Что такое Анализаторы поисковых машин?
Качество поисковых машин касается каждого. Если поисковики ищут хорошо, то мы экономим время и быстро находим нужное.
Но как оценить качество поиска? Частные мнения и опросы не помогут: каждый пользователь имеет собственные привычки и склонность к определённому типу запросов. Для Маши лучше ищет Яндекс, а для её соседа Пети – Google.
Оценивать качество по популярности – тоже не очень корректно, потому что для популярности (доли рынка) большое значение имеют маркетинг, реклама и привычки пользователей.
Чтобы получить объективный и независимый тест качества главных
поисковиков, мы в 2007 году и сделали эти анализаторы.
Мы автоматически анализируем поисковики по навигационным, тематическим, информационным запросам, замеряем уровень порно и так далее.
В настоящее время, насколько нам известно, наш сервис – единственный независимый тест поисковиков в Рунете.
В общем – смотрите.
Как работают Анализаторы
Мы используем запросы-маркеры и сайты-маркеры. Например, чтобы оценить
качество навигационного поиска, мы используем более 500 запросов, ответ на
которые заранее задан нашими лингвистами. Например, на запрос
[Сбербанк] пользователь ожидает увидеть сайт Сбербанка на первом месте.
Здесь запрос [Сбербанк] и сайт Сбербанка – маркеры. Чтобы исключить
«накрутку» наших анализаторов разработчиками поисковиков, мы меняем
маркеры каждый день, для чего применяем скользящее окно из нескольких
десятков или сотен запросов.
Мы делаем замеры раз в сутки, ночью, постепенно собирая и обрабатывая
данные, так что обычно корректный результат можно увидеть примерно к
10-00 по московскому времени.
Подробнее методика каждого анализатора описана на его странице.
Семинар «Продвижение сайтов в Интернете – теория и практика» 7-8 октября, Москва
|
|
Интегральный показатель качества поиска
Интегральный показатель качества поиска призван помочь оценить общее качество поиска каждого поисковика.
Интегральный показатель качества поиска расчитывается по результатам всех анализаторов, которые оценивают качество различных параметров поиска. Анализаторы переходов и апдейтов в расчете не учитываются. Раскрыть →
Расчет производится по следующей методике:
1) Показатели поисковиков по каждому анализатору нормируются на 100 в диапазоне от худшего до лучшего результата. Это позволяет учесть тот факт что абсолютные значения показателей в каждом анализаторе сильно различаются. Так например, в анализаторе навигационного поиска значения лежат в диапазоне 85-100, а в анализаторе спама – в диапазоне 1-10.
2) Полученные значения умножаются на коэффициенты. Эти коэффициенты отражают наше представление о весе данного вида поиска или данной функциональности поиск в интернет-поиске вцелом. Значения коэффициентов по умолчанию следующие:
Навигационный поиск 1 Тематический поиск 0.8 Подсказки 1 Исправление опечаток 0.5 Цитатный поиск 1 Поиск оригиналов 0.5 Поиск синонимов 1 Устойчивость к поисковому спаму 1 Устойчивость к СЕО-прессингу 0.5 Доля порнографии 0.5 Полнота индекса 1
Вы можете изменить эти коэффициенты самостоятельно, если считаете что на самом деле веса видов поиска другие. Подвигайте "ползунки" слева от соответствующих информеров. Значения интегрального показателя качества будут пересчитаны автоматически при изменении положения "бегунка"
3) Полученные значения суммируются и нормируются на максимально возможный диапазон значений. При коэффициентах по умолчанию это диапазон 0-875. Диапазон расчитывается как сумма коэффициентов * 100. При изменении коэффициентов (смещении "бегунков") максимально возможный диапазон изменяется и пересчитывается.
Свернуть ↑
[ Ссылка на статью ]
|
|
|
Анализатор качества навигационного поиска
|
|
|
Анализатор качества тематического поиска
|
|
|
Анализатор качества подсказок
|
|
|
Анализатор устойчивости к опечаткам
Человек – не робот и может ошибиться. В том числе и при вводе поискового запроса в поисковую строку поисковой машины. Он может просто допустить опечатку, введя соседний символ (и тогда вместо "запрос" получится "звпрос"), он может по ошибке ввести символ дважды или пропустить вовсе (и тогда вместо "запрос" получится "зпрос" или "заппрос"), наконец, он может не знать правильного написания слова и ввести его "как слышится" (и тогда вместо "яндекс" получится "яндыкс"). Раскрыть →
Поисковик в этом случае может придерживаться одной из трех стратегий: 1) никак не обрабатывать эти случаи и искать строго то что ввел пользователь 2) понять что имела место опечатка, тем не менее найти то что введено и рядом предложить правильную по мнению поисковой машины форму – "возможно, вы имели ввиду [правильное написание запроса]" 3) понять что имела место опечатка, не искать ошибочное написание а сразу искать правильную форму
В зависимости от выбранной стратегии, пользователь либо не увидит что он ошибся при написании, либо увидит это и сделает лишний клик (если захочет), либо даже не догадается о собственной опечатке.
В данном анализаторе сравнивается поисковая выдача по "правильному запросу" и по нескольким формам возможных его опечаток. Оценивается степень близости поисковой выдачи по запросу с опечаткой к выдаче по "правильному" запросу
Кроме сознательного исправления опечаток, совпадения могут возникать в четырех случаях: 1) случайно 3) страница содержит как правильную форму, так и форму с опечаткой 4) ложное срабатывание морфологии поисковика (например, приведение неизвестного поисковику слова "гриби", которое есть опечатка слова "грибы" к слову "гриб") 5) продвижение одних и тех же сайтов как по запросам в правильном ниписании, так и по запросам с опечатками
Все эти случаи в рамках данного анализатора дают шум – случайное совпадение результатов. Степень близости оценивается аналогично тому как это делается в анализаторе апдейтов, только сравниваются другие запросы.
Чем большее совпадение результатов зафиксировано, тем выше результат поисковика по данному анализатору. Именно в этом порядке сверху вниз отсортированы поисковики в информере данного анализатора.
В дальнейшем будет введена ротация групп запросов с опечатками из большого массива групп.
Свернуть ↑
[ Ссылка на статью ]
|
|
|
Анализатор качества поиска цитат
Цитатный поиск – это поиск конкретного текста по его известному фрагменту. Часто таким образом ищутся оригиналы литературных произведений. Качественный поисковик должен выдавать ссылку на страницу, где содержится текст произведения, цитата из которого запрашивается. И в идеале – поставить ее первой. Например, давая запрос "Однажды в студеную зимнюю пору я из лесу вышел" , пользователь скорее всего ищет текст стихотворения Некрасова, и ссылку именно на этот текст поисковик должен выдать на первой странице. Раскрыть →
Как правило, цитатные запросы длиннее других типов и не часто повторяются, но в сумме составляют значительную долю запросов.
Для оценки качества цитатного поиска производится опрос поисковиков по 50 запросам, случайно выбираемым из общего массива цитатных запросов. Каждому запросу приписан один или несколько фрагментов текста, которые должны быть включены в текст страниц , на которые ссылкается поисковая выдача. В Топ10 поисковой выдачи ищутся вхождения фрагментов-маркеров. Далее расчитывается доля запросов, для которых на первой странице найден фрагмент-маркер. Это и является сводным показателем качества цитатного поиска.
Свернуть ↑
[ Ссылка на статью ]
|
|
|
Анализатор поиска оригиналов
В интернете, к сожалению, широко распространено незаконное копирование информации. С воровством сталкивался любой автор: спустя дни, а то и часы после выкладывания на сайт свежей статьи ее текст может появиться на ресурсах, не имеющих разрешения на републикацию. Укравшие информацию обычно говорят, что она "взята из открытых источников". Либо объясняют, статья размещена кем-то из пользователей, за действия которого владелец сайта ответственности не несет. Используя чужой контент, можно получать посетителей из результатов поиска и конвертировать этот трафик в деньги. Что, собственно, и является главным экономическим мотивом "заимствования". Поэтому очень важны способность поисковых систем отличать оригинальные материалы от копий, и умение ссылки на оригиналы в результатах поиска размещать всегда выше. Раскрыть →
Анализатор поиска оригиналов ежедневно проверяет по точной цитате позиции ста статей-маркеров, для которых известны адреса, где они находятся на законных основаниях. Подсчитывается количество запросов, для которых данный поисковик дает ссылку на оригинал документа выше, чем ссылки на его перепечатки.
В информере анализатора поисковые системы отсортированы по убыванию способности находить оригинальные источники.
Свернуть ↑
[ Ссылка на статью ]
|
|
|
Анализатор запросов-синонимов
Один и тот же вопрос можно задать десятком способов. Например, для пользователей запросы "как узнать адрес по номеру телефона", "поиск адреса по номеру телефона" и "найти адрес по номеру телефона" имеют одинаковый смысл, это запросы-синонимы. Раскрыть →
Запросы-синонимы появляются по разным причинам: - при использовании общепринятых сокращений – "погода в Санкт-Петербурге" и "погода в Спб"; - использовании транслитераций – "характеристики toyota camry" и "характеристики тойота камри"; - использовании разных падежей – "сценарий встречи Нового Года" и "сценарий встреча Новый Год"; - использовании перестановок слов – "ремонт АКПП", "АКПП ремонт"; - использовании жаргонизмов – "скачать мультфильмы", "скачать мультики"; - использовании слов, не несущих смысловой нагрузки – "быстрый интернет", "супер быстрый интернет"; - использовании синонимов слов, входящих в запрос – "грустные стихи", "печальные стихи".
Поисковые системы в ответ на запрос должны подобрать наилучший набор ссылок. И, конечно, чаще всего в результатах поиска люди ожидают увидеть информацию, соответствующую смыслу, а не букве запроса. Из этого следует, что выдача в ответ на синонимичные запросы должна быть одинаковой, несмотря на то, что формулировки отличаются друг от друга.
Анализатор поиска по запросам-синонимам проверяет, насколько совпадает выдача по разным запросам, имеющим одинаковое значение. Образно можно сказать, что анализатор в какой-то мере показывает способность поисковика "понимать" смысл запроса. В информере поисковые системы отсортированы по убыванию этого показателя.
Все примеры, используемые в данном анализаторе, реальные, они получены с помощью сервиса статистики поисковых запросов "Рамблера" (http://adstat.rambler.ru/wrds/) Отметим, что мы не рассматриваем здесь варианты запросов с ошибками и опечатками.
Свернуть ↑
[ Ссылка на статью ]
|
|
|
Анализатор спама в поисковой выдаче
Компания "Ашманов и партнеры" профессионально занимается изучением феномена поискового спама – приемов и технологий, ухудшающих качество поисковой выдачи и мешающих нормальной работе поисковых систем.
Поисковым спамом могут быть названы текст, ссылка, технология, программный код и иные элементы веба, созданные не для повышения удобства пользователей, целью которых является быстрый и легкий поиск полной, профессионально оформленной, достоверной информации, определяемой поисковым запросом. Но для которых точно известно, что причиной их создания является желание веб-мастера улучшить позиции продвигаемого сайта в результатах поиска. Раскрыть →
Эксперты регулярно просматривают Тор10 выдачи по выборке поисковых запросов, отмечая сайты, которые, с их точки зрения, содержат элементы поискового спама. Сводные данные выводятся на информер и показывают процент отмеченных экспертами сайтов от общего количества сайтов в Тор10 выдачи по анализируемым запросам.
Источник информации о спам-статусе данного URL – собственные данные антиспам-лаборатории компании "Ашманов и Партнеры". Используются следующие категории поискового спама: * doorway – безусловный спам: дорвеи, увод пользователя к другим страницам, * spamcatalog – безусловный спам: спамерские каталоги, * spamcontent – безусловный спам: спамерский заимствованный контент, * pseudosite – безусловный спам: сайт, маскирующийся под корпоративный (псевдофирма), * catalog – каталоги, * board – доски объявлений, * domainsale – домены на продажу, * secondary – вторичный, заимствованный контент, * partner – любые партнерки, * linksite – сайт линкоподдержки, * spamforum – заспамленный форум, * techspam – технический спам, * searchres – результаты поиска
Сводным показателем является доля спам-сайтов в поисковой выдаче. Лучшим является поисковик с наименьшим сводным показателем. Именно в таком порядке поисковики отсортированы в информере данного анализатора.
Свернуть ↑
[ Ссылка на статью ]
, [ Ссылка на коллекцию примеров поискового спама ]
|
|
|
Анализатор SEO-прессинга
Многие запросы невозможно понять однозначно. Например, дизайн, автомобили, спорт и др. Такие запросы называются информационными. Лучшим ответом на них является подборка, в которой пользователям предлагаются ссылки на ресурсы по различным смысловым направлениям запроса. Так, в выдаче в ответ на запрос "дизайн" должны быть ссылки на сайты о веб-дизайне, ландшафтном дизайне, дизайне интерьера и др. Раскрыть →
Сформировать качественную политематическую подборку ссылок непросто. Особенно в условиях, когда оптимизаторы рассматривают популярные информационные запросы как цели для продвижения сайтов своих клиентов. В результате такого SEO-"прессинга" наверх пробиваются только ресурсы, продвижение которых наиболее окупается, и выдача становится однообразной, состоящей из ссылок на сайты с однотипными коммерческими предложениями.
Анализатор ищет в титульных фразах и сниппетах Тор10 выдачи по анализируемым запросам однотипные строки. Суммарный показатель представляет собой процент найденных однотипных строк от общего количества сайтов в Тор10 выдачи по анализируемым запросам. Чем выше этот показатель – тем более велико SEO-давление на данный поисковик. В качестве признака монотематичности используется вхождение в заголовок или цитату страницы характерных слов или фраз. Сводным показателем является доля результатов поиска, в которых "фразы-маркеры" встречаются.
Лучшим считается поисковик с наименьшим сводным показателем по данному анализатору. Именно в таком порядке поисковики отсортированы в информере данного анализатора.
Свернуть ↑
[ Ссылка на статью ]
|
|
|
Анализатор наличия 'сайтов для взрослых' в поисковой выдаче
Этот анализатор работает в тестовом режиме, в настоящее время идет отладка детектора порнографии в текстах документов. Результаты могут быть некорректными.
Данный анализатор собирает результаты поиска по запросам, которые могут трактоваться как поиск порнографии определенной тематики, но эта трактовка не единственно возможная. Среди этих запросов нет таких, которые однозначно являются поиском порно.
Например, запрос «колготки» может означать, что пользователь ищет магазин колготок, а может означать поиск соответствующего раздела порнографии. Раскрыть →
Для детектирования порнографии в поисковой выдаче используется технология «Семантическое Зеркало», разработанная нашей компанией. В данном анализаторе «контентом для взрослых» считается документ, который получил рубрику /Dosug/Adult или ее подрубрики.
Для каждого поисковика среди всех его топ10 поиска вычисляется доля документов, отнесенных к этим рубрикам.
Анализатор наличия «сайтов для взрослых» в поисковой выдаче не имеет «оценочной» составляющей. То есть, мы не утверждаем что поисковик с высокой долей порно в поисковой выдаче «плохой», «аморальный» и т.д.
Свернуть ↑
[ Ссылка на статью ]
|
|
|
Анализатор полноты индексов
Этот анализатор работает в тестовом режиме. Результаты могут быть некорректными.
Для качества поиска довольно важно, насколько полно индексируется Интернет поисковой машиной. Если поисковая база поисковика маленькая, то часть веб-страниц могут оказаться вообще недоступными через данный поисковик. Раскрыть →
Конечно, по большинству частотных и среднечастотных запросов любая поисковая машина гарантированно выдаст вам десятки или сотни тысяч результатов. При этом, однако, реальный размер базы у разных поисковиков может отличаться в несколько раз. Как понять истинный размер базы? Это непросто и вот почему: а) Нельзя доверять декларации поисковиков "всего найдено N документов", поскольку у каждого поисковика количество найденного подсчитывается по-своему. Кто-то считает только документы, где есть все заданные в запросе слова, а кто-то дописывает в "хвост" вообще все документы. где встретилось хотя бы одно слово из запроса. Поисковики любят мериться мускулами и не чужды маркетинговых трюков. б) Более того, в действительности ни один поисковик никогда не покажет вам все заявленные 10 000 результатов. Листая результаты поиска, Вы сможете увидеть десятки, в лучшем случае сотни страниц результатов поиска, после чего вас так или иначе отключат. Таким образом, можно быть уверенным, что мы знаем истинное количество страниц в Интернете с данным словом, только когда результатов – максимум сотня-другая. в) доверять декларации поисковика о том, что им заиндексировано M миллиардов документов – тоже нельзя, потому что, опять-таки способ подсчёта неизвестен (считаются ли дубли, например, и какие именно), а также потому, что может оказаться, что половина Рунета всё-таки оказалась вне этих условных M миллиардов страниц и не попала в индекс вообще. Поэтому мы выбрали наиболее простой и надёжный способ анализа полноты поисковой базы по редким запросам. Редкими здесь мы называем запросы, которые встречаются в Интернете всего несколько десятков раз. Впрочем, обычно такие запросы – редкие и в смысле частоты поиска их в поисковиках, поскольку если запрос – частотный, то под него моментально подстраиваются спамеры, производя множество фальшивых страниц с этим словом или словосочетанием. Итак, мы построили набор редких запросов, по каждому из которых поисковики выдают не более нескольких десятков результатов. И проверяем "окраины Интернета" на предмет того, видит ли их каждая из поисковых машин. Анализатор раз в сутки проверяет все поисковики на предмет того, сколько страниц найдёно каждым поисковиком по каждому запросу. После чего вычисляется показатель полноты базы по следующей формуле: Проводится поиск по запросу во всех сравниваемых поисковых машинах. Для машины, в которой найдено максимальное число страниц, полнота считается равной 1, для остальных – определяется пропорционально. Затем полнота усредняется по множеству специфических запросов. Это и есть значение анализатора полноты.
Мы постоянно пополняем список запросов-маркеров, стараясь охватить все "окраины Интернета". Если вам кажется, что есть ещё какие-то редкие слова и словосочетания, которые стоит включить в базу маркеров – присылайте их нам.
Свернуть ↑
[ Ссылка на статью ]
|
|
|
Анализатор апдейтов поисковых машин
Апдейт (от англ. update – гл. обновить информацию) поисковой машины – процесс обновления результатов поиска. Какие-то сайты поднимаются в первую десятку, какие-то "тонут". Каждый поисковик обладает собственным стилем обновлений, которые хорошо видны на соответствующем анализаторе. Анализатор апдейтов поисковых машин ежедневно мониторит позиции первых десяти ссылок (Тор10) по 140 запросам и сравнивает, для какого количества сайтов позиция изменилась и какова степень этого изменения по сравнению с данными вчерашнего дня. Раскрыть →
Для расчета сводного индекса апдейта обозначим через Di изменение позиции для i-ой по порядку страницы из 1-го Top10. К примеру, если 5ый сайт из первой выдачи оказался на второй день на 3ей или 7ой позиции, то D5=2. Если i-я страница из 1-го Top10 не попала во 2-й Top10, то считаем, что Di=10.
Индикатор апдейтов вычисляется по формуле:
10 ∑ Di/100 i=1
Для наглядности рассмотрим два примера: Пример 1 В 1-й день по некоторому запросу Top10 имеет следующий вид: С1, С2, С3, С4, С5, С6, С7, С8, С9, С10. Во 2-й день по тому же запросу Top10 выглядит так: Сн, С1, С2, С3, С4, С5, С6, С7, С8, С9.
Результат вычисления индикатора апдейта в этом случае: ((2-1)+(3-2)+(4-3)+(10-9)+10)/100 = 0.19 (19%)
Пример 2 В 1-й день по некоторому запросу Top10 имеет следующий вид: С1, С2, С3, С4, С5, С6, С7, С8, С9, С10. Во 2-й день по тому же запросу Top10 выглядит так: Сн1, Сн2, Сн3, Сн4, Сн5, Сн6, Сн7, Сн8, Сн9, Сн10.
В этом случае индикатор апдейта равен: 10*10/100 = 1.00 (100%)
Кроме того, вычисляются дополнительные параметры – количество исчезнувших из поисковой выдачи сайтов и количество сайтов, изменивших позицию.
У данного анализатора нет оценочной характеристики. Результаты можно трактовать двояко: поисковик с частыми большими апдейтами можно считать более актуальным, часто обновляющим свои данные; поисковик с редкими апдейтами можно считать стабильным и предсказуемым. В информере данного анализатора поисковики отсортированы в порядке увеличения уровня апдейта сверху вниз.
Свернуть ↑
[ Ссылка на статью ]
|
|
|
Анализатор переходов
Анализатор доли переходов с поисковых машин не является «качественным» анализатором, а отражает популярность и используемость поисковых машин. Для его построения используются данные счетчика Liveinternet.ru. Таким образом, учитываются переходы только на те сайты, на которых установлен счетчик Liveinternet.ru. Раскрыть →
Данный анализатор отражает процентное соотношение переходов с поисковых машин на сайты Рунета. Используются данные статистики счётчика LiveInternet по переходам с поисковиков. Здесь необходимо сделать несколько поясняющих комментариев: А. Здесь взят срез статистики счётчика LiveInternet по российским пользователям (то есть пользователям с российским адресом IP). Это сделано, чтобы отфильтровать шум, возникающий из-за так называемых idiot clicks, то есть случайных переходов западных пользователей из "больших" поисковых машин, таких как Гугл, MSN Live Search, Yahoo. Эти пользователи не являются настоящими пользователями поисковиков Рунета, но могут довольно сильно искажать статистику (так как западный Интернет большой и таких случайных пользователей много). Б. Принято считать эти цифры долями рынка поисковых машин, но это не вполне корректно. Дело в том, что: а) счётчик LiveInternet показывает переходы только на те сайты, на которых установлен счётчик. Некоторые крупные сайты не ставят счётчик, что может давать смещение статистики при экстраполяции на весь Рунет. б) точно неизвестно, что именно показывает процент переходов с поисковика, и как он связан с истинной популярностью поисковика. Можно предположить, что посещаемость поисковика и количество переходов с него коррелируют, но это только предположение. Вдруг, например, в "плохом" поисковике пользователь вынужден много раз щёлкнуть по результатом поиска, пока он найдёт нужный сайт, а в "хорошем" он находит нужный сайт с одного клика? Тогда "плохой" поисковик будет генерировать много переходов на одного пользователя, а "хороший" – только один переход. В общем, точно это соотношение популярности и переходов неизвестно, и именно поэтому мы назвали данный параметр техническим. Вероятно, сильное изменение процентной доли переходов (скажем, на 5-10 пунктов и более) может отражать реальное изменение посещаемости поисковика. Про малые флуктуации (1-2%) этого утверждать наверняка нельзя. В. Нужно не забывать, что эти цифры – не абсолютная посещаемость или количество переходов, а процентные доли (сумма которых постоянна и равна 100%). Именно это вызывает эффект ясно видимых на месячном графике зеркальных ям Яндекса и наведённых выступов Гугла: посещаемость Яндекса в выходные падает, а посещаемость Гугла, похоже, падает не так сильно (мы не знаем, почему). Поэтому оттого, что доля Яндекса велика, то из-за её падения пропорционально увеличивается процентная доля Гугла по выходным (ведь сумма долей всех поисковиков постоянна). У Рамблера же, очевидно, падение в выходные также ярко выражено, так что его процентная доля не подскакивает так, как у Гугла.
Лучшим по данному анализатору считается поисковик с наибольшей долей переходов. Именно в таком порядке сверху вниз отсортированы поисковики в информере данного анализатора.
Свернуть ↑
[ Ссылка на статью ]
|
|
|
Анализатор актуальности: должности
Этот анализатор — первый из планируемой серии анализаторов, оценивающих актуальность поисковой выдачи.
Для многих запросов актуальность найденной информации — важный фактор качества. Например, задавая запрос президент Зимбабве, пользователь, скорее всего, хочет узнать, кто занимает этот пост сейчас, и сведения о бывших президентах Зимбабве вряд ли будут ему полезны (особенно если нет информации о том, что эти сведения — «исторические»). Раскрыть →
В рамках данного анализатора каждому запросу сопоставлен один или несколько актуальных маркеров (вариантов ответа) и один или несколько неактуальных, устаревших. Если документ из поисковой выдачи содержит актуальный маркер, он засчитывается в плюс, если только неактуальные — в минус. Документы, не содержащие ни актуального, ни «просроченного» маркера, при подсчете не учитываются (это, конечно, обычно не вполне релевантные ответы на запрос — но мы ведь в данном случае оцениваем не релевантность, а актуальность).
В будущем будут разработаны анализаторы по другим типам запросов, для которых важна актуальность, — про только что произошедшие события (по свежим новостям), про цены на товары, про курсы акций и валют, про горящие туры и т. п.
Свернуть ↑
[ Ссылка на статью ]
|
|
|
Анализатор регионального поиска
Когда пользователь Интернета в Уфе или в Новосибирске задает запрос «доставка пиццы», он, скорее всего, хочет, чтобы ему привезли пиццу. Теория вопроса (в каких городах России пицца доступнее) его вряд ли интересует, а сайты московских фирм ему и вовсе не нужны, поскольку из Москвы в Новосибирск пиццу не доставляют. Раскрыть →
В этом анализаторе запросы поисковым машинам задаются из разных городов России. В результатах поиска для каждого города отбираются те ответы, из которых понятно, что они релевантны именно здесь: город (или характерный район, улица, номер телефона и т.п.) упомянут в заголовке, в адресе сайта или в снипете. (Результаты, по которым сразу не видно, что они «местные», региональный пользователь просто не станет открывать.)
Мерой дружественности поисковых машин региональному пользователю мы считаем процент <местных> ответов в среднем по всем городам, из которых задаются запросы, кроме Москвы.
Мы специально включили в этот анализатор не только «строго региональные» запросы («заказать очки», «китайская кухня доставка на дом»), но и «информационно-региональные» — такие, которые предполагают и информационную составляющую («цены на лекарства», «анализы при беременности»).
Свернуть ↑
[ Ссылка на статью ]
|