Анализатор поиска имён
Нахождение информации о конкретном человеке по его имени – частая цель обращения к поисковикам. Однако результат поиска может разочаровать пользователя: нередко вместо нужного человека находятся более известные однофамильцы.
Одной из самых распространённых ошибок является «смешивание» частей имени (например, нахождение по запросу «Иван Петров» страницы, содержащей Ивана Иванова и Петра Петрова), и запросы в анализаторе подобраны таким образом, чтобы вероятность появления результатов этого вида была достаточно высокой. Для этого были использованы однофамильцы известных людей и люди с «нестандартными» фамилиями, которые традиционно представляют особую сложность для поисковых машин. Тем не менее, все запросы анализатора соответствуют реально существующим людям.
Анализатор автоматически разбирает имена, найденные в снипетах и заголовках первой страницы выдачи поисковиков, засчитывая нахождение нужной персоны в «плюс», а ненужной (тёзки, однофамильцы) - в минус. После этого результаты автоматической разметки контролируются вручную. Такая проверка нужна, чтобы засчитать отдельные сложные конструкции (например, «сын Василия Иванова Петр» как хороший результат для «Петр Иванов») и отменить засчитывания случайных склеек (например, «На дне рождения Ивана Петрова целовалась с Сидоровым» для «Иван Петров»). Кроме того, при ручном просмотре оцениваются отдельные фамилии или фамилии с подходящими инициалами, если по контексту можно понять, что речь идёт о нужном (или, наоборот, ненужном) человеке - в противном случае, этот результат не учитывается.
Результат работы анализатора – усредненное по всем запросам отношение количества страниц, засчитанных в «плюс» к общему количеству засчитанных страниц.
- 90−100%
- 80−90%
- 60−80%
- 40−60%
- 20−40%
- 0−20%
|
|