Анализатор различения форм слов
Поисковики должны уметь находить слова во всех формах. Но иногда формы двух слов очень похожи или просто совпадают — и в таких случаях важно ограничить расширение запроса, не найти лишнего. Человека, задающего запрос про двигатели на паромах, вряд ли заинтересует мойка двигателя паром, а спрашивающего про компанию Роскофе — отели в городе Роскоф.
Название «Грамматика» — достаточно условное: речь идет о способности поисковых машин различать похожие грамматические формы разных слов.
В этом анализаторе специально подобраны трудные запросы (некоторые из них — достаточно редкие), для которых существует заметная вероятность неверной интерпретации. Каждому запросу соответствует набор маркеров, иногда довольно обширный, присутствие которых в снипете определяет, как именно, «в плюс» или «в минус» засчитывается поисковику соответствующий результат. Иногда это отдельные словоформы — например, слово «ливень» будет однозначным минусом для запроса про Авраама Ливни, а слово «куру» — плюсом для запроса про болезнь куру. Некоторые маркеры, однако, устроены сложнее и используют не только форму слова, но и контекст, так ответ «к походу готов» очевидно, не будет засчитан для запроса [походы готов].
Результатом поисковика в анализаторе является общее количество найденных им правильных форм — то есть, несмотря на принадлежность к группе «Ошибок», анализатор определяет процент результатов, в которых ошибок нет.
- 90−100%
- 80−90%
- 60−80%
- 40−60%
- 20−40%
- 0−20%
|
|