Rabbit Кролики - это не только ценный мех |
Зарегистрирован: 01.08.2005
Сообщений: 19787
|
Обратиться по нику
|
Rabbit |
Ответить с цитатой | | |
|
В официальном блоге Google подробно растолковано, каким образом поисковый движок обрабатывает запросы с надбуквенными символами: ударениями, французскими аксан-гравами и т.д.
Если в поисковом запросе присутствует надбуквенный символ, то среди результатов поиска Google будут страницы с упоминанием этого слова в обоих вариантах: как с использованием надбуквенного символа, так и без него. Например, при поисковом запросе [México] осуществляется поиск как страниц со словом “Mexico”, так и страниц со словом “México”.
С другой стороны, если в поисковом запросе присутствует слово без надбуквенных символов, которое, однако, часто встречается с надбуквенными символами, то в поисковой выдаче опять же будут присутствовать оба варианта. В этом можно убедиться на поисковом запросе [Mexico] .
Поисковый движок принимает также во внимание язык интерфейса пользователя. От этого зависит набор надбуквенных символов, которые система приравнивает к обычному написанию символов. Поисковый запрос с французским аксан-гравом приведет к разным результатам поиска, в зависимости от того, каков интерфейс пользователя: французский или какой-то другой. При этом более релевантными считаются документы на языке интерфейса пользователя.
Таким образом, поисковые результаты в ответ на один и тот же запрос варьируются в зависимости от языка интерфейса пользователя. Кроме того, они могут изменятся в зависимости от его физического месторасположения, которое вычисляется по IP-адресу.
Дополнительно учитываются разнообразные персональные настройки для каждого пользователя, например, выдача только страниц на родном языке или активация поиска с учетом истории поисковых запросов (персонализированный поиск).
Чтобы оценить разницу в поисковых результатах, возьмем тот же поисковый запрос [Mexico], который мы осуществляли с англоязычного интерфейса, и запустим его из интерфейса с испанским языком: ссылка на скриншот. Сразу можно заметить, как увеличилось в выдаче количество документов с надбуквенными символами, хотя в самом запросе таких символов не было.
Опции поисковой системы Google дают возможность пользователю принудительно ограничить выдачу тем или иным вариантом написания слова. Можно получить среди поисковых результатов только вариант “Mexico” или только “México”. Для этого нужно добавлять символ “+” в начало поискового запроса: [+Mexico] или [+México].
habrahabr.ru |
|
|
|
|