Запущен «Палех» – новый поисковый алгоритм Яндекса

07.11.2016

В основе нового алгоритма Яндекса лежат нейронные сети. «Палех» поможет поисковой системе лучше находить ответы на уникальные и редкие поисковые запросы. Они практически никогда не повторяются, однако в сумме их достаточно много — порядка ста миллионов каждый день.

Таким образом, редкие и уникальные составляют около 30% от всех запросов, которые делают пользователи. Из-за большого количества специалисты часто называют их «длинным хвостом» поиска, что стало поводом назвать алгоритм «Палех». Именно это село считается родиной сказочной Жар-птицы с длинным хвостом.

Запущен «Палех» – новый поисковый алгоритм Яндекса

Основной механизм работы поисковой системы относительно прост – чтобы найти ответы на запросы пользователи используют ключевые слова. Страница, на которой они присутствуют, предлагается в качестве одного из релевантных результатов.

Однако опираться только на ключевые слова не стоит, поскольку одну и ту же мысль можно выразить по-разному. Поэтому поисковая система начинает учитывать дополнительные параметры. Например, данные статистики: веб-страницы, на которые заходили пользователи, вводившие тот же запрос. Однако в случае с редкими и уникальными запросами такой информации практически нет, и тогда помочь могут нейронные сети.

Алгоритм «Палех» умеет создавать смысловые соответствия между заголовками веб-страниц и поисковым запросом. Благодаря этому можно определить, что на сайте и в запросе пользователя говорится об одном предмете, даже если они не имеют общих слов. Например, если человек введет в строку поиска [фильм про человека, который выращивал картошку на другой планете], поисковая машина поймет, что он ищет информацию о фильме «Марсианин». При этом сами слова «картошка» или «планета» необязательно будут содержаться в тексте на релевантных страницах.

Запущен «Палех» – новый поисковый алгоритм Яндекса

Искусственные нейронные сети являются одним из способов машинного обучения. Они эффективны при анализе естественной информации: текста, аудио, изображений. До «Палеха» Яндекс уже использовал нейронные сети для поиска по картинкам. Также они применялись для фильтрации контента для взрослых, модерации рекламных объявлений и решения других смежных задач. На основе нейронных сетей созданы модели для распознавания человеческой речи. В долгосрочной перспективе Яндекс планирует создать алгоритмы для понимания запросов пользователей на уровне, сравнимом с интеллектом человека.

Это одно из наиболее значимых изменений в работе Яндекса за последнее время. Ранее было объявлено, что мобилопригодность сайта стала еще одни фактором ранжирования.




Похожие новости
01.12.2017
Новые Турбо-страницы от Яндекса

Яндекс запустил новый формат отображения контента на мобильных гаджетах – Турбо-страницы. На них нет ничего лишнего: только картинки, видео и текст. Такие страницы в среднем весят в десятки раз меньше обычного и загружаются в разы быстрее при 3G-подключении.

21.11.2017
Музей Яндекса

Осенью 2017 года в центральном офисе Яндекса открылся музей, в котором представлены предметы, связанные с историей компании.