"Яндекс" представил очередной поисковый алгоритм "Палех". Он будет заниматься сопоставлением сути запроса с потенциально релевантными страницами, используя нейросети. Ключевые слова при этом отойдут на второй план. Новичок улучшит выдачу на редких или длинных запросах. На данный момент "Палех" обучен работать с заголовками, а в скором времени начнет анализировать и само содержимое страницы.

Обновление произошло несколько месяцев назад. Технические подробности о внедрении и обучении можно найти в статье на "Хабре".

"Палех" основан на той же технологии, что и распознавание картинок. Обучаясь на положительных и отрицательных примерах, он быстро приходит к пониманию, чего именно хочет пользователь. Со временем примеры начинают диктовать сами люди, оставляя соответствующие подсказки своим поведением при поиске. Сейчас алгоритм достиг того момента, когда он с высокой точностью понимает релевантность заголовка запросу.

Технологию обработки запроса и его сравнение с возможными результатами называется семантическим вектором. Подход хорошо зарекомендовал себя при работе с длинными хвостами - он позволяет найти корректный ответ при работе с низкочастотными запросами, по которым почти нет поведенческих данных. Это помогает и точнее определить релевантность, а не полагаться на ключевые слова.

Семантический вектор долгое время использовался в поиске по картинкам "Яндекса". С его помощью удавалось находить релевантные изображения, соответствующие запросу. Однако, как могут вспомнить некоторые пользователи, алгоритмы не всегда угадывали реальную суть запроса, как это произошло с запросом "часы песков".