lis-enka Опубликовано 02.11.2016 14:32
Обновление произошло несколько месяцев назад. Технические подробности о внедрении и обучении можно найти в статье на "Хабре".
"Палех" основан на той же технологии, что и распознавание картинок. Обучаясь на положительных и отрицательных примерах, он быстро приходит к пониманию, чего именно хочет пользователь. Со временем примеры начинают диктовать сами люди, оставляя соответствующие подсказки своим поведением при поиске. Сейчас алгоритм достиг того момента, когда он с высокой точностью понимает релевантность заголовка запросу.
Технологию обработки запроса и его сравнение с возможными результатами называется семантическим вектором. Подход хорошо зарекомендовал себя при работе с длинными хвостами - он позволяет найти корректный ответ при работе с низкочастотными запросами, по которым почти нет поведенческих данных. Это помогает и точнее определить релевантность, а не полагаться на ключевые слова.
Семантический вектор долгое время использовался в поиске по картинкам "Яндекса". С его помощью удавалось находить релевантные изображения, соответствующие запросу. Однако, как могут вспомнить некоторые пользователи, алгоритмы не всегда угадывали реальную суть запроса, как это произошло с запросом "часы песков".
