Привет всем. Маленькая темка, хотел поделиться недавно найденным графиком, показывающим рост размера формулы ранжирования Яндекс-поиск. Те, кто приблизительно представляет, как мало весит обычный текст\знаки, поймут масштабы работы программистов и глобальность алгоритма работы поисковика.
Рис. Рост размера формулы рассчета за последние 6 лет. На данный момент формула, длинною в 40 Мегабайт...
Насколько я знаю, в настоящее время формула совершенствует себя сама. Типа машинное обучение. Или я что-то не понимаю? Я не математик и не программист. :)
Ну да то что алгоритм это самаобучающияся экспертная система они давно заявили. Но все еще не обходятся без человеческих допилок, так как слишком уж много времени должно пройти чтобы алгорит ранжирования подстраивался под новые "пакости" спамеров поисковой выдачи.
ткуда такая информация, если не секрет? Достоверен ли источник?
Информация от самих разработчиков алгоритмов ранжирования.
Сообщение от egor63rus
Думаю, там не формула, а набор скриптов, алгоритмов и кодов, так что не стоит удивляться такому размеру
Имеено код алгоритма, т.е. грубо говоря один "черный ящик", имеющий запрос на входе и тысячи параметров для фильтра и один выход. Посомтрите 2006 год - вес кода 20 байт, скорее всего только фильтр на Тайтл, кейвордс и дескрипшн.
Сообщение от Виктор1974
Насколько я знаю, в настоящее время формула совершенствует себя сама. Типа машинное обучение.
Да, матрикснет. Машинное обучение, код сам себя контролирует, "учится", анализирует весь спектр параметров ранжирования и влияния каждого из них. Но сам себя он не пишет:)
AlexDV, хорошая информация, а найдено это где? источник, надеюсь, Яндекс? :)
Сообщение от Виктор1974
Насколько я знаю, в настоящее время формула совершенствует себя сама. Типа машинное обучение. Или я что-то не понимаю? Я не математик и не программист.
Формула не улучшает сама себя, есть ИИ, который действует по определенным правилам (читай формула) и он может строить какие-то выводы методом проб и ошибок + подсказок со стороны асессоров.
Сообщение от egor63rus
Думаю, там не формула, а набор скриптов, алгоритмов и кодов, так что не стоит удивляться такому размеру.
а разве определенный набор скриптов и алгоритмов, которые взаимосвязаны в одну систему нельзя назвать формулой? :)
AlexDV, хорошая информация, а найдено это где? источник, надеюсь, Яндекс?
Источник - блог яндекса(или кого-то из яндекса) на хабре. _habrahabr.ru/company/yandex/blog/174213/ Только самого главного ТС не написал. Первым делом выбирается собственно формула, а потом она применяется. Т.е. для разных запросов-разные формулы!
Самое главное, что я хотел передать топиком - это то, насколько колоссальным является итог рабты сотен людей, сколько идей внедрено, сколько сил и времени потрачено ... в том числе и на, теперь уже, извечное противостояние с СЕОшниками