Яндекс хочет быть зеркалом интернета. Поиск в реальном времени
SEOburn уже как то вскользь упоминал то что Яндекс ввел два новых поисковых робота в своем посте "[URL="http://webmasters.ru/blogs/seoburn/99-novosti-yandeksa-za-poslednii-mesyac.html"]Новости Яндекса за последний месяц[/URL]"
А я хочу немного разобрать сам пост [URL="http://clubs.ya.ru/company/replies.xml?item_no=26957"]о новых поисковых роботах Яндекса[/URL]
Будут небольшие цитаты и мои комменты к ним. Если кто то захочет и свое мнение высказать по поводу новых ботов - милости просим в комментарии.
[QUOTE]Яндекс всегда хотел быть зеркалом интернета[/QUOTE]
Даже как то насмешили.
[QUOTE]С момента запуска быстрого робота мир изменился. В интернете стало много людей, интересы которых далеки от технических проблем поиска, и у них вызывает крайнее изумление ситуация, когда страница на сайте есть, а в поиске ее нет. Именно поэтому правилом хорошего тона в ближайшие годы станет индексация нового за секунды.[/QUOTE]
Интересно мне, а когда они быстробота запустили. И это они только сейчас поняли что информация очень быстро меняется и обновляется. И что с их апами 2-3 раза в неделю они совсем не успевают за новостями, даже и с помощью быстробота.
[QUOTE]Чтобы окончательно сделать из поискового индекса отражение, мы создали и запустили новые технологии — робот «Orange Crawler» и «Real-Time поиск». Основная разработка была сделана калифорнийским отделением Яндекса — Yandex Labs в сотрудничестве с программистами московского офиса.
Новый апельсиновый робот не прокачивает все страницы интернета, а извлекает из него свежий и сочный контент. Количество страниц в интернете бесконечно, поэтому важно их обходить в определенном порядке, чтобы в первую очередь были скачаны страницы с ценной информацией.[/QUOTE]
Что то мне кажется что нововведением особенно заинтересуются дорвейщики. У них и так были способы вгона доров в индекс при помощи быстробота. Теперь будут экспериментировать с "апельсинчиком".
[QUOTE]Orange познает ссылочную структуру интернета. Для этого ему достаточно скачивать и переобходить только часть «старых» страниц — хоть и достаточно большую. Полученные знания позволяют Orange обнаруживать почти все новые страницы, выбирать из огромного их количества все хоть сколько-нибудь интересные и мгновенно рассчитывать для них ссылочные факторы ранжирования. Вслед за роботом Orange документы обрабатывает Real-Time поиск — он подхватывает выбранные документы, индексирует их и за секунды выкладывает на поиск.[/QUOTE]
Интересно,как он знает и выбирает "[I]хоть сколько-нибудь интересные[/I]"?
[QUOTE]С помощью Orange мы достигли значительного улучшения свежести базы. В будущем мы сделаем его еще более агрессивным: Orange будет использовать все доступные источники информации об изменениях в интернете и реагировать на эти изменения мгновенно.[/QUOTE]
С этого абзаца можно сделать два вывода:
- алгоритм "сырой" и в нем естественно будут дыры
- как и для быстробота для "апельсинчика" будут существовать "трамплины" откуда он будет перепрыгивать на новые старицы, это "[I]источники информации об изменениях в интернете[/I]"
[QUOTE]Свежесть — еще одна составляющая в поиске, где простой эффект достигается сложными средствами. Хорошо, когда смотрящий в зеркало видит не особенности зеркала, а только то, что в нем отражается.[/QUOTE]
Посмотрим что получится, лишь бы зеркало гримас не строило.
А что вы думаете по поводу новых роботов?
2 Комментарии