Яндекс научился искать оригиналы веб-страниц. Звучит как фантастика)

**mall** · 18.12.2009 02:07

вот официальное заявление с блога яндексов:

Перед поисковыми системами давно стоит проблема определения первоисточника контента в интернете. Иногда издательство выкладывает свои тексты в сеть позже, чем это делают пользователи. Бывает, что у автора контента вообще нет сайта в интернете. Всё чаще встречаются случаи автоматизированного копирования текстов с целью их размещения на ****-сайтах, созданных исключительно для манипулирования алгоритмами поисковых систем, о чём мы можем судить по жалобам в нашу службу поддержки.

Определение первоисточника текста, размещённого в сети, это сложная задача, которая ещё не решена в общем виде. Однако нам удалось построить алгоритм, который во многих случаях по косвенным признакам определяет, какая из группы страниц с одинаковым текстом является оригиналом. Этот алгоритм уже работает в российской формуле ранжирования, а через некоторое время он будет включён и для всех остальных стран.
Алгоритм ещё (мб никогда lol прим. mall) не обладает стопроцентными полнотой и точностью, но и мы работаем над его улучшением. Будем рады примерам некорректного ранжирования оригиналов и копий, что позволит нам быстрее повысить качество разработанного алгоритма.

ох не верю :) время покажет, быть может яшки действительно разработали что-то на сей раз работающее.

кто что думает?

**karbid** · 18.12.2009 02:21

Думаю, что любой алгоритм можно обмануть :)

**newgeniy** · 18.12.2009 02:23

если это действительно так..то это радует)

**Ultras** · 18.12.2009 03:25

Не верю. И каким это способом они решили определить, оригинальная статья или ее копия? Разве что по времени создания. Никак по другому. А время создания как узнали?

Эх...чем дальше, тем веселей. Проверим однозначно.

**phoeeenix** · 18.12.2009 08:18

Не тот ли это алгоритм, который определял первоисточники в "Яндекс.Новостях"?

**grazer** · 18.12.2009 16:10

Что-то я очень сомневаюсь, как можно определить источник материала вообще с помощью алгоритма. :) Интересно, что же они там такое придумали. И, кстати, чразу оправдались, типа что алгоритм не точен, чтобы сразу не завалили их письмами.

Наверное самый хороший способ определения первоисточника этот - кого первым проиндексировал яндекс тот и папа. :) Так было бы, наверное, лучше всего.

**mall** · 18.12.2009 16:45

grazer так бы продолжали крупные (просто старые) сайты воровоать материалы с новых, и новые уходили бы под фильтры за якобы копипаст.

то что сразу оправдались действительно читалось просто со слезами на глазах

**dimok** · 18.12.2009 16:52

слабо верится, но чем черт не шутит

**grazer** · 18.12.2009 18:12

Сообщение от mall

grazer так бы продолжали крупные (просто старые) сайты воровоать материалы с новых, и новые уходили бы под фильтры за якобы копипаст.

Почему? Если бы старый сайт своровал инфу, то ведь своровал бы уже проиндексированную, а следовательно яндекс бы правильно определил источник.

А на данный момент так и было. :) У кого больше пузомерка тот и источник :) Полный бред.

Верх мастерства копипастера - воровать материалы до того, как они проиндексируются на сайте источнике.

**dimok** · 18.12.2009 18:16

grazer, тут еще момент такой, что оригинал может проиндекситься позже раскрученного вора. что тогда?

	18.12.2009 02:07 #1
mall Гуру Регистрация: 08.09.2009 Сообщений: 1,981 Записей в дневнике: 4 Репутация: 193	вот официальное заявление с блога яндексов: Перед поисковыми системами давно стоит проблема определения первоисточника контента в интернете. Иногда издательство выкладывает свои тексты в сеть позже, чем это делают пользователи. Бывает, что у автора контента вообще нет сайта в интернете. Всё чаще встречаются случаи автоматизированного копирования текстов с целью их размещения на **-сайтах, созданных исключительно для манипулирования алгоритмами поисковых систем, о чём мы можем судить по жалобам в нашу службу поддержки. Определение первоисточника текста, размещённого в сети, это сложная задача, которая ещё не решена в общем виде. Однако нам удалось построить алгоритм, который во многих случаях по косвенным признакам определяет, какая из группы страниц с одинаковым текстом является оригиналом. Этот алгоритм уже работает в российской формуле ранжирования, а через некоторое время он будет включён и для всех остальных стран. Алгоритм ещё (**мб никогда lol прим. mall) не обладает стопроцентными полнотой и точностью, но и мы работаем над его улучшением. Будем рады примерам некорректного ранжирования оригиналов и копий, что позволит нам быстрее повысить качество разработанного алгоритма. ох не верю :) время покажет, быть может яшки действительно разработали что-то на сей раз работающее. кто что думает?
0 mall

	18.12.2009 02:21 #2
karbid Гуру Регистрация: 06.09.2009 Сообщений: 2,236 Репутация: 90	Думаю, что любой алгоритм можно обмануть :)
0 karbid

	18.12.2009 02:23 #3
newgeniy Дипломник Регистрация: 13.12.2009 Сообщений: 180 Репутация: 18	если это действительно так..то это радует)
0 newgeniy

	18.12.2009 03:25 #4
Ultras Опытный Регистрация: 01.12.2009 Сообщений: 381 Репутация: 21	Не верю. И каким это способом они решили определить, оригинальная статья или ее копия? Разве что по времени создания. Никак по другому. А время создания как узнали? Эх...чем дальше, тем веселей. Проверим однозначно.
0 Ultras

	18.12.2009 08:18 #5
phoeeenix Гуру Регистрация: 07.09.2009 Сообщений: 712 Записей в дневнике: 33 Репутация: 79 Webmoney BL: ?	Не тот ли это алгоритм, который определял первоисточники в "Яндекс.Новостях"? АнтиSEO рулит
0 phoeeenix

Яндекс научился искать оригиналы веб-страниц. Звучит как фантастика)

Опции темы

Тэги топика:

Похожие темы

Как искать журналиста?

Где искать толковые домены для сайтов

В индексе гугла в 5 раз меньше страниц чем в яндекс

как искать...?

Как искать трастовые места под доры

Тем:

Сообщений:

Пользователей:

Сейчас на сайте:

Вход

Сайт

Разделы

Прочее

Следите за нами

Витрина ссылок

У нас проходит

У кого попросить инвайт?

Золотые темы форума

Последние новости

Популярные темы

Информеры

	18.12.2009 16:10 #6
grazer Super Moderator Регистрация: 03.09.2009 Сообщений: 5,202 Записей в дневнике: 83 Репутация: 2384 Webmoney BL: ?	Что-то я очень сомневаюсь, как можно определить источник материала вообще с помощью алгоритма. :) Интересно, что же они там такое придумали. И, кстати, чразу оправдались, типа что алгоритм не точен, чтобы сразу не завалили их письмами. Наверное самый хороший способ определения первоисточника этот - кого первым проиндексировал яндекс тот и папа. :) Так было бы, наверное, лучше всего. Домены, хостинг и VPS 10 лет доверяю REG.RU. Проблем нет. Пишу про SEO в 2025 в телеграме, подписывайтесь (cнг/бурж seo).
0 grazer

	18.12.2009 16:45 #7
mall Гуру Регистрация: 08.09.2009 Сообщений: 1,981 Записей в дневнике: 4 Репутация: 193	grazer так бы продолжали крупные (просто старые) сайты воровоать материалы с новых, и новые уходили бы под фильтры за якобы копипаст. то что сразу оправдались действительно читалось просто со слезами на глазах
0 mall

	18.12.2009 16:52 #8
dimok Гуру Регистрация: 10.08.2009 Сообщений: 1,605 Репутация: 143 Webmoney BL: ?	слабо верится, но чем черт не шутит Ротабан - баннерная реклама Ротапост - платные посты и постовые
0 dimok

	18.12.2009 18:12 #9
grazer Super Moderator Регистрация: 03.09.2009 Сообщений: 5,202 Записей в дневнике: 83 Репутация: 2384 Webmoney BL: ?	Сообщение от mall grazer так бы продолжали крупные (просто старые) сайты воровоать материалы с новых, и новые уходили бы под фильтры за якобы копипаст. Почему? Если бы старый сайт своровал инфу, то ведь своровал бы уже проиндексированную, а следовательно яндекс бы правильно определил источник. А на данный момент так и было. :) У кого больше пузомерка тот и источник :) Полный бред. Верх мастерства копипастера - воровать материалы до того, как они проиндексируются на сайте источнике. Домены, хостинг и VPS 10 лет доверяю REG.RU. Проблем нет. Пишу про SEO в 2025 в телеграме, подписывайтесь (cнг/бурж seo).
0 grazer

	18.12.2009 18:16 #10
dimok Гуру Регистрация: 10.08.2009 Сообщений: 1,605 Репутация: 143 Webmoney BL: ?	grazer, тут еще момент такой, что оригинал может проиндекситься позже раскрученного вора. что тогда? Ротабан - баннерная реклама Ротапост - платные посты и постовые
0 dimok

Темы	Раздел	Ответов	Последний пост
Как искать журналиста?	Прочее	32	10.08.2012 16:15
Где искать толковые домены для сайтов	Дайджест блогосферы	0	26.05.2010 00:12
В индексе гугла в 5 раз меньше страниц чем в яндекс	Google	25	15.04.2010 12:54
как искать...?	Хостинг и Серверы	6	17.01.2010 00:23
Как искать трастовые места под доры	Обучающие статьи	8	11.09.2009 03:28