Гэри Илш, специалист Google и первое лицо компании на конференциях, рассказал, что считается "почти дублированным контентом".


Алгоритмы могут посчитать контент страниц "почти дублированным", если:
  • содержимое было скопировано с другого сайта и подвергнуто минимальным изменениям, которые не мешают узнать оригинал. Насколько досконально сверяется контент, Илш не уточнил.
  • контент был целиком скопирован, без изменений, однако на странице "вора" присутствует дополнительный сторонний контент, вроде хедера, расширенного сайдбара или футера.

При этом Google понимает, что копия контента в разных форматах не является прямым копированием. Так, если документ доступен в формате PDF, а также выложен на веб-странице, санкций за такое дублирование не последует.

В начале прошлого года Джон Мюллер, специалист Google по качеству поиска, заверил, что дубли при переносе или склейке сайтов не приведут к санкциям со стороны поисковика.