Привет всем, на форуме периодически всплывают вопросы о копипасте, поэтому решил написать пару своих мыслей и рассмотреть один интересный пример. Не пиара ради, а пользы для :-) Для ленивых можно сразу прокрутить в конец статьи - там есть вывод
Предыстория будет такая - периодически гугля некоторые сео-ориентированные вопросы (по типу "сколько нужно копирастов, что бы вкрутить лампочку") попадал на один сайт, не находя на нем ответа на свой вопрос щелкал дальше сайты в выдаче и, в итоге, попадал на серч, в котором уже повторно читал тоже самое, что и на том самом сайте. Такое положение дел меня заинтриговало, решил рассмотреть его поближе. Через некоторое время после своих выводов вдобавок прочел о нем у маула </prehistory>
Речь пойдет о сайте ir-magazine.ru. На главной практически ничего нет, кроме карты сайта, самое интересное находится на его форуме. В двух словах - сайт полная копия серча и маултолка. В большинстве разделов находится более 100к сообщений, в одном из них - более миллиона. Должен ли выжить сайт, имеющий пару лямов страниц копипаста? Исходя из логики нормального, трезвого человека - нет. Исходя из необъяснимой логики Googla - почему бы и нет?
Краткий анализ
На скрине однозначно видно, что на данный момент в индексе 630 тысяч страниц.
При этом множество страниц осталось не проиндексированными по причине прописанного robots.txt
- Довольно интересно, что сайт закрыт для индексации в Яндексе. Хотя в индексе одна страница присутствует, вероятней всего сайт схватил АГС (но зачем закрыт от индекса в robots.txt тогда? непонятно) Сайт имеет Alexa Rank:35,739, это около 2к посетителей в день (у Алексея aka Terehoff Rank:45,450).
260 тысяч внешних ссылок
Сейчас сайт имеет 325 ТИЦ, 5 PR
Поковырявшись в истории я нашел, что всю жизнь сайта можно разделить на два периода - когда сайт еще был СДЛ (архив сайта за 2009 год) и когда сайт сменил владельца (2010 год). Как можно увидеть вот тут у сайта истек срок регистрации
Судя по всему сайт был довольно трастовым - до февраля 2010 он имел 475 ТИЦ, после этого ТИЦ сделал скачек аж на 225 и стал равен 700 - вероятней всего сайт был добавлен в Яндекс Каталог (это предположение подтверждает то, что 08.05.2010 ТИЦ упал обратно, примерно в это же время произошло переоформление домена, а как известно, при переоформлении сайт вылетает из ЯК) Скрин:
Дальше смотрим скрин с историей индексации в Яндексе (слева) и ТИЦ (справа)
Скажу, что при старом владельце количество страниц в индексе было около 3.5к. Довольно забавный скачок из 108 страниц в 17к страниц, не находите? Дальше видно, что их количество только увеличивалось и в итоге Яндекс подавился. ТИЦ только падал
Если вы думаете, что сплошной копипаст это все, что поражает на этом сайте, то вы ошибаетесь. На каждой странице присутствует одинаковый текст на 3к символов, который различается одним ключевиком (например можно посмотреть на этой странице - уже лень скриншотить)
Итак, что мы имеем. Сайт, который был трастовым был перекуплен и стал площадкой для копипаста с двух популярных форумов. Еще раз - сайт состоит исключительно из копипаста. 600к страниц в индексе. Каждая страница состоит на 70% из одного и того же текста, который слегка меняется - как ключевик туда добавляется титл страницы. На 100% уверен, что сайт не имеет ПФ. По многим НЧ запросам этот сайт выше, чем его доноры.
Вывод
Для чего столько букв? Умные люди сделают для себя выводы. Но главное, что я хотел сказать - копипаст жив. И не как Ленин или Цой, а дает траф и позиции. И второе - траст это не миф, это серьезный фактор, который в данном случае сыграл свою роль на 100%.
P.s про реалити шоу помню, скоро отчитаюсь P.p.s про копирастов и лампочку это шутка, если что
Последний раз редактировалось TbIKBA; 02.02.2012 в 05:26.
Рассказы про вылет копипаста смешны, это как зомбирование прямо))) Да, если траст хоть какой-то есть у сайта, копипаст будет жить прекрасно, это я на собственном опыте знаю, не из серчевых мифов. А Гугл просто обожает форумы, чем наверняка и объясняется наличие в его индексе огромного количества страниц.
Непонятно только, зачем такой трастовый домен загубили почем зря, можно ведь было сделать прекрасный сайт и давить из него бабло раз в несколько больше, чем сейчас. И да, этот случай в очередной раз подчеркивает, что алгоритмы определения первоисточника у поисковиков до сих пор никудышные))
Прекрасный пост. Однако надо отдать должное истеричке Яндексу, в нем копипаст не прокатил :) Может от индексации закрыли, что бы робот лишний раз не грузил сервак, раз все равно АГС.
В Яндексе копипаст тоже отлично индексируется... у меня сайт был на 96к страниц в индексе Я, все копипаст... когда проводил эксперименты на эту тему...
кстати что за сайт, который показывал историю тиц, историю индексации.
Как уже сказал artorlov - это RDS
Сообщение от Maiwend
Может от индексации закрыли, что бы робот лишний раз не грузил сервак, раз все равно АГС.
Да, наверное это и есть причина, учитывая количество страниц
Сообщение от Orcstation
Ну да, копипаст жив. Фигня это. Во-первых ТС взял очень трастовый сайт, во-вторых он под АГС Копипаст жив как Ленин
Умение анализировать является одним из самых главных в СЕО, на мой взгляд. ТС специально привел в пример этот сайт, в котором можно оценить влияние отдельных факторов. Например - огромное количество неуникальных страниц в индексе не является пессемизирующим фактом для гугла. Кстати, обратите внимание - в Яндексе сайт прожил почти пол года. Делайте выводы для себя, намекаю - не обязательно полностью копировать чужие сайты.
Жаль, что нет архива за 2010 год, пока сайт был в я-индексе. Можно было бы посмотреть продавал ли он ссылки - тогда стало бы понятно каковы причины АГС