Копипаст в индексе - миф или реальность? Разрушаем стереотип

(Ответов: 52, Просмотров: 8652)
Страница 1 из 6 123 Последняя
  1. Super Moderator Аватар для TbIKBA
    • Регистрация: 04.08.2011
    • Сообщений: 2,002
    • Репутация: 1574
    • Webmoney BL: ?
    Золотой пост
    Привет всем, на форуме периодически всплывают вопросы о копипасте, поэтому решил написать пару своих мыслей и рассмотреть один интересный пример. Не пиара ради, а пользы для :-) Для ленивых можно сразу прокрутить в конец статьи - там есть вывод

    Предыстория будет такая - периодически гугля некоторые сео-ориентированные вопросы (по типу "сколько нужно копирастов, что бы вкрутить лампочку") попадал на один сайт, не находя на нем ответа на свой вопрос щелкал дальше сайты в выдаче и, в итоге, попадал на серч, в котором уже повторно читал тоже самое, что и на том самом сайте. Такое положение дел меня заинтриговало, решил рассмотреть его поближе. Через некоторое время после своих выводов вдобавок прочел о нем у маула </prehistory>

    Речь пойдет о сайте ir-magazine.ru. На главной практически ничего нет, кроме карты сайта, самое интересное находится на его форуме. В двух словах - сайт полная копия серча и маултолка. В большинстве разделов находится более 100к сообщений, в одном из них - более миллиона. Должен ли выжить сайт, имеющий пару лямов страниц копипаста?
    Исходя из логики нормального, трезвого человека - нет. Исходя из необъяснимой логики Googla - почему бы и нет?

    Краткий анализ

    На скрине однозначно видно, что на данный момент в индексе 630 тысяч страниц.



    При этом множество страниц осталось не проиндексированными по причине прописанного robots.txt

    robots.txt

    User-agent: *
    Disallow: /cat/
    Disallow: /inform
    Disallow: /community/post
    Disallow: /community/user
    Disallow: /community/search.html
    Disallow: /community/login
    Disallow: /community/register
    Disallow: /community/feed
    Disallow: /community/redirect
    Disallow: /community/subscribe
    Disallow: /community/forum
    Disallow: /community/topic
    Disallow: /community/report
    Disallow: /community/delete
    Disallow: /community/edit
    Disallow: /community/new
    Disallow: /community/move
    Disallow: /community/close
    Disallow: /community/stick
    Disallow: /community/help
    Disallow: /community/get
    Disallow: /community/reputation
    Disallow: /community/pun_pm
    Disallow: /community/change
    Disallow: /community/admin
    Disallow: /community/viewforum
    Disallow: /community/viewtopic

    User-agent: Yandex
    Disallow: /

    Host: www.ir-magazine.ru
    [свернуть]

    - Довольно интересно, что сайт закрыт для индексации в Яндексе. Хотя в индексе одна страница присутствует, вероятней всего сайт схватил АГС (но зачем закрыт от индекса в robots.txt тогда? непонятно)
    Сайт имеет Alexa Rank:35,739, это около 2к посетителей в день (у Алексея aka Terehoff Rank:45,450).

    260 тысяч внешних ссылок



    Сейчас сайт имеет 325 ТИЦ, 5 PR

    Поковырявшись в истории я нашел, что всю жизнь сайта можно разделить на два периода - когда сайт еще был СДЛ (архив сайта за 2009 год) и когда сайт сменил владельца (2010 год). Как можно увидеть вот тут у сайта истек срок регистрации

    Судя по всему сайт был довольно трастовым - до февраля 2010 он имел 475 ТИЦ, после этого ТИЦ сделал скачек аж на 225 и стал равен 700 - вероятней всего сайт был добавлен в Яндекс Каталог (это предположение подтверждает то, что 08.05.2010 ТИЦ упал обратно, примерно в это же время произошло переоформление домена, а как известно, при переоформлении сайт вылетает из ЯК)
    Скрин:



    Дальше смотрим скрин с историей индексации в Яндексе (слева) и ТИЦ (справа)



    Скажу, что при старом владельце количество страниц в индексе было около 3.5к. Довольно забавный скачок из 108 страниц в 17к страниц, не находите? Дальше видно, что их количество только увеличивалось и в итоге Яндекс подавился. ТИЦ только падал

    Если вы думаете, что сплошной копипаст это все, что поражает на этом сайте, то вы ошибаетесь. На каждой странице присутствует одинаковый текст на 3к символов, который различается одним ключевиком (например можно посмотреть на этой странице - уже лень скриншотить)

    Итак, что мы имеем. Сайт, который был трастовым был перекуплен и стал площадкой для копипаста с двух популярных форумов. Еще раз - сайт состоит исключительно из копипаста. 600к страниц в индексе. Каждая страница состоит на 70% из одного и того же текста, который слегка меняется - как ключевик туда добавляется титл страницы. На 100% уверен, что сайт не имеет ПФ. По многим НЧ запросам этот сайт выше, чем его доноры.

    Вывод

    Для чего столько букв? Умные люди сделают для себя выводы. Но главное, что я хотел сказать - копипаст жив. И не как Ленин или Цой, а дает траф и позиции. И второе - траст это не миф, это серьезный фактор, который в данном случае сыграл свою роль на 100%.

    P.s про реалити шоу помню, скоро отчитаюсь
    P.p.s про копирастов и лампочку это шутка, если что
    Последний раз редактировалось TbIKBA; 02.02.2012 в 05:26.
    • 21

    Спасибо сказали:

    Agor71(14.02.2012), ArhStrAngeR(02.02.2012), artorlov(02.02.2012), chuwaka(02.02.2012), Docadept(03.02.2012), Igor_13(02.02.2012), Krez(02.02.2012), lexa82(02.02.2012), Limon4eg(02.02.2012), Maiwend(02.02.2012), masay(26.02.2012), nexUSA(06.02.2012), quadrat(02.02.2012), RuBig(28.02.2012), rutv(07.12.2015), Seopat(09.02.2012), sidash(02.02.2012), sinneren(02.02.2012), varyagov(02.02.2012), viotur(02.02.2012), vovasit91(08.02.2012), Демиург(02.02.2012),
  2. Квадрат, такой кубический Аватар для quadrat
    • Регистрация: 19.09.2011
    • Сообщений: 427
    • Репутация: 74
    • Webmoney BL: ?
    впечатлило, не уйдет ли он теперь по стуку?
    • 0
  3. Super Moderator Аватар для TbIKBA
    • Регистрация: 04.08.2011
    • Сообщений: 2,002
    • Репутация: 1574
    • Webmoney BL: ?
    quadrat, вы думаете он до этого был незаметным с 600 тысяч страниц в индексе и 2к посетителей в день? :-)

    Еще одна вещь, которая меня позабавила - это неизменный PR в течении 3-х лет. Яндекс с его скачками ТИЦ похож на истерику :)
    Последний раз редактировалось TbIKBA; 02.02.2012 в 05:42.
    • 0
  4. Гуру Аватар для Docadept
    • Регистрация: 15.04.2011
    • Сообщений: 627
    • Репутация: 232
    • Webmoney BL: ?
    Рассказы про вылет копипаста смешны, это как зомбирование прямо))) Да, если траст хоть какой-то есть у сайта, копипаст будет жить прекрасно, это я на собственном опыте знаю, не из серчевых мифов. А Гугл просто обожает форумы, чем наверняка и объясняется наличие в его индексе огромного количества страниц.

    Непонятно только, зачем такой трастовый домен загубили почем зря, можно ведь было сделать прекрасный сайт и давить из него бабло раз в несколько больше, чем сейчас. И да, этот случай в очередной раз подчеркивает, что алгоритмы определения первоисточника у поисковиков до сих пор никудышные))
    • 0
  5. Дипломник Аватар для Maiwend
    • Регистрация: 26.05.2011
    • Сообщений: 171
    • Репутация: 57
    • Webmoney BL: ?
    Прекрасный пост. Однако надо отдать должное истеричке Яндексу, в нем копипаст не прокатил :)
    Может от индексации закрыли, что бы робот лишний раз не грузил сервак, раз все равно АГС.
    Тут иногда пишу в свой блог.
    • 1

    Спасибо сказали:

    TbIKBA(02.02.2012),
  6. Старый Дорвейщик Оптимист Аватар для Думка
    • Регистрация: 07.03.2007
    • Сообщений: 687
    • Репутация: 367
    • Webmoney BL: ?
    В Яндексе копипаст тоже отлично индексируется... у меня сайт был на 96к страниц в индексе Я, все копипаст... когда проводил эксперименты на эту тему...
    • 0
  7. Квадрат, такой кубический Аватар для quadrat
    • Регистрация: 19.09.2011
    • Сообщений: 427
    • Репутация: 74
    • Webmoney BL: ?
    TbIKBA, кстати что за сайт, который показывал историю тиц, историю индексации.
    • 0
  8. Banned
    • Регистрация: 21.08.2011
    • Сообщений: 1,589
    • Репутация: 1009
    • Webmoney BL: ?
    quadrat,RDS...
    • 1

    Спасибо сказали:

    quadrat(02.02.2012),
  9. Пастафариани Аватар для Orcstation
    • Регистрация: 05.01.2011
    • Сообщений: 3,183
    • Записей в дневнике: 2
    • Репутация: 1427
    • Webmoney BL: ?
    Ну да, копипаст жив. Фигня это. Во-первых ТС взял очень трастовый сайт, во-вторых он под АГС :) Копипаст жив как Ленин :)
    ВДВ РФ — Вернёшься Домой В РеФрижераторе.
    • 0
  10. Super Moderator Аватар для TbIKBA
    • Регистрация: 04.08.2011
    • Сообщений: 2,002
    • Репутация: 1574
    • Webmoney BL: ?
    Цитата Сообщение от quadrat Посмотреть сообщение
    кстати что за сайт, который показывал историю тиц, историю индексации.
    Как уже сказал artorlov - это RDS

    Цитата Сообщение от Maiwend Посмотреть сообщение
    Может от индексации закрыли, что бы робот лишний раз не грузил сервак, раз все равно АГС.
    Да, наверное это и есть причина, учитывая количество страниц


    Цитата Сообщение от Orcstation Посмотреть сообщение
    Ну да, копипаст жив. Фигня это. Во-первых ТС взял очень трастовый сайт, во-вторых он под АГС Копипаст жив как Ленин
    Умение анализировать является одним из самых главных в СЕО, на мой взгляд. ТС специально привел в пример этот сайт, в котором можно оценить влияние отдельных факторов. Например - огромное количество неуникальных страниц в индексе не является пессемизирующим фактом для гугла. Кстати, обратите внимание - в Яндексе сайт прожил почти пол года. Делайте выводы для себя, намекаю - не обязательно полностью копировать чужие сайты.

    Жаль, что нет архива за 2010 год, пока сайт был в я-индексе. Можно было бы посмотреть продавал ли он ссылки - тогда стало бы понятно каковы причины АГС
    • 1

    Спасибо сказали:

    Krez(02.02.2012),
Страница 1 из 6 123 Последняя

Похожие темы

Темы Раздел Ответов Последний пост
TrustLink.ru Миф или реальность?
Биржи ссылок и статей, seo-сервисы 9 29.12.2011 22:55
Монетизация всего и вся. Реальность?
Партнерские программы 2 18.01.2011 12:03
Попасть в dmoz? Миф или реальность?
Дайджест блогосферы 14 18.07.2010 22:28
Песок - миф или реальность?
Вопросы от новичков 20 11.09.2009 11:13

У кого попросить инвайт?

Вы можете попросить инвайт у любого модератора:

Информеры