Все мы знаем о клоакинге. Если кто не знает (в чем я сомневаюсь),- гугл вам в помощь (введите в поиск "что такое клоакинг"). Ставить редиректы после того, как дор залезет в топ я не люблю, потому что можно немного прозевать и траф пойдет мимо, а с конвертом 1:20 - 1:30 такое расточительство непозволительно :) Поэтому я и использую клоакинг.
Самое просто и наиболее эффективное из-за своей простоты - клоакинг по юзерагенту. Все оставляют след, а мы с помощью него будем отделять мух от котлет. Или котлет от мух. Ну, вообщем, вы меня поняли :)
Самое ценное здесь - это список юзерагентов к фильтрации. Обычно выделяют бесполезных негодяев, которые нагоняют траффик (краулеры левые, начинающие поисковички) и боты целевых поисковиков. Кто как делает - кто первым не отдает ничего, кто отдает контент и первой и второй категории ботов. Мой случай - второй.
Все просто, все понятно. Но это не все. Можно устроить дополнительную проверку для гуглобота для надежности. Если у вас UNIX-сервер, то следует попробовать вычислить гуглобота так:
PHP код:
if( FALSE !== strpos( gethostbyaddr($_SERVER['REMOTE_ADDR']), 'google'))
{
// это бот
}
else
{
// это не бот.
}
Не забывайте анализировать свои логи и вычислять надоедливых гадов :)
UPD:
Вот несколько диапазонов поисковых ботов. Также не будет лишним проверить.
Кстати, для неверующих и для тех, кто еще не знает :)
Дор с точно таким редиком с клоакингом живет в индексе уже на протяжении 4 месяцев, всплывая в топе примерно каждые 2 недели на 4-5 дней. Ой как приятно
Кстати, для неверующих и для тех, кто еще не знает :)
Дор с точно таким редиком с клоакингом живет в индексе уже на протяжении 4 месяцев, всплывая в топе примерно каждые 2 недели на 4-5 дней. Ой как приятно
Честное слово, удивлен без меры. Сколько раз не пробовал делать доры с клоакингом, часто просто не попадали в индекс даже, хотя другие хорошо индексируются. У меня такое впечатление, что гугл через раз палит клоакинг.
Честное слово, удивлен без меры. Сколько раз не пробовал делать доры с клоакингом, часто просто не попадали в индекс даже, хотя другие хорошо индексируются. У меня такое впечатление, что гугл через раз палит клоакинг.
Клоакинг же не только по юзерагенту существует. Тут нужен комплексный подход - по рефереру, по юзерагенту, по IP (зная IP подсетей поисковых ботов).
Диза на доре нет. Контент НЕ уникальный (еще доров *цать с таким же контентом). Тут еще от траста донора многое зависит, дело не только в редике, конечно же.
а то что гуглоботы заходят под юзерагентом "Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.8.0.7) Gecko/20060909 Firefox/1.5.0.7" и с реферером "__JC_UNKNOWN_VAR_cloak.daily-2009-08-19-62-00.vars.referer__" вас не смущает в схеме клоакинга?
если уж клоачить, то надо банить все диапазоны айпи которые относятся к гуглу, а ето ой как непросто. вариант смотреть хуисы, либо иметь сервис который смотрит к какой организации относится данный айпи. Один известный ВМ так делал. Жило прилично долго. вот пример http://whois.domaintools.com/74.125.45.100