вот что записано в robot.txt:
User-agent: *
Disallow: /wp-login.php
Disallow: /wp-register.php
Disallow: /webstat/
Disallow: */feed$
Disallow: */trackback$
Disallow: */comments$
Disallow: /tag/
Disallow: /category/*/*
Disallow: /*?
Disallow: /*?*
Disallow: /wp-content/
Disallow: /wp-admin/
Disallow: /wp-includes/
User-agent: Yandex
Disallow: /wp-login.php
Disallow: /wp-register.php
Disallow: /webstat/
Disallow: */feed$
Disallow: */trackback$
Disallow: */comments$
Disallow: /tag/
Disallow: /category/*/*
Disallow: /*?
Disallow: /*?*
Disallow: /wp-content/
Disallow: /wp-admin/
Disallow: /wp-includes/
Host:********.ru
Sitemap: http://********.ru/sitemap.xml
естественно вместо звездочек сайт...
Так вот в яндексе 58 страниц в индексе а у гугла 1180, причем в гугле есть страницы с такими вот адресами:
http://********.ru/wp-content/plugin...2&r=1344531102
http://********.ru/wp-content/plugin...2&r=1343944030
как мне от такого добра избавится??
Гугл индексирует страницы, запрещенные в robot.txt
(Ответов: 11, Просмотров: 3008)
- 31.08.2012 20:36Дипломник


- Регистрация: 07.01.2012
- Сообщений: 104
- Репутация: 8
- 31.08.2012 20:40
а это вы смотрите страницы которые не под фильтром или ВСЕ страницы, которые есть в гугл?
- 31.08.2012 21:07Banned

- Регистрация: 22.05.2011
- Сообщений: 129
- Репутация: 23
User-agent: * или удалите второй абзац и все.
Сейчас у вас стоит запрет на индексирования только яндексомПоследний раз редактировалось 24list; 31.08.2012 в 21:11.
- 31.08.2012 21:20Дипломник


- Регистрация: 07.01.2012
- Сообщений: 104
- Репутация: 8
Dukhovnik, вроде как все страницы!
---------- Сообщение добавлено 19:20 ---------- Предыдущее 19:19 ----------
24list,разве строчка
User-agent: *
не означает что последующие за ней инструкции действительны для роботов всех поисковиков, включая и гугл??? - 31.08.2012 21:23Banned

- Регистрация: 22.05.2011
- Сообщений: 129
- Репутация: 23
да верно, но в следующем абзаце вы указываете инструкции только для Yandex, и предыдущие теряют всякий смысл
Последний раз редактировалось 24list; 31.08.2012 в 21:25.
- 31.08.2012 21:43Опытный

- Регистрация: 05.11.2011
- Сообщений: 335
- Репутация: 32
24list, почему предыдущие инструкции теряют смысл?
По теме, инструкции роботс - это не указание роботу, а лишь рекомендация. т.е. робот всё-равно может ходить по запрещённым страницам. другое дело, что он не включает их в индекс. почему у вас включил, понятия не имею. Единственный вариант, что робот проиндексировал эти страницы до того как вы написали этот роботс тхт. Если так, то эти страницы скоро вылетят из индекса, если не так...то понятия не имею. Подождём более продвинутых комментаторов) - 01.09.2012 22:17Дипломник

- Регистрация: 06.09.2009
- Сообщений: 203
- Репутация: 38
Да гугл вобще офигел в этом плане, на двух моих старых проектах такое было, помогло добавления ноуиндекса в метаописаниях страниц, а robots.txt гугл игнорировал по-полной...
- 02.09.2012 21:41Дипломник


- Регистрация: 07.01.2012
- Сообщений: 104
- Репутация: 8
кстати по запросу site:http://*****.ru
Выдает Результатов: примерно 1 180 (0,10 сек.)
Причем еще вот что пишет:
Чтобы показать наиболее значимые результаты, мы опустили некоторые, очень похожие на 35 уже показанных.
Если вы хотите, можно повторить поиск, включив опущенные результаты.
Может забить на это все?? или все же добиться исключения не нужных страниц?? - 02.09.2012 22:15
Кстати, та же проблема - если искать гуглом по "site: *****.ru", то выдает 2500 страниц, из которых 2400 - это сопли вида "*****.ru/категория/запись.htm?replytocom=165" или с фидом на конце и при этом в самой выдаче такие страницы помечены как "Описание веб-страницы недоступно из-за ограничений в файле robots.txt."
Черт, дак как их тогда удалить-то из выдачи вобще? - 02.09.2012 22:55Гуру

- Регистрация: 09.10.2011
- Сообщений: 1,813
- Репутация: 251
Тэги топика:
- ----------,
- category,
- comments,
- disallow,
- notcaptcha,
- plugins,
- robot,
- sitemap,
- trackback,
- user-agent,
- webstat,
- wp-admin,
- wp-content,
- wp-includes,
- wp-login,
- wp-notcaptcha,
- wp-register,
- гугл,
- запрещенный,
- иметь,
- индекс,
- индексировать,
- инструкция,
- опустить,
- показать,
- понятие,
- почему,
- результат,
- робот,
- роботс,
- страница
Похожие темы
| Темы | Раздел | Ответов | Последний пост |
|---|---|---|---|
Гугл не индексирует бэки | 12 | 22.07.2012 01:00 | |
Гугл не индексирует сайт | 14 | 26.06.2012 22:05 | |
Гугл не индексирует сайт | Вопросы от новичков | 1 | 19.06.2012 04:23 |
Drugrevenue и запрещенные препараты | Партнерские программы | 4 | 11.09.2009 02:18 |



