Доброго времени суток!
Заметил в панели вебмастера Яндекс, что некоторые страницы сайта исключены роботом из индекса.
Вот сам Robots.txt:
# This virtual robots.txt file was created by the PC Robots.txt WordPress plugin.
# For more info visit: _http://petercoughlin.com/robotstxt-wordpress-plugin/
User-agent: Yandex
Disallow: /cgi-bin
Disallow: /wp-admin
Disallow: /wp-login.php
Disallow: /wp-register.php
Disallow: /xmlrpc.php
Disallow: /wp-includes
Disallow: /wp-content/plugins
Disallow: /wp-content/cache
Disallow: /wp-content/themes
Disallow: /feed
Disallow: */feed
Disallow: /*.js$
Disallow: /*.inc$
Disallow: /*.css$
Disallow: /search/*/feed
Disallow: /search/*/*
Disallow: /tag/
Allow: /wp-content/uploads/
Host: сайт.ru
Sitemap: _http://сайт.ru/sitemap.xml.gz
User-agent: *
Disallow: /cgi-bin
Disallow: /wp-admin
Disallow: /wp-includes
Disallow: /wp-content/plugins
Disallow: /wp-content/cache
Disallow: /wp-content/themes
Disallow: /wp-trackback
Disallow: /wp-feed
Disallow: /wp-comments
Disallow: */trackback
Disallow: */feed
Disallow: */comments
Host: сайт.ru
Sitemap: _http://сайт.ru/sitemap.xml.gz
Исключены страницы типа: /?p=102, /?p=117, /?p=142 ... (т.е. новости).
Интересует, какая именно строка в Robots.txt повлияла на исключение выше указанных страниц?
- 17.04.2012 20:59
- 17.04.2012 21:15Дипломник

- Регистрация: 19.12.2009
- Сообщений: 145
- Репутация: 32
этот роботс не включает в себя правила для исключения такого рода страниц
возможно мета-тэг роботс в самих страницах
посмотрите исходный код страниц - 17.04.2012 22:14
- 17.04.2012 22:24
ctapbiu, вот мета тег для всех новостей: <meta name="robots" content="index,follow,noodp,noydir">.
Но, что с странно - примерно половина из всех новостей в индексе ...
---------- Сообщение добавлено 20:24 ---------- Предыдущее 20:22 ----------
Matsa, нет.
site.ru/?p=102 или site.ru/заголовок-статьи - 17.04.2012 22:40Дипломник

- Регистрация: 19.12.2009
- Сообщений: 145
- Репутация: 32
- 17.04.2012 22:44
ctapbiu, тоже самое: <meta name="robots" content="index,follow,noodp,noydir">.
- 17.04.2012 23:33Дипломник

- Регистрация: 19.12.2009
- Сообщений: 145
- Репутация: 32
Daniel_lt, можете проверить эти урлы на этой странице: webmaster.yandex.ru/robots.xml
но сдается мне что это не из-за роботса
а истинной причины не знаю - 17.04.2012 23:43
ctapbiu, проверил,
1 Ошибка:
39: Host: mmoreviews.ru - Найдено несколько директив Host
Спасибо за помощь, буду дальше разбираться ... :) - 18.04.2012 00:40
Из Яндекс.Вебмастер help.yandex.ru/webmaster/?id=996567
Важно: Директива Host в файле robots.txt может быть только одна. В случае указания нескольких директив, использоваться будет первая. - 18.04.2012 18:49
kstnews, в моем случае будет правильнее убрать первую или вторую директиву Host?
Тэги топика:
- cgi-bin,
- disallow,
- host,
- plugins,
- robots,
- site,
- sitemap,
- themes,
- trackback,
- uploads,
- user-agent,
- wp-admin,
- wp-comments,
- wp-content,
- wp-feed,
- wp-includes,
- wp-login,
- wp-register,
- wp-trackback,
- _http,
- быть,
- директива,
- индексация,
- новость,
- проблема,
- роботс,
- сайт,
- страница
Похожие темы
| Темы | Раздел | Ответов | Последний пост |
|---|---|---|---|
FAQ по robots.txt | Дайджест блогосферы | 12 | 12.02.2012 20:06 |
robots.txt | Web программирование | 4 | 10.08.2011 14:47 |
Robots.txt | Обучающие статьи | 12 | 30.06.2011 10:29 |
robots.txt | Вопросы от новичков | 3 | 18.03.2011 15:03 |
dle robots.txt | Web программирование | 3 | 08.01.2011 22:16 |





