Проблемы с индексации и Robots.txt

(Ответов: 15, Просмотров: 1334)
Страница 1 из 2 12 Последняя
  1. Студент Аватар для Daniel_lt
    • Регистрация: 16.02.2012
    • Сообщений: 52
    • Репутация: 4
    Доброго времени суток!
    Заметил в панели вебмастера Яндекс, что некоторые страницы сайта исключены роботом из индекса.

    Вот сам Robots.txt:

    # This virtual robots.txt file was created by the PC Robots.txt WordPress plugin.
    # For more info visit: _http://petercoughlin.com/robotstxt-wordpress-plugin/

    User-agent: Yandex
    Disallow: /cgi-bin
    Disallow: /wp-admin
    Disallow: /wp-login.php
    Disallow: /wp-register.php
    Disallow: /xmlrpc.php
    Disallow: /wp-includes
    Disallow: /wp-content/plugins
    Disallow: /wp-content/cache
    Disallow: /wp-content/themes
    Disallow: /feed
    Disallow: */feed
    Disallow: /*.js$
    Disallow: /*.inc$
    Disallow: /*.css$
    Disallow: /search/*/feed
    Disallow: /search/*/*
    Disallow: /tag/
    Allow: /wp-content/uploads/
    Host: сайт.ru
    Sitemap: _http://сайт.ru/sitemap.xml.gz

    User-agent: *
    Disallow: /cgi-bin
    Disallow: /wp-admin
    Disallow: /wp-includes
    Disallow: /wp-content/plugins
    Disallow: /wp-content/cache
    Disallow: /wp-content/themes
    Disallow: /wp-trackback
    Disallow: /wp-feed
    Disallow: /wp-comments
    Disallow: */trackback
    Disallow: */feed
    Disallow: */comments
    Host: сайт.ru

    Sitemap: _http://сайт.ru/sitemap.xml.gz

    Исключены страницы типа: /?p=102, /?p=117, /?p=142 ... (т.е. новости).
    Интересует, какая именно строка в Robots.txt повлияла на исключение выше указанных страниц?
    • 0
  2. Дипломник
    • Регистрация: 19.12.2009
    • Сообщений: 145
    • Репутация: 32
    этот роботс не включает в себя правила для исключения такого рода страниц
    возможно мета-тэг роботс в самих страницах
    посмотрите исходный код страниц
    • 0
  3. Гуру Аватар для Matsa
    • Регистрация: 11.02.2012
    • Сообщений: 1,344
    • Репутация: 558
    • Webmoney BL: ?
    Цитата Сообщение от Daniel_lt Посмотреть сообщение
    Disallow: /search/*/*
    может быть из за этой?
    посматрите полный урл, он такой случаной?
    site.ru/search/?p=102
    Читаю https://bankstoday.net/ и стал разбираться в экономике и финансах
    • 0
  4. Студент Аватар для Daniel_lt
    • Регистрация: 16.02.2012
    • Сообщений: 52
    • Репутация: 4
    ctapbiu, вот мета тег для всех новостей: <meta name="robots" content="index,follow,noodp,noydir">.
    Но, что с странно - примерно половина из всех новостей в индексе ...

    ---------- Сообщение добавлено 20:24 ---------- Предыдущее 20:22 ----------

    Matsa, нет.
    site.ru/?p=102 или site.ru/заголовок-статьи
    • 0
  5. Дипломник
    • Регистрация: 19.12.2009
    • Сообщений: 145
    • Репутация: 32
    Цитата Сообщение от Daniel_lt Посмотреть сообщение
    вот мета тег для всех новостей:
    а на странице /?p=102
    ?
    • 0
  6. Студент Аватар для Daniel_lt
    • Регистрация: 16.02.2012
    • Сообщений: 52
    • Репутация: 4
    ctapbiu, тоже самое: <meta name="robots" content="index,follow,noodp,noydir">.
    • 0
  7. Дипломник
    • Регистрация: 19.12.2009
    • Сообщений: 145
    • Репутация: 32
    Daniel_lt, можете проверить эти урлы на этой странице: webmaster.yandex.ru/robots.xml
    но сдается мне что это не из-за роботса
    а истинной причины не знаю
    • 0
  8. Студент Аватар для Daniel_lt
    • Регистрация: 16.02.2012
    • Сообщений: 52
    • Репутация: 4
    ctapbiu, проверил,
    1 Ошибка:
    39: Host: mmoreviews.ru - Найдено несколько директив Host

    Спасибо за помощь, буду дальше разбираться ... :)
    • 0
  9. Студент Аватар для kstnews
    • Регистрация: 18.02.2012
    • Сообщений: 93
    • Репутация: 8
    • Webmoney BL: ?
    Из Яндекс.Вебмастер help.yandex.ru/webmaster/?id=996567
    Важно: Директива Host в файле robots.txt может быть только одна. В случае указания нескольких директив, использоваться будет первая.
    • 0
  10. Студент Аватар для Daniel_lt
    • Регистрация: 16.02.2012
    • Сообщений: 52
    • Репутация: 4
    kstnews, в моем случае будет правильнее убрать первую или вторую директиву Host?
    • 0
Страница 1 из 2 12 Последняя

Похожие темы

Темы Раздел Ответов Последний пост
FAQ по robots.txt
Дайджест блогосферы 12 12.02.2012 19:06
robots.txt
Web программирование 4 10.08.2011 14:47
Robots.txt
Обучающие статьи 12 30.06.2011 10:29
robots.txt
Вопросы от новичков 3 18.03.2011 15:03
dle robots.txt
Web программирование 3 08.01.2011 21:16

У кого попросить инвайт?

Вы можете попросить инвайт у любого модератора:

Информеры