robots - кто-нибудь сталкивался с подобным?

(Ответов: 13, Просмотров: 1660)
Страница 1 из 2 12 Последняя
  1. Дипломник
    • Регистрация: 25.01.2013
    • Сообщений: 233
    • Репутация: 61
    • Webmoney BL: ?
    Код:
    User-agent: * 
    Disallow: /a/ 
    Disallow: /stat/ 
    Disallow: /index/1 
    Disallow: /index/2 
    Disallow: /index/3 
    Disallow: /index/5 
    Disallow: /index/7 
    Disallow: /index/8 
    Disallow: /index/9 
    Disallow: /panel/ 
    Disallow: /admin/ 
    Disallow: /secure/ 
    Disallow: /informer/
    Disallow: /search 
    Disallow: /shop/order/ 
    Disallow: /news/1*
    Disallow: /news/2*
    Disallow: /news/3*
    Disallow: /news/4*
    Disallow: /news/5*
    Disallow: /news/6*
    Disallow: /news/7*
    Disallow: /news/8*
    Disallow: /news/9*
    Disallow: /file/
    Disallow: /publ/0-*
    Вот robots.txt экспериментального сайта, находится он на ucoze, так как сайт экспериментальный и выделять ему место на хостинге мне не хочется. Как видите, он немного обрезан, так как публиковать хост и сайтмап мне не требуется.
    Проблема в следующем, в яндексе запрещенные каталоги и адреса не индексируются, но в поиске Google в индексе крепко держатся некоторые странички из этих каталогов, особенно из /secure/, хотя, по сути, от индекса они закрыты. Может быть кто-нибудь сталкивался с подобной проблемой на данном "движке", написание отдельного блока под Гугл тоже не спасает..
    • 0
  2. Гуру Аватар для 3s777
    • Регистрация: 09.02.2013
    • Сообщений: 1,417
    • Репутация: 384
    • Webmoney BL: ?
    Как долго они в гугле держаться? Может они в соплях? В сниппете не написано "Описание закрыто в robots.txt"?
    • 0
  3. Гуру
    • Регистрация: 09.10.2011
    • Сообщений: 1,813
    • Репутация: 251
    klassman, роботся для гугла управляет сканированием, а не индксированием. Мысль понятна?
    • 0
  4. Дипломник
    • Регистрация: 25.01.2013
    • Сообщений: 233
    • Репутация: 61
    • Webmoney BL: ?
    3s777, Описание веб-страницы недоступно из-за ограничений в файле robots.txt, просто не особо я с этим движком дружу)
    Последний раз редактировалось klassman; 13.10.2013 в 18:29.
    • 0
  5. Новичок
    • Регистрация: 23.10.2013
    • Сообщений: 8
    • Репутация: 1
    "Хотя Google не сканирует и не индексирует содержание страниц, заблокированных в файле robots.txt, URL, обнаруженные на других страницах в Интернете, по-прежнему могут добавляться в индекс." - https://support.google.com/webmaster...r/156449?hl=ru

    Отправь в панели вебмастера запрос на удаления из выдачи этих страниц. Однако, если на данные страницы ведут внешние ссылки, есть вероятность, что они снова попадут в индекс.

    В таком случае можешь прописать rel="canonical" для этих страниц - https://support.google.com/webmaster...r/139394?hl=ru
    • 0
  6. Гуру
    • Регистрация: 09.10.2011
    • Сообщений: 1,813
    • Репутация: 251
    Цитата Сообщение от klassman Посмотреть сообщение
    3s777, Описание веб-страницы недоступно из-за ограничений в файле robots.txt, просто не особо я с этим движком дружу)
    Дело не в движке. Дело в том, что роботс не управляет индексированием, как я и писал. Вам нужно использовать метатег ноиндекс, чтобы удалить не нужное из индекса и только потом закрывать в роботс. Только так сработает в гугле.
    • 0
  7. Дипломник
    • Регистрация: 25.01.2013
    • Сообщений: 233
    • Репутация: 61
    • Webmoney BL: ?
    pyramida, как я по-вашему закрою от индексации определенную капчу?))
    • 0
  8. Гуру
    • Регистрация: 09.10.2011
    • Сообщений: 1,813
    • Репутация: 251
    klassman, уточните урл страниц?
    • 0
  9. Гуру Аватар для genjnat
    • Регистрация: 30.11.2010
    • Сообщений: 2,884
    • Репутация: 2594
    • Webmoney BL: ?
    Цитата Сообщение от pyramida Посмотреть сообщение
    Дело в том, что роботс не управляет индексированием,
    Интересно, с каких это пор
    Цитата Сообщение от pyramida Посмотреть сообщение
    Вам нужно использовать метатег ноиндекс
    та хоть 404, в гугле если попало в индекс, то до полугода там сидеть будет.
    Выбить по быстрому можно только через панель ГВМ
    • 0
  10. Гуру
    • Регистрация: 09.10.2011
    • Сообщений: 1,813
    • Репутация: 251
    genjnat, читаем
    -----
    Чтобы полностью исключить вероятность появления контента страницы в индексе Google, даже если на нее ссылаются другие сайты, используйте метатег noindex или x-robots-tag. По мере сканирования страниц, робот Googlebot обнаружит метатег noindex и не станет отображать страницу в индексе. HTTP-заголовок x-robots-tag рекомендуется использовать, чтобы исключить из индекса файлы, формат которых отличается от HTML (например, изображения или другие типы документов).
    ------
    Пруфа хватает, на гугле форуме и серче.
    • 0
Страница 1 из 2 12 Последняя

Похожие темы

Темы Раздел Ответов Последний пост
Похожие товары в e-Commerce. Кто сталкивался?
WordPress 3 30.08.2013 12:52
Кто сталкивался с установкой видеонаблюдения?
Оффтоп и свободные темы 7 23.05.2013 15:27
Вирус на сайте - Troj/ExpJS-IE. Сталкивался кто-нибудь?
Консультации по безопасности 4 27.03.2013 14:30
Кто сталкивался с этим компонентом?
Web программирование 1 01.12.2011 21:28
Капча на wordstat.yandex. Кто сталкивался?
Прочее 12 19.07.2011 22:51

У кого попросить инвайт?

Вы можете попросить инвайт у любого модератора:

Информеры