Правильно ли составлен файл robots.txt для Wordpress

(Ответов: 11, Просмотров: 1480)
Страница 1 из 2 12 Последняя
  1. Опытный
    • Регистрация: 06.08.2013
    • Сообщений: 307
    • Репутация: 5
    На многих ресурсах читал про создание файла robots.txt. Создал и для своего сайта. Посмотрите пожалуйста, правильно я его сделал. Вот файл:
    User-agent:*
    Dissallow:/cgi-bin
    Dissalow:/wp-admin
    Dissalow:/wp-includes
    Dissalow:/wp-content/plugins
    Dissalow:/wp-content/cache
    Dissalow:/wp-content/themes
    Dissalow:/trackback
    Dissalow:*/trackback
    Dissalow:*/*/trackback
    Dissalow:*/*/feed/*/
    Dissalow:*/feed
    User-agent: Yandex
    Disallow: /cgi-bin
    Disallow: /wp-admin
    Disallow: /wp-includes
    Disallow: /wp-content/plugins
    Disallow: /wp-content/cache
    Disallow: /wp-content/themes
    Disallow: /trackback
    Disallow: */trackback
    Disallow: */*/trackback
    Disallow: */*/feed/*/
    Disallow: */feed
    Host:SoftGildia.com
    Sitemap:SoftGildia.com/sitemap.xml
    Я на своем сайте использую древовидные комментарии, а они создают дубли страниц. Как избавится от этого?
    Последний раз редактировалось SergeyNetIt; 08.02.2014 в 13:06.
    • 0
  2. Banned
    • Регистрация: 20.06.2012
    • Сообщений: 1,262
    • Репутация: 2251
    • Webmoney BL: ?
    Вот посмотрите пример: http://up-74.ru/robots.txt дополнительно закрыты категории, страничка автора
    • 0
  3. Гуру Аватар для KipiaSoft
    • Регистрация: 16.11.2009
    • Сообщений: 638
    • Записей в дневнике: 4
    • Репутация: 255
    • Webmoney BL: ?
    я бы еще добавил:
    запрет индексации архивов по датам (если есть записи и по другим годам добавляем аналогичную строчку с нужным годом)
    Dissalow: */2014/*

    Запрет индексации тегов:
    Dissalow: */tag/*

    Запрет индексации архивов по авторам:
    Disallow: /autor/*

    Запрет индексации категорий:
    Disallow: /category/*

    Запрет индексации комментариев
    Disallow: */comments

    Запрет индексации страниц сгенерированных поиском по сайту _тут нужно смотреть индивидуально по каждому сайту, у меня страницы с поиском выглядели примерно так)
    Disallow: /*?*
    Disallow: /*?
    Disallow: /?*
    • 0
  4. Опытный
    • Регистрация: 06.08.2013
    • Сообщений: 307
    • Репутация: 5
    KipiaSoft,А посмотрите на мой _http://fr3809bb.bget.ru/. А мне категорию закрывать не нужно. Если я ее запрещу, тогда не будет видно http://fr3809bb.bget.ru/category/prosmotrshiki/ то, что находится здесь. Список новостей. Или это не играет роли. Сами новости будут все равно проиндесированы. Просто не будут индексироваться сама страничка содержащая в себе список опубликованных в ней новостей http://joxi.ru/igT2Uv3JTJCXeWG0XAQ Так ли это?
    • 0
  5. Гуру Аватар для KipiaSoft
    • Регистрация: 16.11.2009
    • Сообщений: 638
    • Записей в дневнике: 4
    • Репутация: 255
    • Webmoney BL: ?
    Если я ее запрещу, тогда не будет видно _http://fr3809bb.bget.ru/category/prosmotrshiki/ то, что находится здесь. Список новостей.
    Создайте карту сайта, и будет видно все

    Просто не будут индексироваться сама страничка содержащая в себе список опубликованных в ней новостей
    А зачем ее индексировать? Ее уникальность нулевая. А для того что бы индексировался список всех новостей - для таких целей создается карта сайта.

    Кстати, в в файл robots.txt еще добавляю строчку для запрета страничек постраничной навигации:
    Dissalow: */page/*
    • 0
  6. Гуру Аватар для Vooda2012
    • Регистрация: 16.05.2012
    • Сообщений: 522
    • Репутация: 156
    Чтобы не открывать новую тему спрошу здесь.
    Есть 2 урла
    сайт.ру/блабла/
    и
    сайт.ру/блабла/play/

    Контент на них частично дублируется, поэтому естественно хочу закрыть одну страницу от индексации, а именно страницу сайт.ру/блабла/play/

    Прописал в robots
    Disallow: /play/
    но при проверке урла "сайт.ру/блабла/play/" в ЯВМ пишет, что он доступен для индексации? Что я сделал не так?
    И еще. Многие говорят, что гуглу часто пофиг на запреты в роботсе. Как средствами Wordpress можно прописать мета-тег noindex на всех страницах, урл которых заканчивается на /play/ ?
    • 0
  7. Гуру Аватар для KipiaSoft
    • Регистрация: 16.11.2009
    • Сообщений: 638
    • Записей в дневнике: 4
    • Репутация: 255
    • Webmoney BL: ?
    Что я сделал не так?
    звездочку забыл поставить:
    Disallow: */play/

    play после слеша без звездочку подразумевается что play идет сразу после названия домена. Звездочка подразумевает что между play и названием домена есть еще какие то буковки
    • 1

    Спасибо сказали:

    Vooda2012(08.02.2014),
  8. Гуру Аватар для Vooda2012
    • Регистрация: 16.05.2012
    • Сообщений: 522
    • Репутация: 156
    Большое спасибо.
    А по второму вопросу не подскажете? "Как средствами Wordpress можно прописать мета-тег noindex на всех страницах, урл которых заканчивается на /play/ ?"
    • 0
  9. Гуру Аватар для KipiaSoft
    • Регистрация: 16.11.2009
    • Сообщений: 638
    • Записей в дневнике: 4
    • Репутация: 255
    • Webmoney BL: ?
    Как средствами Wordpress можно прописать мета-тег noindex на всех страницах, урл которых заканчивается на /play/
    Если /play/ это категория, подкатегория или метка, то поставить noindex можно с помощью плагина All in One SEO Pack. Там галочку поставить нужно напротив соответствующего пункта настроек
    • 0
  10. Студент Аватар для nemetc
    • Регистрация: 03.12.2011
    • Сообщений: 46
    • Репутация: 10
    • Webmoney BL: ?
    Сначала и сам использовал длиннющий robots.txt пока не прочитал статью от Алаева в его блоге _http://alaev.info/blog/post/4143, применяю его метод и плагин All in One SEO Pack, пока хватает
    • 0
Страница 1 из 2 12 Последняя

Похожие темы

Темы Раздел Ответов Последний пост
Как создать карту сайта для поисковых систем. Файл robots.txt.
Дайджест блогосферы 2 06.02.2013 19:38
Зачем нужен файл robots.txt и что делать если он игнорируется?
Дайджест блогосферы 0 22.06.2011 10:52
Файл robots.txt – важная часть блога
Дайджест блогосферы 11 15.01.2010 23:43

У кого попросить инвайт?

Вы можете попросить инвайт у любого модератора:

Информеры