ТС как и многие вебмастера забывает или не знает, что:
По умолчанию к концу каждого правила, описанного в robots.txt, приписывается '*'
Таким образом:
Сообщение от MacLeo
Disallow: */comment-page*
Тоже самое что и Disallow: */comment-page
Сообщение от MacLeo
Disallow: /page/* Disallow: /category/*/*
Тоже самое что и Disallow: /page Disallow: /category Зачем Вы ставите слеши в конце? Это просто лишнее.
Сообщение от MacLeo
Disallow: /year/* Disallow: /tag/*
Тоже самое что и Disallow: /year Disallow: /tag
Сообщение от MacLeo
Disallow: /*?* Disallow: /*?
Это одно и то же, достаточно написать Disallow: /*?
Сообщение от MacLeo
Disallow: /wp-admin/ Disallow: /wp-includes/
Слеши в конце не нужны. Если написать Disallow: /wp-admin/ то это не запрещает индексирование Disallow: /wp-admin
Сообщение от MacLeo
В папке wp-includes лежат еще папки плагинов, кеша, тем и картинок.
Очепятка. В папке wp-content
Сообщение от MacLeo
Disallow: /wp-content/
Роботс который Вы предлагаете, разрешает индексировать картинки только Яндексу, но не Гуглу. Также в разных источниках я читал, что нужно закрывать от индексации /xmlrpc.php, /cgi-bin, /wp-trackback, /wp-feed, /wp-comments, /archive, /author Лично у меня роботс такой (хотя возможно и в нём есть ошибки):
Gami, рубрики, в моем случае, не закрыты. Посмотрите внимательней, закрыты лишь страницы рубрик. Главная страница - доступна :) MtvKat, никогда не закрывал, и смысла закрывать всю папку не вижу. Я закрыл тот файл что мне мешает. krockki, с удовольствием послушаю Вас о пропущенных элементах в моем robots. Составил такой, так как уже так же не один год им вполне удачно пользуюсь и проблем никогда небыло :) dmg.shark, да и вполне удачно, получаю трафик :)
Сообщение от CherVal
ТС как и многие вебмастера забывает или не знает, что:
забыл, тут прокол :) Практически никогда не ставил, вот последнее время почему то начал ставить :)
Сообщение от CherVal
Слеши в конце не нужны. Если написать Disallow: /wp-admin/ то это не запрещает индексирование Disallow: /wp-admin
Поправил
Сообщение от CherVal
Роботс который Вы предлагаете, разрешает индексировать картинки только Яндексу, но не Гуглу.
Некоторые предыдущие ТС и автор MacLeo советуют закрыть метки и рубрики (Disallow: /tag/* Disallow: /category/*/*), чего делать категорический не рекомендую. В моем случае, после закрытия, трафик с поисковиков уже через 10 дней упал на 30%. Рассчитывал, что восстановится, но чуда не произошло.
Роботс обычно составляют на заре создания сайта, а не через полгода, год... Точнее так нужно делать. Метки и категории - это дубли, а дубли поисковики не любят. Абсолютно очевидно, что когда создаётся новый сайт, то все дубли нужно пытаться закрыть.
---------- Сообщение добавлено 15:20 ---------- Предыдущее 15:06 ----------
Сообщение от blazhnov
MacLeo, спасибо за статью. У меня один вопрос, касающийся защиты сайта на WP. Довольно часто сайты на WP взламывают, пытаясь подобрать логин и пароль админа, либо же изменить электронный ящик, на который админка высылает пароль на сайт в случае его утери. Для начала взлома сайта хакеру нужна страница ввода логина-пароля или страница запроса нового пароля. Используя ваш файл robots.txt злоумышленник видит адреса этих страниц.
На своих проектах я всегда переименовываю стандартные адреса страниц входа в админку и запроса нового пароля и не прописываю их в роботсе. Зачем запрещать эти страницы к индексированию, если ссылок на них нигде нет? Как поисковик попадет на нее, чтобы проиндексировать?
Не подскажите как их переименовать? Всмысле как переименовать понятно, но где потом прописать новые адреса чтобы всё работало. Я обычно прописываю блокировку доступа по ip в htaccess для директории wp-admin - после этого войти в site.ru/wp-admin можно только с моего ip. Если на сайте сделана регистрация/комментирование через какой-либо соц. плагин, кароче говоря если локальная регистрация пользователей не нужна - можно прописать также блокировку доступа по ip к файлу login.php Кроме того можно установить плагин Limit Login Attempts или аналогичные. Ещё можно через phpMyAdmin изменить admin на сложный набор букв (если вначале вы указали себя как "admin"). При этом на сайте при публикации материалов будет указываться ник автора, но не логин, который вы используете при входе в админку. Но это всё не относится к robots.txt, поэтому подробно тут расписывать не буду.
Роботс обычно составляют на заре создания сайта, а не через полгода, год... Точнее так нужно делать. Метки и категории - это дубли, а дубли поисковики не любят. Абсолютно очевидно, что когда создаётся новый сайт, то все дубли нужно пытаться закрыть.
Больше года дубли висели и поисковики их кушали на ура! Тогда с какой стати свалился трафик? Мало того, были закуплены хорошие ссылки, это не помогло. Подожду месяца два-три, если изменений не произойдет, открою рубрики и метки, проверю Ваше утверждение.
Gami, достаточно часто пользователь с поиска попадает на страницу выдачи результатов по определенному тегу, это не удобно для искавшего так как ему придется еще раз искать на Вашем сайте среди результатов сортировки по одной из меток. Метки выгодны в том случае, если Вы продаете ссылки с сайта в таких биржах как sape. Других плюсов я не вижу