Решил делать пушистый и белый во всех отношениях сайт. Сначала думал на голом html т.к. дублей нет, но подумал, что это достаточно муторно и решил выбрать родной WP. Поэтому возникло несколько вопрос по дублям, которые WP создает. 1) От меток я сразу отказался. (Правильное решение?) 2) Архивы закрывать от индексации? и вообще стоит их выводить на страницах сайта? ведь вес на них перетекает. 3) Категории стоит закрывать от индексации, при условии, что в категориях выводится только анонс статьи, и при этом сама статья получается девственно чистой? при условии, что написано описание категории объемом (300 символов) 4) Т.к. статей планируется достаточное множество, то в категориях и на главной странице будут дублироваться страницы типа /page/2, /page/3 и т.д. Нужно ли их закрывать от индексации? и вообще стоит ли использовать? (пр. PageNavi). Или просто выводить определенное количество новостей на главной без учета навигации по страницам? А в категориях просто выводить урлы всех страниц принадлежащих данной категории? Но получается что для пользователя это неудобно. Но на страницы /page/2 перетекает вес, причем имеется сайт где подобные страницы имеют пр3. В соседнем топике показывается пример редиректа:
но в данном случае пользователь не получит информации лежащей и на 2 странице ведь? П.С. видел плагин на WP, где пагинацию выводят ява скриптом. Не подскажите что за плагин? (ссылки из ява скрипта ведь пс не учитывают?)
1) Я рекомендую использовать, если метки созданы вручную. Но закрываю от индексации 2) закрывать. виджет не имеет смысла. 3) всех ссылок не закроешь :-)
Плагин не встречал. Идея отличная, я поищу в extend, если такого нет, то изменю pagenavi, это будет не сложно, и выложу в паблик
1) Правильно. Метки используются в ИМ и сложных по структуре сайтах. В отсальном это лишнее! 2) Кому интересны архивы?) Я зашел на сайт и такой. О интересно , а что же автор писал в ноябре 2007 .. ?:) Мусор, даже выводить не стоит 3) Рубрики.. Рубрики на главной странице ок, на внутряках в ноуиндексе) Как сделать? ищите условие, оно не сложное ) 4) пэйдж нави использовать стоит.) Сами page луче закрыть в роботс.тхт ) чтобы поисковики их вообще в выдачу не выгружали) Тоже самое стоит сделать и с ?replytocom=810 . Закрыть в роботс.тхт, типа *replytocom* О правилах роботс.тхт можете почитать в гугле)
или скопировать вот эти строки и добавить в роботс.тхт + погуглить и понять как правильно добавить туда страницы, в урле которых присутствует "replytocom" :) Это так, для саморазвития, а не просто скопировал-вставил:)
Для белого и пушистого сайта дубликаты нужно исключать, дабы не портили и не разбавляли выдачу. Я недавно запустил новый сайт на WP. Ничего не закрывал, кроме урлов на feed и comments. Как ни странно, но Яндекс и Google индексируют в основном только страницы со статьями и архивы категорий. Остальные (page, author и т.д.) мигают в индексе.
С другой стороны, я не закрываю такие страницы как tag по причине того, что они могут сыграть отличную роль для той же выдачи. На моем опыте не раз страницы tag занимали места в топе по некоторым запросам, ибо на этих страницах были собраны сугубо релевантные статьи (главное, чтоб они еще были линкованы между собой по теме событий и т.д.). Таким образом, в частности, Google отдал мне 2 позиции в ТОП-6. 6-е занимала страница tag.
Поэтому, если вы с умом будете тэгировать статьи так, чтобы формировался некий внутренний архив по конкретной теме или событию (это хорошо видно на СМИ порталах), то страницы дублей дадут вам дополнительные бонусы в выдаче. Не зря Wordpress ввел и расширил таксономию.
Я описал частный случай. И в моей практике именно tag страницы играли роль. Archive, author (вообще бред) и т.д. имели место только для накрутки счетчика индекса.
а если категории закрыты от индексации, то робот индексирует посты с категорий?
Индексирует. <noindex> еще не означает, что робот не переходит по этой ссылке на посты :) Видел не мало сайтов, где ссылки на рубрики закрыты вообще на всех страница (и на главной тоже). Т.е. ПС индексировали только single страницы. Кстати, это один из альтернативных способов закрыть от индексации технические страницы.