Помогите найти мусор

(Ответов: 8, Просмотров: 859)
  1. Designer, WebMaster Аватар для Dim4ik0
    • Регистрация: 25.01.2012
    • Сообщений: 156
    • Репутация: 18
    На сайте всего около 300 новостей, но в индексе почти 5к, что запретить?
    https://www.google.com/search?q=site...w=1280&bih=920
    • 0
  2. Опытный Аватар для NightHawk
    • Регистрация: 12.08.2011
    • Сообщений: 460
    • Репутация: 152
    А самим посмотреть? Изучаете как работают директивы robots.txt и вперед, свои 300 статей вы знаете, что к ним не относится, то мусор - убираете, по максимум меньшим количеством строк, не нужно всех например юзеров переписывать, Disallow: /user/ вполне хватит.
    /newposts/‎
    /tags/‎
    /user/
    и т.д и т.п.
    Юзаю этот хостинг с приятными ценами
    • 1

    Спасибо сказали:

    liveman(21.07.2013),
  3. работяга Аватар для liveman
    • Регистрация: 24.03.2011
    • Сообщений: 346
    • Репутация: 113
    • Webmoney BL: ?
    Добавлю

    /2013/ - закроете дубли архива
    /page/ - закроете дубли пагинации
    *lastcomments - закроете дубли комментариев
    • 0
  4. Banned
    • Регистрация: 04.06.2013
    • Сообщений: 172
    • Репутация: 50
    Я так полагаю, сайт на Вордпресе?
    Вот с одного своего снял робост.тхт
    Там все закрыто корме главной, страниц навигации и самих страниц и постов
    В вашем случае (у вас ведь обзорник-новостник)
    то некоторые строки возможно непригодятся

    Развернуть текст



    User-agent: *
    Disallow: /wp-login.php
    Disallow: /wp-register.php
    Disallow: /feed/
    Disallow: /cgi-bin
    Disallow: /wp-admin
    Disallow: /wp-includes
    Disallow: /wp-content/plugins
    Disallow: /wp-content/cache
    Disallow: /wp-content/themes
    Disallow: /trackback
    Disallow: */comments
    Disallow: /category/*/*
    Disallow: */trackback
    Disallow: */*/trackback
    Disallow: */*/feed/*/
    Disallow: */feed
    Disallow: /*?*
    Disallow: /?s=

    User-agent: Yandex
    Disallow: /wp-login.php
    Disallow: /wp-register.php
    Disallow: /feed/
    Disallow: /cgi-bin
    Disallow: /wp-admin
    Disallow: /wp-includes
    Disallow: /wp-content/plugins
    Disallow: /wp-content/cache
    Disallow: /wp-content/themes
    Disallow: /trackback
    Disallow: */comments
    Disallow: /category/*/*
    Disallow: */trackback
    Disallow: */*/trackback
    Disallow: */*/feed/*/
    Disallow: */feed
    Disallow: /*?*
    Disallow: /?s=
    Host: домен.ru

    Sitemap: http://домен.ru/sitemap.xml.gz
    Sitemap: http://домен.ru/sitemap.xml
    [свернуть]
    • 0
  5. Designer, WebMaster Аватар для Dim4ik0
    • Регистрация: 25.01.2012
    • Сообщений: 156
    • Репутация: 18
    GARGAR, На DLE 10

    NightHawk, liveman, Попробовал добавить к url в поиске /2013/ и прочее, везде не более 10 страниц, никак не 5к
    • 0
  6. работяга Аватар для liveman
    • Регистрация: 24.03.2011
    • Сообщений: 346
    • Репутация: 113
    • Webmoney BL: ?
    allinurl:/user/ site:htc-rom.ru/ - 228 страниц
    allinurl:/2013/ site:htc-rom.ru/- 89 страниц
    allinurl:/page/ site:htc-rom.ru/ - 72 страницы
    allinurl:lastcomments site:htc-rom.ru/ - 41 страница
    allinurl:/lastnews/ site:htc-rom.ru/ - 30 страниц
    allinurl:index.php site:htc-rom.ru/ - 57 страниц

    ну и по мелочи тэги и прочее (выше перечисленное) + комбинации из этих (например /page/ + lastcomments, или /user/ + /page/) = много результатов в выдаче :)

    И цифры выше не факт что именно такие, так как гугл урезает часть в показах (сопли).
    • 2

    Спасибо сказали:

    Dim4ik0(22.07.2013), NightHawk(22.07.2013),
  7. Гуру
    • Регистрация: 09.10.2011
    • Сообщений: 1,813
    • Репутация: 251
    Dim4ik0, пустая например
    Скрытый текст (вы должны зарегистрироваться или войти под своим логином):
    У вас нет прав чтобы видеть скрытый текст, содержащийся здесь.

    прогоните сайт
    http://home.snafu.de/tilman/xenulink.html узнаете много нового.
    • 0
  8. Designer, WebMaster Аватар для Dim4ik0
    • Регистрация: 25.01.2012
    • Сообщений: 156
    • Репутация: 18
    pyramida, Прогнал, всего пара ошибок и те с картинками.

    Этого хватит?

    Disallow: /engine/
    Disallow: /forum/
    Disallow: /backup/
    Disallow: /favorites/
    Disallow: /language/
    Disallow: /lastnews/
    Disallow: /newposts/
    Disallow: /tags/$
    Disallow: /templates/
    Disallow: /uploads/
    Disallow: /user/
    Disallow: /*print
    Disallow: /*do=pm
    Disallow: /*subaction=userinfo
    Disallow: /*subaction=newposts
    Disallow: /*do=addnews
    Disallow: /*do=lastnews
    Disallow: /*do=lastcomments
    Disallow: /*do=lostpassword
    Disallow: /*do=register
    Disallow: /*do=search
    Disallow: /addnews.html
    Disallow: /statistics.html
    Disallow: /search.html
    Disallow: /rules.html
    • 0
  9. Гуру
    • Регистрация: 09.10.2011
    • Сообщений: 1,813
    • Репутация: 251
    Цитата Сообщение от Dim4ik0 Посмотреть сообщение
    pyramida, Прогнал, всего пара ошибок и те с картинками.
    теперь смотрите адреса страниц и удаляйте. Но не через роботс, а нужно устанавливать метатег ноиндекс. Роботс только управляет сканированием.
    • 0

Тэги топика:

Похожие темы

Темы Раздел Ответов Последний пост
Помогите найти скрипт?
Web программирование 4 11.04.2013 00:23
Помогите найти ПП
Партнерские программы 11 24.01.2013 16:36
Помогите найти ПП
Оффтоп и свободные темы 10 22.01.2013 22:27
Помогите найти вредоносный код
Вопросы от новичков 4 10.04.2012 02:12
Помогите найти прогу
Софт, скрипты, сервисы 4 17.11.2009 01:57

У кого попросить инвайт?

Вы можете попросить инвайт у любого модератора:

Информеры