Работаем с Shop-Script - Репутация: 277
- Webmoney BL: ?
| Здравствуйте, Semion! Я уже много расписывал на этом форуме о дублях в Joomla. Расскажу и Вам)) Итак, для начала я Вам посоветую не использовать для борьбы с дублями только robots.txt. Мне кажется, что нужно бороться, так сказать, на корню! 1. Первое, что нужно сделать - это (желательно) не использовать сторонние компоненты для генерации ЧПУ. Я всё делаю через стандартный SEF Joomla. 2. Для начала убираем www и дубли с index.php в .htaccess. Код, указанный ниже, на моем сервере работает нормально. Если у Вас будут проблемы, то пробуйте другие варианты:
Код: RewriteEngine On
RewriteCond %{HTTP_HOST} ^www.joofaq.ru$ [NC]
RewriteRule ^(.*)$ http://joofaq.ru/$1 [R=301,L]
RewriteCond %{THE_REQUEST} ^[A-Z]{3,9}\ /index\.php\ HTTP/
RewriteRule ^index\.php$ http://joofaq.ru/ [R=301,L] 3. Теперь нужно избавиться от ID материалов (ссылки вида _sayt.ru/categoriya/20-material.html, где 20 - это и есть ID материала). Описанное ниже решение, работает только на Joomla 1.6/1.7/2.5 Вот подробный мануал по избавлению от этих цифр: _http://alex-leo.ru/joomla/116-ybiraem-id-iz-statei-joomla 4. Я использую плагин от sherza _http://joomlaforum.ru/index.php/topic,201567.0.html Это просто супер плагин, способный вылечить от 90 процентов всех дублей на сайте с Joomla 1.5 и Joomla 2.5. Кроме того, у них на сайте разработчика этого плагина есть форум, где Вам бесплатно помогут с настройкой этого плагина. Я там три дня мучил модератора по настройке плагина для нормальной работы joomla с галереей JoomGallery - и не заплатил ни копейки! Вот сайт _http://hekima.ru/shnodoubles 3. После проделанного выше, Вам остается лишь добавить в robots.txt некоторые пункты, чтобы не проскакивали системные страницы. Вот robots.txt моего блога _Joofaq.ru с пояснениями:
Код: User-agent: *
Allow: /index.php?option=com_xmap&view=xml&id=1 // разрешаю индексировать карту сайта Xmap
Allow: /*?start= // разрешаю индексировать пагинацию страниц
Disallow: /administrator/
Disallow: /cache/
Disallow: /cli/
Disallow: /components/
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Disallow: /libraries/
Disallow: /logs/
Disallow: /media/
Disallow: /modules/
Disallow: /plugins/
Disallow: /templates/
Disallow: /tmp/
Disallow: /feed/
Disallow: /component/
Disallow: /*? // запрещаю все страницы, в которых встречается символ "?"
Disallow: /*limit= // это опять же для пагинации. Запрет всех страниц с "limit="
Host: joofaq.ru // главное зеркало сайта. У меня без WWW
Sitemap: http://joofaq.ru/index.php?option=com_xmap&view=xml&id=1 // карта сайта 4. Вот, кстати, классная тема для настройки robots.txt на Joomla _http://joomlaforum.ru/index.php/topic,193446.0.html В этой теме Вы увидите, что нужно прописать для некоторых сторонних расширений, чтобы лишние страницы не попали в выдачу. Всё вышеперечисленное я делал не только на сайте, на котором нет сторонних расширений, но и на многих других проектах. При этом не возникало проблем с такими компонентами, как Virtuemart, Zoo, K2, JBZoo, JoomGallery и многих других похожих. Спасибо за внимание! Надеюсь, что Вам поможет эта статья! Последний раз редактировалось Павел Joofaq; 25.01.2013 в 15:38. |
|