Кнопка Google +1 игнорирует файл robots.txt?

(Ответов: 2, Просмотров: 294)
  1. Гуру
    • Регистрация: 11.05.2011
    • Сообщений: 2,354
    • Репутация: 390
    На популярном западном форуме для вебмастеров Google Webmaster Help один из пользователей поднял вопрос о взаимодействии кнопки Google +1 и файла robots.txt.



    Он поинтересовался, следует ли кнопка директивам для робота Google. Если роботу запрещено обходить какой-то контент, а при этои пользователь Google нажал на +1, одобряя контент данной страницы, индексируется ли этот контент поисковиком?

    Вопрос не праздный, особенно в свете прошедшей недавно в рунете череды случаев утечки персональной информации пользователей в поисковые системы. Напомним, основной удар пришелся на Яндекс как самую популярную систему рунета. Яндекс также признал, что утечки могли происходить в ряде случаев с участием счетчика Я.Метрика, который действовал подобно кнопке +1, обсуждаемой сейчас в западном сообществе вебмастеров. Метрика узнавала о страницах, на которые обычным путем роботы попасть не могут, благодаря тому, что на них заходили пользователи (например, генерируемые со сложным урлом страницы в интернет-магазинах, на которые пользователь переходит только со своего email). Затем Метрика передавала информацию о страницах основному индексу, а поскольку эти страницы не были специально запрещены для индексации в файле robots.txt, дальше они оказывались уже в общедоступной выдаче.

    По поводу кнопки Google+1 представитель компании Дженни Мерфи ответила, что кнопка +1 взаимодействует с robots.txt и другими директивами для роботов интересным образом.
    «Поскольку кнопка +1 может применяться не только для открытых страниц, мы можем посетить страницу в момент клика по кнопке, чтобы определить, является ли она публичной. Эта проверка игнорирует директивы для роботов. Однако это не влияет на поведение поисковых роботов Google и на то, как они взаимодействуют с файлом robots.txt»
    , - пояснила Мерфи.
    На словах все это выглядит очень логично: все что запрещено в robots.txt, останется недоступно для общего индекса. Однако, как мы убедились на примере рунета, далеко не всегда конфиденциальные страницы оказываются скрыты от индексации (вебмастера тоже люди и тоже ошибаются), а растущее количество различных счетчиков и кнопок, которые получают информацию о посещенных пользователем страницах, на сайтах постоянно увеличивается.
    • 0
  2. Дипломник Аватар для Increazon
    • Регистрация: 14.04.2011
    • Сообщений: 147
    • Репутация: 24
    • Webmoney BL: ?
    "а растущее количество различных счетчиков и кнопок, которые получают информацию о посещенных пользователем страницах, на сайтах постоянно увеличивается" - на ГОВНОсайтах. Пару счетчиков поставил и хватит.
    • 0
  3. Студент Аватар для gertc
    • Регистрация: 05.06.2009
    • Сообщений: 33
    • Записей в дневнике: 7
    • Репутация: 4
    Не, ну закрыл её в роботсе и всё, проблем то
    • 0

Похожие темы

Темы Раздел Ответов Последний пост
Бесплатный парсер google с сохранением информации в файл.
Софт, скрипты, сервисы 8 25.07.2014 23:33
Кнопка Google +1
Web программирование 16 29.08.2011 01:04
Зачем нужен файл robots.txt и что делать если он игнорируется?
Дайджест блогосферы 0 22.06.2011 10:52
Файл robots.txt – важная часть блога
Дайджест блогосферы 11 15.01.2010 23:43

У кого попросить инвайт?

Вы можете попросить инвайт у любого модератора:

Информеры