При определении уникальности статьи гугл по логике должен обращатся к своему кешу (хранилищу контента сайтов). Подтверждением того что гугл сравнивает контент с контентом кеша является включение в Адвего этого механизма проверки. Мне кажется все другие сервисы и программы скоро добавят такую функцию.
Интересует следующее. Если гугл делает вывод об уникальности статьи на основе хранилища своего кеша(а это копия сайтов в определенное время), то возможно создать парсер из контента кеша который бы выдавал пропавший контент (например 5 Марта была статья а 6 ее удалили), но опять же это задание осложняется вероятностью невозможности контента стать вновь уникальным если он был проиндексирован.

P.S. Немного сумашедший пост, всегда так когда имею дело с новым и тем чего лично не проверял