InFakes, добрый день! Я сканировал только Fine Readerом, так что на этот вопрос боюсь не отвечу. Но он во всем устраивает, не знаю чего больше желать:) Про второй вопрос хорошо, что спросили, сейчас в статье это добавлю. Самый действенный способ - без всяких знаков препинания взять отрывок текста и вставить его в поисковик в двойных кавычках. Т.е. к примеру часть вашего верхнего поста "какое программное обеспечение используете для получения контента"
Отличная статья. Хотя я пишу сам или покупаю готовые статьи, но этот метод обязательно испробую. Но к примеру, если искать в архивах, то тут загвоздка такая, не все сайты есть в архиве....
Sabirchik, так в списке доменов последняя графа показывает есть домен в вебархиве или нет... Shefarik, если у вас группа, то создайте конкурс по граффити или сочинению какому-нибудь, вот и контент:)
Прочитав статью решил попробовать. Единственное это то, что я знал про "умерший" с год назад сайт-конкурент. Залез в архив. В итоге получил 7 статей с 64-99% уникальности по Миралинкс. Неплохо! Спасибо ушло ТС
на уровне обсуждения. давеча с коллегами обсуждали мысль, почему сайты на идеально вылизанном и причесанном скане постоянно уходят под АГС . Одна из версий была следующей: Яшка таки хранит у себя информацию по забанненым сайтам и их контенту, если они попали под фильтр явного скана. Т.е., есть ГС на скане, пожил он месяц, потом агс и вылет из индекса. Прошел год. Я беру тот же источник контента, сканирую, проверяю по адвего. Ух ты, 100% уник! НО!!! Адвего проверяет по текущей общей базе (я условно так назову общий индекс) яндекса, отсюда и "уник". А яшка-то потом новый ГС сравнит со своей внутренней базой скана и отправит очередной "уникальный" сайт под фильтр. повторюсь - это лишь гипотеза, хочется услышать мнения на эту тему. Основным посылом для подобной теории - это систематический уход под фильтр сайтов на скане, даже если все на 100% вылизано и оформлено (переносы, разбивка на статьи итд итп)
Для всех лентяев (и для себя тоже) написал программу, которая отсеивает все домены без записей в вебархиве. Смысл ее прост. Качаете файл содержащий домены. Загружаете в программу и жмяк-жмяк кнопку "Очистить". На выходе получаете домены только в записями в вебархиве.