Так ведь название статьи не соответствует содержанию. В каком месте тут добыча контента? Тут тупо описано как проверить домены на наличие в вебархиве. А еще заплюсовали непонятно за что. Объясняю, вот имеем сайт с тысячами страниц в вебархиве. Задача: добыть с него контент. И как это сделать, ручками копировать каждую страницу? Понятно, что нужен какой-то скрипт, но статья вообще не об этом.
JumJum,Как по мне удобнее всего пользоваться фильтром Exele, a не поиском через ctrl+F. Лично я делаю так: выделяю столбец с доменами, на рабочей панели Exele есть выпадающее меню: Сортировка и фильтр, из выпавшего списка выбираем фильтр. Теперь обращаем внимание на столбец в верху которого появилась кнопка с выпадающим меню, нажимаем, со списка выбираем "текстовый фильтр" затем "равно". В поле "равно" вводим необходимый текст. После нажатия ОК, ячейки содержащие необходимую фразу сгруппируются в один столбец. Мне так проще фильтровать.