Хочу собрать свою базу бурж сайтов/блогов/форумов где можно оставить ссылочку, статью, коммент и т.д.. Для этого необходим парсер. Тк, что есть в наличии (Yandex Parser, Batterly) не годятся совсем ()нет антикаптчи итд. Потому ищу самую продвинутую програмку такого рода. Она должна поддерживать:
прокси, чтоб при бане йпишника сразу же начинал использовать другой
систему антикапчти антигейт
И программа должна обязательно парсить столько страниц, сколько я укажу, а не первые 100 или сто, как это часто бывает. Any suggestions?
п.с. Если кто занимается такого рода парсингом то велкам в личку.
Можно кей коллектором попробовать по признакам CMS пропарсить. Только нужно будет много проксей. Вообще гугл херово парсится. Можно еще яндекс распарсить кей коллектором по признакам CMS. Очень быстро это можно сделать использую xml лимиты.