Вот вчеа нужна была прога для парсинга. Нашел BackLink Gear но он парсит со страниц. Но ето меделнно и кажды сайт нужно отдельно вводить. Написал небольшой скриптик, парсит беки сайтов которые находяться в файле urlyahoo.txt и ложит беки в backs.txt. Преимущество скрипта в том что он не шарит по страницам а качает .tsv в котором первые 1000 беков(лимит хоть по страницам шарь хоть файл скачай) но намного быстрее. Работает на курле. Кстати те урлы что отпарсил он из файла urlyahoo.txt удаляет (делал для себя спец. чтобы если скрипт вырубился и не рыскать в поисках того на каком урле он именно остановился) .Вот
п.с за роботу второго не ручаюсь(не тестил) ппс Только не надо говорить что скрипт криво написан)))согласен, можно было более рационально все сделать, но писал чисто для себя, а на красоту мне как-то пофиг)) только бы работал)
Один из самых удобных и функциональных паблик парсеров на сегодняшний день - безусловно Хрумер. Парсить с помощью этой тулзы одно удовольствие: быстрая настройка, подгонка шаблонов под выдачу нужной ПС,многопоточность, сохранение результатов в разных форматов, сортировка и прочие прелести. Единственный минус - Хрефер теперь поставляется только в комплекте с Хрумером, но зато достаточно много людей дающих сервера с вышеупопянутым софтом на прокат всего за несколько талеров.
Хрефер все же более масштабный и универсальный продукт. А вот конкретно под парсинг Яху вполне удобно использовать то, что предложил zifanchuck. К тому же можно конкретно под свои нужды доработать.