Senior Member | Всем привет! =) Уже больше года использую очень удобный метод парсинга ссылок на страницах. Очень часто надо собрать все линки с какой либо страницы, например список ссылок на бесплатные прокси-листы, список ссылок на картинки да и просто ссылки на внутренние страницы сайта. В ручную их копипастить в некоторых случаях очень надоедливое, долгое и просто скушное занятие =) Делаеться все очень просто 1)Делаем закладку в том же ФаерФоксе 2)В и в ее свойствах в адрес пишем -
PHP код: javascript:all=document.links.length;mass='<b>Всего ссылок на странице:\u0020'+all+'</b><br><br>\n';for(i=0;i<all;i++){mass+=document.links[i]+'<br>\n';}newwind=window.open('about:blank','result','width=600,top=100,left=100,scrollbars=1');newwind.document.write(mass);
3)Сохраняем с название “Парсер” 4)Выводим эту закладку на Панель Закладок Все, наш парсер готов, теперь при нажатии на эту закладку-кнопку будет появляться окошко с списком всех ссылок на текущей странице =) Теперь разкажу как использовать этот парсер для парсинга выдачи google.com В обычной выдаче гугла ссылки имеют формат редиректа через сервер гугла и при сборе ссылок мы получим не адрес http://site.com а чтото на подобии http://www.google.com/url?sa=t&source=web&ct=res&cd=3&url=http%3A%2F%2Fw ww.site.com………. Нам такие ссылки не нужны, потому мы делаем умно, а именно смотрим упрощённую выдачу http://www.google.com/ie?q=&num=100&...&sa=N&filter=0 Этот линк также добавляем себе в закладки чтоб не вводить постоянно вручную. Вот и всё, теперь мы можем вводить любой запрос и собирать по 100 линков выдачи гугла переходя по страницам выдачи и так вплоть до 1000. Вариантов использования этого метода уйма. Я его использую чуть ли не каждый день и даже не представляю что бы я делал, если бы не знал эго =) Спасибо за внимание=) Последний раз редактировалось mr. werewolf; 03.09.2009 в 23:42. |