Добрый день, помогите написать код (в пхп особо не силен). Собственно ситуация такая - есть страницы сайта:
htpp://site.ru/1/
htpp://site.ru/2/
...
htpp://site.ru/1000/
На каждой странице есть таблица в первом столбце которой заключен в теги <a class="class2" href="site.ru/...>требуемый текст.</a>
Как запилить такой скрипт который бы перебирал по очереди эти страницы и вытаскивал именно из этого столбца текст, и у которого именно этот стиль?
- 13.04.2012 23:02
- 13.04.2012 23:29
zambrotta04, дайте сайт в ЛС. Попробую сделать. И скажите куда сохранять нужно полученные данные?
Последний раз редактировалось Jeremen; 13.04.2012 в 23:36.
- 14.04.2012 13:10PHP код:В массиве $text будет нужный текст для дальнейшей обработки.
<?
function getUrl($url) {
$curl = curl_init();
curl_setopt($curl, CURLOPT_URL, $url);
curl_setopt($curl, CURLOPT_USERAGENT, 'User-Agent: Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; .NET CLR 2.0.50727)');
curl_setopt($curl, CURLOPT_HEADER,1);
curl_setopt($curl, CURLOPT_AUTOREFERER, true);
curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($curl, CURLOPT_TIMEOUT, 20);
$post = curl_exec($curl);
return $post;
}
$text = array();
for($i=1;$i <= 1000;$i++)
{
$post = getUrl("htpp://site.ru/$i/");
preg_match('|<a class="class2" href="site.ru/(.*)>(.*)</a>|sU', $post, $tmp);
$text[] = $tmp['2'];
echo $tmp['2']."<br />";
flush();
}
?>Спасибо сказали:
aidem(15.04.2012), - 15.04.2012 22:52Студент

- Регистрация: 14.09.2011
- Сообщений: 64
- Репутация: 23
Сделаю все в лучшем виде за 15$
- 15.04.2012 23:12
TBicTep, уже исполнил всё в лучшем виде...
если курл не работает на сервере то можно просто file_get_contents() сделать.
А если ТСу интересно не PHP вариант, то смогу предоставить на Питоне или Баш-скриптом под Линуксы..
Похожие темы
| Темы | Раздел | Ответов | Последний пост |
|---|---|---|---|
Ссыла из рубрики в меню страницы сайта | Web программирование | 5 | 28.02.2012 01:58 |
Подарочная партнерка для конкретной страницы сайта | Партнерские программы | 7 | 13.11.2011 18:00 |
Как проиндексировать все страницы сайта | Вопросы от новичков | 12 | 29.08.2011 19:47 |
Как проиндексировать все страницы сайта | Общие вопросы поисковой оптимизации | 1 | 29.08.2011 13:09 |
Проверяем все страницы сайта на PR | Дайджест блогосферы | 3 | 26.07.2011 19:40 |




