Заходить на страницы сайта и вытаскивать код PHP

(Ответов: 4, Просмотров: 1804)
  1. Well done. Аватар для zambrotta04
    • Регистрация: 16.11.2011
    • Сообщений: 511
    • Репутация: 90
    Добрый день, помогите написать код (в пхп особо не силен). Собственно ситуация такая - есть страницы сайта:
    htpp://site.ru/1/
    htpp://site.ru/2/
    ...
    htpp://site.ru/1000/
    На каждой странице есть таблица в первом столбце которой заключен в теги <a class="class2" href="site.ru/...>требуемый текст.</a>
    Как запилить такой скрипт который бы перебирал по очереди эти страницы и вытаскивал именно из этого столбца текст, и у которого именно этот стиль?
    • 0
  2. Гуру Аватар для Jeremen
    • Регистрация: 10.10.2011
    • Сообщений: 766
    • Репутация: 92
    • Webmoney BL: ?
    zambrotta04, дайте сайт в ЛС. Попробую сделать. И скажите куда сохранять нужно полученные данные?
    Последний раз редактировалось Jeremen; 13.04.2012 в 22:36.
    Время не любит, когда его тратят впустую.
    • 0
  3. Опытный Аватар для TBicTep
    • Регистрация: 08.06.2011
    • Сообщений: 342
    • Репутация: 64
    PHP код:
    <?
    function getUrl($url) {
    $curl curl_init(); 
    curl_setopt($curlCURLOPT_URL$url); 
    curl_setopt($curlCURLOPT_USERAGENT'User-Agent: Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; .NET CLR 2.0.50727)'); 
    curl_setopt($curlCURLOPT_HEADER,1); 
    curl_setopt($curlCURLOPT_AUTOREFERERtrue);   
    curl_setopt($curlCURLOPT_RETURNTRANSFER1); 
    curl_setopt($curlCURLOPT_TIMEOUT20); 
    $post curl_exec($curl);
    return 
    $post;
    }
    $text = array();
    for(
    $i=1;$i <= 1000;$i++)
    {
    $post getUrl("htpp://site.ru/$i/");
    preg_match('|<a class="class2" href="site.ru/(.*)>(.*)</a>|sU'$post$tmp);
    $text[] = $tmp['2'];
    echo 
    $tmp['2']."<br />";
    flush();
    }
    ?>
    В массиве $text будет нужный текст для дальнейшей обработки.
    • 1

    Спасибо сказали:

    aidem(15.04.2012),
  4. Студент
    • Регистрация: 13.09.2011
    • Сообщений: 64
    • Репутация: 23
    Сделаю все в лучшем виде за 15$
    • -2
  5. Orange Аватар для aidem
    • Регистрация: 11.11.2010
    • Сообщений: 502
    • Репутация: 127
    • Webmoney BL: ?
    TBicTep, уже исполнил всё в лучшем виде...
    если курл не работает на сервере то можно просто file_get_contents() сделать.
    А если ТСу интересно не PHP вариант, то смогу предоставить на Питоне или Баш-скриптом под Линуксы..
    • 0

Похожие темы

Темы Раздел Ответов Последний пост
Ссыла из рубрики в меню страницы сайта
Web программирование 5 28.02.2012 01:58
Подарочная партнерка для конкретной страницы сайта
Партнерские программы 7 13.11.2011 18:00
Как проиндексировать все страницы сайта
Вопросы от новичков 12 29.08.2011 18:47
Как проиндексировать все страницы сайта
Общие вопросы поисковой оптимизации 1 29.08.2011 12:09
Проверяем все страницы сайта на PR
Дайджест блогосферы 3 26.07.2011 18:40

У кого попросить инвайт?

Вы можете попросить инвайт у любого модератора:

Информеры