Помогите с написанием скрипта с помощью библиотеки PHP Simple HTML DOM Parser

(Ответов: 8, Просмотров: 1650)
  1. Опытный
    • Регистрация: 21.11.2013
    • Сообщений: 407
    • Репутация: 58
    Здраствуйте!
    Решил написать небольшой парсер для личных нужд.Суть его в том чтобы парсить названия фильмов с одного сайта.Я уже написал основную часть с помощью библиотеки PHP Simple HTML DOM Parser.Получилось вот что -
    PHP код:
    <?php 
    header
    ('Content-Type: text/html; charset=UTF-8'); 
    include(
    'simple_html_dom.php'); 
    $html file_get_html('http://kiino.ru/films/'); 
    foreach(
    $html->find('ul[class="films-gallery large"]') as $e); 
    echo 
    $e->plaintext ;  
    ?>
    Теперь проблемы:
    1)Когда я получаю результат,сразу падает в глаза не нужные элементы.Это описания к фильмам(около 2-4 слов).Я пытался удалить , облазил весь интернет - так и не решил проблему.+ ко всему это описание есть не у всех фильмов,а только у некоторых
    2)Опять же когда я получаю результат-получается все в одну строку.Нужно чтобы каждое название переносилось
    P/S - Я в php сам плохо разбираюсь так что извиняюсь за тупые\тупой возможно вопрос(ы) и прошу обьяснить во всех деталях как решить эти проблемы...
    Заранее спасибо!
    • 0
  2. Дипломник Аватар для Ispanec
    • Регистрация: 27.04.2010
    • Сообщений: 142
    • Репутация: 33
    PHP код:
    <?php 
    header
    ('Content-Type: text/html; charset=UTF-8'); 
    include(
    'simple_html_dom.php'); 
    $html file_get_html('http://kiino.ru/films/'); 
    foreach(
    $html->find('ul[class="films-gallery large"] strong a') as $e){ 
    echo 
    "<p>".$e->plaintext."</p>\n" ;  
    }
    ?>
    Последний раз редактировалось Ispanec; 15.02.2015 в 17:21.
    «Если кто не хочет трудиться, тот и не ешь!» © Послание апостола Павла к Фессалоникийцам, гл. 3, ст. 10
    • 1

    Спасибо сказали:

    Max111(15.02.2015),
  3. Quae res omnia Аватар для Coder
    • Регистрация: 29.01.2015
    • Сообщений: 821
    • Репутация: 299
    Цитата Сообщение от Max111 Посмотреть сообщение
    Суть его в том чтобы парсить названия фильмов с одного сайта
    Немного непонятно:
    Цитата Сообщение от Max111 Посмотреть сообщение
    ,сразу падает в глаза не нужные элементы.Это описания к фильмам(около 2-4 слов)
    Варианты следующие - во-первых, попробуйте заменить plaintext на innertext и потом на outertext и посмотрите, что получается и в каких элементах находится ненужное.

    Посмотрите документацию _http://simplehtmldom.sourceforge.net/, там показано, как и получить нужное, и как приклеить что нужное - например, тег переноса.

    Возможен вариант промежуточной записи получаемого в файл, обработки не только средствами парсера, и вывод в нужном виде.
    • 1

    Спасибо сказали:

    Max111(15.02.2015),
  4. Опытный
    • Регистрация: 21.11.2013
    • Сообщений: 407
    • Репутация: 58
    Coder,Ispanec, Спасибо.Работает все...Теперь каким образом это все в txt файлик запихнуть без тегов?
    • 0
  5. Quae res omnia Аватар для Coder
    • Регистрация: 29.01.2015
    • Сообщений: 821
    • Репутация: 299
    Цитата Сообщение от Max111 Посмотреть сообщение
    Теперь каким образом это все в txt файлик запихнуть без тегов?
    Если правильно понял и если вы используете вышеприведенный код (см. результат в файле file_example.txt):
    Скрытый текст (вы должны войти под своим логином или зарегистрироваться и иметь 1 сообщение(ий)):
    У вас нет прав чтобы видеть скрытый текст, содержащийся здесь.


    Собственно, можно и без strip:
    Скрытый текст (вы должны войти под своим логином или зарегистрироваться и иметь 1 сообщение(ий)):
    У вас нет прав чтобы видеть скрытый текст, содержащийся здесь.
    Последний раз редактировалось Coder; 16.02.2015 в 00:14. Причина: Исправил расширение файла в коде на txt
    • 1

    Спасибо сказали:

    Max111(16.02.2015),
  6. Гуру
    • Регистрация: 09.10.2011
    • Сообщений: 1,814
    • Репутация: 251
    Цитата Сообщение от Max111 Посмотреть сообщение
    PHP Simple HTML DOM Parser
    Я с ним долго парился. Но потом плюнул и купил Content Downloader и все :)
    • 0
  7. Студент Аватар для Михаил Роганин
    • Регистрация: 12.02.2015
    • Сообщений: 47
    • Репутация: 21
    Я постоянно с этой библиотечкой парсеры пишу. Очень удобно да и функционал нормальный такой. Вот как раз на своём блоге писал о создании php парсера. Может кто прочтёт, если станет интересно.
    • 2

    Спасибо сказали:

    Max111(16.02.2015), west0293(16.02.2015),
  8. Гуру Аватар для west0293
    • Регистрация: 09.06.2011
    • Сообщений: 1,025
    • Репутация: 342
    • Webmoney BL: ?
    Михаил Роганин, хорошая статья, мне понравилась) твитнул в знак благодарности) пойду оттачивать свои навыки в Php)
    • 0
  9. Опытный
    • Регистрация: 21.11.2013
    • Сообщений: 407
    • Репутация: 58
    Coder,Огромное спасибо!Тему можно закрыть :)
    P.S - возможно в будущем обращусь к вам и попрошу что-то сделать за определенную плату :)
    • 1

    Спасибо сказали:

    Coder(17.02.2015),

Похожие темы

Темы Раздел Ответов Последний пост
Помогите с написанием тз копирайтеру
Вопросы от новичков 4 16.02.2015 10:08
Нужна помощь с Simple html dom
Web программирование 3 12.07.2013 16:17
Помогите убрать: sait.ru/kategoria.HTML/material.html
Joomla 9 26.10.2012 18:38
Помогите с написанием правильного кода
Web программирование 0 07.05.2011 13:51
Помогите с написанием правильного кода
Софт, скрипты, сервисы 0 07.05.2011 13:51

У кого попросить инвайт?

Вы можете попросить инвайт у любого модератора:

Информеры