Здраствуйте!
Решил написать небольшой парсер для личных нужд.Суть его в том чтобы парсить названия фильмов с одного сайта.Я уже написал основную часть с помощью библиотеки PHP Simple HTML DOM Parser.Получилось вот что -PHP код:Теперь проблемы:<?php
header('Content-Type: text/html; charset=UTF-8');
include('simple_html_dom.php');
$html = file_get_html('http://kiino.ru/films/');
foreach($html->find('ul[class="films-gallery large"]') as $e);
echo $e->plaintext ;
?>
1)Когда я получаю результат,сразу падает в глаза не нужные элементы.Это описания к фильмам(около 2-4 слов).Я пытался удалить , облазил весь интернет - так и не решил проблему.+ ко всему это описание есть не у всех фильмов,а только у некоторых
2)Опять же когда я получаю результат-получается все в одну строку.Нужно чтобы каждое название переносилось
P/S - Я в php сам плохо разбираюсь так что извиняюсь за тупые\тупой возможно вопрос(ы) и прошу обьяснить во всех деталях как решить эти проблемы...
Заранее спасибо!
Помогите с написанием скрипта с помощью библиотеки PHP Simple HTML DOM Parser
(Ответов: 8, Просмотров: 1790)
- 15.02.2015 16:58Опытный


- Регистрация: 21.11.2013
- Сообщений: 407
- Репутация: 58
- 15.02.2015 17:15PHP код:
<?php
header('Content-Type: text/html; charset=UTF-8');
include('simple_html_dom.php');
$html = file_get_html('http://kiino.ru/films/');
foreach($html->find('ul[class="films-gallery large"] strong a') as $e){
echo "<p>".$e->plaintext."</p>\n" ;
}
?>Последний раз редактировалось Ispanec; 15.02.2015 в 17:21.
Спасибо сказали:
Max111(15.02.2015), - 15.02.2015 17:21
Немного непонятно:
Варианты следующие - во-первых, попробуйте заменить plaintext на innertext и потом на outertext и посмотрите, что получается и в каких элементах находится ненужное.
Посмотрите документацию _http://simplehtmldom.sourceforge.net/, там показано, как и получить нужное, и как приклеить что нужное - например, тег переноса.
Возможен вариант промежуточной записи получаемого в файл, обработки не только средствами парсера, и вывод в нужном виде.Спасибо сказали:
Max111(15.02.2015), - 15.02.2015 18:49Опытный


- Регистрация: 21.11.2013
- Сообщений: 407
- Репутация: 58
Coder,Ispanec, Спасибо.Работает все...Теперь каким образом это все в txt файлик запихнуть без тегов?
- 15.02.2015 23:56
Если правильно понял и если вы используете вышеприведенный код (см. результат в файле file_example.txt):
Скрытый текст (вы должны войти под своим логином или зарегистрироваться и иметь 1 сообщение(ий)):У вас нет прав чтобы видеть скрытый текст, содержащийся здесь.
Собственно, можно и без strip:Скрытый текст (вы должны войти под своим логином или зарегистрироваться и иметь 1 сообщение(ий)):У вас нет прав чтобы видеть скрытый текст, содержащийся здесь.Последний раз редактировалось Coder; 16.02.2015 в 00:14. Причина: Исправил расширение файла в коде на txt
Спасибо сказали:
Max111(16.02.2015), - 16.02.2015 01:25Гуру

- Регистрация: 09.10.2011
- Сообщений: 1,813
- Репутация: 251
- 16.02.2015 17:58
Я постоянно с этой библиотечкой парсеры пишу. Очень удобно да и функционал нормальный такой. Вот как раз на своём блоге писал о создании php парсера. Может кто прочтёт, если станет интересно.
- 16.02.2015 20:31
Михаил Роганин, хорошая статья, мне понравилась) твитнул в знак благодарности) пойду оттачивать свои навыки в Php)
- 16.02.2015 23:20Опытный


- Регистрация: 21.11.2013
- Сообщений: 407
- Репутация: 58
Coder,Огромное спасибо!Тему можно закрыть :)
P.S - возможно в будущем обращусь к вам и попрошу что-то сделать за определенную плату :)Спасибо сказали:
Coder(17.02.2015),
Похожие темы
| Темы | Раздел | Ответов | Последний пост |
|---|---|---|---|
Помогите с написанием тз копирайтеру | Вопросы от новичков | 4 | 16.02.2015 10:08 |
Нужна помощь с Simple html dom | Web программирование | 3 | 12.07.2013 16:17 |
Помогите убрать: sait.ru/kategoria.HTML/material.html | Joomla | 9 | 26.10.2012 18:38 |
Помогите с написанием правильного кода | Web программирование | 0 | 07.05.2011 13:51 |
Помогите с написанием правильного кода | Софт, скрипты, сервисы | 0 | 07.05.2011 13:51 |



