А он может в веб сам лезть? Пользуюсь им постоянно, но лишь для работы с большими количествами текстовых файлов, сохранённых на винте. Т.е. для парсинга - нужно ещё из веба все необходимые страницы чем-то выкачать.
А он может в веб сам лезть? Пользуюсь им постоянно, но лишь для работы с большими количествами текстовых файлов, сохранённых на винте. Т.е. для парсинга - нужно ещё из веба все необходимые страницы чем-то выкачать.
да сначала нужно выкачать. Но телепор про это делает очень быстро :)
В доргене есть такая функция в большинстве случаев. их и юзаем.
Не все же доргенами пользуются. Иногда нужно наполнить блог статьями. Вот для таких целей и нужны эти парсеры. Есть ещё граберы РСС но они и парсят только РСС, а эти грабят всё на любых сайтах.
да сначала нужно выкачать. Но телепор про это делает очень быстро :) Не все же доргенами пользуются. Иногда нужно наполнить блог статьями. Вот для таких целей и нужны эти парсеры. Есть ещё граберы РСС но они и парсят только РСС, а эти грабят всё на любых сайтах.
Использовал раньше граббер вроде FeedMaster или что-то подобное, пытался вспомнить не нашел. Он грабил все, указывай ему только сайты.
Помню как выглядил стандартный шаблон, может узнаешь. Сайт в ширину фиксирован 850-900 пикселей. синенький шаблон, в левом углу типа логотип, двое людей в костюмах рассматривают документы какието. Слева ниже лого меню, под ним рекламный блок, сайт из двух колонок. В правой колонке краткие новости.... вот как-то так.
он же вроде только ленты парсит, или текст со страниц тоже? Плагин реально интересный если бы была возможность то заюзал бы. Но FeedMaster работает с Вордпресом. А если тебе нужен текст для других движков? Или текст только с определёных страниц? Тогда в этом поможет Web Info Extractor. Кликнул по тексту который нужен, указал ссылки и сделал шаблон для сохранения. Вообщем проще не бывает. :)