Доброго времени суток! Назрел вопрос - как спарсить список доменом из рейтинга LiveInternet? Пробовал парсить с помощью ContentDownloader, но ничего из этого не выходит. Другие сайты без проблем парсит. Я так понимаю, что все дело из-за скрипта, который и выводит рейтинг в LI. Так собственно вопрос - как теперь быть, как обойти этот скрипт и все же получить список доменов? Заранее спасибо!
- 07.01.2018 02:08
- Регистрация: 02.01.2018
- Сообщений: 3
- Репутация: 0
- 07.01.2018 02:28
_http://simplehtmldom.sourceforge.net/manual.htm
- 12.02.2018 23:53
- Регистрация: 30.03.2016
- Сообщений: 9
- Репутация: 0
MasterLee, Liveinternet наверняка старается бороться с такими как вы. Я пробовал парсить с использованием python scrapy и тоже долго не мог понять в чем дело. Но все очевидно, вся инфа генерится js скриптом. Поэтому нужен реальный браузер, а не парсер запросов. Для этого хорошо подходит например selenium.
- 13.02.2018 00:37
- Регистрация: 12.04.2015
- Сообщений: 37
- Репутация: 6
зеннопостер на раз два сделает
Спасибо сказали:
Anna GAevska(13.02.2018), - 13.02.2018 08:50
Поддержу, зенка работает гуд.
- 13.02.2018 19:41
- Регистрация: 09.10.2011
- Сообщений: 1,813
- Репутация: 251
- 14.02.2018 05:21Код:Сложно js посмотреть, да?
https://www.liveinternet.ru/rating/ru//today.tsv?page=1
Спасибо сказали:
suvoroff(14.02.2018),
Похожие темы
Темы | Раздел | Ответов | Последний пост |
---|---|---|---|
Как спарсить iframe | Web программирование | 1 | 03.03.2016 16:51 |
Спарсить пользователей ВК | Вопросы от новичков | 6 | 12.01.2016 14:15 |
Показатели Liveinternet | Вопросы от новичков | 1 | 02.08.2015 19:36 |
liveinternet заблокирован | Оффтоп и свободные темы | 23 | 09.11.2012 13:06 |
Что с liveinternet? | Вопросы от новичков | 2 | 27.01.2012 16:54 |