Умный парсинг рейтинга LiveInternet, поиск незапароленных стат
(Ответов: 26, Просмотров: 6384)
- 30.06.2013 23:59
- 02.07.2013 14:07
grazer, Спасибо за парсинг. Много всего интересного нашел, особенно конечно это открытая стата.
Спасибо, буду пробовать использовать, о результатах напишу.
Еще раз спасибо.Спасибо сказали:
grazer(02.07.2013), - 06.07.2013 19:19
пришло время для отзыва
я получил базу на выходных прошлой недели, с учетом текущей загрузки было не до анализа
А вот сегодня плотно засел пощупать, что же grazer мне переслал.
САБЖ представляет из себя csv файл, в котором собрана инфа по 3к сайтов "дом и семья"
напротив каждого сайта обещанная информация по кол-ву страниц, пузу, дате создания итд.
минусы:
-нет шапки файла, т.е. перед тобой столбики цифр, сиди угадывай, что есть что.
-данные по трафу представлены на момент снятия статы. Понятное дело, что этот момент не переиначишь, но по ряду площадок встретил разлеты в 5-10 раз (на момент проверки мною траф был меньше в 5-10 раз)
-данные представлены в виде ХХ,ХХХ (20,359), что мешает отсортировать нормально столбцы по трафику
плюсы:
-разлет данных по трафику имеет место быть и в обратную сторону. Т.е., лучше заинтересовавшие площадки пробивать руками (хотя бы по RDS )
-если есть голова, то предоставленная статистика - это просто ПЗДЦ (извините). Недооценить сабж могут только новички или совсем недалекие товарищи.
ЧАС неспешной работы с файлом и сервисами дали понимание:
- что один из проектов нашей команды имеет незакрытый счетчик ))
- сайт на укозе с 30 страницами и трафом в 1.5к
- ГС в 100+ страниц на генере и трафом в 3.5к в сутки, сайту 2 месяца
- схемы монетизации - какими партнерками, кто как юзает РСЯ и АДСЕНС, как ставятся блоки
- очень много инфы по внутренней перелинковке ,как следствие - вот они все ключи
- понимание, что половину из увиденного можно перетащить под Украину, проверил, у нас аналогичные ниши для ряда сайтов по СЧ запросы пустые. По сути, можно под копирку содрать все, поменять названия городов - и будет трафик
- крайне любопытно смотреть на чужие проекты с включенным RDS , когда видишь, что 97% морды сайта, к примеру, в noindex , в индексацию идет только перелинковка по заголовкам.
- самый жир - сайты под АГС , но с трафом в 1-2к в сутки. Как? включайте голову, смотрите беки и стату.
- самый жир 2 - ниши. Микро ниши, тематические, социальные итд. Мы занимаемся трафом, в сайтострое я очень давно, но даже я был удивлен рядом идей: никогда голова в этом направлении даже не думала, а там, оказывается, тоже есть трафик.
если у вас к тому же есть и ahrefs, то скучно вам точно не будет, идей для доноров тоже появляется масса.
Я крайне благодарен grazer за возможность окунуться в мир чужих идей и технологий работы с проектами.
Однозначно закажу в ближайшее время еще несколько выборок, настроен на долгое сотрудничество и общение.Последний раз редактировалось zloberman; 06.07.2013 в 19:21.
- 06.07.2013 19:54
zloberman, спасибо за честный отзыв. По поводу шапки - это будет исправлено, в курсе проблемы, запятые в "20,754" тоже исправится. По поводу "данные по трафу представлены на момент снятия статы" - тут ничего не изменишь, разве что только парсить ближе к ночи.
Еще раньше часть данных не снималась, потому что сервисы с которых идет парсинг падают, сейчас пробелов уже не бывает в отчетах.
По поводу плюсов. Я хотел бы все это написать в старпост, но вроде и так не мало написал. Да и смысл писать, если очень немногие понимают насколько это важно делать такие выборки со съемом параметров для дальнейшего анализа. :) Мне тоже очень нравится находить микрониши под контекст, в которых только по 1 сайту вертится.Спасибо сказали:
zloberman(07.07.2013), - 06.07.2013 22:06Новичок

- Регистрация: 30.01.2013
- Сообщений: 12
- Репутация: 1
Тема интересная, ручками иногда искал открытые статы, пытался анализировать. Правда не ЛИ, а хотлог.
Но чтоб это кто-то начал делать в автомате и ещё парсить столько параметров - такое вижу в первый раз. - 07.07.2013 00:06
Grazer, я только сейчас понял, что это уже второй мой отзыв по вашим наработкам. Еще раз спасибо за доверие, обращайтесь ; )
Спасибо сказали:
grazer(08.07.2013), - 08.07.2013 19:10
Можно в экселе заменять. Выделяем нужный столбец, нажимаем ctrl+F, там выбираем замену, пишем в поле заменить "," а в поле заменить на "", всё без кавычек, вторая строчка пустая, потом нажимаем заменить всё, и в этой строчке все запятые удаляются, а мы получаем числа. Занимает это ровно 4,38 секунды=)Спасибо сказали:
grazer(08.07.2013), - 24.07.2013 14:56
Привет, интересует тематика Прокат автомобилей. Не знаю нужно ли указывать что в Москве.
За 10$. - 24.07.2013 17:28
- 01.08.2013 18:16
Здравствуйте. Готов заказать тематику медицина, написал вам на почту
Тэги топика:
Похожие темы
| Темы | Раздел | Ответов | Последний пост |
|---|---|---|---|
Парсинг ников пользователей твиттера из рейтинга Яши | Yandex | 12 | 21.06.2013 22:38 |
VkPostTaker - умный граббер ВКонтакте | Софт, скрипты, лицензии | 6 | 11.05.2013 20:22 |
Анализ спроса - чекалка стат для ру партнерок | Софт, скрипты, сервисы | 5 | 23.11.2012 18:02 |
Умный парсер | Софт, скрипты, сервисы | 1 | 26.04.2011 01:51 |
Инвайты в PR.sape.ru «Новостной удар» – биржа размещения ссылок и стат | Дайджест блогосферы | 0 | 20.10.2010 05:33 |






