grazer, Спасибо за парсинг. Много всего интересного нашел, особенно конечно это открытая стата. Спасибо, буду пробовать использовать, о результатах напишу.
я получил базу на выходных прошлой недели, с учетом текущей загрузки было не до анализа А вот сегодня плотно засел пощупать, что же grazer мне переслал.
САБЖ представляет из себя csv файл, в котором собрана инфа по 3к сайтов "дом и семья" напротив каждого сайта обещанная информация по кол-ву страниц, пузу, дате создания итд.
минусы: -нет шапки файла, т.е. перед тобой столбики цифр, сиди угадывай, что есть что. -данные по трафу представлены на момент снятия статы. Понятное дело, что этот момент не переиначишь, но по ряду площадок встретил разлеты в 5-10 раз (на момент проверки мною траф был меньше в 5-10 раз) -данные представлены в виде ХХ,ХХХ (20,359), что мешает отсортировать нормально столбцы по трафику
плюсы: -разлет данных по трафику имеет место быть и в обратную сторону. Т.е., лучше заинтересовавшие площадки пробивать руками (хотя бы по RDS ) -если есть голова, то предоставленная статистика - это просто ПЗДЦ (извините). Недооценить сабж могут только новички или совсем недалекие товарищи.
ЧАС неспешной работы с файлом и сервисами дали понимание: - что один из проектов нашей команды имеет незакрытый счетчик )) - сайт на укозе с 30 страницами и трафом в 1.5к - ГС в 100+ страниц на генере и трафом в 3.5к в сутки, сайту 2 месяца - схемы монетизации - какими партнерками, кто как юзает РСЯ и АДСЕНС, как ставятся блоки - очень много инфы по внутренней перелинковке ,как следствие - вот они все ключи - понимание, что половину из увиденного можно перетащить под Украину, проверил, у нас аналогичные ниши для ряда сайтов по СЧ запросы пустые. По сути, можно под копирку содрать все, поменять названия городов - и будет трафик - крайне любопытно смотреть на чужие проекты с включенным RDS , когда видишь, что 97% морды сайта, к примеру, в noindex , в индексацию идет только перелинковка по заголовкам. - самый жир - сайты под АГС , но с трафом в 1-2к в сутки. Как? включайте голову, смотрите беки и стату. - самый жир 2 - ниши. Микро ниши, тематические, социальные итд. Мы занимаемся трафом, в сайтострое я очень давно, но даже я был удивлен рядом идей: никогда голова в этом направлении даже не думала, а там, оказывается, тоже есть трафик.
если у вас к тому же есть и ahrefs, то скучно вам точно не будет, идей для доноров тоже появляется масса.
Я крайне благодарен grazer за возможность окунуться в мир чужих идей и технологий работы с проектами. Однозначно закажу в ближайшее время еще несколько выборок, настроен на долгое сотрудничество и общение.
Последний раз редактировалось zloberman; 06.07.2013 в 20:21.
zloberman, спасибо за честный отзыв. По поводу шапки - это будет исправлено, в курсе проблемы, запятые в "20,754" тоже исправится. По поводу "данные по трафу представлены на момент снятия статы" - тут ничего не изменишь, разве что только парсить ближе к ночи.
Еще раньше часть данных не снималась, потому что сервисы с которых идет парсинг падают, сейчас пробелов уже не бывает в отчетах.
По поводу плюсов. Я хотел бы все это написать в старпост, но вроде и так не мало написал. Да и смысл писать, если очень немногие понимают насколько это важно делать такие выборки со съемом параметров для дальнейшего анализа. :) Мне тоже очень нравится находить микрониши под контекст, в которых только по 1 сайту вертится.
Тема интересная, ручками иногда искал открытые статы, пытался анализировать. Правда не ЛИ, а хотлог. Но чтоб это кто-то начал делать в автомате и ещё парсить столько параметров - такое вижу в первый раз.
Можно в экселе заменять. Выделяем нужный столбец, нажимаем ctrl+F, там выбираем замену, пишем в поле заменить "," а в поле заменить на "", всё без кавычек, вторая строчка пустая, потом нажимаем заменить всё, и в этой строчке все запятые удаляются, а мы получаем числа. Занимает это ровно 4,38 секунды=)