Недавно написал прогу по парсингу прямого эфира яндекса. Программа по-сути аналогична с [Бесплатно] Парсер прямого эфира Яндекса Колян 2.0 но есть пара улучшений: - все данные пишутся в базу - перед добавление ключа, он проверяется на уникальность, добавляются только уникальные значения - не уникальные значения суммируются (т.е. по-сути есть своеобразная частотность).
Текущий размер базы данных - 65 миллионов записей (собрано чуть более чем за сутки).
Кому необходимо - могу предоставить выгрузку по интересующим ключам (естественно бесплатно)
Отдельно хочу сказать спасибо Gann он задавал неудобные вопросы и в следствии этого я переписал программу. Надо сказать, что скорость работы ее после исправления замечаний увеличилась более чем в 10 раз. Текущая скорость - порядка 1 000 000 записей за 20 минут (естественно добавляются не все, а сначала проверяются на дубли)
Последний раз редактировалось ArhStrAngeR; 07.11.2015 в 14:56.
Давайте буду первым в очереди :) ключ скинул в личку. Очень интересно посмотреть в конкурентной нише, возможно будут суперНЧ, по которым можно собирать трафф.
Давайте буду первым в очереди :) ключ скинул в личку. Очень интересно посмотреть в конкурентной нише, возможно будут суперНЧ, по которым можно собирать трафф.
отправил обратно в личку.
Сообщение от Avot
А саму программу распространять не планируете?
пока не планировал
Сообщение от M_W
ArhStrAngeR, спасибо, вписываюсь
К сожалению не сильно много ключей нашел по вашему ключу
Скрытый текст (вы должны войти под своим логином или зарегистрироваться и иметь 589 сообщение(ий)):
У вас нет прав чтобы видеть скрытый текст, содержащийся здесь.
Последний раз редактировалось ArhStrAngeR; 07.11.2015 в 14:55.