Лучший парсер всего и всея на рынке ИМХО) Давно являюсь владельцем - рекомендую. Продукт и поддержка стоит своих денег.
A-Parser - продвинутый парсер поисковых систем, Suggest, WordStat, PR, DMOZ, Whois, DNS, etc
(Ответов: 336, Просмотров: 45120)
- 06.11.2014 14:20
- 24.11.2014 10:26
A-Parser - версия 1.1.135 - множество улучшений и исправлений в связи с изменениями в выдачи
Улучшения- Теперь парсер-паук для сбора ссылок
HTML::LinkExtractor основывается на парсере
Net::HTTP и поддерживает все его возможности и опции, включая работу с Cookies - В парсер
SE::Google добавлена возможность подставлять в запросы найденные Related keywords, что позволяет собрать большую базу тематических ключевых слов, которая будет сильно отличаться от подсказок - Добавлена возможность выбора текущего пресета для прокси-чекера через API
- В парсере
SE::Google добавлен обход лишнего редиректа на HTTPS - Улучшена скорость обработки HTTPS запросов на некоторых сайтах, затрагивает парсер
SE::Yandex::WordStat - На ОС Windows x64 парсер может использовать до 3Гб оперативной памяти
- В интерфейсе добавления заданий появилась возможность сворачивать настройки парсеров
- Улучшен импорт пресетов: теперь при совпадении названий пресетов настроек парсеров пользователю будет предложено заменить пресет или создать новый с другим именем
- В парсере
Net::HTTP исправлена медленная обработка запросов при одновременном использовании опции Emulate browser headers и методе HEAD - Исправлена проблема с запуском парсера на некоторых версиях Windows
- В парсере
SE::Google исправлена обработка запросов с нулевым результатом, в связи с изменением в выдачи - В парсере
SE::Yahoo исправлена работа с региональными доменами, в связи с изменением в выдачи - Исправлена ошибка в парсере
SE::Google при которой парсер мог вылетать если использовалась опция Location - Исправлена ошибка в интерфейсе добавления Конструкторов результата, при которой в списке результатов могли появляться лишние элементы
- Парсер
SE::Baidu исправлен в связи с изменением в выдачи - В парсере
SE::YouTube исправлен парсинг общего числа результатов, в связи с изменением в выдачи - Неудачные запросы сохранялись в неверной кодировке
- Исправлена работа опции Raw data results
- В парсере SE::Google исправлена работа опции Parse not found, в связи с изменением в выдачи
- В парсере SE::Yandex исправлен парсинг Related keywords, в связи с изменением в выдачи
- Исправлена работа с доменами в зоне .be для парсера Net::Whois
- Парсер SE::Yahoo исправлен в связи с изменением в выдачи
- В парсере SE::Yandex исправлена обработка времени кэширования страниц для некоторых форматов дат
- В API исправлен метод getTaskResultsFile, в некоторых случаях IP адрес сервера заменялся IP адресом клиента
- Теперь парсер-паук для сбора ссылок
- 24.11.2014 20:34
Парсер — парсеру рознь!
Скажу честно – вы не найдете во всем интернете парсер, который будет превосходить A-parser по скорости, многообразии обрабатываемых сайтов, и его универсальности!
Его плюсы:
- Собственный чекер прокси.
1. Редко пропускает рабочие прокси, если у вас хороший интернет и мощное железо (железо для большого кол — во потоков).
2. Очень большая многопоточность (на момент покупки а-парсера, я работал с паблик прокси, которые собирал 10 дней по всему буржнету (Китай, Индия, Usa и.т.д). Общее кол — во всех прокси достигало выборки в 500к. Благодаря этому.. я успевал их обрабатывать менее чем за час и мог парсить гугл без покупных прокси-серверов.
- Большая база ресурсов для парсинга.
1. Единственный парсер, где собрана такая громадная база обрабатываемых ресурсов.
2. Нету таких чекеров-парсеров, которые созданы лишь для видимости и потом не поддерживаются разработчиком. Каждый найдет для себя что-то (от дорвейщика до белого seo-вебмастера).
3. Большой плюс а — парсера, что он позволяет комбинировать результаты своего парсинга.
Например:
Pr, Тиц, кол — во страниц в яше, кол — во страниц в гугл, Alex, частотность по вордстату (любая комбинация по вашему желанию).
- Много полезных фич
1.SE::Yandex::Register — Регистрирует аккаунты в Yandex
2. Rank::CMS — Определение 187 видов CMS на основе признаков. Определяет все популярные форумы, блоги, CMS, гестбуки, вики и множество других типов движков
3. Rank::Category: — Автоматически определяет категорию сайта на английском языке
4. SE::Bing::Translator — Переводчик текста через сервис www.bing.com/translator/
5. Check::BackLink — Проверяет нахождение обратной ссылки(ссылок) по базе сайтов
- Скорость парсинга
Если мне нужна по настоящему отпрасить большое кол — во данных и быстро, то я отбрасываю зенку и беру только A-парсер.
Мои результаты:
- За 7 дней чекнуть более 148 мл.доменов на опр.признак.
- Спарсить более 100000 разных комбинация в гугле за несколько часов и с минимальным % бана прокси (другие парсеры быстрее убивают прокси).
- Чекнуть на тиц, pr, alex, dmoz, более 15 миллионов сайтов за 2 дня. (использовалось 5000 покупных прокси с ботнетов)
- Спарсить более 2 миллионов кеев через вордстат и директ за день.
- Собираем свой парсер
Можно также написать свой собственный парсер [только для опытных юзеров]
Например: чекер лайвинтернета или парсинг Google play. Также можно собирать свои чекеры cms по собранными вами фунтпривами. - 15.12.2014 12:55
A-Parser - 1.1.162 - новые парсеры Seznam и подсказок AOL, уменьшено потребление памяти на 40%
Улучшения
SE::Seznam - парсер чешской поисковой системы seznam.cz
SE::AOL::Suggest - парсер подсказок с поисковой системы AOL- Уменьшено начальное потребление памяти на 40%
- В парсере
Net::HTTP добавлена возможность указать произвольные заголовки запроса, с поддержкой возможностей шаблонизатора - Добавлена опция позволяющая сохранять параметры окна интерфейса A-Parser
- Добавлена возможность пропускать обновления на определенную версию
- Улучшено отображение интерфейса при изменении размеров окна и растягивании на весь экран
- Добавлен параметр командной строки -nofork позволяющий отключить многоядерную обработку результатов
- Исправлено отображение текущий версии A-Parser для пользователей Lite версии
- Исправлена работа тестового парсинга с некоторыми ресурсами
- Исправлен парсер
Rank::Ahrefs в связи с изменением в выдаче - Исправлена работа опции Use pages для парсера
Net::HTTP при использовании перебора запросов
- 06.01.2015 14:51
A-Parser - 1.1.177 - Новый модуль SEO::Ping и парсер Rank::Mustat, улучшения в интерфейсе
Улучшения- Новый модуль
SEO::Ping - массовая отправка Ping запросов в сервисы поддерживающие Weblog API(Google Blog Search, Feed Burner, Ping-o-Matic и т.п.) - Новый парсер
Rank::Mustat - оценка трафика на сайте, также стоимость и рейтинг домена - Для парсера
Net::Whois добавлена возможность вручную указать адрес whois-сервера - В поле Additional headers парсера
Net::HTTP теперь возможно использовать переменные из конструктора запросов - Добавлена опция позволяющая перезаписывать файл результата
- Добавлена возможность поиска пресета задания по названию
- Автоматическая прокрутка к выбранному элементу во всех списках в интерфейсе парсера
- В очереди заданий теперь отображаются названия пресетов
Исправления- Парсер
Rank::Ahrefs исправлен в связи с изменением в выдачи - Исправлен вывод Raw results для парсера
Net::Whois - Исправлен вывод порядкового номера запроса $query.num
- Исправлена работа метода API bulkRequest
- Новый модуль
- 13.02.2015 11:40
A-Parser - 1.1.200 - возможность добавлять запросы на основе результатов парсинга, множество исправлений
Улучшения
- Добавлена возможность добавлять новые запросы на основе результатов парсинга, что позволяет составлять более продвинутые пресеты по сбору данных
- Парсер
SE::Google::Images теперь парсит без https - Добавлена возможность ограничить максимальное число соединений на один прокси сервер
- В API добавлена возможность удалять файл результата
- Обновлен Perl модуль по работе с API AParser.pm
- В Конструкторе результатов теперь автоматически подставляются имена результирующих переменных
- Добавлена возможность использовать запрос $query в настройке Extra query string
Исправления
- В парсере
SE::Yandex исправлена обработка каптчи, переход по страницам и парсинг времени кэширования, в связи с изменением в выдачи - Исправлена возможность сохранять бинарные данные(скачивать картинки, видео, документы...)
- Исправлен вывод запроса после форматирования для конкретного парсера, используя конструкцию $p1.query.query
- Исправлена кодировка при сохранении неудачных запросов
- Исправлена ошибка, при которой задания могли не удалятся из очереди
- Исправлена кодировка в именах файлов результатов
- В парсере
HTML::LinkExtractor исправлена работа при переходе одновременно по внутренним и внешним ссылкам - При использовании нескольких парсеров и опции Parse to level в некоторых случаях могли накапливаться запросы что приводило к утечке памяти
- Исправлен вылет парсера при использовании некоторых регулярных выражений
- Исправлена обработка относительных путей в парсере
Net::HTTP при использовании опции Next Page Regex - Исправлен парсинг количества результатов в парсере
SE::Google при использовании арабской локализации - Исправлена блокировка файла после завершения задачи при использовании нескольких файлов результатов
- Исправлен парсер
Rank::Ahrefs в связи с изменением в выдачи - Исправлена ошибка работы с исходным кодом страницы в парсере
SE::Google
- 06.03.2015 07:31
Демо версия A-Parser
Рады представить онлайн демо версию A-Parser, в которой можно ознакомиться со всеми возможностями перед покупкой парсера или перед переходом на новую версию
Демо версия предоставляет доступ к A-Parser установленному на нашем сервере, период тестирования - 6 часов, по истечению этого времени все настройки автоматически будут сброшены
Ограничения демо версии:- Результаты парсинга не доступны для загрузки
- Максимальное число потоков - 100
- Парсинг возможен только с использованием прокси
- 25.03.2015 14:48
A-Parser - 1.1.224 - улучшенные возможности по уникализации результатов, множество исправлений
Все возможности новой версии можно протестировать в демо версии A-Parser'а
Улучшения
- Добавлена возможность уникализировать результаты созданные с помощью Конструктора результатов
- Добавлена возможность передавать дополнительные параметры на сервис распознавания каптчи(например специальные настройки для CapMonster)
- В парсер
SE::Bing::Images добавлена возможность отключить безопасный поиск - В парсер
SE::YouTube добавлен фильтр по 4K видео - Добавлена возможность применять Конструктор запросов после подстановок запросов
- В парсер
SE::Bing добавлена возможность парсить связанные кейворды в глубину, автоматически подставляя новые кейворды в запросы(Parse to level) - Переработан выбор файлов запросов, теперь вложенные директории отображаются только при клике по ним
Исправления в связи с изменениями в выдачи
- Исправлен парсер
SE::Yandex::WordStat - Исправлен парсер
SE::Yahoo - Исправлен парсер
SE::AOL - Исправлен парсинг связанных ключевых слов в парсере
SE::Bing - Исправлен парсинг времени последнего кэширования страницы в парсере
SE::Yandex - Исправлен регистратор аккаунтов
SE::Yandex::Register - Исправлен парсинг связанных ключевых слов в парсере
SE::Yandex
Исправления
- Некорректно работала опция сохранения переноса строк для Windows (CRLF)
- Иногда задание могло зависнуть в состоянии pausing/stopping
- 05.05.2015 08:01
A-Parser - 1.1.247 - новые парсеры поисковиков Ask и Comcast, произвольные шаблоны в конструкторе результатов
Улучшения
- В конструкторе результатов и фильтрах теперь возможно использовать произвольный шаблон в качестве аргумента для преобразования или фильтрации
- В парсер
SE::Yandex добавлена возможность выбора домена yandex.com для парсинга - Добавлен новый поисковик
SE::Ask с американской выдачей Google - Добавлен новый поисковик
SE::Comcast с американской выдачей Google - Добавлена статистика для завершенных заданий, а также отображение общего времени выполнения задания
- Добавлен объект $request, который доступен при форматировании результата и позволяет извлечь любую информацию о текущем запросе, а также о всех редиректах выполненных перед конечным запросом
- Парсер мог заблокировать файл результата после завершения задания
- Исправлена некорректная обработка <base href= в некоторых случаях
- Парсер вылетал при использовании инструмента генерации произвольного User-Agent tools.ua.random() в тестовом парсинге
- В быстром задании не работал выбор запросов из файла
- Некорректно обрабатывался редирект с автоматическим выбором схемы(ссылки вида //domain.com/)
Исправления в связи с изменениями в выдачи
- В парсере
Rank::Alexa исправлен парсинг страны и регионального рейтинга - Улучшен парсинг тИЦ в парсере
SE::Yandex::TIC - Исправлен парсер
SE::Yahoo - Исправлено определение блокировки IP-адреса в парсере
Rank::Ahrefs - Исправлен парсер
SE::Yandex::WordStat::ByDate - Парсер
Rank::Category перешел на семантический анализатор от Ашманова
- 19.05.2015 12:18
Программа LinkAParser - объединение функционала генератора PandoraBox и парсера A-Parser
С помощью данного софта задействованы основные возможности парсера A-Parser при генерации сайтов программой PandoraBox.
Обсуждение на форуме A-Parser'а и ссылка на сайт генератора
Применяет возможности А-Парсера для:- Парсинга релевантного текста
- Парсинга релевантных картинок
- Парсинга релевантных видео роликов
Понимает какие ключи уже обработаны и не парсит одно и тоже дважды
С программой идут готовые пресеты, которые достаточно импортировать и можно запускать генерацию
Спаршенные данные программа структурировано раскладывает в файлы и папки
Спаршенный текст программа чистит от мусора по множеству признаков
В комплекте с программой идет набор дополнительных макросов:- Макрос вывода релевантного текста с подмешанными ключами
- Макрос вывода релевантного текста без ключей
- Макрос вывода релевантной картинки
- Макрос вывода релевантной картинки как локальной(проксирование скриптом)
- Макрос вывода релевантного видео ролика
Тэги топика:
Похожие темы
| Темы | Раздел | Ответов | Последний пост |
|---|---|---|---|
LTK Parser - парсер поисковых подсказок на разных языках | Софт, скрипты, лицензии | 12 | 06.05.2012 21:10 |
Парсер контента под дорвеи и сателлиты X-Parser | Софт, скрипты, сервисы | 0 | 15.08.2010 23:51 |
KD Parser - парсер ключевых слов | Софт, скрипты, лицензии | 2 | 10.04.2010 21:47 |
Хороший Парсер Я.Директ и Wordstat - Магадан | Поисковые системы | 10 | 24.11.2009 15:52 |
Хороший Парсер Я.Директ и Wordstat - Магадан | Софт, скрипты, сервисы | 4 | 15.09.2009 19:38 |



