Парсинг Для начинающих базы лучше собирать дектоповскими парсерами, такими как AGGRESS Parser - добный парсер для начинающих.
План работы с запросами для парсинга. 1. Надо выделить несколько уникальных запросов. 2. Чекаем уникальные запросы на количество результатов в выдаче Google. 3. Размножение уникальных запросов. Для того чтобы собрать больше запросов и результатов по ним. 4. Чекаем размноженные запросы на результаты в выдаче Google. 5. Собираем базу. Начнем по порядку.
1. Надо выделить несколько уникальных запросов. Для начинающих рекомендую собирать для начала китайские гесты, типа как inurl:"yybbs.cgi" их достаточно много, но их плохое качество, что их большая часть уже сильно заспамлена. (список запросов) Собрали мы несколько запросов к примеру: inurl:"yybbs.cgi" и inurl:"bbs/yybbs.cgi"
2. Чекаем уникальные запросы на количество результатов в выдаче Google. Скачиваем программу от solutionfix. скачать Это программа Вам позвонит по собранным запросам прочекать их на результаты в выдаче гугла. Это надо для того чтобы отсеять безрезультатные запросы, они нам просто не к чему. Как пользоваться этой программой. - нажимаем на кнопку “Загрузить keywords” ищем текстовый файл, в котором ваши запросы, добавляем его. - ставим только галочку на “Смотреть Google” другие поисковые системы нам не нужны. - потоков ставим 10. - Анти – бан таймайт – 15секунд. - нажимаем старт. - ждем как прочекается и скачиваем результаты. И выбираем только те запросы где больше 10к результатов выдаче Google. Уникальные запросы готовы.
3. Размножение уникальных запросов. Для того чтобы собрать больше запросов. Тут все просто берем этот уникальный запрос inurl:"yybbs.cgi" и к нему подставляем доменные зоны типа site:com – это надо для того чтобы собрать как можно больше это этому одному запросу гестов. (список доменных зон) также можно подставлять всякие слова (BBS) и т.д… У вас выйдут запросы типа inurl:"yybbs.cgi" site:com и т.д… Чтоб к уникальному запросу подставить доменные зоны, рекомендую для начала пользоваться Microsoft Office Excel. Тут все просто. - Открываем ексель. - В первой столбец вбиваем уникальный запрос, а во второй доменные зоны. Выглядеть будет примерно так. скриншот Потом копируем из ексель все, чтоб все скопировать, можно нажать Ctrl+A – выделить все и Ctrl+С - копировать. - открываем текстовый файл. И нажимаем Ctrl+V – вставить - У вас должно получится что то типа этого inurl:"yybbs.cgi" site:ac inurl:"yybbs.cgi" site:ad inurl:"yybbs.cgi" site:ae inurl:"yybbs.cgi" site:aero и т.д…. И также делаем с каждым уникальным запросам не только с inurl:”yybbs.cgi”
4. Чекаем размноженные запросы на результаты в выдаче Google. Тут повторяем, то что делали с уникальными запросами, т.е. чекаем на результаты в выдаче Google. Чтобы отсеять те запросы, по которым нету результатов, они нам не к чему.
5. Собираем базу. Тут нам поможет AGGRESS Parser. Скачать парсер можно тут - скачать - запускаем парсер. - переходим в настройки парсера, и там выставляем Time Out – 15сек. - переходим во вкладку “Парсер” выбираем парсить Google, в окошко Запросы, вставляем свои запросы, которые вы собрали. - нажимаем ЗАПУСК. Все готово, ваша база собирается.
Спам. Для спама вам понадобится программа – AGGRESS AutoPost. - скачать - скачиваем программу, устанавливаем. - переходим в установленную папку, находим там папку date. - копируем в папку date, текстовый файл с напаршенными гестами. - запускает спамилку. - выбираем в левом самом крайнем столбце, тот текстовый файл, который добавляли в папку date. - по середине вы увидите те самые гесты, из текстового файла, который выбрали. - в правом крайнем столбце, вписываете данные для спама - заходим настройки и выбираем чтоб сохранять хорошие урлы. - нажимаем спам и ждем. Сам ни когда не пользовался этой прогой.
P.S. Если вы отберете только те гесты, в которых нету спама, чтоб таких было около 1 – 2к, то можете начинать работу с НЧ. Выбираете кеи где мало конкуренции, скажем около 50к. или и то меньше. А дальше можете повышать это число.
Я надеюсь что кому та эта статья будет полезна. Не забываем ставить плюсик…
И еще. Готовые запросы можете купить у меня в шопе. Они все уже прочеканны на результаты в выдаче Google и полностью готовы к использованию.
Спасибо за внимание.
Последний раз редактировалось BABBLS; 06.09.2009 в 14:00.
Не знаю на что похожа статья. К сожалению не имел счастья читать статью john22 но эта статья мне понравилась. 5 звездочек. Все разжевано. Это даже пугает, т.к теперь каждый сможет научится быстро, и главное спамить. Но здоровая конкуренция повышает мастерство.
Наиболее полное пособие по парсингу, которое я когда-либо видел. Статья на пятерку. Только вот и правда, инструмент не лучший выбрали, хотя для новичков пойдет...
да уж, разжевал просто отлично. Упомянутый выше мануал, по этому пункту, нервно курит в сторонке:) единственное один момент для меня остается загадкой -запрос "типа как inurl:"yybbs.cgi"" - откуда он??? откуда именно такой набор букв после inurl:?
Кто пробовал? Подскажите плз, нажал остановить, оно уже около часа пишет что Подождите... Ждать или утром так же будет? Я про постер! Хотелось просто рабочие линки сохранить!
Последний раз редактировалось I love this game; 29.09.2009 в 23:01.