Раз заплатил - тиц получил

(Ответов: 203, Просмотров: 18572)
Страница 21 из 21 Первая ... 11192021
  1. Дипломник
    • Регистрация: 13.02.2012
    • Сообщений: 113
    • Репутация: 13
    всевозможные доски объявлений, со спаршеным контентом живут в индексе яндекса превосходно. Несмотря на то, что инфа на многих досках дублируется, яндекс не выкидывает их из индекса, до тех пор пока вебмастер в силу природной жадности не начинает размещать всякие попандеры и прочую хрень.

    Итак сейчас я покажу вам на примере, как можно быстро без особых усили и не имея навыков программирования создать такую вот досочку, скажем на 500 страниц.

    Для того, что бы исключить непонятки - поясню, что под парсером я имею в виду некую прогу которая тырит контент и делает его удобоимпортируемым в наш дизайн.

    Итак начнём. Для начала давайте выберем "жертву", пусть это будет какая ни будь отдельная рубрика Яндекс.каталога (о том, как разделять спаршенный контент, расскажу в слудующей статье, пока у нас будет одна категория).

    Скачиваем рубрику "как есть" прогой Teleport Pro (бесплатная, делает дубликаты сайтов). качаем только контент без сохранения структуры и картинок. Это просто.

    Далее выбираем движок. Предлагаю использовать DLE, устанавливаем его на денвер или на хостинг. Заходим в используемую базу, откываем таблицу где храняться все записи (в DLE это таблица dle_post в других движках другие)




    В DLE нужно заполнить как минимум четыре поля:
    Заголовок:title
    Автор:autor
    Короткий текст:short_story
    Полный текст:full_story

    Составляем заготовку slq запроса (для тех, кто не вкурсе - это написанная на языке sql инструкция, которую можно скопировать во вкладку slq в phpmyadmin и она что то там сделает с базой. При помощи sql запросов можно работать с базой напрямую, без всяких навороченых админок с визуальными редакторами)

    она будет выглядеть так:

    Код:
    INSERT INTO dle_post (title,autor,short_story,full_story) VALUES ('','admin','','')
    Оставляем вкладку с phpmyadmin пока открытой и ищем прогу text pipe pro.
    Утилита для пакетной обработки текстовой информации. Программа служит для форматирования и конвертирования текстовых файлов, замены в них текста, выполнения сложных преобразований, конвертирования текста из одного формата в другой. В TextPipe Pro встроено почти полторы сотни фильтров. линк на демо
    Где вы её найдёте, думайте сами. Но в демоверсии ограничение максимум на 100 обработанных файлов.

    Открываем, сразу запускаем мастер фильтров

    Выбираем самый верхний фильтр "Поиск и замена по схеме".



    теперь подходим к самому основному - создание схемы по которой прога и будет выдирать нужную нам инфу. Писать мы будем на регулярных выражениях, точнее используем самую простую схему.

    Открываем наш яндекс каталог в виде html и копируем кусок html кода который содержит заголовок и описание (собсно то. что нам и нужно)



    Код:
    "r(this, 'ctya')">"Яндекс" - поисковая система по русскому интернету </a><br>Поиск информации в интернете с учетом русской морфологии, возможность регионального уточнения. Параллельный поиск по новостям, картинкам, товарам, блогам, адресам организаций.<div class="url">
    Теперь нужную нам текстовую информацию заменяем вот таким образом

    Код:
    "r\(this, 'ctya'\)">(.*?)</a><br>(.*?)<div class="url">
    (.*?) - на языке регулярных выражений означает вытащить максимальное количество символов после того, что слева от скобки до того что справа от закрывающей скобки. Проще говоря - то что надо. Обратите внимание на слэши перед "нормальными" скобками, их нужно экранировать обязательно иначе прога решит, что это инструкции для неё.

    Скидываем это всё в поле "найти схему", предварительно в выпадающем списке выбрав тип поиска - Схема perl, а внизу поставить галку "Извлечь соответсвия"

    В поле замена на пишем наш sql запрос

    Код:
    INSERT INTO dle_post (title,autor,short_story,full_story) VALUES ('$1','admin','$2','$2')
    Цифры $1 и $2 означают, что в это место будет вставляться содержимое первого "(.*?)" и второго "(.*?)" соответсвенно. Как видим полное и краткое описание у меня будет одинаковым.

    у вас должно быть что то типа такого:



    На вкладке "Зона учебного прогона", в левое поле копируем поностью html код страницы каталога-донора (откуда выдрали кусок с вхождением названия и описания сайта). Жмём "Тестовый прогон", если получилось что то типа этого, значит всё ок.



    Возвращаемся на первую вкладку, Файл вывода ставим "выводить в один файл".

    На вкладке "файлов в обработке", указываем папку куда скачали сайт через teleport pro. Запускаем!

    Если всё ок, то в указанной нами файле будет сохранён дамп со всеми найденными соответствиями схеме. Теперь просто импортируем через phpmyadmin (вкладка импорт) этот файл в базу. Готово!
    • 0
  2. Дипломник Аватар для adminpab
    • Регистрация: 08.06.2011
    • Сообщений: 151
    • Репутация: 9
    Можно пример такого сайта?
    • 0
  3. Гуру Аватар для Room
    • Регистрация: 11.04.2009
    • Сообщений: 2,289
    • Репутация: 530
    • Webmoney BL: ?
    Ну например deaxon.ru делался с использованием этой технологии
    • 0
  4. Sunshine reggae Аватар для OKyJIucT
    • Регистрация: 02.09.2011
    • Сообщений: 3,240
    • Репутация: 1830
    • Webmoney BL: ?
    Цитата Сообщение от noxon.su Посмотреть сообщение
    Ну например deaxon.ru делался с использованием этой технологии
    что за партнерка? или свой "платник" ?
    • 1

    Спасибо сказали:

    0pium(11.09.2012),
Страница 21 из 21 Первая ... 11192021

Похожие темы

Темы Раздел Ответов Последний пост
Получил приглашение в ProfitSpy
Реклама партнерских программ 10 12.04.2012 13:09
Как я получил тиц 20 для своего блога
Дайджест блогосферы 5 09.11.2011 22:13
Мой первый сайт или как я получил повестку в суд куда-то в США
Дайджест блогосферы 4 03.11.2011 05:56

У кого попросить инвайт?

Вы можете попросить инвайт у любого модератора:

Информеры