[Мануал]Полуавтоматический поиск уникального контента

(Ответов: 41, Просмотров: 6520)
Страница 2 из 5 Первая 1234 Последняя
  1. Гуру Аватар для 13й
    • Регистрация: 03.02.2010
    • Сообщений: 1,660
    • Репутация: 1110
    • Webmoney BL: ?
    Частичный отчёт о проведённой проверки данного мануала. "Частичный" из-за того, что технически полный отчёт сделать на данный момент технической возможности нет, но даже имеющейся информации будет вполне достаточно для того, чтобы оценить, покупать или нет данный мануал. И, чтобы не было лишних вопросов, сразу скажу - ман от ТС я получил за пару дней до опубликования данного топика.

    1. Как я писал ранее - гугл аналогов данной методики не нашёл. Я о такой методике тоже не знал.
    2. Источник информации другой, чем в первых двух мануалах от данного ТСа. И метод добычи - тоже.
    3. Для тестирования мной использовались 2 разных моих компа. Один - на 7-ке, второй - на ХР SP3 (обе - лицензионные). Почему так - поймёте позже.
    4. В ходе тестов проверялись 3 основные задачи:
    - сбор контента;
    - проверка собранного контента на уникальность;
    - возможность использования полученного уникального контента.
    5. По софту: на 7-ке софт для выполнения первой задачи работать отказался. При чём, как более ранняя версия, так и более поздняя. Почему - не знаю. Аська производителя софтинки указана, так что покупатели смогут задать этот вопрос непосредственно к первоисточнику, если возникнет необходимость. На ХР SP3 данный софт отработал без проблем, нагружая двухядерник на 10-15% и потребляя оперативной памяти где-то до 15Mb.
    Результаты работы софтинки (где-то за 6 часов) - на скриншоте ниже.

    Нажмите на изображение для увеличения.  Название:	Okno-softa.JPG  Просмотров:	91  Размер:	2.9 Кб  ID:	8890

    6. Для скачивания софтинке были заданы следующие форматы файлов: .txt;.docx;.rtf;.doc
    7. А вот дальше начался "рок-н-ролл" (работа проводилась на 7-ке).
    а) Естественно я засунул все скачанные 1241 файл сразу на проверку уникальности. Итог - через 5 часов работы eTXT Антиплагиат выдал фатальную ошибку и прекратил проверку.
    --- Подумал, что слишком большая очередь на проверку.
    б) Взял первые 100 файлов, перенёс в другую папку и снова запустил пакетную проверку eTXT Антиплагиат. Через 5 часов работы eTXT Антиплагиат снова выдал фатальную ошибку и прекратил проверку.
    --- Поняв, что халявы не будет - включил мозг. Увидел, что файл, на котором eTXT Антиплагиат выдал фатальную ошибку, имеет размер 0. Таких файлов оказалось ещё 2 или 3 из 100 отобранных.
    в) Запустил повторную проверку уже 97 файлов. Через 8 часов работы eTXT Антиплагиат опять выдал фатальную ошибку и прекратил проверку.
    --- Поняв, что не только халявы не будет, но и надо поработать - открыл файл, на котором eTXT Антиплагиат выдал фатальную ошибку. Он оказался на арабском языке. Проверил оставшиеся 96 файлов. Почти во всех файлах с расширением .txt (а их было где-то 20-25 в той пачке) оказались всевозможные логи (работы софтов, айпишек и прочие, ранее мне не встречавшиеся). Удалил. Проверка файлов с расширениями .docx;.rtf;.doc выявила там как наличие отличных от русского языка других языков, так и множество всевозможных схем, формул и прочего). Тоже удалил. Осталось 53 файла (из 100 первоначальных) в папке.
    г). Снова запустил пакетную проверку уникальности, которая длилась более 24 часов (что-то около 30), при чём во время пакетной проверки eTXT Антиплагиат потребляет до 3 гигов оперативы при пиковых нагрузках (из 4х имеющихся на том компе), что делает невозможным использование компа для других целей во время пакетной проверки на уникальность собранного контента. В результате из 53 файлов уникальными оказались 10 (у меня был задан порог отбора - 85% уникальности).

    Результат:

    Из 10 файлов
    -- в 3х файлах оказался контент, который я не придумал куда бы приспособить (а я искал контент для сайтов под статейные биржи);
    -- в 1 файле был контент, подходящий под сайт строительной тематики (примерно 50К символов без пробелов);
    -- в 1 файле контент, подходящий под сайт туристической тематики (примерно 40К символов без пробелов);
    -- в 3х файлах - литературные книги (200-300+К символов без пробелов);
    -- в 1 файле контент, подходящий под сайт оборудования для торговли (примерно 70К символов без пробелов);
    -- в 1 файле контент, подходящий под сайт на тему воспитания или образования (примерно 60К символов без пробелов).

    Данные результаты после проверки 1/12 скачанных файлов (сейчас уже почти 20 часов проверяется на 2-ом компе на уникальность 2-ая пачка отсортированных скачанных файлов).

    Выводы и рекомендации:.
    1. Процесс хоть и автоматизирован, но машинное время потребляется в больших количествах. Хотя, стоит признать - результат того стоит.
    2. Поработать ручками придётся (открывая и просматривая скачанные файлы), чтобы не перезапускать многократно eTXT Антиплагиат, если он будет утыкаться в фатальные ошибки.
    3. Файлы с расширением .txt лучше не качать, а если уж скачали, то не отправлять на пакетную проверку не проверив их, так как более чем в 90% случаев в них окажутся разнообразные логи, голые цифры и разнообразные символы, на которых eTXT Антиплагиат реально утыкается и начинает жрать ресурсы оперативной памяти.
    4. Не поленитесь, и перед отправкой на пакетную проверку уникальности контента откройте и просмотрите каждый файл на предмет наличия в нём русского языка, а также отсутствия большого количества таблиц, формул и прочего материала, который вы не сможете использовать.
    5. Я не претендую на истину на счёт описания нагрузок на компы на разных системах - просто констатировал факты, как это было у меня. Можете сами пройтись по моим граблям, а может у вас их и не окажется на пути.

    Последнюю часть (что выше этой строки) можете считать дополнением к мануалу...

    Цитата Сообщение от hond Посмотреть сообщение
    Добавил в пакет Дополнительный Способ на основе данного мануала
    Получил его буквально несколько часов назад и, по озвученным выше причинам, даже не приступал к его проверке. Да и не буду, так как этот способ заявлен как "дополнительный". Основного более чем достаточно.

    Вроде как всё расписал более чем подробно, но если вопросы остались - задавайте.

    P.S. Отчёт - почти 5К символов без пробелов... и не спрашивайте, чего я в свой блог так редко пишу...
    Последний раз редактировалось 13й; 12.03.2013 в 02:57.
    Место свободно для Вашей рекламы. С предложениями в ЛС.
    • 5

    Спасибо сказали:

    A1ex(12.03.2013), chameleon4ik(12.03.2013), Dvoryashin(12.03.2013), Gulenkov(25.03.2013), hond(12.03.2013),
  2. Super Moderator Аватар для zloberman
    • Регистрация: 04.12.2011
    • Сообщений: 962
    • Репутация: 740
    • Webmoney BL: ?
    насколько контент читабельный?
    насколько контент требует пост-обработки?
    уникальность проверялась по каким настройкам? (шингл 5 или выше?)
    и основное - причина продажи?

    наберусь наглости предложить себя на отзыв для доп. способа или комплексного отзыва
    пример обзора тут. Если заинтересуетесь - в личку могу объяснить, почему grazer доверил мне писать отзыв. У меня парк машин, в том числе и норм лошадка с 8 опертивами corei5, 100мбит канал, 4 пары свободных (условно) рук. Т.е., отзыв смогу предоставить оперативно
    Последний раз редактировалось zloberman; 12.03.2013 в 03:13.
    • -1
  3. Гуру Аватар для 13й
    • Регистрация: 03.02.2010
    • Сообщений: 1,660
    • Репутация: 1110
    • Webmoney BL: ?
    Цитата Сообщение от zloberman Посмотреть сообщение
    насколько контент читабельный?
    100% ТС ведь писал, что
    Цитата Сообщение от hond Посмотреть сообщение
    Тема как то связана с ... машинным рерайтом, сканом и т.п.? Категорично отвечу: НЕТ
    Подтверждаю.

    ----------------------

    Цитата Сообщение от zloberman Посмотреть сообщение
    насколько контент требует пост-обработки?
    Не требует.

    ---------------------

    Цитата Сообщение от zloberman Посмотреть сообщение
    уникальность проверялась по каким настройкам? (шингл 5 или выше?)
    Использовался ТОЛЬКО шингл 5.

    --------------------

    Цитата Сообщение от zloberman Посмотреть сообщение
    наберусь наглости предложить себя на отзыв для доп. способа или комплексного отзыва
    Просто:
    во-первых
    ОПФ 2.6 Запрещено просить ТС сделать ту или иную работу "за отзыв", если сам ТС не предусмотрел этого, либо количество таких заказов уже исчерпано.
    во-вторых
    Цитата Сообщение от zloberman Посмотреть сообщение
    За плечами своя студия, сотни проектов, самый разнообразный опыт в сайтострое и продвижении, в том числе и своя сетка сайтов на 300+ дроп-доменов.
    Вроде как есть чем заняться... да и деньги есть свободные (ну, или, по логике - должны быть). Горите желанием написать отзыв? Купите ман да напишите, никто ж не запрещает. А то данный пост вызывает противоречивые впечатления. Не то нет денег на покупку и тогда приведённая выше цитата - фейк, не то - завуалированная предъява мне, что необъективный отзыв. Хотя после такого развёрнутого отзыва кидать предъяву в необъективности - как-то уже совсем неадекватно... В общем - погрузился в раздумья, как реагировать на данный пост...
    Место свободно для Вашей рекламы. С предложениями в ЛС.
    • 4

    Спасибо сказали:

    Dvoryashin(12.03.2013), hond(12.03.2013), Odhost(12.03.2013), Triple(23.03.2013),
  4. Super Moderator Аватар для zloberman
    • Регистрация: 04.12.2011
    • Сообщений: 962
    • Репутация: 740
    • Webmoney BL: ?
    позвольте объяснить свою позицию

    1 вопрос по читабельности контента и его пост-обработке - по сути, один момент, разбитый на 2 части. Если вы отбирали для бирж, понятное дело, что контент читабельный с точки зрения семантики, меня интересовала больше тех. сторона

    2 предъявы я всегда говорю прямо, в данном случае никаких вопросов к вам именно нет

    3 причина моего предложения: причина продажи темы, которая при затрате в 100 уе дает 320к текста (книги по внутренним моментам в счет не беру). даже при 0.5 уе за кило, мы получаем 160 уе.
    Деньги на покупку мануала есть, но у меня на винте пылится уже такой ворох рунетовских инфопродуктов, что предвзято отношусь к любым схемам типа " продаю тему на 100500к, цена вопроса 50 руб". Т.е., у меня вопросы не к вашему отзыву, а к самой теме. По простой логике - тема тухнет, конечная или что-то не было сказано вслух, если ее сливают.
    поэтому я и озвучил свои вопросы и предложения.

    покупать тухлые темы не вижу смысла. понять логику, додумать ее, возможно, когда-то в чем-то применить -это имеет смысл.
    поэтому в данном случае я готов рискнуть временем на ознакомление и написание отзыва, т.к. есть шанс, что тема будет иметь логическое продолжение.
    В остальном вы правы, заняться есть чем.

    Надеюсь ответил на все заданные и неозвученные вопросы
    • -1
  5. Гуру Аватар для 13й
    • Регистрация: 03.02.2010
    • Сообщений: 1,660
    • Репутация: 1110
    • Webmoney BL: ?
    Когда обращаетесь в одном сообщении к разным людям - разделяйте хоть как-то вопросы адресованные персонально.

    Цитата Сообщение от zloberman Посмотреть сообщение
    1 вопрос по читабельности контента и его пост-обработке - по сути, один момент, разбитый на 2 части. Если вы отбирали для бирж, понятное дело, что контент читабельный с точки зрения семантики, меня интересовала больше тех. сторона
    Так я же указал расширения файлов, по которым производился отбор. Или тогда совсем конкретно укажите, что вы имели в виду.

    --------------

    Цитата Сообщение от zloberman Посмотреть сообщение
    3 причина моего предложения: причина продажи темы
    Это больше к ТС. Хотя ваш интерес тоже вижу: в случае, если вариант получить ман за отзыв прокатит - загрузить своих работников обработкой контента для своих сайтов полученного нахаляву, в отличии от рядовых покупателей мана. У меня своей сетки из 300+ сайтов нет, так что много контента я не использую в любом случае.

    --------------

    Цитата Сообщение от zloberman Посмотреть сообщение
    покупать тухлые темы не вижу смысла.
    То есть тема grazer-а тоже классифицировалась как "тухлая", если вы её тоже за отзыв аж на 18 странице выпросили? Имелось в виду до получения мана от grazer-а, а все отзывы классифицировались как необъективные потому как:

    Цитата Сообщение от zloberman Посмотреть сообщение
    т.к. я НЕ модератор, НЕ близкий знакомый итд
    типа: "там фуфло, а не отзывы и только я в силах предоставить истинный на 100% отзыв".

    -----------------

    Цитата Сообщение от zloberman Посмотреть сообщение
    По простой логике - тема тухнет, конечная или что-то не было сказано вслух, если ее сливают.
    поэтому я и озвучил свои вопросы и предложения.
    По такой же простой вашей логике темы grazer-а и ТЫКВЫ тоже тухнут, потому как их "слили".
    Место свободно для Вашей рекламы. С предложениями в ЛС.
    • 2

    Спасибо сказали:

    hond(12.03.2013), Odhost(12.03.2013),
  6. Дипломник
    • Регистрация: 08.12.2012
    • Сообщений: 145
    • Репутация: 16
    13й, уточните, не будут ли нарушены авторские права при размещении полученного таким образом контента?
    • 2

    Спасибо сказали:

    Blondolly(12.03.2013), TbIKBA(12.03.2013),
  7. Студент
    • Регистрация: 22.08.2010
    • Сообщений: 70
    • Репутация: 12
    Скажите пожалуйста, насколько ограничен источник контента? в смысле всем хватит?
    Последний раз редактировалось Blondolly; 12.03.2013 в 17:30.
    • 0
  8. Студент Аватар для Stif
    • Регистрация: 01.06.2010
    • Сообщений: 81
    • Репутация: 19
    • Webmoney BL: ?
    Бронирую копию. Сегодня Оплачу.
    • 0
  9. Гуру Аватар для 13й
    • Регистрация: 03.02.2010
    • Сообщений: 1,660
    • Репутация: 1110
    • Webmoney BL: ?
    Цитата Сообщение от romarioz Посмотреть сообщение
    13й, уточните, не будут ли нарушены авторские права при размещении полученного таким образом контента?
    Гипотетически - да, так как данные контент писали не Вы, Вы его не покупали у того, кто его писал и не спрашивали разрешения на его публикацию. Практически - доля того, что Вас заставят удалить контент, ничтожно мала. С литературными книгами чуть сложнее, но - тоже не смертельно.

    Цитата Сообщение от Blondolly Посмотреть сообщение
    Скажите пожалуйста, насколько ограничен источник контента? в смысле всем хватит?
    Вопрос кому был?
    Место свободно для Вашей рекламы. С предложениями в ЛС.
    • 0
  10. Banned
    • Регистрация: 08.02.2011
    • Сообщений: 103
    • Репутация: 63
    Цитата Сообщение от Blondolly Посмотреть сообщение
    Скажите пожалуйста, насколько ограничен источник контента? в смысле всем хватит?
    контента хватит всем и еще останется )))(кол-во контент обновляется)

    ---------- Сообщение добавлено 13:57 ---------- Предыдущее 13:18 ----------

    кстати, добавил еще один бонус (несвязанный с уникальным контентом)
    • 0
Страница 2 из 5 Первая 1234 Последняя

Похожие темы

Темы Раздел Ответов Последний пост
Добыча уникального контента
Софт, скрипты, сервисы 30 04.08.2014 00:22
Как подняться в топ ПМ без уникального контента?!
Общие вопросы поисковой оптимизации 19 10.01.2013 14:40
Способы добычи уникального контента
Контент 37 05.12.2012 10:41
API по продаже уникального и смыслового контента
Ссылки, статьи 6 03.10.2012 01:03
Парсер уникального контента в LiveStreet
Софт, скрипты, сервисы 0 05.03.2011 17:31

У кого попросить инвайт?

Вы можете попросить инвайт у любого модератора:

Информеры