Частичный отчёт о проведённой проверки данного мануала. "Частичный" из-за того, что технически полный отчёт сделать на данный момент технической возможности нет, но даже имеющейся информации будет вполне достаточно для того, чтобы оценить, покупать или нет данный мануал. И, чтобы не было лишних вопросов, сразу скажу - ман от ТС я получил за пару дней до опубликования данного топика.
1. Как я писал ранее - гугл аналогов данной методики не нашёл. Я о такой методике тоже не знал.
2. Источник информации другой, чем в первых двух мануалах от данного ТСа. И метод добычи - тоже.
3. Для тестирования мной использовались 2 разных моих компа. Один - на 7-ке, второй - на ХР SP3 (обе - лицензионные). Почему так - поймёте позже.
4. В ходе тестов проверялись 3 основные задачи:
- сбор контента;
- проверка собранного контента на уникальность;
- возможность использования полученного уникального контента.
5. По софту: на 7-ке софт для выполнения первой задачи работать отказался. При чём, как более ранняя версия, так и более поздняя. Почему - не знаю. Аська производителя софтинки указана, так что покупатели смогут задать этот вопрос непосредственно к первоисточнику, если возникнет необходимость. На ХР SP3 данный софт отработал без проблем, нагружая двухядерник на 10-15% и потребляя оперативной памяти где-то до 15Mb.
Результаты работы софтинки (где-то за 6 часов) - на скриншоте ниже.
6. Для скачивания софтинке были заданы следующие форматы файлов: .txt;.docx;.rtf;.doc
7. А вот дальше начался "рок-н-ролл" (работа проводилась на 7-ке).
а) Естественно я засунул все скачанные 1241 файл сразу на проверку уникальности. Итог - через 5 часов работы eTXT Антиплагиат выдал фатальную ошибку и прекратил проверку.
--- Подумал, что слишком большая очередь на проверку.
б) Взял первые 100 файлов, перенёс в другую папку и снова запустил пакетную проверку eTXT Антиплагиат. Через 5 часов работы eTXT Антиплагиат снова выдал фатальную ошибку и прекратил проверку.
--- Поняв, что халявы не будет - включил мозг. Увидел, что файл, на котором eTXT Антиплагиат выдал фатальную ошибку, имеет размер 0. Таких файлов оказалось ещё 2 или 3 из 100 отобранных.
в) Запустил повторную проверку уже 97 файлов. Через 8 часов работы eTXT Антиплагиат опять выдал фатальную ошибку и прекратил проверку.
--- Поняв, что не только халявы не будет, но и надо поработать - открыл файл, на котором eTXT Антиплагиат выдал фатальную ошибку. Он оказался на арабском языке. Проверил оставшиеся 96 файлов. Почти во всех файлах с расширением .txt (а их было где-то 20-25 в той пачке) оказались всевозможные логи (работы софтов, айпишек и прочие, ранее мне не встречавшиеся). Удалил. Проверка файлов с расширениями .docx;.rtf;.doc выявила там как наличие отличных от русского языка других языков, так и множество всевозможных схем, формул и прочего). Тоже удалил. Осталось 53 файла (из 100 первоначальных) в папке.
г). Снова запустил пакетную проверку уникальности, которая длилась более 24 часов (что-то около 30), при чём во время пакетной проверки eTXT Антиплагиат потребляет до 3 гигов оперативы при пиковых нагрузках (из 4х имеющихся на том компе), что делает невозможным использование компа для других целей во время пакетной проверки на уникальность собранного контента. В результате из 53 файлов уникальными оказались 10 (у меня был задан порог отбора - 85% уникальности).
Результат:
Из 10 файлов
-- в 3х файлах оказался контент, который я не придумал куда бы приспособить (а я искал контент для сайтов под статейные биржи);
-- в 1 файле был контент, подходящий под сайт строительной тематики (примерно 50К символов без пробелов);
-- в 1 файле контент, подходящий под сайт туристической тематики (примерно 40К символов без пробелов);
-- в 3х файлах - литературные книги (200-300+К символов без пробелов);
-- в 1 файле контент, подходящий под сайт оборудования для торговли (примерно 70К символов без пробелов);
-- в 1 файле контент, подходящий под сайт на тему воспитания или образования (примерно 60К символов без пробелов).
Данные результаты после проверки 1/12 скачанных файлов (сейчас уже почти 20 часов проверяется на 2-ом компе на уникальность 2-ая пачка отсортированных скачанных файлов).
Выводы и рекомендации:.
1. Процесс хоть и автоматизирован, но машинное время потребляется в больших количествах. Хотя, стоит признать - результат того стоит.
2. Поработать ручками придётся (открывая и просматривая скачанные файлы), чтобы не перезапускать многократно eTXT Антиплагиат, если он будет утыкаться в фатальные ошибки.
3. Файлы с расширением .txt лучше не качать, а если уж скачали, то не отправлять на пакетную проверку не проверив их, так как более чем в 90% случаев в них окажутся разнообразные логи, голые цифры и разнообразные символы, на которых eTXT Антиплагиат реально утыкается и начинает жрать ресурсы оперативной памяти.
4. Не поленитесь, и перед отправкой на пакетную проверку уникальности контента откройте и просмотрите каждый файл на предмет наличия в нём русского языка, а также отсутствия большого количества таблиц, формул и прочего материала, который вы не сможете использовать.
5. Я не претендую на истину на счёт описания нагрузок на компы на разных системах - просто констатировал факты, как это было у меня. Можете сами пройтись по моим граблям, а может у вас их и не окажется на пути.
Последнюю часть (что выше этой строки) можете считать дополнением к мануалу...
Получил его буквально несколько часов назад и, по озвученным выше причинам, даже не приступал к его проверке. Да и не буду, так как этот способ заявлен как "дополнительный". Основного более чем достаточно.
Вроде как всё расписал более чем подробно, но если вопросы остались - задавайте.
P.S. Отчёт - почти 5К символов без пробелов... и не спрашивайте, чего я в свой блог так редко пишу...![]()
[Мануал]Полуавтоматический поиск уникального контента
(Ответов: 41, Просмотров: 6669)
- 12.03.2013 02:51
Последний раз редактировалось 13й; 12.03.2013 в 02:57.
Спасибо сказали:
A1ex(12.03.2013), chameleon4ik(12.03.2013), Dvoryashin(12.03.2013), Gulenkov(25.03.2013),hond(12.03.2013), - 12.03.2013 03:08
насколько контент читабельный?
насколько контент требует пост-обработки?
уникальность проверялась по каким настройкам? (шингл 5 или выше?)
и основное - причина продажи?
наберусь наглости предложить себя на отзыв для доп. способа или комплексного отзыва
пример обзора тут. Если заинтересуетесь - в личку могу объяснить, почему grazer доверил мне писать отзыв. У меня парк машин, в том числе и норм лошадка с 8 опертивами corei5, 100мбит канал, 4 пары свободных (условно) рук. Т.е., отзыв смогу предоставить оперативноПоследний раз редактировалось zloberman; 12.03.2013 в 03:13.
- 12.03.2013 03:21
100% ТС ведь писал, что
Подтверждаю.
----------------------
Не требует.
---------------------
Использовался ТОЛЬКО шингл 5.
--------------------
Просто:
во-первыхво-вторыхОПФ 2.6 Запрещено просить ТС сделать ту или иную работу "за отзыв", если сам ТС не предусмотрел этого, либо количество таких заказов уже исчерпано.
Вроде как есть чем заняться... да и деньги есть свободные (ну, или, по логике - должны быть). Горите желанием написать отзыв? Купите ман да напишите, никто ж не запрещает. А то данный пост вызывает противоречивые впечатления. Не то нет денег на покупку и тогда приведённая выше цитата - фейк, не то - завуалированная предъява мне, что необъективный отзыв. Хотя после такого развёрнутого отзыва кидать предъяву в необъективности - как-то уже совсем неадекватно... В общем - погрузился в раздумья, как реагировать на данный пост...Спасибо сказали:
- 12.03.2013 03:38
позвольте объяснить свою позицию
1 вопрос по читабельности контента и его пост-обработке - по сути, один момент, разбитый на 2 части. Если вы отбирали для бирж, понятное дело, что контент читабельный с точки зрения семантики, меня интересовала больше тех. сторона
2 предъявы я всегда говорю прямо, в данном случае никаких вопросов к вам именно нет
3 причина моего предложения: причина продажи темы, которая при затрате в 100 уе дает 320к текста (книги по внутренним моментам в счет не беру). даже при 0.5 уе за кило, мы получаем 160 уе.
Деньги на покупку мануала есть, но у меня на винте пылится уже такой ворох рунетовских инфопродуктов, что предвзято отношусь к любым схемам типа " продаю тему на 100500к, цена вопроса 50 руб". Т.е., у меня вопросы не к вашему отзыву, а к самой теме. По простой логике - тема тухнет, конечная или что-то не было сказано вслух, если ее сливают.
поэтому я и озвучил свои вопросы и предложения.
покупать тухлые темы не вижу смысла. понять логику, додумать ее, возможно, когда-то в чем-то применить -это имеет смысл.
поэтому в данном случае я готов рискнуть временем на ознакомление и написание отзыва, т.к. есть шанс, что тема будет иметь логическое продолжение.
В остальном вы правы, заняться есть чем.
Надеюсь ответил на все заданные и неозвученные вопросы - 12.03.2013 04:28
Когда обращаетесь в одном сообщении к разным людям - разделяйте хоть как-то вопросы адресованные персонально.
Так я же указал расширения файлов, по которым производился отбор. Или тогда совсем конкретно укажите, что вы имели в виду.
--------------
Это больше к ТС. Хотя ваш интерес тоже вижу: в случае, если вариант получить ман за отзыв прокатит - загрузить своих работников обработкой контента для своих сайтов полученного нахаляву, в отличии от рядовых покупателей мана. У меня своей сетки из 300+ сайтов нет, так что много контента я не использую в любом случае.
--------------
То есть тема grazer-а тоже классифицировалась как "тухлая", если вы её тоже за отзыв аж на 18 странице выпросили? Имелось в виду до получения мана от grazer-а, а все отзывы классифицировались как необъективные потому как:
типа: "там фуфло, а не отзывы и только я в силах предоставить истинный на 100% отзыв".
-----------------
По такой же простой вашей логике темы grazer-а и ТЫКВЫ тоже тухнут, потому как их "слили". - 12.03.2013 13:29Дипломник

- Регистрация: 08.12.2012
- Сообщений: 145
- Репутация: 16
13й, уточните, не будут ли нарушены авторские права при размещении полученного таким образом контента?
- 12.03.2013 17:23Студент

- Регистрация: 22.08.2010
- Сообщений: 70
- Репутация: 12
Скажите пожалуйста, насколько ограничен источник контента? в смысле всем хватит?
Последний раз редактировалось Blondolly; 12.03.2013 в 17:30.
- 12.03.2013 17:41
Бронирую копию. Сегодня Оплачу.
- 12.03.2013 19:34
Гипотетически - да, так как данные контент писали не Вы, Вы его не покупали у того, кто его писал и не спрашивали разрешения на его публикацию. Практически - доля того, что Вас заставят удалить контент, ничтожно мала. С литературными книгами чуть сложнее, но - тоже не смертельно.
Вопрос кому был? - 13.03.2013 18:57Banned


- Регистрация: 08.02.2011
- Сообщений: 103
- Репутация: 63
Тэги топика:
Похожие темы
| Темы | Раздел | Ответов | Последний пост |
|---|---|---|---|
Добыча уникального контента | Софт, скрипты, сервисы | 30 | 04.08.2014 00:22 |
Как подняться в топ ПМ без уникального контента?! | Общие вопросы поисковой оптимизации | 19 | 10.01.2013 14:40 |
Способы добычи уникального контента | Контент | 37 | 05.12.2012 10:41 |
API по продаже уникального и смыслового контента | Ссылки, статьи | 6 | 03.10.2012 01:03 |
Парсер уникального контента в LiveStreet | Софт, скрипты, сервисы | 0 | 05.03.2011 17:31 |





