Частичный отчёт о проведённой проверки данного мануала. "Частичный" из-за того, что технически полный отчёт сделать на данный момент технической возможности нет, но даже имеющейся информации будет вполне достаточно для того, чтобы оценить, покупать или нет данный мануал. И, чтобы не было лишних вопросов, сразу скажу - ман от ТС я получил за пару дней до опубликования данного топика.
1. Как я писал ранее - гугл аналогов данной методики не нашёл. Я о такой методике тоже не знал. 2. Источник информации другой, чем в первых двух мануалах от данного ТСа. И метод добычи - тоже. 3. Для тестирования мной использовались 2 разных моих компа. Один - на 7-ке, второй - на ХР SP3 (обе - лицензионные). Почему так - поймёте позже. 4. В ходе тестов проверялись 3 основные задачи: - сбор контента; - проверка собранного контента на уникальность; - возможность использования полученного уникального контента. 5. По софту: на 7-ке софт для выполнения первой задачи работать отказался. При чём, как более ранняя версия, так и более поздняя. Почему - не знаю. Аська производителя софтинки указана, так что покупатели смогут задать этот вопрос непосредственно к первоисточнику, если возникнет необходимость. На ХР SP3 данный софт отработал без проблем, нагружая двухядерник на 10-15% и потребляя оперативной памяти где-то до 15Mb. Результаты работы софтинки (где-то за 6 часов) - на скриншоте ниже.
6. Для скачивания софтинке были заданы следующие форматы файлов: .txt;.docx;.rtf;.doc 7. А вот дальше начался "рок-н-ролл" (работа проводилась на 7-ке). а) Естественно я засунул все скачанные 1241 файл сразу на проверку уникальности. Итог - через 5 часов работы eTXT Антиплагиат выдал фатальную ошибку и прекратил проверку. --- Подумал, что слишком большая очередь на проверку. б) Взял первые 100 файлов, перенёс в другую папку и снова запустил пакетную проверку eTXT Антиплагиат. Через 5 часов работы eTXT Антиплагиат снова выдал фатальную ошибку и прекратил проверку. --- Поняв, что халявы не будет - включил мозг. Увидел, что файл, на котором eTXT Антиплагиат выдал фатальную ошибку, имеет размер 0. Таких файлов оказалось ещё 2 или 3 из 100 отобранных. в) Запустил повторную проверку уже 97 файлов. Через 8 часов работы eTXT Антиплагиат опять выдал фатальную ошибку и прекратил проверку. --- Поняв, что не только халявы не будет, но и надо поработать - открыл файл, на котором eTXT Антиплагиат выдал фатальную ошибку. Он оказался на арабском языке. Проверил оставшиеся 96 файлов. Почти во всех файлах с расширением .txt (а их было где-то 20-25 в той пачке) оказались всевозможные логи (работы софтов, айпишек и прочие, ранее мне не встречавшиеся). Удалил. Проверка файлов с расширениями .docx;.rtf;.doc выявила там как наличие отличных от русского языка других языков, так и множество всевозможных схем, формул и прочего). Тоже удалил. Осталось 53 файла (из 100 первоначальных) в папке. г). Снова запустил пакетную проверку уникальности, которая длилась более 24 часов (что-то около 30), при чём во время пакетной проверки eTXT Антиплагиат потребляет до 3 гигов оперативы при пиковых нагрузках (из 4х имеющихся на том компе), что делает невозможным использование компа для других целей во время пакетной проверки на уникальность собранного контента. В результате из 53 файлов уникальными оказались 10 (у меня был задан порог отбора - 85% уникальности).
Результат:
Из 10 файлов -- в 3х файлах оказался контент, который я не придумал куда бы приспособить (а я искал контент для сайтов под статейные биржи); -- в 1 файле был контент, подходящий под сайт строительной тематики (примерно 50К символов без пробелов); -- в 1 файле контент, подходящий под сайт туристической тематики (примерно 40К символов без пробелов); -- в 3х файлах - литературные книги (200-300+К символов без пробелов); -- в 1 файле контент, подходящий под сайт оборудования для торговли (примерно 70К символов без пробелов); -- в 1 файле контент, подходящий под сайт на тему воспитания или образования (примерно 60К символов без пробелов).
Данные результаты после проверки 1/12 скачанных файлов (сейчас уже почти 20 часов проверяется на 2-ом компе на уникальность 2-ая пачка отсортированных скачанных файлов).
Выводы и рекомендации:. 1. Процесс хоть и автоматизирован, но машинное время потребляется в больших количествах. Хотя, стоит признать - результат того стоит. 2. Поработать ручками придётся (открывая и просматривая скачанные файлы), чтобы не перезапускать многократно eTXT Антиплагиат, если он будет утыкаться в фатальные ошибки. 3. Файлы с расширением .txt лучше не качать, а если уж скачали, то не отправлять на пакетную проверку не проверив их, так как более чем в 90% случаев в них окажутся разнообразные логи, голые цифры и разнообразные символы, на которых eTXT Антиплагиат реально утыкается и начинает жрать ресурсы оперативной памяти. 4. Не поленитесь, и перед отправкой на пакетную проверку уникальности контента откройте и просмотрите каждый файл на предмет наличия в нём русского языка, а также отсутствия большого количества таблиц, формул и прочего материала, который вы не сможете использовать. 5. Я не претендую на истину на счёт описания нагрузок на компы на разных системах - просто констатировал факты, как это было у меня. Можете сами пройтись по моим граблям, а может у вас их и не окажется на пути.
Последнюю часть (что выше этой строки) можете считать дополнением к мануалу...
Сообщение от hond
Добавил в пакет Дополнительный Способ на основе данного мануала
Получил его буквально несколько часов назад и, по озвученным выше причинам, даже не приступал к его проверке. Да и не буду, так как этот способ заявлен как "дополнительный". Основного более чем достаточно.
Вроде как всё расписал более чем подробно, но если вопросы остались - задавайте.
P.S. Отчёт - почти 5К символов без пробелов... и не спрашивайте, чего я в свой блог так редко пишу...
Последний раз редактировалось 13й; 12.03.2013 в 02:57.
Место свободно для Вашей рекламы. С предложениями в ЛС.
насколько контент читабельный? насколько контент требует пост-обработки? уникальность проверялась по каким настройкам? (шингл 5 или выше?) и основное - причина продажи?
наберусь наглости предложить себя на отзыв для доп. способа или комплексного отзыва пример обзора тут. Если заинтересуетесь - в личку могу объяснить, почему grazer доверил мне писать отзыв. У меня парк машин, в том числе и норм лошадка с 8 опертивами corei5, 100мбит канал, 4 пары свободных (условно) рук. Т.е., отзыв смогу предоставить оперативно
Последний раз редактировалось zloberman; 12.03.2013 в 03:13.
Тема как то связана с ... машинным рерайтом, сканом и т.п.? Категорично отвечу: НЕТ
Подтверждаю.
----------------------
Сообщение от zloberman
насколько контент требует пост-обработки?
Не требует.
---------------------
Сообщение от zloberman
уникальность проверялась по каким настройкам? (шингл 5 или выше?)
Использовался ТОЛЬКО шингл 5.
--------------------
Сообщение от zloberman
наберусь наглости предложить себя на отзыв для доп. способа или комплексного отзыва
Просто: во-первых
ОПФ 2.6 Запрещено просить ТС сделать ту или иную работу "за отзыв", если сам ТС не предусмотрел этого, либо количество таких заказов уже исчерпано.
во-вторых
Сообщение от zloberman
За плечами своя студия, сотни проектов, самый разнообразный опыт в сайтострое и продвижении, в том числе и своя сетка сайтов на 300+ дроп-доменов.
Вроде как есть чем заняться... да и деньги есть свободные (ну, или, по логике - должны быть). Горите желанием написать отзыв? Купите ман да напишите, никто ж не запрещает. А то данный пост вызывает противоречивые впечатления. Не то нет денег на покупку и тогда приведённая выше цитата - фейк, не то - завуалированная предъява мне, что необъективный отзыв. Хотя после такого развёрнутого отзыва кидать предъяву в необъективности - как-то уже совсем неадекватно... В общем - погрузился в раздумья, как реагировать на данный пост...
Место свободно для Вашей рекламы. С предложениями в ЛС.
1 вопрос по читабельности контента и его пост-обработке - по сути, один момент, разбитый на 2 части. Если вы отбирали для бирж, понятное дело, что контент читабельный с точки зрения семантики, меня интересовала больше тех. сторона
2 предъявы я всегда говорю прямо, в данном случае никаких вопросов к вам именно нет
3 причина моего предложения: причина продажи темы, которая при затрате в 100 уе дает 320к текста (книги по внутренним моментам в счет не беру). даже при 0.5 уе за кило, мы получаем 160 уе. Деньги на покупку мануала есть, но у меня на винте пылится уже такой ворох рунетовских инфопродуктов, что предвзято отношусь к любым схемам типа " продаю тему на 100500к, цена вопроса 50 руб". Т.е., у меня вопросы не к вашему отзыву, а к самой теме. По простой логике - тема тухнет, конечная или что-то не было сказано вслух, если ее сливают. поэтому я и озвучил свои вопросы и предложения.
покупать тухлые темы не вижу смысла. понять логику, додумать ее, возможно, когда-то в чем-то применить -это имеет смысл. поэтому в данном случае я готов рискнуть временем на ознакомление и написание отзыва, т.к. есть шанс, что тема будет иметь логическое продолжение. В остальном вы правы, заняться есть чем.
Надеюсь ответил на все заданные и неозвученные вопросы
Когда обращаетесь в одном сообщении к разным людям - разделяйте хоть как-то вопросы адресованные персонально.
Сообщение от zloberman
1 вопрос по читабельности контента и его пост-обработке - по сути, один момент, разбитый на 2 части. Если вы отбирали для бирж, понятное дело, что контент читабельный с точки зрения семантики, меня интересовала больше тех. сторона
Так я же указал расширения файлов, по которым производился отбор. Или тогда совсем конкретно укажите, что вы имели в виду.
--------------
Сообщение от zloberman
3 причина моего предложения: причина продажи темы
Это больше к ТС. Хотя ваш интерес тоже вижу: в случае, если вариант получить ман за отзыв прокатит - загрузить своих работников обработкой контента для своих сайтов полученного нахаляву, в отличии от рядовых покупателей мана. У меня своей сетки из 300+ сайтов нет, так что много контента я не использую в любом случае.
--------------
Сообщение от zloberman
покупать тухлые темы не вижу смысла.
То есть тема grazer-а тоже классифицировалась как "тухлая", если вы её тоже за отзыв аж на 18 странице выпросили? Имелось в виду до получения мана от grazer-а, а все отзывы классифицировались как необъективные потому как:
Сообщение от zloberman
т.к. я НЕ модератор, НЕ близкий знакомый итд
типа: "там фуфло, а не отзывы и только я в силах предоставить истинный на 100% отзыв".
-----------------
Сообщение от zloberman
По простой логике - тема тухнет, конечная или что-то не было сказано вслух, если ее сливают. поэтому я и озвучил свои вопросы и предложения.
По такой же простой вашей логике темы grazer-а и ТЫКВЫ тоже тухнут, потому как их "слили".
Место свободно для Вашей рекламы. С предложениями в ЛС.
13й, уточните, не будут ли нарушены авторские права при размещении полученного таким образом контента?
Гипотетически - да, так как данные контент писали не Вы, Вы его не покупали у того, кто его писал и не спрашивали разрешения на его публикацию. Практически - доля того, что Вас заставят удалить контент, ничтожно мала. С литературными книгами чуть сложнее, но - тоже не смертельно.
Сообщение от Blondolly
Скажите пожалуйста, насколько ограничен источник контента? в смысле всем хватит?
Вопрос кому был?
Место свободно для Вашей рекламы. С предложениями в ЛС.