Вобщем, имеется большая база текстов (несколько тысяч работ студентов за несколько лет), в интернете эти тексты имеют уникальность 90-100% - по Advego Plagiatus, но возникла дургая проблема:
- при беглом осмотре базы выснилось что примерно 10% работ идентичны или очень похожи друг на друга...

Задача: нужно сравнить каждый текст с остальными в базе используя параметры определния униальности в интернете и выделить похожие (в идеале с указанием процента похожести).

Так как текстов очень много - вручную сделать это невозможно, так же как и невозможно воспользоваться онлайн сервисами подобного типа.

Поэтому ищестя стационарный софт для автоматического сравнения уникальности - подскажите кто что может)

P/S/ - Разработчика софта имеющим желание заняться созданием такой програмки (если не найдется уже готовых вариантов) - писать ЛС.