Кто занимается сканом текста с изображений и прочего, подскажите софт для обработки распознанных текстов. Нужна прога которая будет исправлять "опечатки" например : распознано слово "сео-форм", т.е. пропущена буква "y", нужен софт который свожет исправить подобные ошибки
нашел прогу AfterScan 5.1, но не получается ее заставить делать то, что мне нужно. надеюсь на вашу помощь :)
naprimer001,смотрим стартпост, замечаем строку <<софт для обработки распознанных текстов>>, выделяем ключевое слово <<софт для обработки распознанных текстов>>, делаем логический вывод, что файнридер это не то
С таким софтом не встречался, в свое время искал что-то подобное для правки текста после перевода - пусто. А правописание можно в ворде проверить, но тоже надо ручками делать.
Софт в данном случае может помочь при узкой тематики текстов и обширного словаря терминов. В остальных случаях самый эффективный инструмент - ручная работа не требовательных исполнителей.
Не так давно столкнулся со схожей проблемой. Более месяца искал решение...перелопатил кучу программ, старых и новых, быстрых и тормозных...и в итоге пришел к выводу, что в такой ситуации спасут только руки. Автоматизировать это скорее всего не получится...ну, по крайней мере, мне не удалось.
Тут скорее всего только word+руки. Вы привели простой пример, а если, например, будет распознанное слово "форм" (имеется ввиду форУм), как программа определит что вы не имеете ввиду слово "формА"? Это просто не реально определить какую именно букву нужно подставлять.
Тоже занимаюсь наполнением сайтов сканированным текстом, как исправлять грамматику выхода не нашел, только руками.
Есть программа regexfilters она очищает текст от шлака, но вырезает целыми предложениям. Но я ей пользуюсь, так как проще найти много книжек, чем сидеть и руками исправлять ошибки и мусор.