Все знают, что довольно неплохой источник контента - это книги. Также все знают что почти все книги можно найти в сети в виде pdf-файла. Чтобы конвертировать PDF можно использовать finereader, но прога тяжелая и жрет много ресурсов компа. Но мало кто знает что есть онлайн конвертеры. Вот некторые из них: http://pdftextonline.com/ - Извлекает текст из PDF и его можно копировать. http://showpdf.com/ - конвертер PDF в HTML. http://www.freepdfconvert.com/ - Конвертация PDF в Word (doc) или Excel (xls), извлечение картинок из PDF.
Если вы знаете еще подобные сервисы, делитесь. Думаю это весьма полезные сервисы, например для изготовления ГС или дорвеев.
Я лично конвертил стандартной функцией акробата "Сохранить как -> Текст" когда мне это нужно было. Не знаю, зачем ещё нужны какие-то конвертеры. Может только не во всех версиях акробата это доступно...
Можно действительно просто сохранить текст, тем же акробатом или какой-нибудь другой читалкой. Правда может не всегда получится, но тогда и сервисы не помогут, придется юзають что-нибудь вроде FineReader. Насчет уникальности, можно попробвать найти книги в djvu, конвертировать их в ПДФ и распознать FineReader.
Правда может не всегда получится, но тогда и сервисы не помогут, придется юзають что-нибудь вроде FineReader.
Да - это не получится только в том случае, если pdf-исходник - скан картинка, а не скомпилированный текст. Тогда его придется распознавать, редактировать и т.д.
Индексят то они индексят, но не все есть в Интернете. Я совсем недавно нашел огромный источник PDF файлов с уникальным читабельным контентом. Палить не буду, скажу лишь что этот источник есть у каждого на компьютере, даже у простых юзверей которые играют в игры и раскладывают пасьянсы =) Главное хорошенько присмотреться.
Но вот по поводу конвертации... Хорошие вещи, нужно будет попробовать, так как до сегодняшнего дня использовал FineReader, что очень муторно.