Конвертируем PDF в текст

(Ответов: 18, Просмотров: 11993)
Страница 1 из 2 12 Последняя
  1. Senior Member Аватар для RichardBeeter
    • Регистрация: 05.09.2009
    • Сообщений: 574
    • Репутация: 23
    Все знают, что довольно неплохой источник контента - это книги.
    Также все знают что почти все книги можно найти в сети в виде pdf-файла.
    Чтобы конвертировать PDF можно использовать finereader, но прога тяжелая и жрет много ресурсов компа. Но мало кто знает что есть онлайн конвертеры.
    Вот некторые из них:
    http://pdftextonline.com/ - Извлекает текст из PDF и его можно копировать.
    http://showpdf.com/ - конвертер PDF в HTML.
    http://www.freepdfconvert.com/ - Конвертация PDF в Word (doc) или Excel (xls), извлечение картинок из PDF.


    Если вы знаете еще подобные сервисы, делитесь. Думаю это весьма полезные сервисы, например для изготовления ГС или дорвеев.
    • 0
  2. Гуру Аватар для bezumniy
    • Регистрация: 03.09.2009
    • Сообщений: 1,071
    • Репутация: 13
    Также все знают что почти все книги можно найти в сети в виде pdf-файла.
    Да только так же надо знать что эти PDF файлы боты индексят и с них текст будет уже неуникален.
    • 0
  3. Senior Member Аватар для RichardBeeter
    • Регистрация: 05.09.2009
    • Сообщений: 574
    • Репутация: 23
    Цитата Сообщение от bezumniy Посмотреть сообщение
    Да только так же надо знать что эти PDF файлы боты индексят и с них текст будет уже неуникален.
    Да, но ведь никто не мешает синонимировать его.
    • 0
  4. Гуру Аватар для bezumniy
    • Регистрация: 03.09.2009
    • Сообщений: 1,071
    • Репутация: 13
    Да, но ведь никто не мешает синонимировать его.
    Ну а зачем тогда конвертировать PDF?
    Можно так же синонимизировать любой текст с любых страниц, при этом гемороя меньше.
    Хотя кому как удобнее
    • 0
  5. Опытный Аватар для LEO
    • Регистрация: 25.09.2009
    • Сообщений: 495
    • Репутация: 7
    Цитата Сообщение от bezumniy Посмотреть сообщение
    Ну а зачем тогда конвертировать PDF?
    Можно так же синонимизировать любой текст с любых страниц, при этом гемороя меньше.
    Хотя кому как удобнее
    Большинство текста в пдф валяется в нете на обычных сайтах в виде текста или хтмл
    • 0
  6. Гуру Аватар для karbid
    • Регистрация: 06.09.2009
    • Сообщений: 2,236
    • Репутация: 90
    Цитата Сообщение от RichardBeeter Посмотреть сообщение
    Но мало кто знает что есть онлайн конвертеры.
    Я лично конвертил стандартной функцией акробата "Сохранить как -> Текст" когда мне это нужно было. Не знаю, зачем ещё нужны какие-то конвертеры. Может только не во всех версиях акробата это доступно...
    • 0
  7. Junior Member
    • Регистрация: 12.09.2009
    • Сообщений: 24
    • Репутация: 10
    Можно действительно просто сохранить текст, тем же акробатом или какой-нибудь другой читалкой. Правда может не всегда получится, но тогда и сервисы не помогут, придется юзають что-нибудь вроде FineReader. Насчет уникальности, можно попробвать найти книги в djvu, конвертировать их в ПДФ и распознать FineReader.
    • 0
  8. Гуру Аватар для karbid
    • Регистрация: 06.09.2009
    • Сообщений: 2,236
    • Репутация: 90
    Цитата Сообщение от kalombo Посмотреть сообщение
    Правда может не всегда получится, но тогда и сервисы не помогут, придется юзають что-нибудь вроде FineReader.
    Да - это не получится только в том случае, если pdf-исходник - скан картинка, а не скомпилированный текст. Тогда его придется распознавать, редактировать и т.д.
    • 0
  9. Banochkin.com Аватар для Sk8er
    • Регистрация: 08.09.2009
    • Сообщений: 1,799
    • Записей в дневнике: 1
    • Репутация: 91
    • Webmoney BL: ?
    Да только так же надо знать что эти PDF файлы боты индексят и с них текст будет уже неуникален.
    Ого. даже не знал :)

    Вот тут хорошо описана эта тема: http://seofamily.ru/kak-konvertirova...-v-format-doc/
    Banochkin.com — веду блог, создаю и продвигаю сайты.
    Контакты.
    • 0
  10. Опытный Аватар для dendesoft
    • Регистрация: 20.09.2009
    • Сообщений: 291
    • Записей в дневнике: 1
    • Репутация: 8
    • Webmoney BL: ?
    Ого. даже не знал
    Индексят то они индексят, но не все есть в Интернете.
    Я совсем недавно нашел огромный источник PDF файлов с уникальным читабельным контентом. Палить не буду, скажу лишь что этот источник есть у каждого на компьютере, даже у простых юзверей которые играют в игры и раскладывают пасьянсы =) Главное хорошенько присмотреться.

    Но вот по поводу конвертации... Хорошие вещи, нужно будет попробовать, так как до сегодняшнего дня использовал FineReader, что очень муторно.
    • 0
Страница 1 из 2 12 Последняя

Похожие темы

Темы Раздел Ответов Последний пост
Конвертируем траф в $$$$$ (подписки).
Реклама партнерских программ 1 16.12.2009 23:37
Конвертируем трафик до 500$ с 1k России
Реклама партнерских программ 0 24.11.2009 23:21
СЧ и НЧ на профилях. Как конвертируем?
Дорвеи и black SEO 21 01.10.2009 11:29
Как составить текст объявлениея для PPC кампании?
Обучающие статьи 28 20.09.2009 16:44

У кого попросить инвайт?

Вы можете попросить инвайт у любого модератора:

Информеры