Вот подумываю использовать распознавание голоса для уник. контента

(Ответов: 8, Просмотров: 752)
  1. Опытный Аватар для SEEK
    • Регистрация: 10.09.2012
    • Сообщений: 252
    • Репутация: 205
    • Webmoney BL: ?
    Всем привет...Знаю что темка эта проскакивала-но я до нее допер своим умом :). Хочу попользовать _speechpad.ru для наполнения своего зарубежного проекта-контентом. А так как англицкий знаю более менее-то какие то ошибки машины вполне могу поправить. Никто не пользовал его для своих проектов?
    А, кстати забыл сказать для чего! - распознавание голоса из видео на ё-туб.
    • 0
  2. Гуру Аватар для Sabirchik
    • Регистрация: 18.02.2012
    • Сообщений: 971
    • Репутация: 232
    • Webmoney BL: ?
    SEEK, попробуйте, потом нам сообщите какие результаты
    • 0
  3. Super Moderator
    • Регистрация: 20.05.2011
    • Сообщений: 5,730
    • Репутация: 4288
    • Webmoney BL: ?
    Знаем такое, вот вам в помощь ССЫЛКА
    • 0
  4. Опытный Аватар для SEEK
    • Регистрация: 10.09.2012
    • Сообщений: 252
    • Репутация: 205
    • Webmoney BL: ?
    Закончил тест(в процессе написания стартпоста-у меня уже был запущен тест)..Вполне недурственно между прочим!
    Расставить знаки препинания, бегло прочитать и поправить мелочи -и вполне себе годно!
    Как тестил:
    1) взял видеоролик HD качества;
    2) звук погромче

    Надиктовало 400 слов статейку на американском английском, уровень распознавания 98% показывало в процессе.
    Ошибок почти нет-я в восторге! :)

    P.S. но есть и минусы -кто "не шарит" в английском-не сможет понять что тут верно, что нет...но в целом-вполне!
    Последний раз редактировалось SEEK; 13.04.2013 в 22:09.
    • 0
  5. Человечный Android Аватар для wolf28
    • Регистрация: 21.11.2011
    • Сообщений: 1,111
    • Репутация: 275
    SEEK, шарить то особо не понадобится, Word все равно лучше знает
    ТУТ может быть ваша реклама! Заинтересовало, пишите в ЛС.
    • 0
  6. Опытный Аватар для SEEK
    • Регистрация: 10.09.2012
    • Сообщений: 252
    • Репутация: 205
    • Webmoney BL: ?
    wolf28, это понятно. Только я не об синтаксических ошибках ;-). А об смысловых -когда надо допустим it -а он пишет was и т.д. Ну а так прикольно-на начальном этапе, кто хочет заморочиться :). Можно даже СДЛ-ы делать потихоньку...По крайней мере не покупая у буржуинов контент...
    • 1

    Спасибо сказали:

    wolf28(13.04.2013),
  7. Человечный Android Аватар для wolf28
    • Регистрация: 21.11.2011
    • Сообщений: 1,111
    • Репутация: 275
    SEEK, понял что вы имели в виду, отличная связка будет если word + google translate (для той же правки похожих слов по звучанию, но перевод разный). Как то так, тоже пробовал делать схемы с софтом в теории, но до практики не дошло
    ТУТ может быть ваша реклама! Заинтересовало, пишите в ЛС.
    • 0
  8. Опытный Аватар для SEEK
    • Регистрация: 10.09.2012
    • Сообщений: 252
    • Репутация: 205
    • Webmoney BL: ?
    wolf28, ну вот я сейчас попробовал, -мне понравилось! Очень сильно степень правильности распознавания зависит от громкости звука, - как на плеере, так и в ролике. Думаю что если брать хорошие, профессионально снятые ролики, где люди не жуют слова-то можно достичь неплохих результатов. Вот к примеру в этих 400 словах он единственно что не перевел- это профессиональные термины, которые я даже прослушав несколько раз в видео-не понял как они должны писаться.

    P.S. заморачиваюсь сейчас с мфа под буржунет-вот и темы у меня такие :)
    • 0
  9. Опытный Аватар для SEEK
    • Регистрация: 10.09.2012
    • Сообщений: 252
    • Репутация: 205
    • Webmoney BL: ?
    Итак, я продолжаю исследовать нашу родную "твою трубу" :) на предмет воровства из нее текстового контента.
    Нашел способ гораздо лучше вышеперечисленного (правда он ограничен роликами с субтитрами):

    ОПИСАНИЕ

    Скачиваем субтитры из YouTube


    Скажем, вы посмотрели выступление Эрика Шмидта на TechCrunch Disrupt и хотите поделиться с кем-нибудь интересными идеями, высказанными в ходе конференции. К счастью, к видео были добавлены субтитры, которые проще было бы скопировать.

    Хорошая новость в том, что теперь вы можете это сделать - скачать прикрепленные субтитры. Для этого достаточно воспользоваться ссылкой http://video.google.com/timedtext?lang=en&v=VIDEO_ID, где вы должны заменить VIDEO_ID на ID YouTube видео. Вот, например, файл с субтитрами из видео с Эриком Шмидтом.

    Открыв его в браузере, вы увидите, что это обычный XML файл, и вы можете извлечь простой текст, удалив все тэги. Правый клик на странице, выбираете "view source", копируете нужный текст без тэгов и вставляете его в нужном месте. Например, так:

    We have one of the largest databases of information in the world which we've engineered and which is very, very difficult technologically in order to house all that information and ready for more. So, where do we go next with search? Well, you've got personal contacts, personal emails, personal network of people and your relationships with them, and with your permission -- and I need to say that about 500 times -- with your permission, we can actually search and index that information and make all of these answers so much better. The next step after that is obviously autonomous search. This is searches that you're -- that are occurring while you're not even doing searching.
    [свернуть]


    Проверил-работает!
    • 1

    Спасибо сказали:

    altezzik(14.04.2013),

Похожие темы

Темы Раздел Ответов Последний пост
Распознавание каптчи, OCR
Софт, скрипты, сервисы 29 27.05.2015 23:53
Подумываю о продаже сайтиков, [примерная оценка стоимости]
Оценка ваших сайтов, блогов 1 25.02.2013 17:37
Падение цен на голоса
Социальные сети 5 02.02.2013 22:33

У кого попросить инвайт?

Вы можете попросить инвайт у любого модератора:

Информеры