Нам регулярно требуется англоязычный контент в больших количествах. Поэтому мы тестируем различные подходы к его генерации. Насколько успели заметить, для индексации контента и последующего хорошего ранжирования страниц с этим контентом, текст должен быть более менее качественным (субъективно - читаемым). Проанализировали ряд сервисов для машинного перевода текста. Для пары ru-en так и не нашли ничего толкового с точки зрения качества получаемого на выходе контента. Поэкспериментировали с цепочками (вроде ru|fr|en) - качество также не понравилось. Начали смотреть в сторону родственных языков и наткнулись на интересную пару: de-en (немецкий-английский). На выходе получается далеко не идеальный текст, однако читаемость в среднем явно выше ru-en. Например:
Исходный текст
Ludwig von Mises gilt zweifellos als einer der größten Intellektuellen des 20. Jahrhunderts. Es gibt kaum ein wirtschaftliches Thema, auf das der Philosoph des Liberalismus und Vordenker der Österreichischen Schule der Nationalökonomie in seinen Publikationen nicht eingegangen ist. Das Faszinierende daran:
Seine Gedankengänge sind noch immer brandaktuell, seine Denkanstöße, wie zum Thema Mindestlohn, erschreckend visionär.
Michael Ladwig hat in liebevoller Detailarbeit das umfangreiche Werk Ludwig von Mises’ analysiert und ein Lexikon zusammengestellt, das eine Orientierungshilfe in seiner Philosophie bietet. Leicht verständliche Artikel beleuchten Mises’ Gedanken von A wie Anarchismus bis Z wie Zwang, mal in ein paar Sätzen auf den Punkt gebracht, mal über mehrere spannende Seiten.
Переведено Яндекс переводчиком
Ludwig von Mises is without a doubt one of the greatest Intellectuals of the 20th century. Century. There is hardly an economic subject, the philosopher of liberalism, and thinkers of the Austrian school of Economics in its publications is not addressed. The Fascinating thing is:
His thoughts are always up to date, its food for thought, as to the topic of minimum wage, terrifying visionary.
Michael Ladwig has analysed in loving detail the extensive work of Ludwig von Mises’ and a lexicon is compiled, which provides a guidance in his philosophy. Easy-to-understand article Mises’ thoughts of A like anarchism to Z as in forced, time in a couple of sentences to the point light, at other times about several exciting pages.
Вопросы 1. Есть ли у вас рекомендации по улучшению качества автопереводного контента? 2. Возможно, посоветуете языковые пары или сервисы автоперевода, которые стоит использовать? 3. Проводил ли кто-нибудь тесты по массовой индексации и выводу в ТОП страниц с подобным контентом, в частности, при машинном переводе родственных языковых пар?
kolchakA,Какой бы машинный перевод не был, если без ручного вмешательства, получается шлак в итоге.
Максимум что можно было бы попробовать это двойной перевод, например en-ru и потом перевод ru прогонять через свои словари для правки и исправлений корявых и нечитаемых слов. Таким же макаром можно и делать под нужный язык. Но, одного машинного перевода мало, автоперевод без правок, шлак, хотя может в начале как-то в выдчи плавать, но потом все проваливается и фильтруется такая генеренка..
Проводил ли кто-нибудь тесты по массовой индексации и выводу в ТОП страниц с подобным контентом, в частности, при машинном переводе родственных языковых пар?
проводили эксперименты и не один, результат везде одинаковый - бан, других результатов не видел ни разу ни в одном кейсе...Так что не советую, лучше дешевых копирайтеров нанять, чем использовать такой перевод т.к. в случае бана все труды и усилия будут потрачены зря.
Раньше сайты на автопереводе хорошо индексировались и получали солидный траф. Я долго работал на паре текста ru-ua и наоборот. Думаю, ru-by тоже будет нормально.
По поводу систем перевода - раньше был выбор между Yandex, Google и Pragma (других я не знаю или их нет). Сейчас там капитально завинтили гайки - Google защитил скрипты на которых работает сам сайт translate.google.com, я не сильно напрягался, конечно, но мне не удалось сейчас возобновить работу своих скриптов. Yandex тоже некоторое время назад сменил API и старые кроны работать перестали. Я переписал, но пришлось уже регистрировать ключ и укладываться в лимиты (они там есть).
1. нет. невозможно. 2. использовать любой, смотря для какой пары. Пробуй языки одной языковой семьи. 3. Массовый перевод текстов с одного источника - однозначный АГС, если источники разные и их много по пару текстов с каждого - все работает как часы. Раньше вообще хорошо было, сейчас загнать в индекс сложнее. Или мне кажется.
Массовый перевод текстов с одного источника - однозначный АГС
Пардон, но какой АГС? Он же, вроде, хочет переводит с немецкого на англ., а потом выкладывать для Гугла. Последнему, на самом деле, пофиг уник у тебя на сайте или копипаст, главное - регулярная подача интересного контента с удобной для ботов и юзеров форме, а также постоянно появление внешних ссылок на сайт. Тогда со временем Гугл полюбит ваши ресурсы и будет давать хороший трафф.
Надежный и отзывчивый VPS Хостинг для серьёзных проектов.
Знакомый проводил эксперименты с переводами. Не знаю технических подробностей, но он переводил РУ-Инглиш с помощью Фейбука. Говорит, что самый качественный перевод получался. Думаю, что на автомат не получится поставить, но это автору как вариант для анализа морфологии, словарей и пополнения своей базы переводов.
Экспериментировал с разными языками (en, fr, de, it, es, pl, ch) и связками за 8 месяцев все улетело в бан. Тестировались переводчики google, yandex, bing. Были применены ручные меры:
[Инструменты для веб-мастеров] http://****/: проблемы с качеством сайта