На главную страницу AlgoNet В сотрудничестве с ZDNet
АРХИВ СТАТЕЙ 2008-1-22 на главную / новости от 2008-1-22
AlgoNet.ru
поиск

 

Место для Вашей рекламы!

 

Все новости от 22 января 2008 г.

ЕС предлагает разработчикам ресурсы по машинному переводу

Европейская Комиссия предложила разработчикам ПО перевода бесплатный доступ почти к миллиону переведенных предложений на 22 из 23 официальных языков Евросоюза. ЕК надеется, что эти данные помогут повысить качество разнообразных языковых инструментов, включая программы проверки грамматики и орфографии, онлайновые словари и автоматические переводчики — особенно на менее распространенных языках, таких как Латвийский или Румынский.

Предложения взяты главным образом из Acquis Communautaire, свода законов, который должен быть принят всеми новыми членами ЕС и включает договоры, директивы и постановления ЕС, а также решения Европейского суда. Эти документы, переведенные профессиональными переводчиками, охватывают такие темы, как информационные технологии, телекоммуникации, трудовой кодекс, сельское хозяйство и право рыбной ловли.

Переводы этих предложений образуют часть «памяти переводов», используемой 1750 штатными переводчиками Комиссии, снабжены признаками предметной классификации и в точности совпадают для каждого из 22 языков. Это делает их особенно полезными для разработчиков ПО статистического машинного перевода, которым нужно собрать корпус из тысяч совпадающих фраз на разных языках, чтобы затем можно было найти наиболее вероятный перевод любой заданной фразы. Так как предложения уже совпадают, разработчики сэкономят массу времени — а гигантский размер Acquis Communautaire поможет им получать более точные результаты вычислений. До сих пор разработчики обычно разыскивали в вебе тексты, переведенные на несколько языков, и пользовались другими программными инструментами, чтобы определять начало и конец предложений и совмещать их.

Предоставляя эти данные в распоряжение разработчиков, Комиссия не совсем бескорыстна: она надеется, что доступность лучшего и более дешевого ПО машинного перевода откроет людям, говорящим на «малых» языках ЕС, доступ к онлайновой информации, которая сейчас доступна только носителям широко распространенных языков.

Заинтересованные разработчики могут загрузить тексты с веб-сайта Дирекции по переводу Европейской Комиссии. Им понадобится также программа для извлечения текста и ее библиотека

 Предыдущие публикации:
2007-04-12   Новый PROMT переводит лучше?
Обсуждение и комментарии
ast - tron84mail.ru
23 Jan 2008 2:18 AM
Ссылка на софт должна быть http://wt.jrc.it/lt/Acquis/DGT_TU_1.0/ExtractionTool/
 

 

← декабрь 2007 17  18  20  21  22  23  24  25  28 февраль 2008 →
Реклама!
 

 

Место для Вашей рекламы!