Новая технология позволяет говорить на нескольких языках одновременно

Через несколько лет можно будет синхронно говорить по-испански, по-французски и по-английски.

Алекс Уэйбел, профессор вычислительной техники Карнеги-Меллонского университета (CMU) и университета Карлсрухе в Германии, продемонстрировал в кампусе CMU в Питтсбурге технологию, помогающую общаться людям, говорящим на разных языках.

Одна из его программ, неофициально называемая «переводчиком лектора», синхронно переводит речь с одного языка на другой без всяких ограничений. Существующие технологии перевода обычно ограничены определенными темами или имеют ограниченный словарь и требуют предварительного обучения.

Другой прототип, имя которому еще не дано, использует направленные динамики, чтобы разным слушателям направлять переводы доклада на разных языках. «Это все равно, как если бы рядом с вами стоял переводчик-синхронист, только без неудобств, связанных с присутствием человека за спиной», — говорит Уэйбел. А для тех, кто предпочитает чтение, так называемые «очки-переводчик» преобразуют эти потоки устной речи в субтитры, отображаемые на маленьком ЖК-экране.

Еще есть «мышечный переводчик». Электроды улавливают сигналы движения лицевых мышц и преобразуют их в речь. Это позволит, например, в кинотеатре говорить по телефону, не произнося ни звука. В будущем электроды можно будет заменить беспроводными чипами, имплантированными под кожу лица. «Это кажется необычным, но кто мог подумать, что люди станут вставлять в щеки серьги?» — смеется Уэйбел. В эксперименте используются восемь электродов, «но почти вся информация передается через три или четыре», — добавил он.

Хотя машинный перевод иногда воспринимается как самостоятельный язык, технологические достижения и рыночный спрос в последние годы возродили интерес к идее заставить компьютеры разгребать лингвистические джунгли. Например, компания Language Analysis Systems предложила поисковую машину для иностранных имен, а Language Weaver разработала программу синхронного двустороннего перевода с английского на несколько избранных языков (китайский, арабский), которые особенно интересуют разведчиков.

Прототипы, предложенные университетами, основаны на идее наведения «достаточно хороших» мостов для межкультурного общения, которое становится все более распространенным. Благодаря автоматическим переводчикам, иностранные водители в Германии смогут слышать передаваемые по радио предупреждения службы дорожного движения. В другом проекте CMU используются PDA, способные переводить с тайского на английский или с английского на арабский. Они помогают военным и сотрудникам службы по борьбе с наркотиками.

Прогресс в области машинного перевода достигается главным образом благодаря философскому сдвигу в этой сфере. В прошлом пытались создать программы, позволяющие компьютеру «понимать» язык. Однако внутренняя логика и многочисленные исключения делают эту задачу слишком сложной. В последние годы разработчики перешли на использование в переводе статистического анализа. «Глубокого понимания значения фразы при этом не требуется. Система просто сопоставляет одно слово с другим, — поясняет Уэйбел. — Повышение быстродействия компьютеров и базы данных сделали этот подход предпочтительным… Мы практически отказались от попыток уловить всю семантику. В ближайшие три-четыре года будут достигнуты гигантские успехи в этой области».

Об успехах статистического подхода можно судить по недавней победе Google в конкурсе машинного перевода, спонсируемом Национальным институтом науки и технологии. При статистическом подходе чем больше примеров перевода доступны компьютеру, тем более гладко и точно получается. У Google несколько терабайт данных на многих языках.

Но у статистических методов есть свои ограничения. Из-за общего сходства между определенными языками прототипы Уэйбела работают лучше при переводе с английского, например, на испанский, чем на немецкий. Увлечение немцев сложными словами тоже не помогает системе в работе. «Переводчик лектора» только «отображает» слова, а в окончательном переводе меняется их порядок, так чтобы фразы звучали как испанские, а не транслитерированные английские.

«С испанским получается лучше, а с немецким случаются заминки», — говорит Уэйбел. В будущем добавится перевод между западными и азиатскими языками. Если для спонтанного голосового перевода с английского на японский базы данных, вероятно, существуют, то с другими языками будет трудно просто из-за отсутствия данных. «Как насчет перевода с каталанского на корейский? Вряд ли удастся найти для этого базу данных, — говорит Уэйбел. — Придется использовать промежуточный язык».

Сам он имеет личный интерес в этом деле. «Я родился в Германии, мое детство прошло в Испании, и я говорю на немецком, английском, испанском, французском и латыни, — рассказывает Уэйбел. — А жена у меня японка, так что культурных проблем хватает».

Предыдущие публикации:

2005-08-23

Google лидирует в тестах машинного перевода

В продолжение темы:

2005-11-18

Швейцарские связи помогли ПРОМТу проникнуть в NASA

Обсуждение и комментарии

	M&M's 28 Oct 2005 1:15 PM
Ну и freaks в этих американских университетах, какой хренотенью занимаются... Эффект направленного звука - известен еще с позапрошлого века. Последняя разработка по этой технологии - панасониковский, кажется, домашний кинотеатр, состоящий из одной колонки. Несколько направленных динамиков генерят звуковые потоки, отражающиеся от стен, и достигающие ушей слева, справа и сзади. Вживлять контакты под кожу лица наподобие пирсингоманов из племени мумба-юмба - это да, совершенно в стиле американских универских кампусников. И это вместо того, чтобы языки учить... Ептель, Америка вырождается прямо на глазах.

	INFOVIEW 28 Oct 2005 3:45 PM
Это глупость, Да так можно перевести предупреждения дорожной службы или заранее просчитанные собеседником фразы на деловых переговорах. Но! 1) Вы не получите контакта с собеседником. (Что вы ответите роботу если он попросит у вас 100 долларов?) 2) Все ньюансы, всех языков кроме английского, будут уничтожены (конечная цель уничтожение самих языков) 3) Породит еще один порочный круг, если сможет, из разряда Макдональдсов (мусорная пища), и Масс культуры, что в конечном итоге должно превести к уничтожению насителей любой отличной от известной аторам культуры, (опять же если приведет)

	INFOVIEW 28 Oct 2005 3:52 PM
секундочку... ту задачу слишком сложной. В последние годы разработчики перешли на использование в переводе статистического анализа. «Глубокого понимания значения фразы при этом не требуется. Система просто сопоставляет одно слово с другим, — поясняет Уейбел. — Означает ли это что в этой МЕГАСУПЕРРАЗРАБОТКИ просто в базу забиты 20 000 000 шаблонов, и программа быстро ищет среди них наиболее похожий? Потом берет слова из словаря, разбирает формы слов. И подгонятет под заранее готовый перевод? И это что Всё???? Да Нобелевка Однозхначно, база данных из двух столбцов и разбор слов по формам и падежам... Грустно даже.

	M&M's 28 Oct 2005 6:01 PM
> И это что Всё???? А ты что хотел? :-))) Это же не нобелевская работа, а так, домашнее хобби прохвессора информатики. Непонятно правда, почему это печатается в зидинэт под таким кричащим заголовком.

	BlackQ 31 Oct 2005 10:49 AM
to INFOVIEW: Это означает, что у Гугла есть до фига инфы на английском и, например, такой же инфы на испанском. Одно находится в полном соотвествии с другим (типа как версии одного и того же сайта на разных языках). И ты просто, получив фразу на англицком, находишь такую же или близкую к ней на испанском

	INFOVIEW 31 Oct 2005 3:12 PM
BlackQ Человек который не знает что языки не переводятся друг в друга таким образом, недостоин заниматься такой работой. То есть нет и быть не может полного соответствия. Ты имеешь фразу на английском потом находишь близкую ей на испанском потом опять ищешь близкую ей на английском и у тебя обязательно получится другая фраза. Таковы законы построения естественных языков. Или фразы нужжно ограничить очень примитивными.

	Max 31 Oct 2005 3:35 PM
Даже не представляю себе что получится после такого перевода с каталанского на корейский с применением промежуточного (т.е. английского, естественно) языка. И уж любой переводчик скажет, что нельзя сделать правильный перевод не понимая о чем речь и не "включаясь" в контекст. Кстати, многие фильмы идут с такими бесконтекстными переводами. А ведь их переводят люди!

	Вольцев 31 Oct 2005 6:10 PM
Не нужно путать, господа, Божий дар с яичнецей! Перевод, описанный в статье -- некоторая разновидность технологии TM (Translation Memory), усиленная еще и частотным поиском по очень большому хранилищу текстов. Здесь свои технические и лингвистические проблемы, такие как дрейф словарной базы. (В английском за год меняется 1,5% слов.) Вторая технология -- считывание речи с артикуляционной мускулатуры. Очень интересная и полезная вещь для ряда случаев. И не надо путать технологии с давлением английского языка и западной поп-культуры. С ростом силы Китая неизбежно будет усиление влияния китайского языка. По крайней мере в Азии. :)

	Кораблёв Игорь 1 Nov 2005 8:29 AM
У меня за стенкой работает десяток переводчиц. Над проектом (стройка) работают командировочные немцы, французы, бразильцы, индусы... Время от времени иностранцы "западают" на наших девушек, женятся на них, увозят к себе на родину в качестве трофея!... :) Вот как бы вопрос, что они будут делать с понравившимся автоматическим переводчиком ???... :) Человеческий фактор уходит!... Мне кажется, что компьютеры ещё долго не смогут заменить тренированое ухо женщины.

	M&M's 2 Nov 2005 2:12 PM
2 Кораблев Игорь: > Мне кажется, что компьютеры ещё долго не смогут заменить тренированое ухо женщины Ухо ли? ;-))

← сентябрь 2005

21 23 24 25 26 27 28 30 31

ноябрь 2005 →