На главную страницу AlgoNet В сотрудничестве с ZDNet
АРХИВ СТАТЕЙ 1998-11-18 на главную / новости от 1998-11-18
AlgoNet.ru
поиск

 

Место для Вашей рекламы!

 

Все новости от 18 ноября 1998 г.

ПО распознавания речи произвело фурор на Comdex

Устное обращение к компьютеру вряд ли можно назвать редкостью - каждый прибегает к этому способу общения с машиной, когда она перестает работать. Однако компании, представляющие свои изделия на выставке Comdex в Лас-Вегасе, надеются, что в будущем способом общения с большими и малыми устройствами станут не ругательства, а команды на естественном языке.

"Тяжеловесы" в области технологии распознавания речи - IBM и Lernout & Hauspie (L&H) представили не только целый ряд голосовых продуктов, но и множество новых применений для них. Главный пропагандист систем распознавания речи в IBM Дэвид Барнз (David Barnes) считает голосовую технологию следующим типом интерфейса для настольных ПК, телефонов и встроенных устройств. "Мы хотим предложить механизм для этого", - сказал он.

На Comdex технология IBM ViaVoice демонстрировалась на множестве изделий - от банковских систем до карманных компьютеров. Но экзотикой ее уже не назовешь. Производители систем распознавания речи продемонстрировали здесь больше практичных потребительских приложений, чем когда бы то ни было. "Это больше не предмет научной фантастики, - сказал Барнз. - Голосовая технология - передний край электронной коммерции".

На стенде Citibank IBM представила макет будущего изделия, которое позволит клиентам банка, обращаясь к компьютеру голосом, решать такие задачи, как подведение итогов по своему счету. Кроме того, компания продемонстрировала технологию, лежащую в основе цифрового диктофона корпорации Olympus. Пользователи диктуют ему документы, а записанный и преобразованный с помощью ViaVoice текст можно переносить в ПК с помощью PC-карты.

Быть может, самым шокирующим применением технологии ViaVoice стал карманный компьютер компании Xybernaut, содержащий процессор 200-233 МГц и надеваемый на голову монитор размером с металлический доллар. Работники справочных служб и выездной технический персонал могут надиктовывать на этот компьютер свои замечания и наблюдения.

Предел точности пока не ясен

И все же технология распознавания речи имеет свой предел точности, который еще предстоит определить. Однако по сравнению с прошлогодней выставкой Comdex заметны значительные успехи. Директор IBM по международному маркетингу и продажам систем распознавания речи Анна-Мария Дероут (Anne-Marie Derouault) полагает, что в ближайшие 2-5 лет они станут вездесущими, а в течение 5-10 лет будут доведены до такой степени совершенства, что им можно будет задавать вопросы на естественном языке с самыми разными акцентами. "Пора свыкнуться с мыслью, что это уже возможно", - сказала Дероут.

Движущей силой развития технологии станут не только повышение ее точности, но и более быстродействующие процессоры, прецизионные микрофоны и новые приложения. IBM работает над механизмом естественного языка для финансового сектора, который должен быть готов в будущем году, а также над технологией и комплектом инструментов для встроенных бесклавиатурных устройств, таких, как бортовые компьютеры для автомобилей и домашние системы защитной сигнализации.

Новые продукты

Компания Lernout & Hauspie, также нацеленная на потребительский рынок, анонсировала на Comdex два новых продукта. Now You're Talking позволяет вводить распознавание речи в конторские приложения, так что появляется возможность диктовать прямо в документы Microsoft Office, управлять цифровыми календарями посредством голоса и делать голосовые запросы в веб.

Кроме того, компания представила первую голосовую игру Talking Max, в которой можно будить, кормить и дразнить сердитого попугая по имени Макс. Со временем компания планирует сделать Макса интеллектуальным агентом, способным проверять электронную почту и решать другие задачи. По словам представителя L&H Джеймса Уильямса (James Williams), фирма занимается потребительскими изделиями в рамках своей кампании по приближению речевой технологии к среднему пользователю. "В настоящее время технология распознавания речи готова к широкому распространению", - сказал он.

Еще один новый продукт L&H - механизм преобразования текста в речь RealSpeak. Он может встраиваться в приложения и воспроизводит натурально звучащую речь.
Обсуждение и комментарии

Izolda - Izo_ldamail.ru
3 Oct 2000 3:58 PM
Не возникает энтузиазма по материалам статьи, т.к. вывод напрашивается один: все, что обещалось десять лет назад, обещается и сейчас.
 

 

← октябрь 1998 8  10  11  15  18  19  20  23  24 декабрь 1998 →
Реклама!
 

 

Место для Вашей рекламы!