На главную страницу AlgoNet В сотрудничестве с ZDNet
АРХИВ СТАТЕЙ 2003-10-29 на главную / новости от 2003-10-29
AlgoNet.ru
поиск

 

Место для Вашей рекламы!

 

Все новости от 29 октября 2003 г.

Веб гудит о голосовом плане Microsoft

В веб просочилась информация о новом приложении Microsoft, наделяющем карманные компьютеры с операционной системой Pocket PC способностями распознавания речи.

В сентябре Microsoft начала набирать бета-тестеров для испытаний Voice Command, программного модуля для КПК на платформе Pocket PC и смартфонов. Согласно предоставленной тестерам информации, программа позволит управлять всеми основными функциями устройства, проговаривая команды в микрофон.

Представитель Microsoft сообщил, что компания планирует выпустить ПО на будущей неделе через специализированный веб-сайт Handango. Однако сведения о приложении и его цене появились на этом сайте в конце прошлой недели, так что энтузиасты Pocket PC уже в курсе дела.

Согласно Handango, программа будет продаваться за 40 долл. На сайте она значится как уже доступная, однако попытки загрузить ее приводят к сообщению об ошибке. В описании говорится, что Voice Command позволит пользователям Pocket PC выполнять посредством голосовых команд все основные функции — такие как доступ к календарю и информации о контактах, звонки по телефону и запуск программ. Кроме того, ПО будет интегрировано с карманной версией Microsoft Media Player, что позволит управлять воспроизведением цифровой музыки при помощи голоса.

IBM, Microsoft и другие вкладывают значительные средства в речевую технологию в надежде на то, что голосовые системы обеспечат более естественный интерфейс для общения с компьютерами. 

 Предыдущие публикации:
2003-07-11   Говорящие машины становятся ближе к реальности
2003-10-16   Размышления о рынке ПО для смартфонов
Обсуждение и комментарии
Илья
29 Oct 2003 5:34 PM
А вот интересно, кто-нибудь пытался выяснить, что легче - нажимать кнопки или говорить? По-моему так голосовой интерфейс будет попросту физически тяжел в обращении. Можно несколько часов набивать текст и не устать, а вот горло пересыхает уже после 30 минут говорения. Полагаю, при наборе слова "тест" с клавиатуры задействуется в 10 раз меньше мышц, чем при его произнесении вслух. Так что мелкософт в своем стиле - вместо того, чтобы тратить деньги на поиск и исправление дыр в своих глюкодромах, изобретает очередную ненужную свистульку.
 

Cheetah
29 Oct 2003 5:52 PM
2 Илья: а ты пробовал? Управление простыми голосовыми командами достаточно удобно.

И количество мышц подсчитал, молодец. А сколько мышц ты задействовал при подсчете?
 

Andy
29 Oct 2003 5:53 PM
> Илья:

Могу только посоветовать попробовать "понабивать" несколько часов текст на наладоннике, стоя на улице в перчатках...

:)
 

VicTor
29 Oct 2003 8:11 PM
2Andy: да, сэр знает толк в извращениях :)))
 

V
29 Oct 2003 8:35 PM
А в моем телефоне уже есть управление голосовыми командами. У виндовса будет наверное что-то похожее. Когда пользователь будет говорить наладоннику "Смотри это барашек (запускается голосом) бээ, а это ... (...) мээ" Де-жа-вю
 

Dr_Zuzumbo
29 Oct 2003 10:42 PM
>изобретает очередную ненужную свистульку

К сказанному: ничего этот мелкий ворюга не изобретает (никогда не изобретал). Все это уже давным-давно было в прототипах Ньютона!
 

Monty Python
30 Oct 2003 4:31 AM
представляю себе офис, в котором все пользуются голосовым вводом. а если машина глухая попадется или свисток сломается?
 

Masonok
30 Oct 2003 7:04 AM
Мимо проходишь обладателя такой штуковины и нежно так: "Format C: Enter"... и на последок, очаровательно улыбнувшись: "Yes!"
 

Илья
30 Oct 2003 8:03 AM
>стоя на улице в перчатках...
На той же улице попробуй-ка поорать команды своему наладоннику.
 

Илья
30 Oct 2003 8:09 AM
> 2 Илья: а ты пробовал? Управление простыми голосовыми

Пробовал, этот мусор существует еще со времен вымени-3.1, и программка шла в комплекте с SB-16, который я покупал в 1994г. Некрософт в очередной раз выдает давным-давно реализованные идеи за свои - тут он прав, малограмотные современные пионэры-виндузята все сожрут, спасибо скажут.
 

Илья
30 Oct 2003 8:14 AM
>и на последок, очаровательно улыбнувшись: "Yes!"

Очередное заблуждение - если этот процесс прервать до его завершения (диски сейчас большие, а ублюдочный format работает медленно), то потери данных не произойдет. Если уж есть сильное желание нагадить пионэру с микрофоном, скажите что-нибудь про fdisk, или хотя бы format c: /q
 

Буба Касторский
30 Oct 2003 11:03 AM
Ой, послушаешь вас... Ну были эти фичи в прототипах пальмы, ну и что? Давайте хаять Боинг за то, что крылья уже когда-то пытались сделать Дедал с Икаром. Навернулись. Ну и где же спустя 10-15 лет ваши голосовые фичи в пальмах и пр.? В жопе? А "новое" - это не обязательно придуманное. Это то, что новое в этой системе. Вам бы только хаять, независимо от того, что это. Главное, что Билли это делает, а значит надо хаять. Вы, господишки, просто злопыхатели. Мозгёнок хватает сисадмином хрен сосать за 500 гринов и у начальства клянчить сотню на "новый девайс" типа памяти (жалобы постоянные в форуме). На большее головы нет - вот и пищите.
 

V
30 Oct 2003 11:36 AM
2Илья : Забыл добавить, в мобилке есть "предиктивный" ввод слов. Это когда нажимаешь клавиши по одному разу а программа пытается подобрать слово под данное сочетание. Например слово "computer" можно набрать 8 раз нажав на клавиши, количество действий как на обычной клавиатуре + проверяются слова, с ошибкой их уже не наберешь.
 

dimav
30 Oct 2003 1:01 PM
А вот интересно, кто-нибудь пытался выяснить, что легче - нажимать кнопки или говорить?
По-моему так голосовой интерфейс будет попросту физически тяжел в обращении. Можно несколько часов набивать текст и не устать, а вот горло пересыхает уже после 30 минут говорения.

--
именно сказать две-три фразы легко. Говорить 5 минут что б тебя компьютер понимал можно. И это даже быстрее чем печатать.
а вот говорить 45-минут и больше _тяжело_.
Не зря (по крайне мере раньше) лекторов и дикторов _учили_ говорить.
И заболевания которые заработают неученые пользователи "поговорившие 8 часов с машиной" будут таковы что по сравнению с ними "клавиатурный синдром" покажется легким насморком по сравнению с дифтерией.
 

maxfalcon
30 Oct 2003 6:53 PM
А всмомним ка ситуацию с распознованием печатных символов. Думаете что всегда было гладко? Программы, которые успешно выполняют распознование текста появились только недавно. Почему так поздно? И даже дело в том, что не было таких программ и оборудования, дело в том, что алгоритмы распознования образов начали создаваться только в 60-70 годы, и совершенствоваться в 80-е 90-е, что позволило затем реаизовать их в FineReader'е и прочих программах.
Ситуация с распознаванием речи ещё более сложная, связанная с многими техническими, индивидуальными, математико-алгоритмическими сложностями. Но прогресс идет по тихоньку, лет может через 20 мы будем иметь что то вроде Finereader для речи.
 

Cheetah
30 Oct 2003 7:52 PM
> Ситуация с распознаванием речи ещё более сложная...

На самом деле все не так уж и сложно. Голосовая речь распадается на отдельные модуляции, которые можно распознать (гласные, согласные, шипящие буквы и т.п.), после букв распознаются слова, фразы... (Так же действует и Microsoft Sam, только в обратном порядке - текст в звуки). В комплекте с хорошим словарем (!!! именно со словарем, без словаря в голове и человек не распознает, что ему говорят) получится вполне приличная программа-"слушатель".

Это уже широко используется спецслужбами ведущих стран для отслеживания телефонных разговоров, в которых появляются слова типа "терроризм", "мафия", "Бен Ладен"... Ну да это все знают.

В Файнридере все намного сложнее, потому что распознавание двухмерных изображений гораздо сложнее, чем линейного потока звуков.

Другое дело, чего делать с этими распознаными выражениями... Вводить голосом текст? (Кстати, два раза в неделю по 45 минут голосового ввода, и через месяц будете говорить не хуже Митковой или Галкина :-)
Или выдавать команды типа "Ворд!" (для запуска MS Word)
или "Изменить шрифт на четырнадцатой странице в третьей строке сверху пятое слово справа два слова вперед - с Таймс Нью Роман на Люсида Консоль" (легче мышкой)
или "Стоять!" (при установке Windows)

В общем, как раз тут и образовалась проблемка...
 

Cheetah
30 Oct 2003 8:02 PM
Японский робот Асимо (между прочим, только сейчас до меня дошло, что это японская транскрипция фамилии Айзека Азимова) может не только понимать, что ему говорят, но и поддерживать разговор на практически любые темы... У япошек с речевым вводом давно уже проблем нет...
 

Cheetah
30 Oct 2003 8:04 PM
Э... А где же обсуждение этой интересной статьи "Главная страница"? Э...
 

V
31 Oct 2003 6:38 PM
2Cheetah : Я не уверен что у них нет проблем с речевым вводом. Я уверен что у них есть проблема с роботами вообще. То что они называют роботом является бесполезной электромеханической куклой.

Отдельные модуляции вроде называются фонемами. Фонемный синтез речи не был проблемой уже в 1985 году. С распознавание сложнее, человек применяет интонации, растягивает и сжимает фонемы. Собственно у каждого человека растягивание фонем уникально и зависит от состояния мозга, воспроизводящего тракта и постоянно меняется в течении жизни. "Азимо" лишь тупая игрушка :)
 

Cheetah
31 Oct 2003 10:23 PM
2 V:
Ну уж конечно нельзя приравнивать мозги робота к человеческим мозгам :-) Но с роботами у них проблем нет. Это у роботов проблемы с ними :-)

Насчет индивидуальных особенностей произношения - тоже в принципе не проблема. Научились же распознавать Файнридером различные шрифты. И даже рукописный ввод (не файнридером, конечно)
 

ViaVoice
1 Nov 2003 9:10 AM
A kto-nibud novym ViaVoicom ili Dragonom polzovalsya? Ochen prilichnoe kachestvo raspoznavaniya - v srednem 4 oshybki na stranicu. Zal chto dlya russkogo yazyka prilichnoi programmy net.
 

Михаил Елашкин - mikeelashkin.com
2 Nov 2003 10:20 AM
Специалисты, блин :) А то что уже несколько лет сущесвует ИК ДУ пульт на покете с голосовым управлением? Качаем и смотрим.
 

V
3 Nov 2003 1:44 PM
2 Cheetah :
> Но с роботами у них проблем нет.
Есть. То что они рекламируют было разработано не менее 10 лет назад. Для каждого режима у них своя программа. Это больше похоже на пианино с перфокартами. Вы же не называете роботом такое утройство, или детскую куклу, которая "может ходить" :)
 

V
3 Nov 2003 5:24 PM
2ViaVoice : Попробуйте проверить качество на телевизионной программе, диктор читает текст ( например новости) или попробуйте песню на соответствующем языке. Мне будет интересен результат, только честно :)
 

C3Man - semdiyahoo.com
3 Nov 2003 6:48 PM
когда
я
пробую (со скуки)
проорать,
в свой супер-пупер телефон - одно лиш слово
я нахожу себя со стороны похожим
на Шевчука
поющего "Последнюю осень"...
 

ViaVoice
6 Nov 2003 8:26 AM
2V : Nu vy daete! ViaVoice ili Dragon nado minut 40 potrenirovat s nashym russkim akcentom, potom skormit emu stranic 30 kotorye sam napisal "ot i do" chtoby on vesovye faktory v svoih veroyatnostnyh modelyah angliiskogo podkorrektiroval. I tolko potom mozno upraznyatsya. Na samom dele ya chasa 3 potratil na vse uprazneniya i skormil emu polnostiyu disser, vse svoi stati i e-maily chtoby dobitsya etih 4 oshybok na stranicu. Narod u nas konechno "opuh" kogda uvidel kak ya "nabirayu" text cheres microfon ili voobshe perekachivayu .wav fail s MD playera i uhozu obedat. Po-moemu vse uze sebe postavili oba paketa, no cheres nedelyu ponyali chto dvumya palcami oni vse ravno bystree nabirayut, a "uchit" soft i rabotat nad svoei dikciei bolshynstvu prosto oblom.
Kstati otlichnyi sposob postavit dikciyu i nauchitsya "speak up with confidence".
 

V
6 Nov 2003 11:30 AM
2ViaVoice :
> Kstati otlichnyi sposob postavit dikciyu i nauchitsya "speak up with confidence".
Скорее отличный способ убить свою дикцию. У меня до сих пор акцент в английском как у синтезатора речи :)
 

Cheetah
6 Nov 2003 6:02 PM
Кому интересно, отсылаю к новой разработке японцев, в которой используются и голосовые команды. Разработочка очень интересная, новый вид мобильного телефона.
http://www.inopressa.ru/details.htm?id=15534
Опять скажут: нууу, фуфлооо, это было еще 10 лет назад придумано, японцы дурят... :-)
 

V
6 Nov 2003 7:53 PM
2 Cheetah :
> Опять скажут: нууу, фуфлооо
Нет, не скажут. Это просто бред. Какое-то угадывание мыслей. В статью еще лоботомию надо добавить, очень полезная вещь знаете, в телефонии. Вживляешь электроды в мозг и когда по костям пойдет вызов, подавать на электроды высокое напряжение, сразу в мозг, чтобы на горло и уши ничего не вешать :)
 

V
6 Nov 2003 8:11 PM
Без обид. Если кому интересно. "Японцы разработали новый шагающий экскаватор. Он может не только шагать, но и бегать, и прыгать. Осталось его только догнать, поймать и заставить работать" (C) ОСП Студия кажется :)
 

ViaVoice
7 Nov 2003 8:06 AM
2V: A vy ne staraites govorit kak komputer. Vy zamechali kak govorit dictor na CNN ili kak chitaet lekciyu horoshyi amerikanskii professor ili kak ozvucheny audioknizki? Berite primer u luchshyh. A mashyna vas poimet. Ei glavnoe chtoby signaly byli vosproisvodimye. Mozete hote ves slovar i model angliiskogo peredelat. Ei vse ravno.
Kstati v novoi versii Dragona est otlichnyi sintezator dlya text-to-speech. Mozete poslushat korotkie primery na site ScanSoft. Ochen klassno s nim texty redaktirovat.
 

ViaVoice
7 Nov 2003 8:13 AM
2V: Na yaposnkie shagayushie ekskavatory ya nasmotrelsya. Est tut poslnostiyu komputerisirovannyi okolo sosednego zdaniya. Uze navernoe vtoroe pokolenie studentov ne nem PhD delaet. A voobshe period zashit disserov na engineering departmenr moya lyubimaya pora. Tam za besplatno takogo nasmotrishsya chto ehse ne skoro v kino uvidesh.
 

V
7 Nov 2003 12:07 PM
2 ViaVoice :
> Tam za besplatno takogo nasmotrishsya chto ehse ne skoro v kino uvidesh.
Например :)
Мне будет очень интересно.

> Ei glavnoe chtoby signaly byli vosproisvodimye.
А еще руки хорошо бы иметь с 102 пальцами для клавиатуры, да ? :) Я так предполагал что распознавание речи для того чтобы облегчить работу а не наоборот. В случае если я буду тратить время не только на свое обучение, но и на обучение программы, вполне возможно что на выполнение реальной работы времени не будет :) Не вижу смысла в том, чтобы каждый купивший программу потом брал словарь и начинал учить вашу программу. Это сизифов труд :)

 

V
7 Nov 2003 12:33 PM
2 ViaVoice :
> Uze navernoe vtoroe pokolenie studentov ne nem PhD delaet.
Не хорошо это, студентов учить плохому :)
 

V
7 Nov 2003 1:00 PM
> Mozete hote ves slovar i model angliiskogo peredelat.
"Вот так кажного использовать, вот так, такое будет, такое, понимаешь, развитие прогресса ..." :)
 

Cheetah
9 Nov 2003 9:46 PM
2 V: ты видимо эту разработку недавно испытывал на себе?
 

Cheetah
9 Nov 2003 9:48 PM
2 V: Я имел в виду электроды и высокое напряжение
 

V
10 Nov 2003 12:07 PM
2Cheetah :
> Я имел в виду электроды и высокое напряжение
Я бы сначала проверил на подопытных.
Кстати, по себе о других не судят :)
 

ViaVoice
11 Nov 2003 9:05 AM
2 V: U menya pokalechenna levaya kist. Tak chto daze slepym desyatipalcevym metodom ya ni kogda 400 znakov v minutu nabivat ne budu, a potrenirovav ViaVoice 3 chasa mozgu nadiktovyvat ih bes osobyh problem. Potom programma sama obuchaetsya. Da i 3 chasa ya potratil is-sa togo chto ne polenilsya dopolnit slovar terminami, nazvaniyami, sokrasheniyami i makrosami kotoryh tam net.
 

 

← сентябрь 2003 21  22  23  24  27  28  29  30  31 ноябрь 2003 →
Реклама!
 

 

Место для Вашей рекламы!