На главную страницу AlgoNet В сотрудничестве с ZDNet
АРХИВ СТАТЕЙ 1999-2-1 на главную / новости от 1999-2-1
AlgoNet.ru
поиск

 

Место для Вашей рекламы!

 

Все новости от 1 февраля 1999 г.

Звук, приятный во всех отношениях

Введение
Способ обработки аудиоданных на ПК во всем меняется к лучшему: от объемного звука до удобных аудиоинтерфейсов пользователя. В настоящем обзоре мы изучаем этот прогресс и сравниваем передовые технологии 3D-аудио.

Интерес, проявляемый к РС-аудио, огромен. Если больше всего внимания привлекают игры, опирающиеся на новейшие графические ускорители, то на втором месте, несомненно, технология аудио для ПК, которая тоже развивается в фантастическом темпе. Обволакивающий высококачественный звук делает игру не отличимой от действительности. Новые алгоритмы помогают и в решении таких задач, как организация видеоконференций и распознавание речи.

Усовершенствования в области РС-аудио происходят по четырем направлениям:

Позиционируемый звук. Реализуемые с применением специальной аппаратуры алгоритмы 3D-аудио создают более реалистичное звуковое поле, окружающее слушателя. А многоканальное аудио позволяет имитировать домашний театр с несколькими колонками.

Повышение качества звучания. Intel, Microsoft и другие производители налагают все больше ограничений на допустимый уровень шумов и искажений, так что по качеству звука типичный ПК скоро сможет конкурировать с домашними стереосистемами.

Дебют USB аудио. Интерфейс Universal Serial Bus обещает стать точкой подключения колонок, которые возьмут на себя большую часть задач по обработке аудиосигнала, иногда вообще исключая необходимость в установке звуковой платы.

Переход на шину PCI. Производители ПК отказываются от шины ISA, так что на смену звуковым платам ISA приходят аудиорешения PCI.

Насколько все это важно? Те, кто использует аудиосистему своего ПК главным образом для воспроизведения музыкальных CD во время работы, уже получили все те усовершенствования, которые выводят качество звука на уровень недорогой домашней стереоаппаратуры. Заядлым же игрокам и фанатам видео DVD трехмерный звук необходим (и чем больше колонок, тем лучше). Технология USB аудио привлекательна для предприятий своей возможностью быстрого подключения, тогда как позиционируемый звук займет центральное место в приложениях видеоконференц-связи.

Обзор опубликован в выпуске PC Magazine за 9 февраля 1999 г.

3D-аудио: к новым рубежам
Позиционируемый звук (или 3D-аудио) — самая модная из современных технологий воспроизведения звука на ПК. Пришедший из кино объемный звук обволакивает слушателя, создавая впечатление звукового окружения. Больше всего от 3D-аудио выгадывают игры, так как звучащие намеки помогают игроку занять правильную позицию для следующего боя. Практически каждая из новейших игр поддерживает один или больше кодеров-декодеров 3D-аудио.

Однако игры — не единственное применение трехмерного звука. При организации видеоконференций с обеих сторон, у камеры, обычно собирается по несколько участников. Так как изображение меняется очень медленно, бывает трудно определить, кто из них говорит в данный момент. А если несколько человек заговорят одновременно, создается раздражающая какофония или даже неловкая ситуация. Применение 3D-аудио позволяет каждому участнику видеоконференции оставаться в определенной звуковой зоне помещения, так что следить за беседой становится легче.

В домашних театрах используется подход «грубой силы», когда слушателя просто окружают колонками, составляющими так называемую 5,1-канальную систему: левый и правый передние каналы, левый и правый задние каналы, центральный канал и сабвуфер. Существуют звуковые платы для ПК (например, Creative Labs Sound Blaster Live! за 200 $), обеспечивающие многоканальный выход для систем с четырьмя и более колонками (таких, как AudioStorm MT7 компании Gallant Computer за 200 $ или Cambridge SoundWorks Desktop Theatre за 300 $). Такие системы позволяют обеспечить настоящий объемный звук в стандарте Dolby Digital (прежнее название АС-3), распространенном в фильмах на DVD и играх.

Такой подход способен обеспечить наиболее достоверный трехмерный звук, однако большинству пользователей ПК соображения пространства и стоимости не позволяют добавлять колонки. Тогда на помощь приходят алгоритмы и API 3D-аудио, нацеленные на то, чтобы посредством всего двух колонок размещать звуковые образы в любых точках сферы, окружающей слушателя. Новые звуковые платы Creative Labs, Diamond Multimedia, Turtle Beach и Aztech поддерживают один или более из этих API. Многие новые ПК включают встроенные средства 3D-аудио либо на основе одной из перечисленных плат, либо на основе наборов микросхем Cirrus Logic, Crystal Semiconductor и других компаний.

Но каким образом с помощью динамиков, расположенных спереди, можно создать звук, исходящий как бы из-за спины слушателя? Секрет лежит в области психоакустики и способе восприятия направления звука ушами и мозгом. Дело в том, что уши и мозг различают специфические признаки, которые можно имитировать посредством стереосистем: смещение времени между звуками, улавливаемыми каждым ухом; разность силы этих звуков; а также результат фильтрации в ушной раковине (характер влияния внешнего уха на звуки, поступающие в ушной канал). Включая все эти признаки в стереоканалы, система обманывает слушателей, создавая впечатление, что звук исходит вовсе не из динамиков, расположенных перед ними.

Однако для таких фокусов требуется интенсивная математическая обработка при фильтрации звуковых сигналов в реальном времени. По этой причине большинство систем 3D-аудио нуждается либо в специальном процессоре, расположенном на звуковой плате, либо (если аудиоаппаратура размещена на системной плате) в специальных микросхемах с расширенными возможностями по цифровой обработке сигналов.

В последующих разделах мы изложим результаты тестирования основных технических решений фирм Aureal, Creative Labs, Microsoft, QSound Labs, Spatializer и SRS Labs.

Очистка РС-аудио
Но какая польза от объемного звука, если он зашумлен и искажен? Так что вторая задача разработчиков технологий РС-аудио заключается в достижении чистого, четкого звука, очищенного от наведенных в ПК шумов и искажений.

Корпус ПК — неудачное место для размещения высококачественной аудиоаппаратуры. Быстродействующие шины и генераторы тактовых частот с излучаемыми ими электромагнитными шумами — проклятие для утонченного, тихого мира звуков. Спецификация Audio Codec '97 (AC '97), безусловно, улучшила ситуацию, отделив цифровую часть аудиосистемы от ее аналоговой части. Но системы ISA соединяют в себе компьютерные и аудиомикросхемы, что ведет к зашумлению и искажению, типичным для старых ПК. AC '97 призывает размещать цифровые микросхемы на самой шине (они ведают функциями эквалайзера, ревебератора, микшера и другими средствами управления и обработки звука), а аналоговую — подальше от нее и рядом с разъемами ввода/вывода. В результате AC '97-совместимые машины обеспечивают отношение сигнал/шум и частотную характеристику на уровне недорогих домашних аудиосистем.

Однако по-настоящему весомый вклад, вносимый спецификацией AC '97, связан с шиной Universal Serial Bus (USB) и высокоскоростным интерфейсом FireWire (IEEE 1394). Ведь еще лучшие результаты способно дать полное вынесение аналоговых аудиомикросхем за пределы ПК, а USB и 1394 позволяют это сделать. Это гибкие интерфейсы, связывающие все виды периферийных устройств с ПК и между собой. Они почти идеальны для передачи аудиоданных, особенно многоканальных.

Что удобнее: подсоединять к ПК целый пучок проводов или подключить единственный провод, по которому аудиоданные поступают прямо в колонки? Последний вариант как раз и обеспечивается USB-колонками (их производят Altec-Lansing, Labtec, Microsoft, Philips и другие фирмы). Важнейшая деталь — цифроаналоговый преобразователь — вместе с усилителем мощности расположен внутри колонок, так что внутренние шумы ПК до него не достают. Все цифровые схемы (например, эквалайзер) находятся в ПК и подключены к шине USB со скоростью передачи данных 12 Мбит/с: гладкое воспроизведение обеспечивается тем, что пакеты передаются изохронно в гарантированных временных окнах. USB-колонки создают надлежащее звуковое поле, либо дешифруя и воспроизводя уже обработанный сигнал, либо воспринимая «сырой» цифровой аудиосигнал (в этом случае вся обработка производится в самих колонках). Заметим, однако, что аудиопоток USB (как его называют производители аудиоколонок) требует операционной системы Windows 98 или NT 5.0 и быстродействующего дисковода CD-ROM, способного извлекать цифровые аудиоданные непосредственно с диска.

Интерфейс 1394 еще лучше приспособлен для аудио, чем USB. Прежде всего, его скорости передачи данных в 100, 200 и 400 Мбит/с отлично подходят для высококачественного многоканального звука. Спецификация 1394 предусматривает протокол Audio and Music Data Transmission Protocol (A/M Protocol), определяющий, каким образом цифровой аудиосигнал может переноситься по интерфейсу с применением изохронных пакетов. В дальнейшем этот протокол и его будущие многоканальные версии обеспечат достаточную полосу пропускания для перехода к потокам аудиоданных от DVD.

Улучшится и качество аудио — по сравнению с минимальными характеристиками, определяемыми AC '97. Спецификация PC '99, предложенная Intel производителям ПК, повышает планку допустимого уровня шума и искажений.

Последний вздох ISA
Спецификация PC '99 изгоняет аудио с шины ISA. Повышенная пропускная способность PCI обеспечивает возможность многоканальной обработки, требуемой для новых технологий позиционного аудио, прожорливых на ресурсы. Чтобы получить сертификат WHQL (Windows Hardware Quality Lab) и право на логотип Windows, новые ПК вообще не должны иметь шины ISA (хотя в «подновленных» существующих конструкциях ее присутствие все же допускается). В развивающихся странах, где логотип Windows менее важен, чем минимально возможная цена компьютеров, аудиорешения ISA задержатся еще на несколько лет. Платы ISA значительно дешевле, чем платы PCI, однако, уже начиная с этого года, число продаваемых решений PCI будет превосходить объем продаж плат ISA.

Каковы дальнейшие перспективы РС-аудио? Если не считать совершенствования воплощений 3D и USB, то следующий рубеж — это распознавание речи. Современным системам недостает точности, и они лучше всего работают, когда пользуешься наушниками с микрофоном, что помогает исключить изменение амплитуды и влияние внешних шумов, которые собирает обычный микрофон ПК. Однако никто не желает быть привязанным к ПК во время работы. Будущие аудио DSP должны быть достаточно интеллектуальными, чтобы распознавать говорящего на определенном расстоянии от микрофона без дополнительной информации.

Сравнение технологий 3D-аудио
Сравнение технологий 3D-аудио Сравнить технологии 3D-аудио не так легко, как это может показаться. На результат легко могут повлиять трудноучитываемые факторы окружающей среды. Еще хуже то, что в отрасли пока даже нет согласия по поводу самого определения 3D-аудио. Позиционируемые аудиосистемы позволяют помещать звук в любую точку трехмерного пространства, тогда как другие разновидности той же технологии просто расширяют диапазон или добавляют каналы с обычными стереосигналами. Иногда единственным способом определить эффективность технологии 3D-аудио остается метод экспертных оценок: сиди и слушай.

Так мы и делали. Мы прослушали ведущие API 3D-аудио и механизмы обработки сигналов A3D 2.0 от Aureal, EAX 1.0 от Creative Labs, DirectSound3D от Microsoft и Q3D 2.0 от QSound Labs на лучших звуковых платах Aztech, Creative, Diamond Multimedia и Turtle Beach. Заметим, что все эти технологии реализованы и на платах других производителей, а также во многих новых ПК, — через наборы микросхем, например, Cirrus Logic. Кроме того, мы тестировали популярные алгоритмы расширения стерео, предлагаемые компаниями Spatializer и SRS Labs, которые применяются в целом ряде плат и колонок.

Microsoft DirectSound3D
API DirectSound3D (или DS3D) корпорации Microsoft устанавливает для программистов и пользователей стандартный способ размещения файлов WAV в трехмерном пространстве. Набор команд DS3D содержит инструменты для одновременного манипулирования 32 или менее файлами WAV, однако для перевода этих команд в область настоящего трехмерного звука необходима технология обработки 3D-аудио. Одним из первых поставщиков, предложивших нужный механизм, стала компания QSound Labs, предлагающая технологию QMSS для многоканальных систем воспроизведения и двухканальную систему Q3D 2.0 для стереоколонок или наушников. То и другое представляет собой масштабируемые решения, которые могут быть реализованы как программно, так и с аппаратным ускорением.

Мы слушали Q3D 2.0 и QMSS на базе микросхемы СБИС обработки аудиосигнала Thunderbird 128, установленной на опытном образце звуковой платы Aztech Labs PCI 368DSP. Помимо прослушивания демонстрационных и игровых записей, мы подвергли оба алгоритма проверке в соответствии с новым набором тестов Ziff-Davis Audio WinBench 99, который сравнивает возможности трехмерного позиционирования методом экспертных оценок, когда слушателей просят определить направление перемещения звуков в трехмерном пространстве.

Аналогичные процедуры мы применяли при испытаниях технологий A3D 2.0 от Aureal Semiconductor и EAX (Environmental Audio Extensions) от Creative Labs, которые обеспечивают дополнительные функциональные возможности, поддерживая специальные расширения API DS3D.

Технология A3D 2.0, основанная на результатах специального исследования NASA, несомненно, представляет собой наиболее совершенный алгоритм трехмерного позиционирования звука среди всех присутствующих на рынке. В нем предусмотрена уникальная функция Wavetracing, работа которой напоминает механизмы прослеживания лучей, на которых основаны многие программы графического 3D-рендеринга. Wavetracer создает физическую модель акустической среды, содержащую информацию об отражательных свойствах каждой поверхности и о положении каждого источника звука и каждого слушателя. Эти данные используются для генерации звуковых волн посредством вычисления в реальном времени их путей к ушам слушателя.

Неудивительно, что для A3D 2.0 необходима мощь нового набора микросхем обработки звука Aureal Vortex 2. Однако этот алгоритм достаточно сообразителен, чтобы на машинах с недостаточным аппаратным ускорением автоматически возвращаться в высокооптимизированный, чисто программный режим A2D, который поддерживает дополнительные функции A3D 1.x. Правда, при этом приходится жертвовать такими вещами, как моделирование эффекта Доплера, отражение и учет препятствий. Этот алгоритм мы тестировали на звуковой плате Diamond Monster Sound MX300 (100 $; www.diamondmm.com), оборудованной чипсетом Vortex 2.

Решение EAX 2.0 от Creative Labs не так сложно, как A3D, но зато в нем предусмотрено огромное число специальных звуковых функций. Кроме возможности позиционирования в трехмерном пространстве 64 звуков, этот алгоритм обеспечивает большой выбор спецэффектов (ревеберация, хор, смещение тональности и т. п.), которые пользователь может выбирать из автоматически убирающейся инструментальной панели. Кроме того, он содержит десятки готовых моделей акустической среды, настроенных на прослушивание через две колонки, многоканальную акустическую систему или наушники. Расширенные функции EAX требуют аппаратного ускорителя типа микросхемы E-Mu Systems EMU10K1 DSP, однако в обычном позиционном трехмерном формате записи EAX можно воспроизводить на любой плате DS3D. Мы оценивали алгоритм со звуковыми платами Creative Labs Sound Blaster Live! на основе EMU10K1 (200 $) и SoundBlaster Live! Value Edition (100 $, www.sblive.com).

DirectSound3D

Преимущества: обработку можно производить на центральном процессоре без дополнительного оборудования.

Наше впечатление: исполнение ничем не примечательно; некоторое впечатление перемещения вперед/назад создается, однако по вертикали звук не движется.

Aureal A3D: лучший в группе
Aureal A3D: лучший в группе На опытной системе с двумя колонками алгоритм Q3D 2.0, как и DS3D, ничем не примечателен. Тест Audio WinBench выявил некоторое продольное перемещение при практическом отсутствии движения звука по вертикали.

Creative EAX производит чуть более реалистичные эффекты 3D-позиционирования, создавая несколько лучшее впечатление продольного перемещения, чем Q3D 2.0. Эффект перемещения вверх/вниз был сомнительным, хотя мы обнаружили, что иногда звук EAX в сочетании с 3D-анимацией все же создает иллюзию движения по вертикали.

Лучшим из группы при использовании двух колонок оказался алгоритм A3D 2.0, который создавал удовлетворительное впечатление перемещения вправо/влево, вперед/назад и даже вверх/вниз. Он образует богатое трехмерное звуковое поле, а в сочетании с соответствующей графикой создает убедительную иллюзию реалистичной акустической среды.

Ни одна из технологий не смогла убедительно продемонстрировать способность помещать звуковой образ за спиной слушателя. Положение изменилось, когда мы повесили вторую пару колонок MicroWorks и подключили их к многоканальным версиям алгоритмов. Все они — A3D, EAX и QMSS — создавали иллюзию вертикального и горизонтального движения, близкую к той, которую мы испытывали в исполнении на двух колонках. Но продольное позиционирование стало намного лучше; во всех трех случаях звуковое поле заполнило пространство за нашими спинами, и мы впервые почувствовали удовольствие от настоящего обволакивающего звука.

A3D

Преимущества: алгоритм A3D хорошо приспособлен для ПК с двумя колонками. Несмотря на то, что лучшие результаты можно получить лишь с микросхемой Vortex 2 той же компании, система достаточно сообразительна, чтобы на машинах без аппаратного ускорителя автоматически вернуться к высокооптимизированной, чисто программной технологии A2D.

Наше впечатление: лучший из группы. A3D 2.0 создает ощутимое впечатление перемещения вправо/влево, вперед/назад и даже вверх/вниз. В сочетании с соответствующим визуальным рядом он создает убедительную иллюзию реальной акустической среды.

Creative Labs EAX 1.0
Creative Labs EAX 1.0 Первые технологии 3D-звука не были схемами аудиопозиционирования, как A3D и EAX. Зато это были менее сложные алгоритмы развития стереозвука, вносящие глубину и объемность в любой цифровой или аналоговый исходный аудиоматериал. Эти технологии, добавляющие тонкую тональную окраску, изменения амплитуды и временные задержки, улучшили стереозвук настолько, что он стал казаться исходящим из пространства, значительно выступающего за рамки физического положения колонок.

Один из наиболее известных алгоритмов этого типа — Sound Retrieval System (или SRS) компании SRS Labs. SRS, который реализован в более чем дюжине наборов звуковых микросхем и скоро выйдет в чисто программной версии, встраивался в такие не похожие друг на друга продукты, как звуковые платы, электронные фортепиано, автомобильные стереосистемы и мультимедийные стереоколонки. Мы тестировали SRS на звуковой плате Turtle Beach Malibu Surround 64 (100 $, www.tbeach.com).

В большинстве случаев SRS действительно заметно расширяет звуковое поле и синтезирует достоверный стереозвук на основе монофонического исходного материала. Однако при этом он вносит ощутимые изменения громкости и баланса и размазывает стереообраз, так что в сложных аранжировках мы с трудом различали положение источников звука. Еще хуже то, что он вносит определенный шум, причем эта проблема усугубляется еще и склонностью SRS усиливать частоты верхней части диапазона.

Другая технология развития стерео, Spatializer 3-D Stereo компании Spatializer Labs, тоже встроена во многие наборы микросхем и системные платы, а также в такие программные приложения, как программы многодорожечной записи. Мы тестировали ее на предоставленном разработчиком внешнем модуле, который включается между линейным выходом звуковой платы и колонками компьютера. По звучанию Spatializer 3-D Stereo во многом похож на SRS. В наших тестах он определенно повышал глубину и объемность как моно-, так и стереофонического исходного материала, но и замутнял изображение, искажал громкие сигналы и заметно менял уровни амплитуды и стереобаланс. В целом данная технология производит двоякое впечатление. Несмотря на то, что качество ее результата часто зависит от воплощения, развитие стереозвука может считаться недорогим способом создания хорошего двухканального выхода от монофонических источников сигнала. К тому же, она может добавить выразительности относительно простым стереозаписям, таким, как сольные исполнения, и особенно эффективна в сочетании с недорогими колонками. Однако с более сложным исходным материалом она не всегда справляется.

Несмотря на последние достижения, 3D-аудио все еще пребывает в младенческом возрасте. Технологией начального уровня остается развитие стерео, тогда как большинство позиционирующих алгоритмов посредственно выполняет работу по размещению звуковых образов в трехмерном пространстве, и пока ни один 3D-процесс не обеспечивает убедительного всестороннего звукового окружения при использовании стереоколонок. Тем не менее такие новинки, как A3D 2.0, говорят о приближении того дня, когда компьютерный звук сможет конкурировать со звуковым сопровождением в кинотеатрах. Так что лучшее еще впереди.

EAX 1.0

Преимущества: EAX поддерживает оба API DirectSound3D и A3D, позволяя разработчикам добавлять спецэффекты, отсутствующие в других продуктах.

Наше впечатление: EAX создает несколько более реалистичные эффекты трехмерного позиционирования, чем DS3D, немного лучше имитируя перемещение вперед/назад. Перемещение вверх/вниз сомнительно, правда, мы обнаружили, что иногда аудиоадаптер EAX в сочетании с 3D-анимацией может создавать иллюзию вертикального движения.

Обман слуха

USB Audio: еще не готово?
Благодаря значительно усовершенствованной поддержке USB в Windows 98 стало появляться все больше устройств USB. Шина USB предназначена для упрощения процесса наращивания аппаратуры ПК и улучшения качества передачи данных за счет стандартной архитектуры расширения и цифрового обмена данными с периферийными устройствами — мышами, клавиатурами, джойстиками, трекболами, сканерами и т. п. Но для чего могут понадобиться колонки USB? По мнению тех, кто их предлагает, аудиоподсистемы на базе USB не требуют наличия звуковых плат или микросхем на системной плате, а качество звука намного улучшается, так как аудиосигнал продолжает оставаться цифровым до самых колонок.

Действительно, если не перегружать систему, качество звучания CD-записей и некоторых игр с поддержкой DirectSound кажется фантастическим. Мы в самом деле почувствовали чистоту звука, недоступную для сопоставимых по цене аналоговых акустических систем.

Однако мы столкнулись с рядом проблем — от трудностей при установке до хлопков и щелчков при воспроизведении, — которые делают этот выбор неприемлемым. Например, у некоторых из этих систем вызывает икоту простое открытие программы Explorer, обращение к флоппи-дисководу или открытие крупных файлов. Мы обнаружили также примеры того, что подсистема USB отказывается правильно инициализироваться, если колонки не подсоединены к ПК; а после нескольких таких попыток она вообще блокируется. Но больше всего нас озадачило поведение ПК с Phoenix BIOS. С подключенными колонками USB они просто не загружались. Нам приходилось сначала загружать систему и только после этого подключать колонки.

Более того, современные аудиорешения USB не в состоянии конкурировать со звуковыми платами PCI при игре в высококлассные игры, где важное место занимает обработка нескольких аудиопотоков DirectSound и аппаратное ускорение 3D-звука.

Когда эти проблемы будут решены, колонки USB станут гораздо привлекательнее. Но на этот раз мы можем порекомендовать их только тем, кто хочет поэкспериментировать с новой технологией.
Обсуждение и комментарии

Andrew Il - 19811891mail.ru
9 Jun 2000 9:41 PM
Статья явно расчитана на американского читателя,к сожалению простое перечислений возможностей,которые достаточно много на сайтах самих фирм - производителей Я считаю что длч лучшего представления той или иной технологии в области звука требуется более тчательные исследования перед тем как опубликовывать статью подобного характера
 

 

← январь 1999 1  2  3  4  5  8  9  10  11 март 1999 →
Реклама!
 

 

Место для Вашей рекламы!