Аудио система персонального компьютера

14Лекция 12. Аудио система персонального компьютера

Вопросы:

Основы цифровой обработки сигналов.

Звуковая карта ПК.

Интерфейсы звуковых карт.

Литература: 1. Гук. М. Аппаратные средства IBM PC. Питер, 2005, с.660-703.

Основы цифровой обработки сигналов.

Как известно, слышимые звуки представляют собой механические колебания, достигающие ушей слушателя обычно по воздуху. Диапазон частот, воспринимаемых человеческим ухом, простирается от 20 Гц до 20 кГц, причем наибольшая чувствительность приходится на частоты 2-5 кГц. В этой области ухо воспринимает сигналы в динамическом диапазоне около 140 дБ1 (отношение звукового давления болевого порога к порогу слышимости 107). На краях частотного диапазона динамический диапазон сужается до 50 дБ (чувствительность уха существенно снижается, а давление болевого порога уменьшается). Разговорная речь в спектре занимает область примерно 200 Гц-4 кГц при динамическом диапазоне около 40 дБ. Музыка может занимать практически весь слышимый диапазон частот и требовать динамического диапазона 70-90 дБ. Важной особенностью слуха является способность к локализации источника звука, обеспечиваемая его бинауральным восприятием. Дело в том, что звуковые волны воспринимаются обоими ушами, которые пространственно разнесены. Колебания от одного источника достигают ушей с разной амплитудой и фазой, что позволяет мозгу оценить направление (азимут) источника звука. Сигналы с частотами ниже 300 Гц локализуются плохо, поскольку длина волны относительно размера головы велика. Наибольшее значение для локализации имеют частоты от 1 до 3,2 кГц. Бинауральное восприятие позволяет не только локализовывать, но и выделять отдельные источники (например, отдельные инструменты в оркестре).

1 Децибелл (дБ) — логарифмическая мера измерения мощности Р относительно условно принятого нулевого уровня Р, определяется как 10log(P/P0). Когда речь идет об усилении/затухании напряжения сигнала, используют формулу 20log(U/U0). Усилению в 10 раз соответствует +20 дБ, ослаблению в 2 раза соответствует -6 дБ. Частоты одноименных нот соседних октав отличаются в 2 раза («центр» — нота «ля» первой октавы — 440 Гц), что делает удобной логарифмическую шкалу частот.

10log(P/P0)

2

1 ля 1 ля2 f

Для передачи, хранения, воспроизведения и синтеза звуков традиционно используются преобразования акустических колебаний в электрические (микрофон) и обратно (динамик). Первоначально вся промежуточная обработка (усиление, преобразования) сигналов производилась в аналоговой форме, естественной для оконечных электромеханических преобразователей. Хранение, опять-таки в аналоговой форме, выполнялось на механических (грампластинки) или магнитных (магнитофонные ленты) носителях. Для повышения достоверности звукопередачи, включая пространственное расположение источников звука, применяется двухканальная передача и хранение — стереофония. Упрощенно ее идея -заключается в разделении трактов сигналов, предназначенных для левого и правого уха слушателя. Такая система позволяет создать иллюзию звуковой панорамы — кажущиеся источники звука (КИЗ) располагаются на воображаемой сцене, расположенной перед слушателем. Однако пара колонок не позволяет добиться большой ширины зоны стереоэффекта. Прослушивание через головные телефоны не всегда удобно и тоже не дает полной иллюзии присутствия — поворот головы в сторону КИЗ приведет к его уходу в ту же сторону. Более сложные системы используют большее число каналов, например 4 в квадрафонии. Здесь колонки располагаются вокруг (спереди и сзади) слушателя, что позволяет получить эффект присутствия внутри некоторого озвученного объема. Есть и промежуточные варианты между дорогой квадрафонией и фактически стандартной стереофонией — квази- и псевдоквадрафония.

Аналоговое представление сигналов для обработки (фильтрации, создания различных эффектов) и хранения имеет массу недостатков. Во-первых, все устройства в той или иной степени обладают нелинейными передаточными характеристиками — проходящий через них гармонический (чисто синусоидальный) сигнал «обрастает» гармониками — составляющими с частотами, кратными основной. Мерой искажений, вносимых нелинейностью, является коэффициент гармоник, он же коэффициент нелинейных искажений (к.н.и.), который определяется как отношение мощности гармоник выходного сигнала к мощности основного тона:

Pi

к.н.и.= i=2 100%

P (о.т.)i=1

Эти искажения вносят все элементы тракта, так что их всюду стремятся минимизировать. Для современных высококачественных усилителей считается хорошим значение к.н.и. в десятые и сотые доли процента, для электромеханических преобразователей (особенно динамиков) значения гораздо выше.

Следующая беда — шумы и помехи, характерные для любой аналоговой техники. Они сужают динамический диапазон устройства. Отношение сигнал/шум порядка 90-100 дБ для аналоговых устройств удалось получить сравнительно недавно.

Что касается хранения информации, то и здесь аналоговая форма наиболее уязвима — грампластинки «запиливаются», магнитные ленты осыпаются и размагничиваются, в результате ранее записанный сигнал при воспроизведении сильно искажается. Потери происходят и при тиражировании — каждая перезапись или перепечатка вносит свою долю искажений.

С развитием электроники появилась возможность большую часть «путешествия» электрического сигнала производить в цифровой форме. Теперь входной сигнал (от микрофона) после предварительного усиления оцифровывается.

В цифровой форме он может передаваться, храниться (долго и без накопления ошибок), подвергаться различным искусственным преобразованиям. При воспроизведении производится обратное преобразование в аналоговую форму, оконечное усиление и преобразование в акустические колебания.

Для оцифровки аналогового сигнала применяется дискретизация по времени и квантование по уровню. Это означает, что регулярно с частотой дискретизации производятся выборки мгновенного значения аналогового сигнала (рис. 12.1). Эти выборки квантуются при помощи аналогово-цифрового преобразователя АЦП (ADC — Analog-Digital Converter). На выходе АЦП информация представляется в виде двоичного кода — то есть числом, которое может принимать одно из множества дискретных значений, определяемых разрядностью преобразователя. Очевидно, чем выше разрядность, тем точнее это число может представлять мгновенное значение аналогового сигнала. «Может» потому, что для точности характеристика преобразователя должна быть еще монотонной и линейной. В идеале передаточная характеристика преобразователя выглядит ровной «лесенкой» с одинаковыми ступеньками (линейность) и без провалов (монотонность). Поскольку мгновенные значения сигнала не «обязаны» попадать на ступеньки этой лесенки, при преобразовании возникают шумы квантования — отклонения квантованного значения от реального, в среднем, половина кванта. Для высококачественной передачи музыки разрядность преобразователя должна составлять, по крайней мере, 16 бит, что имеется в аудио-CD.

Рис. 12.1. Оцифровка аналогового сигнала

Выбор частоты дискретизации определяется теоремой Котельникова: для адекватного восстановления частота дискретизации должна быть больше удвоенной частоты высших спектральных составляющих входного сигнала. Чтобы не интересующие нас более высокие частоты не искажали оцифровку, они должны быть тщательно отфильтрованы. В том же CD частота 44,1 кГц позволяет воспроизводить сигнал в полосе до 20 кГц — весь слышимый спектр.

Обратное преобразование выполняется с помощью цифро-аналогового преобразователя ЦАП (DAC — Digital-Analog Converter), на вход которого поступает цифровой поток с той же частотой. Аналоговый сигнал после ЦАП должен быть опять-таки отфильтрован — частоты выше половины частоты квантования подавляются. К устройству ЦАП предъявляют те же требования по разрядности, линейности и монотонности. Разрядность АЦП и ЦАП может и не совпадать — эффективная разрядность тракта будет определяться наименьшим значением (включая разрядность находящегося между ними цифрового канала передачи или хранения информации.

На выходе АЦП мы имеем поток данных с интенсивностью 16 бит х 44,1 кГц = 705,6 Кбит/с (88,2 Кбайт/с) на один канал, а при стерео — около 1410 Кбит/с (176 Кбайт/с). Очевидно, что с понижением частоты дискретизации пропорционально снизится и доступная полоса частот. Снижение разрядности приведет к повышению погрешности — уровня шумов квантования. Каждый отброшенный двоичный разряд повысит уровень этого шума на 6 дБ. Если нас интересует только разборчивая передача речи, можно «опуститься» до 8-битного преобразования с частотой 5 кГц — в моно это даст поток около 5 Кбайт/с. При этом на дискету 1,44 Мбайт можно уместить около 5 минут речи с низким качеством. А одна минута стереомузыки с качеством CD занимает около 10 Мбайт (на CD умещается до 74 минут), так что есть повод задуматься о компрессии, т.е. сжатии информации звука.

1.1. Методы сжатия звуковой информации.

Простейший способ цифрового представления сигналов называется импульсно-кодовой модуляцией (ИКМ) или РСМ (Pulse-Code Modulation). Поток данных РСМ представляет собой последовательность мгновенных значений или выборок (samples) в двоичном коде. Если применяемые преобразователи имеют линейную характеристику (мгновенное значение напряжения сигнала пропорционально коду), то данная модуляция называется линейной (Linear PCM). В случае ИКМ кодер и декодер не выполняют преобразования информации, а только занимаются упаковкой/распаковкой бит в байты и слова данных. Интенсивность потока (bit rate) определяется как произведение частоты дискретизации (sample rate) на разрядность и на число каналов. Аудио-CD дает поток 44 100 х16х2= 1411 200 бит/с (стерео).

Для реальных звуковых сигналов кодирование с линейной ИКМ является неэкономичным. Поток данных можно сократить, если использовать несложный алгоритм сжатия, применяемый в системе дельта-ИКМ (ДИКМ), она же DPCM (Differential Pulse-Code Modulation). Упрощенно этот алгоритм выглядит так: в цифровом потоке передаются не сами мгновенные отсчеты, а масштабированная разность реального отсчета и его значения, сконструированного кодеком по ранее сгенерированному им потоку данных. Разность передается с меньшим числом разрядов, чем сами отсчеты. В АДИКМ (адаптивная | ДИКМ, или ADPCM — Adaptive Differential Pulse-Code Modulation) масштаб разности определяется по предыстории — если разность монотонно растет, маcштаб увеличивается, и наоборот.

Конечно, восстановленный сигнал при таком представлении будет больше отличаться от исходного, чем при обычной ИКМ, но можно добиться существенного сокращения потока цифровых данных. ADPCM стала широко применяться при цифровом хранении и передаче аудиоинформации (например, в голосовых модемах). Алгоритм ADPCM с точки зрения процессора PC может быть реализован как программно, так и аппаратно средствами звуковой карты (модема).

Более сложные алгоритмы и высокая степень сжатия применяются в аудио- -кодеках MPEG. В кодере MPEG-1 входным потоком являются 16-битные выборки с частотой 48 кГц (профессиональная аудиотехника), 44,1 кГц (бытовая техника) или 32 кГц (применяется в телекоммуникациях).

Стандарт определяет три «слоя» (layer) сжатия — Layer I, Layer 2 и Layer 3, работающие один поверх другого.

Первоначальная компрессия осуществляется на основе психофизических свойств звуковосприятия. Здесь обыгрывается свойство маскирования звуков: если в сигнале имеются два тона с близкими частотами, существенно различающиеся по уровню, то более мощный сигнал замаскирует слабый (он не будет услышан). Пороги маскирования зависят от удаленности частот.

В MPEG весь диапазон звуковых частот разбивается на 32 поддиапазона (sub-band), в каждом поддиапазоне определяются наиболее мощные спектральные составляющие и для них вычисляются пороги частот маскирования. Эффекты маскирования от нескольких мощных составляющих суммируются. Действие маскирования распространяется не только на сигналы, присутствующие одновременно с мощным, но и на предшествующие ему за 2-5 мс (premasking) и последующие в течение до 100 мс (postmasking). Сигналы маскированных областей обрабатываются с меньшим разрешением, поскольку для них снижаются требования к отношению сигнал/шум. За счет этого «загрубления» и происходит сжатие. Компрессию на психофизической основе выполняет слой Layer 1.

Следующий этап (Layer 2) повышает точность представления и более эффективно упаковывает информацию. Здесь у кодера в работе находится «окно» длительностью 23 мс (1152 выборки).

На последнем этапе (Layer 3) применяются сложные наборы фильтров и нелинейное квантование. Наибольшую степень сжатия обеспечивает слой Layer 3, для которого при высокой достоверности декодирования достигается коэффициент сжатия 11:1.

1.2. Методы обработки звуковой информации

При цифровом хранении легко реализуются многие эффекты, которые ранее требовали громоздких электромеханических или электроакустических устройств или сложной аналоговой электроники.

Прежде всего, это искусственная реверберация и эхо.

Известно, что в закрытом помещении (например, зале) от источника до слушателя доходит не только прямой звук, но и отраженный (многократно) от различных поверхностей (стен, колонн и т. п.). Отраженные сигналы приходят относительно прямого с различными задержками и затуханием. Это явление называется реверберацией. И Этим явлением при цифровой обработке сигнала можно управлять. При цифровом хранении легко реализуются многие эффекты, которые ранее требовали громоздких электромеханических или электроакустических устройств или сложной аналоговой электроники.

Прежде всего, это искусственная реверберация и эхо.

Известно, что в закрытом помещении (например, зале) от источника до слушателя доходит не только прямой звук, но и отраженный (многократно) от различных поверхностей (стен, колонн и т. п.). Отраженные сигналы приходят относительно прямого с различными задержками и затуханием. Это явление называется реверберацией. И Этим явлением при цифровой обработке сигнала можно управлять.

На основе смещения выборок можно делать и более сложные эффекты. В цифровой форме представления легко имитируется эффект Допплера — изменение частоты при быстром приближении источника звука к слушателю или удалении источника от слушателя. С этим эффектом сталкивались все — однотонный свисток приближающегося поезда звучит выше, а удаляющегося — ниже реального тона. В цифровом виде при воспроизведении накопление отставания выборок приведет к понижению тона, а сокращение отставания — к повышению.

Кроме фокусов с задержками возможно использование цифровой фильтрации — от реализации простейших темброблоков и эквалайзеров до «вырезания» голоса из песни (эффект «караоке»). Все определяется программным обеспечением и вычислительными ресурсами процессора.

На основе смещения выборок можно делать и более сложные эффекты. В цифровой форме представления легко имитируется эффект Допплера — изменение частоты при быстром приближении источника звука к слушателю или удалении источника от слушателя. С этим эффектом сталкивались все — однотонный свисток приближающегося поезда звучит выше, а удаляющегося — ниже реального тона. В цифровом виде при воспроизведении накопление отставания выборок приведет к понижению тона, а сокращение отставания — к повышению.

Кроме фокусов с задержками возможно использование цифровой фильтрации — от реализации простейших темброблоков и эквалайзеров до «вырезания» голоса из песни (эффект «караоке»). Все определяется программным обеспечением и вычислительными ресурсами процессора.

2. Звуковая карта ПК.

2.1. Структурная схема звуковой карты.

Упрощенная блок-схема традиционной аналоговой звуковой карты приведена на рис. 12.2. Аналоговые сигналы от различных источников — микрофона, CD (здесь обычно используется аналоговый интерфейс CD-ROM), линейного входа, а также ЦАП и синтезатора — смешиваются микшером. Микшер для каждого входа имеет аналоговые регуляторы с цифровым управлением, позволяющие изменять усиление и баланс стереоканалов. Микшер может быть дополнен регулятором тембра — простейшим регулятором усиления высоких и низких частот или многополосным эквалайзером (на рисунке не показан). С выхода микшера аналоговый сигнал поступает на линейный выход и оконечный усилитель..

Рис. 12.2. Блок-схема звуковой карты

  • Line In — линейный вход от магнитофона, тюнера, проигрывателя, синтезатора и т. п. Чувствительность порядка 0,1-0,3 В.
  • Line Out — линейный выход сигнала на внешний усилитель или магнитофон, уровень сигнала порядка 0,1-0,3 В.
  • Speaker Out — выход на акустические системы или головные телефоны. Подключать к нему внешний усилитель мощности нецелесообразно, поскольку здесь искажения больше, чем на линейном выходе.
  • Mic In — микрофонный вход, чувствительность 3-10 мВ. Этот вход обычно монофонический, но иногда используется трехконтактное гнездо (как в стерео), у которого дополнительный контакт (на месте правого канала) предназначен для подачи питания на электретный микрофон.

Собственно цифровые каналы звуковой карты проходят через интерфейсные схемы (например, MIDI- от шины расширения до ЦАП и от АЦП обратно к шине. Для передачи потоков данных используются каналы DMA (Direct Memory Access=Прямой доступ к памяти)— один 8-битный и один 16-битный. Преобразования синхронизируются от программируемого генератора (ПГ), который определяет частоту дискретизации. Частоту дискретизации, разрядность (8 или 16 бит) и режим (моно/стерео) выбирают при записи. От этих параметров зависит качество оцифровки и объем информации, занимаемой записью с определенной длительностью. Эти же значения параметров должны устанавливаться и при воспроизведении данной записи (сведения о них хранятся в заголовках звуковых файлов). Изменение параметров воспроизведения относительно параметров записи в общем случае требует программного преобразования файла данных.

Несмотря на наличие двух каналов DMA, далеко не все карты позволяют работать в дуплексном режиме цифрового канала — одновременно и независимо вводить и выводить цифровой поток. Полный дуплекс нужен, например, для IP-телефонии: аналоговый сигнал от микрофона поступает на АЦП, с которого цифровой поток в сжатом виде укладывается в пакеты IP-транспорта. Одновременно из принятых пакетов данные через ЦАП направляются на аудиовыход. В структуре, изображенной на рис. 12.2, эти потоки пересекутся в микшере и показаны пунктиром. Практически все современные карты поддерживают полный дуплекс. В них имеются два микшера — один для записи, другой для воспроизведения. В сложных картах может быть и пара преобразователей ЦАП (стереофонических), один из которых служит для воспроизведения звукозаписи, а другой обслуживает цифровые синтезаторы. В современных картах, построенных на основе сигнальных процессоров, аналоговые микшеры заменяются цифровыми. В ряде карт число входов у микшеров (4) меньше, чем число возможных источников сигнала. Тогда на карте имеется программно-управляемый коммутатор, с помощью которого можно выбрать источники, посылаемые на микшер записи и микшер воспроизведения.

Для создания специальных эффектов (хор, реверберация и т. п.) на более сложных звуковых картах применяются процессоры обработки сигналов DSP (Data Signal Processor).

2.2. Цифровые технологии в звуковых картах

По степени вытеснения аналоговой обработки цифровой технологией фирма Intel различает три градации звуковых карт.

  • Аналоговые (Analog) карты имеют аналоговые входные (микрофон, линейный вход, CD) и выходные (линейный и от усилителя) цепи. В этих картах чаще всего применяются аналоговые микшеры. На этих картах располагается и порт традиционного MIDI.
  • Карты Digital Ready позволяют заменить входные и выходные аналоговые интерфейсы на цифровые, используя шины общего назначения (USB, FireWire) и специальные цифровые аудиоинтерфейсы (S/PDIF, I2S) для подключения цифровой аудиоаппаратуры. В этих картах аудиопоток от любого источника внутри карты представляется в цифровом виде и может перенаправляться как на аналоговые, так и на цифровые внешние интерфейсы или носители информации. В отличие от первых карт, где характеристики АЦП (разрядность, максимальная частота преобразования) часто были хуже, чем ЦАП, теперь упор сделан на АЦП. Разрядность этого преобразователя повышают до 18 бит и более, сохраняя разрядность ЦАП в 16 бит. Качественный АЦП, который остается единственным источником шума («цифра» не шумит по определению) нужен для расширения динамического диапазона. Разрядность обрабатываемых аудиоданных увеличивают до 32 бит, чтобы при вычислениях не терялась точность. Преобразователи ЦАП используются только для прослушивания, так что их погрешности и шумы не накапливаются. Поскольку между такой картой и системной шиной может потребоваться циркуляция множества цифровых аудиопотоков, в качестве шины расширения PCI альтернатив не имеет. Интерфейс аналогового джойстика с этих карт уходит, подразумевая его замещение цифровым для шины USB.
  • В полностью цифровых картах (Digital Only) совершенно отсутствуют аналоговые интерфейсы, в них используются интерфейсы S/PDIF, PS, AC-Link, а также ввод-вывод по шинам USB и Fire Wire. В этих картах от традиционных 16-битных стереостандартов переходят к многоканальным системам большей разрядности и с частотой квантования 48 кГц и выше.

Переход на полностью цифровую обработку аудиосигналов, включая микширование, фильтрацию, позиционирование и применение эффектов стал возможен даже для программной реализации на современных процессорах. Однако если для одного потока это и приемлемо, то для множества потоков и в многозадачной системе высокого качества обработки не получить (начнутся «заикания»), а загрузка процессора будет слишком высокой. В графической системе подобная проблема решается видеоакселераторами, которые стали уже традиционной частью видеокарт. То же начинают применять и в аудиокартах. Аппаратные средства, реализующие функции обработки аудиопотоков, называют аудиоакселераторами. Фактически это сигнальные процессоры (DSP) со стандартизованным программным интерфейсом (набором драйверов).

С переходом на цифровые технологии обработки аудиосигналов возникает проблема сведения на микшере сигналов от источников с разными частотами выборки. В аналоговой обработке таких проблем не возникает. Самый простой (но не самый лучший) способ сведения — преобразовывать цифровые сигналы в аналоговые, фильтровать и суммировать уже аналоговые сигналы (а потом их снова преобразовывать в цифровые, например, для записи в файл). Однако возможно и чисто цифровое решение проблемы — преобразование частоты дискретизации, оно же ресэмплинг (resampleing), или SRC (Sample Rate Conversion). Преобразование возможно как в сторону понижения частоты (прореживание выборок), так и повышения. Понижение частоты автоматически приводит к пропорциональному сужению полосы пропускания аудиосигнала. Повышение частоты выборок путем пересчета аудиосигнал, естественно, не улучшит — новые выборки будут «придуманы» конвертером путем интерполяции реально существующих.

Рис. 11.5. Преобразования частот дискретизации

Вполне очевидно, что пересчет будет гораздо проще (и вернее) при удвоении частоты, а не при умножении, скажем, на 8/7. В цифровой аудиосистеме удобно привести все сигналы к единой частоте, и с точки зрения максимального сохранения качества — к самой высокой из используемых. Большое неудобство заключается в том, что аудио-CD (считавшиеся еще недавно эталоном качества) задействуют частоту дискретизации 44,1 кГц, а на DVD кодирование MPEG-2 предусматривает частоту 48 кГц, и эту частоту нельзя обходить вниманием. При разработке аудиокодека АС'97 (см. ниже) был выбран ряд рекомендованных частот дискретизации 8,000, 11,025, 16,000, 22,050, 32,000, 44,100 и 48,000 кГц. Основной частотой принята 48 кГц, и все остальные сигналы приводятся к ней по схеме, приведенной на рис. 11.5. Самым тяжелым преобразованием в этой цепочке является пересчет 147:160 — из 147 выборок, например, от аудио-CD, «сочиняют» 160 выборок, также равномерно распределенных во времени. Для осуществления пересчета требуется буферная память для временного хранения выборок, объем требуемого буфера зависит от соотношения частот и алгоритма пересчета. Понятно, что даже при самом лучшем алгоритме пересчета сигнал от аудио-CD всяко потеряет в качестве.

3. Интерфейсы цифровых карт

Звуковая карта имеет набор разъемов для подключения внешних аудиосигналов, аналоговых и цифровых; звуковая карта может иметь дополнительный интерфейс подключения дочерней карты, расширяющий возможности основной. Дочерние карты могут содержать более качественный синтезатор, дополнительные высококачественные устройства ЦАП, АЦП и иные средства.

3.1. Аналоговые интерфейсы

Аналоговые интерфейсы используются для подключения стандартной бытовойаппаратуры, микрофона, аналогового выхода CD-ROM. На большинстве картмассового потребления для аналоговых сигналов предназначены малогабаритные разъемы — «мини-джеки» (jack) диаметром 3,5 мм, моно и стерео. Эти разъемы универсальны (используются на бытовой аппаратуре), но имеют весьма низ
кое качество контактов — являются источником шумов (шорохов и тресков),а также иногда просто теряют контакт. На некоторых высококачественных картах сигналы линейного входа и
выхода выводятся на пары разъемов RCA, что обеспечивает очень хороший контакт (особенно в позолоченном варианте). В просторечии такие разъемы, часто используемые на бытовых видеомагнитофонах, называют «колокольчиками» или «тюльпанами».

Рис. 12.3. Разъемы подключения аудиосигналов: а— мини-джеки (стерео и моно); б— внутренние разъемы подключения CD-ROM

3.2. Цифровые интерфейсы

S/PDIF (Sony/Philips Digital Interface Format) — цифровой последовательный интерфейс (и форматы данных) для передачи аудиосигналов между блоками бытовой цифровой аудиоаппаратуры Этот интерфейс является упрощенным вариантом студийного интерфейса AES/EBU (Audio Engineers Society/European Broadcast Union). Интерфейс AES/EBU использует симметричный двухпроводный экранированный кабель с импедансом 110 Ом, разъемы XLR, уровень сигнала — 3-10 В, длина кабеля — до 12 м.

Интерфейс S/PDIF использует коаксиальный кабель 75 Ом, разъемы RCА или BNC, уровень сигнала — 0,5-1 В, длина кабеля — до 2 м. В звуковых картах внутренние разъемы S/PDIF проще — это просто пара штырьков на плате с соответствующей ответной частью на кабеле. Такие же упрощенные разъемы применяются и на новых приводах CD-ROM, имеющих выход S/PDIF. «Штатная» схема передатчика S/PDIF содержит разделительный импульсный трансформатор (1:1), благодаря которому соединяемые устройства гальванически развязываются.

Кроме электрической существует и оптическая версия интерфейса S/PDIF — Toslink, стандарт EIAJ СР-1201 — с инфракрасными излучателями (660 нм). Применение оптики позволяет обеспечить полную гальваническую развязку устройств, что необходимо для снижения уровня наводок. Для пластикового волокна (POF) длина кабеля — не более 1,5 м, для стеклянного волокна — 3 м. В.

3.3. Интерфейс MIDI

Цифровой интерфейс музыкальных инструментов MIDI (Musical Instrument Digital Interface) является последовательным асинхронным интерфейсом с частотой передачи 31,25 Кбит/с. Этот интерфейс, разработанный в 1983 году, стал фактическим стандартом для сопряжения компьютеров, синтезаторов, записывающих и воспроизводящих устройств, микшеров, устройств специальных эффектов и другой электромузыкальной техники. В настоящее время интерфейс MIDI имеют и дорогие синтезаторы, и дешевые музыкальные клавиатуры, пригодные в качестве устройств ввода компьютера. Сообщения MIDI широко используются и для передачи музыкальных записей (на дисках и по сети), а также как выходной аудиоинтерфейс для игр и прочих «звучащих» приложений. Описание музыкальных фрагментов в формате MIDI очень компактно: минута MIDI (файлы с расширением .MID) может занимать менее 10 Кбайт, в то время как минута оцифрованного звука (файлы с расширением .WAV) с качеством аудио-CD занимает около 10 Мбайт. Однако формат MIDI позволяет воспроизводить лишь звуки, на которые способен синтезатор на исполняющей стороне, в то время, как цифровое аудио воспроизводит любые звуки. В отличие от оцифрованного звука при воспроизведении данных MIDI пользователь может независимо изменять тональность (транспонировать музыкальный текст) и темп исполнения, причем без искажения тембра и характера звучания инструментов. Современные процессоры и методы обработки сигналов позволяют транспонировать оцифрованный звук даже в реальном времени, но все-таки с рядом ограничений.

В физическом интерфейсе применяется токовая петля 5 мА (возможно, до 10 мА) с гальванической (оптронной) развязкой входной цепи. Логическому нулю соответствует наличие тока, логической единице и отключению — отсутствие тока (в «классической» токовой петле телекоммуникаций — наоборот).

Интерфейс определяет три типа портов: MIDI-In, MIDI-Out и MIDI-Thru (рис. 12.4).

Входной порт MIDI-In представляет собой вход интерфейса «токовая петля», гальванически развязанного от приемника оптроном с быстродействием не хуже 2 мкс. Устройство отслеживает информационный поток на этом входе и реагирует на адресованные ему команды и данные.

Выходной порт MIDI-Out представляет собой выход источника тока, гальванически связанного со схемой устройства. Ограничительные резисторы предохраняют выходные цепи от повреждения при замыкании на землю или источник 5 В. На выход подается информационный поток от данного устройства. При специальной настройке устройства в этом потоке может содержаться и транслированный входной поток, но это нетипично.

Транзитный порт MIDI-Thru служит только для ретрансляции входного потока, по электрическим свойствам он аналогичен выходному. Его наличие не является обязательным для всех устройств.

In

VIDI 1 Контроллер

(Секвенсор)

MIDI

Out

1 голосовые

Звук. модуль

16 управляющие

Thru синхронизирующие

In

MIDI 2

Thru In

MIDI 3

Рис. 12.4. Соединение интерфейсов MIDI

Поток данных MIDI исходит от MIDI-контроллера или от секвенсора. MIDI-контроллер представляет собой устройство, на котором играют как на музыкальном инструменте (чаще всего это клавиатура). MIDI-контроллер формирует поток сообщений, отражающий события исполнения (нажатие и отпускание клавиш) в реальном времени. MIDI-секвепсор (sequencer) — устройство, позволяющее перехватывать, хранить и редактировать (включая комбинирование, наложение и генерацию) поток MIDI-сообщений и воспроизводить его в заданном темпе. Исходящий поток MIDI-контроллера или секвенсора поступает на его разъем MIDI-Out. Для использования в качестве секвенсора компьютер должен иметь порт MIDI и соответствующее прикладное ПО, а также иметь производительность, достаточную для работы в реальном времени. Секвенсоры оперируют треками — строками нот, исполняемыми параллельно. Трек примерно соответствует партии (или ее части) одного инструмента. Такое представление естественно для композиторов и обеспечивает богатые возможности по редактированию. Программный секвенсор может сохранять партитуры как в своем собственном (ни с кем не совместимым), так и в стандартизованном формате. Для синтезаторов с аналоговым управлением интерфейс MIDI непосредственно не подходит. Для их подключения существуют специальные микроконтроллеры с ЦАП, формирующие управляющее напряжение (линейное или экспоненциальное) и разрешающий сигнал на основе потока сообщений MIDI, адресованных к выбранному каналу. Встроенное программное обеспечение такого контроллера может реализовать все команды, связанные с изменением частоты тона: вибрато, глиссандо, портаменто и т. п.

Наиболее распространенные MIDI-контроллеры представляют собой 4-6-ок-тавные клавиатуры с полноразмерными (как у рояля) или уменьшенными клавишами. Каждая клавиша имеет датчик нажатия: простейший дискретный (кнопочный), фиксирующий лишь факт нажатия-отпускания, или же динамический, измеряющий скорость (силу удара) и передающий это значение в качестве параметра сообщения. Простейшие клавиатуры имеют подпружиненные клавиши, более качественные «взвешенные» клавиатуры для исполнителя по ощущениям близки к настоящим рояльным. Клавиатура может иметь датчик давления на клавишу после удара, «колеса» (wheels) для управления строем канала, а также подачи сообщений управления контроллерами (например, глубины модуляции). К клавиатуре могут подключаться педаль удержания нот (sustain), органы включения различных эффектов, переключения номера канала. На клавиатуре может быть установлен и небольшой дисплей или отдельные индикаторы режима работы.

Интерфейс MIDI в значительной степени ориентирован на клавишные музыкальные инструменты. Однако даже самая хорошая «взвешенная» клавиатура с датчиками скорости и давления не позволяет передать всех нюансов исполнения, например, духовых или струнных (щипковых или смычковых) инструментов. В настоящее время существуют MIDI-контроллеры с интерфейсами, отличными от клавишных. Существуют MIDI-контроллеры в виде гитар, где датчики определяют место прижима струн и силу удара (щипка). Есть и MIDI-контроллеры с «духовым интерфейсом» — датчики устанавливаются на клапанах, а специальный мундштук измеряет расход проходящего воздуха. Существуют также и преобразователи аналогового сигнала в поток MIDI-инструкций. Они имеют АЦП, оцифровывающий входной сигнал, снятый микрофоном с реального инструмента, и внутренний сигнальный процессор. Для гитар выпускаются специальные звукосниматели, сопряженные с сигнальными процессорами. Задача разложения звука на голосовые (не спектральные!) составляющие достаточно сложна и легче решается для одноголосных инструментов. Если преобразователь использовать как устройство ввода для секвенсора, то ошибки преобразования можно исправлять средствами редактирования музыкального текста в секвенсоре.

Самым примитивным MIDI-контроллером может являться обыкновенная компьютерная клавиатура — она способна генерировать сообщения по фактам нажатия и отпускания клавиш. Ценным свойством клавиатуры является способность реагирования на одновременные нажатия-отпускания клавиш, в том числе и во время удержания нескольких клавиш нажатыми. Конечно, она не воспринимает динамику удара и расположение клавиш отнюдь не фортепьянное, но при отсутствии настоящей клавиатуры поиграть можно (даже аккордами). Возможность ввода MIDI-команд с клавиатуры имеется во многих программах, работающих с MIDI-синтезатором.

Поток сообщений MIDI проигрывается в компьютере с помощью синтезаторов, аппаратных или программных. Чисто аппаратная реализация MIDI выполняется на звуковых картах с собственным процессором. Этот процессор интерпретирует каждое сообщение MIDI в команды управления синтезатором (FM или WT). Простые карты имеют только сами синтезаторы, а управление ими для интерпретации сообщений MIDI осуществляет программный драйвер карты, исполняемый центральным процессором. Современные процессоры способны поддерживать чисто программную интерпретацию MIDI (Soft MIDI), выполняя и собственно синтез звука в цифровой форме. Правда, при этом занимаются ресурсы (процессорное время и память).

Конечным приемником потока MIDI-сообщений является звуковой модуль (sound module) — синтезатор, формирующий аудиосигнал на основе приходящих к нему команд. Применительно к PC синтезатор может входить в состав звуковой карты, а может быть и внешним.

Каждому звуковому модулю назначается свой номер логического канала (MIDI Channel) в диапазоне 1-16.

Наличие порта MIDI-Thru позволяет соединять устройства в цепочки и более сложные структуры. Возможные варианты топологии должны подчиняться главному правилу: вход MIDI-In одного устройства должен подключаться к выходу MIDI-Out или MIDI-Thru другого устройства. При планировании MIDI-сети необходимо руководствоваться знаниями информационных потоков и связей устройств. Управляющие устройства — клавиатуры, секвенсоры (в режиме воспроизведения), источники синхронизации — должны находиться, естественно, перед управляемыми. Возможно применение и специальных устройств-мультиплексоров, позволяющих логически коммутировать множество входных потоков в один выходной.

Сообщения MIDI разделяются на канальные (Channel Messages) и системные (System Messages).

Канальные сообщения подразделяются на голосовые и управляющие (Channel Mode Messages). Голосовые сообщения несут основную исполнительную информацию. Исполнение ноты начинается по приему сообщения Note On, которое содержит номер ноты и скорость нажатия клавиши. Это сообщение инициирует фазы атаки, спада и удержания (см. рис. 11.3). Скорость нажатия задает уровень (громкость) исполнения, качественные синтезаторы в зависимости от скорости могут корректировать и характер исполнения (спектр, форму огибающей, выбирать нужный образец). Нота снимается (отрабатывается фаза затухания) по приему с ее же номером сообщения Note Off (или Note On с нулевой скоростью). Голосовые сообщения управляют и характером исполнения (громкость, вибрато, смещение строя и т. п.). Каждому параметру синтезатора соответствует номер контроллера (в данном контексте — номер управляемого параметра), с помощью которого можно им управлять. Эти контроллеры не следует путать с MIDI-контроллерами — устройствами, с помощью которых исполнитель генерирует MIDI-сообщения. Управляющие сообщения определяют, как именно звуковой модуль должен отрабатывать голосовые сообщения.

Системные сообщения служат для синхронизации с видеооборудованием и ленточными записывающими устройствами, выбора произведения и позиции воспроизведения, настройки аналоговых синтезаторов. Сообщения реального времени образуют систему синхронизации MIDI Sync, используемую секвенсорами, ритм-машинами и другими тактируемыми устройствами MIDI. Есть и специальные сообщения для обмена различными данными, например для загрузки патчей.

Для обеспечения совместимости различных звуковых модулей был принят стандарт General MIDI (GM). Он определяет минимальные требования к модулям и оставляет место для расширений, среди которых широко распространены стандарты GS и XG. Стандарт GM поддерживают все звуковые карты, «понимающие» MIDI. Расширение GS поддерживается довольно большим числом производителей; XG поддерживают лишь синтезаторы (и звуковые карты) фирм Yamaha и Korg. Для унификации методов хранения и передачи информации MIDI были приняты и стандарты на форматы файлов.

Хранение и передача данных MIDI имеют свою специфику. Когда источником сообщений MIDI является MIDI-контроллер и генерируемый им поток исполняется сразу в реальном времени, никакой маркировки сообщений обычно не требуется. Для хранения данных MIDI в виде файлов требуются специальные меры для отметки времени.

При сопряжении устройств MIDI с «инородными» устройствами (видеосистемы, аудиорекордеры) возникает задача их синхронизации. В MIDI используется система MIDI Sync с однобайтными сообщениями SRT. Кроме этой системы в музыкальных инструментах применяется и аппаратная синхронизация Sync24, известная под названием «DIN Sync», однако, несмотря на однотипность разъемов, никакой совместимости интерфейсов MIDT и Sync24 нет. Выделить из потока MIDI- сообщения SRT может несложный микроконтроллер (или же аппаратная логика).

В мультимедийных приложениях возникает необходимость синхронизации MIDI-звука с движущимся видеоизображением. Существует несколько систем синхронизации SMPTE, принятых организацией Society of Motion Picture ; Television Engineers (Общество инженеров движущихся изображений и телевидения).

Для передачи данных счетчиков SMPTE по интерфейсу MIDI разработана система синхронизации МТС (MIDI Time Code). Она является мостом, соединяющим систему синхронизации MIDI, построенную на отметках долей тактов (beat), с данными в форматах SMPTE. Отметим, что синхронизация MIDI Sync является темпозависимой — частота посылки синхросообщений пропорциональна темпу исполнения, который может меняться. Система SMPTE, а следовательно, и МТС привязана к абсолютному времени — ее частота сообщений определяется только частотой кадров.

.

Направление потоков MIDI задается программно (в среде Windows через Панель управления, значок Multimedia, вкладка MIDI). В простейшем варианте все сообщения MIDI можно посылать на одно из присутствующих в системе устройств, которые включают аппаратные (FM, WT и иные) синтезаторы установленных звуковых карт, их порты, к которым подключены дочерние карты, внешние порты MIDI, а также программные синтезаторы. Более сложную конфигурацию можно задать, указав для каждого из 16 каналов MIDI свой синтезатор (порт назначения).

Внешний порт MIDI (с сигналами ТТЛ) обычно выводится на разъем джойстика, установленный на звуковой карте (или системной плате с интегрированным звуком), и для связи с внешними устройствами (с разъемами DIN и токовым интерфейсом) используются специальные переходники (см. п. 11.2.4). Программно порт обычно совместим с UART MPU-401 (см. п. 11.2.5). На некоторых системных платах применяются БИС контроллеров интерфейсов, в которых UART, используемый для СОМ-порта, конфигурированием через CMOS Setup может быть переведен в режим MIDI-порта.

В последнее время в аудиотехнике намечается тенденция к использованию шины USB, которая пригодна как для обмена данными в традиционном виде.так и для изохронной передачи (с равномерной скоростью поступления данных) аудиоданных в цифровом виде. Интерфейс MIDI имеет ограничение на число каналов (16), и его невысокая скорость передачи ограничивает полифонические возможности (большое число нот в аккорде не может звучать строго одновременно). В то же время производительности современных PC хватает на то, чтобы справляться и с более мощными потоками данных. Для подключения устройств MIDI к компьютеру через USB фирма Roland выпускает 64-канальный процессорный блок S-MPU64, который кроме шины USB имеет 4 входных и 4 выходных порта MIDI. Программное обеспечение допускает объединение до 4 блоков на одной шине USB, что увеличивает число каналов до 256.

PAGE 11

Аудио система персонального компьютера