ЗВУКОВЫЕ ФАЙЛЫ

Оглавление

  1. Звуковая волна – аналоговый сигнал
  2. Оцифровка аналогового сигнала
  3. Форматы звуковых файлов
  4. MIDI и цифровой звук: достоинства и недостатки
  5. Советы по работе со звуком

Звуковая волна – аналоговый сигнал

Мир звуков окружает человека постоянно. Мы слышим шум прибоя, шелест листвы, грохот водопадов, пение птиц, крики зверей, голоса людей. Все это - звуки нашего мира, мира Земли. И, конечно, музыка. Что такое музыка, по большому счету, не знает никто. Конечно, в энциклопедиях и словарях можно найти определения, но они - лишь попытка объяснить то, что, скорее всего, лежит вне сферы нашего понимания. Мы попытаемся уловить и зафиксировать некие важные черты явления, дать определение и проникнуть в сущность вещи. Но есть явления, столь многогранные, что не могут уместиться в ложе простых понятий. Музыка из их числа.

Мир оцифрованных звуков - следующий элемент Мира Информации, с которым мы начинаем свое знакомство. История этого элемента столь же древняя, как и предыдущих, уже рассмотренных нами. Первоначально человек создал устройства, с помощью которых он пытался воспроизвести природные звуки для своих практических целей, в частности, для охоты. Потом звуки в его голове стали складываться в некую последовательность, которую хотелось сохранить. Появились музыкальные инструменты, и они сопровождали человека в горе и в радости. И постепенно шел процесс формирования языка, на котором можно было бы записывать и тем самым надолго сохранять рожденные мелодии.

Первые попытки разработки такого «музыкального алфавита» были предприняты еще в Древнем Египте и Месопотамии. А в том виде, в каком мы знаем ее сейчас, в виде нотной записи, система фиксации музыки сложилась к XVII в. Ее основы были заложены Гвидо д'Ареццо.

На протяжении веков человечество не оставляло попыток связать музыку и математику, «поверить гармонией чисел гармонию небесных сфер». Развитие вычислительной техники дало этому процессу новый импульс. Одновременно шло совершенствование систем записи и хранения звука. Человек научился сохранять и воспроизводить не только музыку, но и любые окружающие звуки. Мир звуков постепенно соединялся с цифровым миром.

Как подчеркивают специалисты, звук является наиболее выразительным элементом мультимедиа. Пришла пора и нам окунуться в мир цифровых звуков.

Звук и музыкальное сопровождение являются мультимедийными элементами, активно влияющими на восприятие материала. Это могут быть записи разнообразных звуков повседневной жизни (пение птиц, звонок телефона, хлопанье дверью и т. п.), музыки или голоса. Звук может присутствовать в виде фраз, произносимых диктором, диалога персонажей или звукового ряда видеофрагмента. Музыка обычно используется в качестве фонового звука. Обычно фоновая музыка должна быть спокойной, мелодичной, с ненавязчивым мотивом. В этом случае у пользователей создается благоприятное, спокойное настроение, способствующее повышению восприимчивости к информационному материалу. Особенности сочетания слуховых и зрительных восприятий информации показаны на рис. 4.

Рис. 4. Особенности восприятия информации

Звук, как и многие другие физические явления, с которыми мы сталкиваемся в повседневной жизни, имеет волновую природу. Звуковые волны могут распространяться в любой сжимаемой среде - газах, жидкостях или твердых телах. На практике чаще всего приходится иметь дело со звуковыми волнами, распространяющимися в атмосфере.

Звуковая волна распространяется с конечной скоростью. В момент прохождения звуковой волны через элементарный объем воздуха все частицы начинают совершать продольные колебания относительно некоторого положения равновесия. Частицы воздуха, лежащие на линии распространения звука, будут приходить в движение по очереди, по мере распространения волны. Вместе с частицами воздуха в каждом элементарном объеме происходят колебания избыточного давления, называемого звуковым давлением, в результате чего давление периодически становится то больше, то меньше исходного, которое было при отсутствии звука. Величина звукового давления ничтожна по сравнению с атмосферным и зависит от скорости колебания частиц и от свойств атмосферы.

Таким образом, звуковая волна - этpо процесс распространения в атмосфере объемных деформаций сжатия-разрежения.

Одним из важнейших параметров звуковой волны является ее частота - величина, обратная периоду колебания. Частоту звука принято измерять в герцах (Гц) или килогерцах (1 КГц = 1 000 Гц). Например, если частота звука равна 20 Гц, это означает, что в течение 1 с происходит 20 полных колебаний. С частотой колебаний неразрывно связана длина волны - расстояние, которое волна успевает пройти за время одного периода колебаний (длина волны = скорость звука / период). Очевидно, что с увеличением частоты длина волны уменьшается: чем меньшее период колебания, тем меньше расстояние проходит волна.

Многолетние исследования доказывают, что чувствительность нашего слуха существенно зависит от частоты звука. Частотный диапазон звуков, которые способен услышать человек, достаточно велик. Считается, что нижняя граница частоты слышимых звуков составляет 16-20 Гц, верхняя - 18-20 КГц. Волны с частотами, лежащими ниже частотного диапазона, воспринимаемого человеком, называются инфразвуковыми, а лежащими выше - ультразвуковыми. Ни инфразвуки, ни ультразвуки человеческое ухо не воспринимает.

Звуковой волной простейшей формы является, например, чистый звуковой тон определенной частоты. Однако распространяющиеся в воздухе звуковые волны обычно имеют более сложную форму, особенно если частицы воздуха подвергаются одновременному воздействию нескольких волн, которые, к тому же, распространяются в различных направлениях. В этом случае наблюдается явление интерференции - сложение волн. При сложении волн с разными частотами и амплитудами, даже если эти волны синусоидальные, результирующая волна может иметь более сложный вид.

Оцифровка аналогового сигнала

Фразу «передача и запись звука» вам, наверное, приходилось слышать не раз, но вряд ли вы задумывались над тем, что она не совсем точно соответствует действительности.

Пожалуй, единственным устройством, в котором запись звука осуществлялась в буквальном смысле, был фонограф Эдисона. Во всех остальных случаях, когда речь заходит о «записи звука», фактически записывается или передается не сам звук, а информация о том, какими были колебания воздуха в момент записи.

В настоящее время для записи и передачи информации о звуке используются два принципиально различных способа: аналоговый и цифровой.

В первом случае изменениям звукового давления соответствуют пропорциональные изменения другой физической величины, например, электрического напряжения. В этом случае изменения электрического напряжения являются новым «носителем» информации о звуке.

Такой способ сохранения звуковой информации является аналоговым, и еще совсем недавно в звукозаписи и радиовещании он был единственным. В аналоговой электронике важно, чтобы изменение напряжения точно соответствовало изменению звукового давления. Напомним, что амплитуда звуковой волны определяет громкость звука, а ее частота - высоту звукового тона, следовательно, для достоверного сохранения звуковой информации амплитуда электрического напряжения должна быть пропорциональна амплитуде звуковых колебаний. Частота напряжения, в свою очередь, должна соответствовать частоте звуковых колебаний.

Таким образом, нетрудно заметить, что форма электрического сигнала является полной копией формы звукового колебания и несет практически полную информацию о звуке. Преобразовать звуковые колебания в колебания электрического напряжения можно с помощью обычного микрофона.

Изменению электрического напряжения можно поставить в соответствие изменение магнитного поля ленты в магнитофоне или звукового потока от звуковой дорожки кинопленки при оптической записи. Но каким бы ни был новый «носитель» информации, изменение его свойств всегда должно быть пропорционально изменению давления воздуха в исходной звуковой волне.

Второй способ получения информации о звуке предполагает измерение значения давления в звуковой волне. Возникающая при этом последовательность чисел - цифровой сигнал - есть не что иное, как новое выражение исходных звуковых колебаний. Естественно, чтобы правильно передать форму сигнала, эти измерения надо проводить достаточно часто - не менее нескольких раз за период самой высокочастотной составляющей звукового сигнала.

Цифровая система записи (передачи) звука в самом общем виде состоит из цифрового микрофона (измерителя звукового давления), цифрового магнитофона или передатчика (для записи или передачи большого массива чисел) и цифрового громкоговорителя (преобразователя последовательности чисел в изменение звукового давления). В реальных цифровых системах записи (передачи) звука пока используют аналоговые электроакустические преобразователи - микрофоны и громкоговорители (динамики), а цифровой обработке подвергают электрические сигналы звуковой частоты.

В общем случае цифровые сигналы представляют собой импульсы прямоугольной формы, которые с помощью логических элементов включают и выключают в электрической схеме различные цепи. В отличие от аналоговой электроники, оперирующей формой и напряжением сигнала, цифровая электроника использует двоичные сигналы: сигналы с дискретными уровнями напряжения, соответствующими «0» и «1».

К амплитуде импульса (уровню напряжения) цифрового сигнала обычно не предъявляется жестких требований при условии, что напряжение надежно перекрывает уровни «0» и «1», которые обычно находятся в диапазоне от 0 до +5 В. Например, за уровень сигнала, соответствующий «1», может быть принято напряжение в интервале от 2,4 до 5,2 В, а за уровень «0» - напряжение в интервале от 0 до 0,8 В.

Для подсчета двоичных сигналов наиболее удобно пользоваться двоичной системой счисления, которая также оперирует только двумя цифрами: 0 и 1. В любой системе счисления, в том числе и двоичной, важное место занимает понятие разряда. Разряд представляет собой степень (число), в которую возводится основание системы счисления. Номера разрядов в числе отсчитываются справа налево, а нумерация начинается с нуля.

Наибольшее число, которое может быть записано в двоичной системе счисления (впрочем, как и в любой другой), зависит от количества используемых разрядов. Так, при использовании одного разряда можно записывать лишь два числа: 0 и 1. Если использовать 2 разряда, можно записывать числа в интервале от 0 до 3. В случае, если используется 8 разрядов, можно оперировать числами от 0 до 255, а при 16 разрядах диапазон возможных значений числа будет иметь границы от 0 до 65 535.

Преобразование аналогового сигнала в цифровой практически в любой системе практической записи звука протекает в несколько этапов. Сначала аналоговый звуковой сигнал падает на аналоговый фильтр, который ограничивает полосу частот сигнала и устраняет помехи и шумы сигнала. Затем из аналогового сигнала с помощью схемы выборки/хранения выделяются отсчеты: с определенной периодичностью осуществляется запоминание мгновенного уровня аналогового сигнала. Далее отсчеты поступают в аналого¬цифровой преобразователь (АЦП), который преобразует мгновенное значение каждого отсчета в цифровой код, или числа. Полученная последовательность бит цифрового кода, собственно, и является звуковым сигналом в цифровой форме. Таким образом, в результате преобразования непрерывный аналоговый звуковой сигнал превращается в цифровой - дискретный по времени и величине.

Дискретизация

Важнейшим этапом аналогово-цифрового преобразования является дискретизация аналогового сигнала. Вместо термина «дискретизация» в технической литературе иногда употребляют термин «выборка».

По определению, дискретизация - это процесс взятия отсчетов непрерывного во времени сигнала в равноотстоящих (эквидистантных) друг от друга во времени точках. Иными словами, в процессе дискретизации измеряется и запоминается уровень аналогового сигнала. Через данный интервал времени, который называется интервалом дискретизации, процедура повторяется. Для качественного преобразования аналогового сигнала в цифровой необходимо производить достаточно большое количество отсчетов даже в течение одного периода изменения аналогового сигнала, другими словами, значение частоты дискретизации не может быть произвольным.

И действительно, значение частоты дискретизации фактически определяет ширину полосы частот сигнала, который может быть записан с помощью используемой цифровой системы. Ширина этой полосы не может быть больше половины значения частоты дискретизации, как определяет теорема отсчетов (Котельникова - Шеннона - Найквиста). Эта теорема имеет важнейшее значение в технике записи и передачи сигнала в цифровой форме. Теорема гласит: сигнал, спектр частот которого занимает область от £^п до fmax, может быть полностью представлен своими дискретными отсчетами с интервалом Тд, если Тд не превышает 1/(2fmax). Другими словами, частота дискретизации Гц = 1/Тд в процессе преобразования должна быть, как минимум, вдвое больше наивысшей частоты звукового сигнала fmax.

Если учесть, что человек способен слышать звуковые колебания, частота которых находится в диапазоне от 17-20 Гц до 20 КГц, и с позиций теоремы отсчетов взглянуть на требования к частотным характеристикам высококачественной аудиотехники (например, проигрывателей аудио компакт¬дисков), становится ясно, что максимальная частота дискретизации исходного звукового сигнала должна составлять не менее 40 КГц. Реально для подобных систем частота дискретизации составляет не менее 44,1 КГц. Стандартное значение частоты дискретизации большинства звуковых карт составляет 44,1 и 48,0 КГц.

Итак, результатом дискретизации является дискретный во времени сигнал, представляющий собой последовательность отсчетов - мгновенных значений уровня аналогового сигнала. Чем выше частота дискретизации, тем более точно будет восстановлен звуковой сигнал.

Квантование

После дискретизации происходит второй этап аналогово-цифрового преобразования - квантование отсчетов. В процессе квантования производится измерение мгновенных значений уровня сигнала, полученных в каждом отсчете, причем осуществляется оно с точностью, которая напрямую зависит от количества разрядов, используемых для записи значения уровня.

Если, задав длину N кодового слова, записать значение уровня сигнала с помощью двоичных чисел, то количество возможных значений будет равно 2N. Естественно, что столько же может быть и уровней квантования. Например, если значение амплитуды отсчетов представляется 16-разрядным кодовым словом, то максимальное количество градаций уровня сигнала (уровней квантования) будет равно 65 536 (216). При 8-разрядном представлении будем иметь 256 (28) градаций уровня. Необходимая разрядность представления значений отсчетов определяется динамическим диапазоном аналогового сигнала - разрядностью между уровнями самого сильного сигнала, который устройство в состоянии пропустить, и самого слабого, еще различимого на фоне шумов. С другой стороны, разрядность АЦП однозначно определяет динамический диапазон цифрового сигнала. Так, при 8-разрядном представлении значений отсчетов динамический диапазон составит 48, а при 16-разрядном - 96 дБ.

Для воспроизведения звукового сигнала, записанного в цифровой форме, необходимо преобразовать его в аналоговую форму, т. е. осуществить цифро¬аналоговое преобразование сигнала.

На первом этапе из потока цифровых данных с помощью цифро-аналогового преобразователя выделяют отсчеты сигнала, следующие с частотой дискретизации. На втором этапе из дискретных отсчетов формируется путем сглаживания (интерполяции) непрерывный аналоговый сигнал. Эта операция равносильна фильтрации сигнала идеальным фильтром низкой частоты, который подавляет периодические составляющие спектра дискретизированного сигнала.

Сразу после первого этапа цифро-аналогового преобразования сигнал представляет собой серию узких импульсов, имеющих многочисленные высокочастотные спектральные компоненты. На аналоговый фильтр в этом случае возлагается задача полностью пропустить сигнал нужного частотного диапазона (например, 0-24 КГц) и как можно сильнее подавить ненужные высококачественные компоненты. Аналоговому фильтру выполнить такие противоречивые требования не под силу.

При использовании аналоговых усилителей с ограниченной полосой пропускания и нелинейной передаточной характеристикой, высококачественные составляющие, содержащиеся в выходном сигнале ЦАП, при недостаточной их фильтрации вызывают заметные на слух интермодуляционные искажения. Поэтому цифровой сигнал сначала интерполируют: вставляют дополнительные отсчеты, вычисленные по специальным алгоритмам, что приводит к увеличению частоты дискретизации без искажения исходного спектра сигнала. Это приводит к тому, что высококачественные спектральные компоненты на выходе ЦАП далеко отстоят от низкочастотных компонентов звукового сигнала, и, чтобы отфильтровать их, достаточно использовать простой аналоговый фильтр.

В современных ЦАП интерполяция может выполняться нелинейными и линейными методами в сочетании с аналоговой фильтрацией.

Полученный в результате цифро-аналогового преобразования звуковой сигнал, как правило, попадает в микшер и через линейный выход направляется в акустическую систему, в которой колебания напряжения электрического сигнала преобразуются в колебания звукового давления.

Принципы преобразования аналогового сигнала в цифровой одинаковы для любого типа информации (текст, графика, звук или видео). Основными характеристиками полученной цифровой информации являются частота дискретизации и разрядность (или глубина оцифровки, битовая глубина, количество уровней квантования).

Форматы звуковых файлов

WAVE (.wav) - наиболее широко распространенный звуковой формат. Используется в OC Windows для хранения звуковых файлов. В его основе лежит формат RIFF (Resource Interchange File Format), позволяющий сохранять произвольные данные в структурированном виде. Для записи звука используются различные способы сжатия, поскольку звуковые файлы имеют большой объем. Самый простой способ сжатия - импульсно-кодовая модуляция (Pulse Code Modulation, PCM), но он не обеспечивает достаточно хорошего сжатия [6].

AU (.au, .snd) - формат звуковых файлов, используемый на рабочих станциях фирмы Sun (.au) и в операционной системе NeXT (.snd). Получил широкое распространение в сети Internet, на ранней стадии развития которой играл роль стандартного формата для звуковой информации.

MPEG-3 (.mp3) - формат звуковых файлов, один из наиболее популярных на сегодняшний день. Был разработан для сохранения звуков, отличных от человеческой речи. Используется для оцифровки музыкальных записей. Предшествующие версии формата - MP1 и MP2. При кодировании применяется психоакустическая компрессия, при которой из мелодии удаляются звуки, плохо воспринимаемые человеческим ухом. Ранние версии обеспечивают худшую компрессию, но менее требовательны к ресурсам компьютера при воспроизведении. Характеристики процессора напрямую влияют на качество звучания - чем слабее процессор, тем больше искажения звука.

MIDI (.mid) - цифровой интерфейс музыкальных инструментов (Musical Instrument Digital Interface). Этот стандарт разработан в начале 1980-х гг. для электронных музыкальных инструментов и компьютеров. MIDI определяет обмен данными между музыкальными и звуковыми синтезаторами разных производителей. Интерфейс MIDI представляет собой протокол передачи музыкальных нот и мелодий. Но данные MIDI не являются цифровым звуком - это сокращенная форма записи музыки в числовой форме. MIDI-файл представляет собой последовательность команд, которыми записаны действия, например, нажатие клавиши на пианино или поворот регулятора. Эти команды, посылаемые на устройство воспроизведения MIDI-файлов, управляют звучанием, небольшое MIDI-сообщение может вызвать воспроизведение звука или последовательности звуков на музыкальном инструменте или синтезаторе, поэтому MIDI-файлы занимают меньший объем (единица звукового звучания в секунду), чем эквивалентные файлы оцифрованного звука.

Существует несколько разновидностей стандарта MIDI. Среди них General MIDI, General Standart, Extended General:

General MIDI (GM) - стандарт, регламентирующий набор тембров (инструментов) в музыкальных синтезаторах. GM - первая разработка фирмы Roland, унифицирующая набор MIDI-инструментов. В соответствии со стандартом GM синтезатор должен иметь 128 мелодических тембров с возможностью воспроизведения звуков разной высоты в каналах 1-9 и 11-16 и 46 ударных инструментов в канале 10. За всеми инструментами закреплены номера. Партитура, подготовленная в соответствии со стандартом GM, должна звучать похоже на разных GM-инструментах. К сожалению, сходство звучания распространяется лишь на «классические» тембры реальных инструментов. А большинство синтетических (Pad/FX) и многие ударные инструменты сильно различаются по скорости нарастания/затухания, громкости, окраске и другим параметрам звучания;

General Standart (GS) - общий стандарт фирмы Roland, регламентирующий набор тембров. Помимо элементов стандарта General MIDI он включает дополнительные наборы мелодических и ударных инструментов, а также различные эффекты (скрип двери, звук мотора, крики и т. п.);

Extended General (XG) - новый стандарт фирмы Yamaha, включающий несколько сотен мелодических и ударных инструментов, ставший альтернативой формату GS.
MOD (.mod) - музыкальный формат, в нем хранятся образцы оцифрованного звука, которые можно затем использовать как шаблоны для индивидуальных нот. Файлы в этом формате начинаются с набора образцов звука, за которыми следуют ноты и информация о длительности. Каждая нота воспроизводится с помощью одного из приведенных в начале звуковых шаблонов. Такой файл относительно невелик и имеет структуру, базирующуюся на нотах. Это облегчает его редактирование с помощью программ, имитирующих традиционную музыкальную запись. Он, в отличие от MTDT- файла, полностью задает звук, что позволяет воспроизводить его на любой компьютерной платформе.

IFF (.iff) - Interchange File Format - формат, первоначально разработанный для компьютерной платформы Amiga. Сейчас также используется на компакт-дисках в форме CD-I. Его структура очень похожа на структуру формата RIFF.

AIFF (.aiff) - Audio Interchange File Format - формат для обмена звуковыми данными, используется на компьютерных платформах Silicon Graphics и Mac. Во многом напоминает формат WAVE, однако, в отличие от него, позволяет использовать оцифрованный звук и шаблоны. Многие программы способны открывать файлы в этом формате.

RealAudio (.ra, .ram) - формат, разработанный для воспроизведения звука в Internet в реальном времени. Разработан фирмой Real Networks (www.real.com). Получающееся качество в лучшем случае соответствует посредственной аудиокассете, для качественной записи музыкальных произведений использование формата mp3 более предпочтительно.

SSEYO Koan (.SKD, .SKP) - формат файлов для записи произвольной объемной компьютерной музыки (или «Koan-музыки»). Термин «Коатмузыка» был введен ее создателем Тимом Коуном в 1994 году. Это своеобразная фантазия на музыкальную тему. Музыкальные Koan-файлы могут быть малыми по размеру, но воспроизведение самой музыки может длиться до восьми часов. В файле указываются основные параметры, а музыка генерируется на компьютере с помощью около 200 специальных переменных параметров управления. Нельзя воспроизвести и услышатьодну и ту же музыку дважды, даже из одного и того же «Koan-файла». Файлы с расширением SKD (SSEYO Koan Design) предназначены для сохранения информации с Koan-музыкой для ее последующего редактирования. Для размещения готовых произведений в Internet предназначен защищенный формат SKP (SSEYO Koan Play), который содержит ту же самую информацию, что и SKD, но не может быть отредактирован имеющимися редакторами Koan-файлов. Эти редакторы позволяют также записать получившуюся музыку в форматах WAV и MIDI, что делает их довольно интересным инструментом для музыкального творчества.

MIDI и цифровой звук: достоинства и недостатки

Формат WAVE представляет собой один из многочисленных форматов, но это далеко не единственный формат для записи цифрового звука. В отличие от MIDI-данных, данные цифрового звука действительно представляют звук, записанный в виде тысяч единиц, называемых квантами (samples). Цифровые данные представляют амплитуду (или громкость) звука в дискретные моменты времени. Звучание цифровых данных не зависит от устройства воспроизведения и поэтому оно всегда одинаково. Но за это приходится расплачиваться большими объемами звуковых файлов [13].

MIDI-данные, по отношению к цифровым данным, - то же самое, что и векторная графика по отношению к растровым изображениям, т. е., MTDT- данные зависят от устройств воспроизведения звука, а цифровые данные не зависят. Также как вид векторных графических изображений зависит от принтера или экрана монитора, так и звучание MIDI-файлов зависит от MIDI- устройства для воспроизведения этих файлов. Аналогично звучание мелодии, сыгранной на концертном фортепиано, будет отличаться от звучания этой же мелодии на простом пианино. Цифровые данные, с другой стороны, идентичны и не зависят от системы воспроизведения. Стандарт MIDI в этом смысле аналогичен стандарту PostScript и позволяет управлять инструментами на понятном языке.

По сравнению с цифровым звуком MIDI имеет следующие преимущества:

Советы по работе со звуком

Запись с помощью микрофона

Любая книга, посвященная мультимедиа, обязательно содержит раздел, посвященный записи звука с помощью микрофона. Причем, для этого обычно используется программа Sound Recorder (Фонограф), входящая в стандартную поставку Windows. Работа с ней подробно описана в прилагаемом к ней файле помощи. Она проста в использовании, и мы не будем на ней подробно останавливаться.

По типам микрофоны делятся на конденсаторные и динамичные. Конденсаторные стоят дороже, дают более качественный звук, но их подключение должно поддерживаться звуковой картой. А подавляющее большинство звуковых карт рассчитано на динамические микрофоны.

Другая важная характеристика микрофона - его направленность (directivity). Микрофоны бывают всенаправленные (имеют одинаковую чувствительность к звуку во всех направлениях), однонаправленные (имеют наибольшую чувствительность к звуку, поступающему спереди) и двунаправленные (более чувствительны к звуку, поступающему спереди и сзади). Однонаправленный микрофон часто является лучшим выбором, поскольку отрезает фоновые шумы. Но он стоит дороже по сравнению с всенаправленным микрофоном и более чувствителен к отрывистым звукам дыхания.

Обязательно обращайте внимание на импеданс (impedance - полное сопротивление) микрофона. Оптимальное значение составляет около 600 Ом.

Итак, рекомендуем динамичpеский, всенаправленный микрофон с импедансом 600 Ом.

Теперь обратимся к программному обеспечению. Для начала следует настроить программу-микшер. Одну из ее разновидностей под названием «Регулятор уровня» вы можете найти среди стандартных программ Windows. Но работать с этой программой очень неудобно, тем более, что в составе программного обеспечения вашей звуковой карты, наверное, есть такая программа с подобными функциями. Советуем пользоваться именно ею, поскольку при ее создании разработчики, как правило, учитывают индивидуальные особенности звуковой платы.

В программе-микшере следует установить в самое нижнее положение регуляторы для всех входов, кроме тех, которые будут задействованы при записи, или вообще отключить их. Это позволит несколько уменьшить «шипение» записей. Для записи с микрофона можно использовать либо микрофонный, либо линейный вход.

Установите регулировку громкости на входе, который вы будете использовать при записи в положение примерно 75 %.

Теперь о самом главном. Основная проблема при записи звука с микрофона состоит в нестабильности уровня сигнала. Чтобы справиться с ней и получить запись с минимальным уровнем шумов, необходимо аппаратное устройство или программное обеспечение, осуществляющее динамическую обработку входного сигнала. Большинство современных програpмм для работы с цифровым звуком осуществляют динамическую обработку (и даже в реальном времени). Их, а не программу Sound Record, и нужно использовать для записи звуковой информации. Такими способностями обладают, в частности, программы Sound Forge и Wavelab. Наличие динамической обработки, т. е. компрессора (limiter), экспандера (expander), эквалайзера и других интересных «штучек» еще не гарантирует качественного результата, но даже с использованием установок по умолчанию вы получите неплохое звучание.

Практически на всех звуковых картах качество микрофонных усилителей слишком низкое, поэтому необходимо приобрести отдельный микрофонный предусилитель или микшер со встроенными предусилителями. До недавнего времени такие устройства стоили довольно дорого, но в последнее время стали появляться приемлемые решения, в частности, следует обратить внимание на микрофонный предусилитель Audio Buddy компании Midi Man (www.midi man.net). Он прекрасно подходит для записи через линейный вход голоса или музыкального сопровождения и рекомендуется для любительской звукозаписи и мультимедиа-производства. Приобретя микрофонный предусилитель, подумайте о хорошем микрофоне.

Выбор частоты оцифровки и разрешение при записи звуковой информации

Подготовка цифровых аудиофайлов довольно проста. Если вы имеете звуковой материал (записи музыки или звуковых эффектов на аналоговом носителе, например, на магнитной ленте), то необходимо сначала выполнить оцифровку этого материала и запись на цифровом носителе информации. В большинстве случаев это означает воспроизведение звука и его ввод в компьютер с помощью соответствующей программы оцифровки звука.

Уделите особое внимание двум аспектам подготовки цифровых аудиофайлов:

В большинстве случаев полезно записывать и редактировать 16-разряд-ные звуковые файлы, окончательный вариант, при необходимости, преобразовывать в 8-разрядный формат. Большинство звуковых плат лучше всего работают на максимальных частотах, поэтому запись лучше всего производить с дискретизацией 44,1 КГц, а затем, при необходимости, сразу же преобразовать файл к низшей частоте.

Несколько слов о том, на какой частоте оцифровки и разрядности следует остановиться для окончательного варианта.

С математической точки зрения, частота оцифровки должна в два раза превышать частоту записываемого сигнала. При записи компакт-дисков используют частоту оцифровки 44,1 КГц для передачи звука частотой 20 КГц с высокой точностью. Однако при создании компьютерных мультимедиа¬проектов необходимо учитывать возможности машины - большая частота оцифровки требует больше места для хранения файла и более совершенного компьютера для воспроизведения. Результат незначительного добавления высоких частот не стоит затрачиваемых усилий. Очень немногие взрослые люди могут слышать звуки частотой выше 15 КГц, эта частота является обычно предельной для стереофонической трансляции. Голос взрослого мужчины редко поднимается выше частоты 7,5 КГц. Исходя из этого, для записи музыкальной дорожки мультимедиа проекта, а также голоса за кадром и звуковой дорожки, содержащей музыку и голос, рекомендуется использовать частоту оцифровки 22,05 КГц, для записи голоса за кадром и звуковых эффектов - 11 КГц.

Выполняя запись звукового файла, придется выбирать между 8-разрядной записью (дающей отношение сигнал/шум 48 децибел (дБ) - приблизительно как в средней радиопередаче на УКВ) и 16-разрядной (96 дБ, что уже переходит разумные пределы). Для деловых и мультимедиа-приложений 8¬разрядная звуковая дорожка более чем достаточна, если она выполнена на качественной звуковой плате.

Таким образом, в окончательном варианте рекомендуется использовать: