Анатолий Вейценфельд
Первые персональные компьютеры, как известно, были «немыми». Только у появившегося в январе 1984 года (ровно двадцать лет назад!) компьютера Macintosh были встроенные монофонические вход и выход с АЦ- и ЦА-преобразователями, работавшими в стандарте 8 бит/22 кГц. Естественно, что запись звука с таким качеством могла быть использована лишь в мультимедийных и офисных целях — о музыкальной записи речи и быть не могло. Для записи же музыки в то время использовались линейные цифровые рекордеры: ленточные магнитофоны форматов U-Matic, DASH, DAT и их модификации.
Однако для записи в компьютер даже с дешевенького микрофона с разрядностью 8 бит и частотой дискретизации 22 кГц требовалась хоть простенькая, но программа. Такая программа входила непосредственно в состав операционной системы, — это была т. н. «панель управления» (Control Panel) Sound. Она представляла собой окно с кнопками «Запись», «Воспроизведение», «Стоп» и счетчиком времени в минутах и секундах. В следующей версии программы в окне появился еще и индикатор уровня входного сигнала — очень условный, без калибровки в децибелах. Вот такой была первая программа для записи звука в персональный компьютер…

Но начало было положено — появились новые программы, увеличивалось количество функций, усложнялся графический интерфейс, росло число регулируемых параметров записи… Стало возможным не только записывать, но и монтировать фонограммы, а затем и производить обработку звука. Одновременно производители компьютеров разрабатывали новые звуковые форматы, причем каждая фирма разрабатывала для своей платформы свой формат. В результате появилось множество форматов звуковых файлов, идентичных по звуковому стандарту (от 8 бит/22 кГц моно до 16 бит/44,1 кГц стерео), но различных по структуре. Свои форматы разработали Apple, IBM, Microsoft, Sun, Amiga, Atari, NeXT, Silicon Graphics… Помимо этого, свои звуковые форматы также разработали некоторые производители специализированного программного и аппаратного обеспечения, например, Adobe, Digidesign, Macromedia, SADiE, Sonic Solutions…
С появлением программ многодорожечной записи звука для каждой из этих программ также был создан собственный формат записи и хранения звуковых данных.
Разработка программ и звуковых карт все эти годы велась параллельно. Если одни производители (Digidesign, SADiE, Sonic Solutions, E-Mu и ряд других) разрабатывали программно-аппаратные комплексы, то есть собственные и программы, и карты, и периферию, то другие фирмы выпускали или только программы, или только «железо». Естественно, что для совместной работы программного и аппаратного обеспечения от разных производителей требовалось согласующее решение в виде специальной программы, называемой драйвером. Как правило, драйвер — это служебная программа (обычно в виде расширения, либо в виде связки расширения и панели управления), создаваемая разработчиком звуковой карты для корректной работы с данной операционной системой, а также с наиболее популярными программами. Установленный в систему драйвер позволяет программе самостоятельно определить тип карты, ее возможности (максимальные разрядность и частота дискретизации, наличие нескольких выходов для работы с Surround-форматами, типы цифровых входов-выходов и т. д.).
С появлением различных форматов программных подключаемых модулей (plug-in) драйверы стали создавать и разработчики программ — эти драйверы предназначены для «увязки» уже не программы и аудиокарты, а основной программы записи и подключаемых модулей разных форматов (VST, AS, RTAS, MAS, DAE, TDM, AP, DirectX и др.). Особый вид драйверов представляют собой программы для управления цифровыми потоками ввода-вывода — ASIO и др.
Что же представляют собой профессиональные программы для записи и монтажа звука? Прежде всего, их надо разделить на два типа — двухдорожечные, иногда не совсем корректно называемые «звуковыми редакторами», и многодорожечные. Первые, по существу, представляют собой аналог реального звукозаписывающего устройства — студийного магнитофона, вторые — аналог целой студии звукозаписи.

Рассмотрим сначала двухдорожечные программы. Они предназначены для следующих видов работ:
· перезапись аналоговых фонограмм в цифровой формат;
· прямая стереофоническая запись;
· монтаж;
· обработка звука (динамическая, частотная, психоакустическая, реже пространственная);
· реставрация;
· создание семплов для музыкальных инструментов;
· создание звуковых библиотек;
· мастеринг.
Интерфейс этих программ состоит из главного меню и следующих окон:
· окно, в котором в графическом (волновом) виде отображена фонограмма;
· окно с функциональными кнопками;
· окно транспорт-контроля, то есть с кнопками управления записью-воспроизведением;
· окно с индикаторами уровня;
· окна отдельных модулей обработки.
Важное место в организации монтажа занимают т. н. маркеры, то есть расставляемые по длине фонограммы временные метки. Они перешли в цифровой монтаж из монтажа на аналоговых магнитофонах, где при нажатии кнопки запоминания на пульте управления определенная временная позиция фонограммы заносилась в память, что позволяло позже отмотать ленту на нужное место без поиска. Но если количество таких меток на аналоговом магнитофоне было ограничено (чаще всего десятью), то количество маркеров при работе с компьютерной программой может быть любым.
Методы компьютерного монтажа представляют собой симбиоз аналогового монтажа и компьютерного редактирования, принципы которого взяты из… редактирования текстов. Выделение нужных фрагментов, всем известные команды «скопировать», «вставить», «заменить», «вырезать», «стереть», «перетащить» и т. п. — все эти операции мало различаются при работе с текстами, фонограммами, MIDI-информацией, графикой, видео и другими видами компьютерного контента.
Но, разумеется, при работе со звуком есть и своя специфика. Прежде всего, она связана с непрерывным характером звука, в отличие от текста или даже покадрового видеоряда. Простой перенос звукового фрагмента в другое место почти наверняка даст слышимый эффект, так называемый «артефакт». Поэтому разработчики программ ввели функцию «нулевого перехода», когда выделенный фрагмент автоматически сокращается или удлиняется до того момента, когда волна совпадет с нулем по амплитудной оси. (В разных программах эта функция называется несколько по-разному: zero-cross, snap-to- zero и т. п.).
Не следует путать функцию «нулевого перехода» с функцией cross-fade, когда для плавности соединения разных фрагментов в момент стыка в первом фрагменте делается затухание, а в последующем — плавное повышение громкости до нормального, причем второй фрагмент соединяется с первым не встык, а с нахлестом. Такой метод применялся еще в аналоговом механическом монтаже и назывался, в зависимости от варианта выполнения, «косой склейкой» либо «ласточкиным хвостом». При монтаже операция zero-cross всегда предшествует операции cross-fade.
Следует также отличать cross-fade от постепенного нарастания и затухания звука в начале и конце фонограммы соответственно. Этот эффект называется fade in и fade out и применяется в случаях, когда самые начало или конец записи имеют дефекты, а fade out также — как особый ходожественный прием «увода в тишину» при бесконечно повторяемой музыкальной фразе-рефрене.
Точное позиционирование фрагментов по времени может осуществляться на слух передвижением их маленькими шажками до нужного места — это вид подгонки временной позиции фрагмента называется «подталкиванием» (nudge или kicking, по терминологии разных производителей).
В наше время аналоговая, да и цифровая линейная запись применяется все реже, однако большинство программ сохраняет возможность совместной работы компьютера и магнитофонов. Для этого в программы введены функции подачи и приема сигналов синхронизации и управления, а также выставления времени отката (pre-roll) лентопротяжных механизмов. Сколь долго эти функции будут присутствовать в программах, сказать трудно, но пока они сохраняются, по крайней мере, в профессиональных программах, о которых и идет речь.
Двухдорожечные аудиоредакторы, как уже сказано, применяются, прежде всего, для целей монтажа сведенных фонограмм. Однако все такие программы предоставляют возможности обработки эффектами. К эффектам для обработки мастер-фонограмм относятся эквалайзеры: графические, параметрические и параграфические (последние не имеют аппаратных, то есть «железных» аналогов), причем количество полос в графическом эквалайзере может равняться нескольким сотням, а глубина регулировки достигать 20…30 дБ, что немыслимо в аппаратных эквалайзрах. Частотная коррекция в программах реализована в виде подключаемых модулей форматов VST, Premiere, TDM, DirectX и др.
Исключительно важной является для мастер-монтажа динамическая обработка. Здесь применяются программные компрессоры (в том числе многополосные), лимитеры, экспандер, гейты — все вышеупомянутых форматов. К динамической обработке можно отнести также изменение общей громкости фонограммы (Gain) и нормализацию (Normalizing, сейчас часто так и говорят — «нормалайзинг»).
Применение пространственно-временных эффектов (реверберация, хорус, задержка и др.) в готовых стереофонограммах встречается редко — этими эффектами обрабатываются обычно отдельные треки многодорожечной фонограммы. А вот различного рода шумоподавители и энхенсеры — неотъемлемый атрибут программ для редактирования звука.
Популярными функциями для стереоредакторов являются сокращение или увеличение длительности звучания фонограммы без изменения тональности (Time Stretch), и повышение или понижение тональности без изменения хронометража (Pitch Correction). Для традиционной музыкальной фонограммы эти операции не очень важны, но необходимы при подготовке аудиоряда для видео, при работе с семплами и некоторых других задачах.
Для упрощения работы рутинные операции обычно автоматизируются — например, одинаковые операции над несколькими файлами могут быть выполнены с помощью так называемого batch-конвертера, или, иначе говоря, пакетной обработки.
Большинство стереоредакторов позволяет обходиться без специальных отдельных программ для записи на компакт-диск. Можно прямо в аудиопрограмме составить порядок треков в таблице содержания (ТОС), расставить паузы, и произвести запись на CD-рекордере.
Как уже указывалось, существует около полутора десятков форматов звуковых файлов, хотя наибольшее применение находят всего четыре-пять… Профессиональные программы, в отличие от бытовых, предполагают возможность чтения и записи максимально возможного числа форматов, а также установки большого числа параметров для этих файлов: изменение разрядности и частоты дискретизации, выбор алгоритма компрессии, варьирование скорости цифрового потока при передаче по сети и т. д.
Еще один принципиально важный момент — математическая основа обработки звука. Еще 6-7 лет назад 24-разрядная внутренняя обработка, то есть длина цифрового слова в 24 бита при преобразовании программой, считалась признаком высокого класса, — а теперь и 32-битный «пересчет» не впечатляет…

Обратимся теперь к многодорожечным программам. Как уже сказано, это по существу аналог целой студии. Поэтому каждое окно программы представляет собой один из компонентов студии: микшерный пульт, мультитрек-рекордер, пульт управления рекордером (транспорт-контроль), рэковую стойку с приборами обработки, распределительно-коммутационную панель (patchbay), индикаторы уровня и пр. К ним могут быть добавлены также окна MIDI-событий (аналог аппаратного секвенсера) и окна с видеорядом, чаще всего на основе QuickTime — аналог телевизионного монитора.
Поскольку компьютер не имеет аппаратных ограничений, сложность микшера зависит только от фантазии разработчиков программы. Никто не мешает им сделать в канальной ячейке пульта шестиполосный параметрический эквалайзер, добавить к нему несколько встроенных обрезных фильтров, предложить пользователю с десяток посылов на эффекты и 6…8 субгрупп, не говоря уже о кнопках Mute, Solo и т. п. стандартных функциях.
То же можно сказать и о многодорожечном рекордере — количество треков в современных аудиосеквенсерах в смысле возможности программ превышает сотню, и ограничения накладываются только производительностью компьютера.
«Связь с внешним миром» — исключительно важная особенность каждой программы. В принципе, любой аудиосеквенсер может работать и с встроенным стереофоническим аудиоинтерфейсом компьютера, или с обычной бытовой двухканальной картой. В этом случае пользователю доступна одновременная запись одной-двух дорожек, что для распространенного способа последовательной записи достаточно. Именно так работают начинающие компьютерные музыканты, прописывая трек за треком на своем инструменте и добавляя при необходимости звуки MIDI-секвенсера, драм-машины и т. п.
Однако для серьезной профессиональной работы применяются многоканальные карты с АЦП-ЦАП, либо внешние конвертеры, соединенные параллельной шиной с картой ввода-вывода цифрового аудио. Для работы программы с этими картами служат драйверы асинхронного одновременного ввода-вывода звука, позволяющие производить запись нескольких звуковых каналов (то есть нескольких цифровых потоков) с одновременным воспроизведением ранее записанных дорожек. В инсталляционном пакете к программе всегда содержится несколько разных драйверов (или «менеджеров») для разных типов карт (Aardwark, Digidesign, Digigram, MOTU, RME и т. д.) и разных протоколов ввода-вывода.
Одни программы предлагают (в окне Preference, Hardware Settings или аналогичном) выбрать аудиоинтерфейс, по которому будет происходить прием и передача цифрового потока аудиоданных, другие сразу определяют наличие установленной карты и отключают возможность использования для записи с данной программой, например, встроенного входа-выхода. Некоторые программы при наличии соответствующего драйвера позволяют даже использовать одновременно две карты. (Напомню, речь идет не о программном обеспечении для аппаратно-программных комплексов типа Pro Tools, Creamware т. п., у которых подобная возможность предусмотрена изначально, а именно о программах, предназначенных для работы с «железом» от постороннего производителя).
Еще один вид «связи с внешним миром» — возможность с помощью программы управлять внешними процессорами эффектов, рекордерами, и обратная возможность — управлять работой программы через консоль-контроллер. Для этого в окне программы, предназначенном для регулирования параметров системы, производится подключение внешних устройств, их назначение на определенные порты, установка параметров и т. п. Программы могут управлять внешними устройствами как по MIDI, так и через последовательные интерфейсы RS-422, USB и FireWire (звуковых устройств на основе последнего интерфейса пока, правда, немного).
Рассмотрим теперь особенности виртуальных аналогов отдельных компонентов студии, входящих в состав программы для многодорожечной записи.
Микшер, как уже сказано, может быть как простым, так и соответствовать по структуре самым «навороченным» студийным консолям. Однако, в отличие от этих консолей, он в некоторых программах может быть «набран вручную» самим пользователем. Можно изменить количество инсертов, полос канального эквалайзера, других элементов управления. Если вам не нужны какие-то регуляторы, можно упростить интерфейс микшера. Правда, такую, очень полезную, возможность предоставляют далеко не все программы.
В отличие от настоящего микшера, регулятор панорамы выполняется обычно не в виде поворотника, а в виде слайдера, передвигаемого влево или вправо. Надо отметить, что в интерфейсах программ и программных модулей дизайнеры часто «по старинке» изображают регуляторы в виде вращающихся потенциометров, что довольно неудобно — как показывает практика, такие регуляторы плохо «слушаются» курсора мыши.
Выбор эффекта, включаемого в инсерт, производится путем открытия меню в соответствующем окне непосредственно на пульте. Меню открывает список имеющихся в компьютере программных модулей эффектов того или иного типа. Количество эффектов, которые можно подать на один канал, определяется как раз числом инсертов.
Количество каналов в виртуальном микшере тоже обычно определяется пользователем.
Мастер-секция также строится «по образу и подобию» аппаратной консоли. Тут различий между аппаратным и компьютерным микшером немного, за исключением того, что чаще всего мастер-фейдер бывает один, общий для левого и правого каналов.
В программах, предназначенных для микширования не только в стереоформате, но и в формате Surround, предусматривается в качестве мастер-фейдера не обычный слайдер, а джойстик. Правда, управлять им с помощью мыши также неудобно, поэтому для работы с такой программой очень полезна консоль-контроллер с настоящим джойстиком.
Рекордер в программе многодорожечной записи отличается от магнитофона-мультитрекера гораздо больше, чем виртуальный микшер от реального. Основные элементы интерфейса рекордера, представленные в окне, обычно называющемся Tracks, позаимствованы из интерфейса MIDI-секвенсеров, появившихся раньше программ записи звука. Звуковые дорожки представлены в виде волны, которую можно с помощью инструмента «лупа» увеличить или уменьшить как по горизонтали, так и по вертикали. Те элементы управления, которые подробно отображены на виртуальном микшере, могут быть в символическом виде показаны и в окне треков в виде цифровых значений. К этой информации относится положение регулятора панорамы, уровень громкости трека, статус кнопок прослушивания одного канала (Solo), заглушения канала (Mute), отключения эффекта (Bypass), режим трека (запись или воспроизведение) и др. Это сделано для того, чтобы можно было наглядно контролировать параметры каждого трека, не обращаясь к окну микшера.
Собственно процесс записи в аудиосеквенсер не очень отличается от записи на многодорожечный магнитофон: точно так же одни дорожки могут быть включены на воспроизведение и их сигнал подан в мониторы или наушники исполнителю, в то время как на другие дорожки производится запись. Разница начинается потом, когда в полной мере реализуются преимущества нелинейных записи и монтажа перед линейными. Такие операции, как переброс фрагментов (обозначаемых как «регионы») на другие дорожки, клонирование треков и раздельная их обработка разными эффектами, на ленточном магнитофоне хотя и выполнимы, но достаточно трудоемки. А перемещение записанных фрагментов по горизонтали, сокращение или увеличение их продолжительности, изменение высоты отдельных треков и их плавный ввод и вывод (фейдинг) в многодорожечной фонограмме и некоторые другие манипуляции на ленточном магнитофоне вообще невозможны.
Отображение звуковой волны при воспроизведении обычно бывает двух типов: либо курсор бежит вдоль волны, а затем картинка на дисплее полностью меняется, либо волна движется справа налево по экрану, а курсор неподвижно стоит в центре. Выбор способа изображения движения остается за пользователем.
Окно транспорт-контроля в компьютерных программах очень похоже на пульт управления магнитофоном. Но в него внесены дополнения — регулятор скорости проигрывания позволяет менять темп без изменения высоты фонограммы, тайм-код может быть отображен в разных единицах измерения: минуты/секунды/миллисекунды, часы/минуты/секунды/кадры (SMPTE-код), такты/доли/биты (MIDI-код), семплы. Правда, измерение в музыкальных единицах бывает нужно только при совместной работе аудиопрограммы с MIDI-секвенсером, а измерение в семплах, количество которых к концу, например, трехминутной композиции может достичь нескольких миллионов, бывает нужно лишь в особых случаях, но тем не менее такая возможность обычно предоставляется.
При обработке дорожек эффектами на экран вызывается окно эффектов, изображающее соответствующий прибор. С точки зрения графического дизайна многообразие интерфейсов приборов исключительно велико — от простой рамки с окошками для ввода цифр до красочной трехмерной картины, в подробностях изображающей переднюю панель реального прибора.
Необходимо, однако, отметить, что управление этим интерфейсом необязательно очень удобно, чаще — наоборот. Кроме того, отображение натуралистической графики увеличивает нагрузку на видеосистему компьютера и может служить причиной притормаживания при выводе на дисплей быстро меняющейся картины, например, прокрутки треков.
Хотя вопросы взаимодействия программы и компьютера, системных требований и особенностей работы разных программ с компьютерами тех или иных платформ выходят за рамки темы данного обзора, все же необходимо коснуться их — хотя бы кратко.
Современные компьютеры обладают очень высокой производительностью, которая все время растет. И хотя теоретики уже установили физический предел для микроэлектронных схем, основанных на существующих принципах их работы и на применяемой архитектуре, до достижения этого предела еще далеко. Однако серьезные профессиональные многодорожечные системы все равно базируются на обработке цифрового сигнала не одним центральным процессором ком-пьютера (host), а специализированными микросхемами (DSP), разработанными именно для работы с аудио.
При работе на компьютере с аудиокартами ввода-вывода без DSP, когда всю тяжесть обработки несет на себе центральный процессор, очень важно контролировать степень его загрузки. Для этой цели большинство программ имеет специальное окно «статуса центрального процессора», в котором в виде индикатора уровня отображается загрузка процессора.
Одной из главных проблем компьютерных станций остается задержка в прохождении сигнала между АЦП и ЦАП, называемая латентностью. Увеличение тактовой частоты центрального процессора компьютера практически не приводит к уменьшению этой задержки, так как она возникает в других компонентах системы. Поскольку свести латентность к нулю при существующей архитектуре компьютера невозможно, разработчики программ идут на ряд ухищрений: вводят буфер переменного размера для цифровых данных, применяют алгоритмы «предвидения» (look-ahead) при обработке цифрового потока и др. И программы записи также имеют несколько окон и меню, позволяющих выставить параметры, рекомендованные разработчиками аппаратной части (карт, интерфейсов, конвертеров) для оптимальной работы системы.
Большинство современных программ позволяют работать с разрядностью 24 бита и частотой дискретизации 96 кГц, а некоторые даже 192 кГц, поэтому реализация этих возможностей зависит от аппаратной подсистемы компьютера. Многие программы имеют возможность Surround-микширования и подключения соответствующих программных модулей.
Представляется малопродуктивной постоянная полемика между сторонниками рабочих станций на основе специализированных аудиокарт с DSP, и теми, кто считает, что время таких решений ушло в прошлое, а будущее — за системами на основе стандартных компьютеров и т. н. «нативной» обработки (то есть на базе центрального процессора), поскольку вне экономической составляющей этот спор бессмысленен. Да, в настоящее время системы на базе центрального процессора успешно справляются с задачами, с которыми 7-8 лет назад могли справиться только рабочие станции на основе DSP. Но при этом все равно существуют задачи, с которыми на должном уровне и с необходимой скоростью справятся лишь DSP-системы. Другое дело, если пользователь по роду работы не должен решать такие задачи, то и такая система ему не нужна. И, с другой стороны, пользователь (скорее всего, не отдельное лицо, а студия), занятый в производстве фонограмм высшей сложности, как правило, располагает бюджетом, позволяющим не экономить и приобрести достаточно дорогой комплекс на основе специализированных аппаратных средств.