Невнятная речь
Прежде всего следует определить — не вызваны ли помехи некорректным проведением записи. Некачественный микрофон или его ошибочное размещение могут привести к тому, что запись окажется приглушенной и нечеткой. К подобным дефектам может привести и использование микрофона, встроенного в видеокамеру. К счастью, подобные артефакты устраняются легко, и чтобы значительно снизить уровень таких помех следует лишь правильно выбрать настройки эквалайзера и громкости. Увеличение эквалайзером уровня на частотах до 2,5 кГц для мужского голоса и 3,5 кГц для женского придает произносимым словам дополнительные звучание и четкость. А при работе с частотами от 6 кГц и выше усиливаются не только свистяще-шипящие составляющие речи, делающие ее неразборчивой, но и фоновые шумы и свисты, поэтому увеличивать частоту нужно постепенно.
Чтобы вырезать частоты ниже 250 Гц нужно просто повысить общий уровень трека без каких-либо дополнительных манипуляций. Еще много лет назад было установлено, что большая часть аудиоинформации размещается в интервале частот 300 Гц - 3 кГц, поэтому отсечение частот ниже 250 Гц не принесет никакого вреда. Но имейте в виду, что EQ затронет все звуки на треке, поэтому не торопитесь и выполняйте все операции последовательно.
Фоновый шум
Если при изготовлении оригинального трека был установлен низкий уровень записи, то при монтаже при увеличении громкости будут возрастать и фоновые шумы. Такие шумы могут генерироваться самой камерой, возникать при перемещении оператора или порождаться приборами, установленными на съемочной площадке (например, работающими кондиционерами).
Если фоновые шумы слышны лишь в интервалах между фразами, то наилучшее решение - использование динамической обработки, которая называется noise gate (“звуковые шлюзы”). Она позволяет свободно проходить звукам, близким к определенному уровню громкости (порогу) или превышающим его. Когда же уровень громкости резко падает ниже порогового значения, то звуковой шлюз сразу же закрывает проход для звукового сигнала. После того, как уровень громкости снова превысит пороговое значение, он вновь его открывает.
Подобно звуковому шлюзу работает другая динамическая обработка, которая называется “экспандер” и предназначена для расширения динамического диапазона сигнала. В тех случаях, когда громкость падает ниже порогового значения, звуковой шлюз фиксирует ее на минимальном уровне, а экспандер — снижает до уровня, заданного пользователем. Экспандер работает более мягко и плавно и позволяет значительно ослабить фоновые шумы. Часто для повышения эффективности обработки звуковой шлюз и экспандер используют одновременно. Такое сочетание позволяет значительно снизить или даже полностью устранить низкоуровневые фоновые шумы.
Если помехи обусловлены шумами с постоянной частотой (например, жужжанием трансформаторов или шумом от кондиционера), то для их уменьшения или удаления вам придется воспользоваться специальными фильтрами. Диапазоны основных фильтров высоких и низких частот слишком широки для этой операции, их применение только ухудшит звучание материала. Постарайтесь найти специальные параметрические фильтры, которые позволяют изменять ширину полосы на частотах шумов (они известны, как фильтры Q - добротные). С помощью параметрических фильтров можно, не затрагивая весь трек, вырезать очень узкий частотный диапазон.
В некоторых программных пакетах предусмотрены специальные фильтры для устранения жужжания, они есть, например в Final Cut Pro корпорации Apple. Такие фильтры помимо точного определения частоты жужжания, позволяют устранить до пяти его гармоник. Наберитесь терпения и попробуйте использовать все возможные комбинации фильтров, нажимая Undo всякий раз, когда результат вас не устраивает.
Нелинейные искажения и щелчки
С нелинейными искажениями справиться сложнее всего. Они возникают, когда входной аудиосигнал такой сильный (громкий), что записывается с искажениями, при которых пики звуковых колебаний обрезаются. Нелинейные искажения делает звучание дребезжащим и скрежещущим, а порой и совершенно неразборчивым. Такие артефакты наиболее характерны для аналоговых приборов, но ей подвержены и цифровые устройства. Для аналоговых устройств характерно постепенное нарастание и усиление искажений, а в цифровых они проявляются на конкретном пороговом уровне, но в обоих случаях записи имеют совершенно непрезентабельное звучание.
Конечно, лучше всего не допускать появления нелинейных искажений при записи звука, так как устранить их на записанных треках позволяет очень ограниченный набор средств. Если искажений немного или поврежденные фрагменты непродолжительны, то можно попытаться убрать их с помощью специального “карандаша” Pencil Tool, который входит в некоторые программы для аудиомонтажа, и вручную подрисовать гладкие закругления на пиках графиков звуковых колебаний.
Если же искажения достаточно сильно повредили трек или продолжительны, самостоятельно переписать звуковой ряд вы не сможете, вам придется отнести эти файлы в ту студию, в которой есть программа NoNoise компании Sonic Solutions (данная программа входит в Sonic Studio HD). NoNoise — это программа для устранения нежелательных шумов на аудиозаписях, которая заслужила высокую оценку у профессионалов. Она позволяет не только эффективно устранить нелинейные искажения, но и сгенерировать заново синтезированный аудиосигнал для замещения поврежденного участка. NoNoise наилучшим образом подходит для устранения динамичных шумов, которые не удается побороть с помощью фильтров, но так как стоит эта программа достаточно дорого, треки для обработки лучше отдавать на сторону. Для этой же цели предназначены приборы для реставрации звука компании Cedar.
Щелчки и треск могут быть вызваны плохим качеством аудиокабелей или обрывом каналов в радиомикрофонах. Очень много шумов и треска присутствует в записях, сделанных на старых граммофонных пластинках. Методы борьбы с этими помехами во многом напоминают те, что используются для устранения нелинейных искажений. Многие программы для аудиомонтажа включают специальную функцию, которая находит и устраняет щелчки в автоматическом режиме. Но такое автоматическое удаление всех щелчков часто разрушает ощущение старинности граммофонных пластинок, поэтому если вы хотите его сохранить, разберитесь с каждым щелчком отдельно, либо используйте приборы компании Cedar.
Программные средства для устранения шумов
Существуют несколько более простых программ, специально разработанных для устранения различных видов фоновых шумов. В них реализованы многие из функций системы NoNoise, но стоят они значительно меньше. DART Pro компании Digital Audio Restoration Technology —программа для Microsoft Windows, в которую включены несколько фильтров, блоки ослабления щелчков и жужжания, а также преобразователи коэффициентов усиления, которые могут запускаться последовательно для обработки всего аудиотрека за один проход.
Программа Ray Gun, разработанная компанией Arboretum Software, предназначена для платформы Macintosh. В ней реализован значительно более простой подход к снижению шумов, заключающийся в использовании предварительно заданных алгоритмов для подавления шумов, удаления щелчков и треска и снижения уровня жужжания. Хотя подобный подход может оказаться более удобным для непрофессионалов, он не достаточно эффективен для решения нетипичных задач.
Важно не только знать, какие программы для работы с аудиотреками существуют, но и научиться правильно их использовать. Так, Марк Бергер, имеющий большой опыт работы со звуком, любит повторять новичкам: “Пираньи опаснее, чем акулы”, пытаясь объяснить, что небольшие, но многочисленные укусы гораздо более эффективны, чем заглатывание одного большого куска за один прием. Поэтому рекомендует он, сначала сделайте небольшую правку с использованием фильтров, а затем проведите незначительную коррекцию коэффициента усиления. При этом каждое устройство будет вносить очень незначительные, зато качественные изменения, а суммарное их воздействие позволит добиться приятного и эффектного звучания. Другой специалист - Ранди том, который уже много лет работает звукорежиссером в кинопроизводстве, считает, что плавное изменение коэффициента усиления и EQ, выполняемое вручную, почти всегда приводит к эффективному результату при устранении шумов, особенно шумов окружающей среды.
Снизить шумы на несколько децибел позволяют и цифровые алгоритмы. Но снижать уровень шумов более чем на 6—8 дБ не рекомендуется, чтобы исключить генерацию нежелательных цифровых помех при уменьшении динамического диапазона. После цифровой обработки дополнительно подавить шумы поможет плавное изменение коэффициента усиления и динамического EQ. Хотя некоторые специалисты предпочитают действовать наоборот: сначала провести часть операций, выполняемых вручную, а только затем подключить алгоритм.
Безусловно, всегда следует стремиться к тому, чтобы в записях на треках не было фоновых шумов на треках. А если перед вами стоит задача спасти записанный аудиотрек, проведите всю работу не спеша, последовательно используя все имеющиеся средства.
Частоты, которые полезно помнить
Сеть
Сеть (питание) шумит на частоте 50 Гц (и умножается). Для устранения этого надо убрать частоты 50 и 100 Гц при помощи параметрического эквалайзера, ширина полосы которого достаточно узка. Тогда это не повлияет заметно на общий звук, но устранит шумы сети. Графический эквалайзер (треть октавы) тоже применим в этой ситуации, но остальными типами эквалайзеров лучше для этого не пользоваться, так как они имеют слишком широкую (зону влияния) и регулировка может серьезно изменить звук 6ac-гитары.
БАС-ГИТАРА
Нижние частоты бас-гитары и бас-барабана лежат в области 40 Гц и менее. Чтобы придать этим звукам мощь (атаку), регулируйте частоту 80 Гц. Многие современные микрофоны, разработанные для бас-барабана, имеют небольшой пик на этой частоте, что позволяет добится хорошего, густого звука.
При обработке звука некоторых бас-гитар необходимо убрать некоторое количество нижней середины (опять же - не переусердствуйте, иначе получите тонкий нечитаемый бас). Так же, часто необходимо поднять усиление в диапазоне около 2000 герц (значительно больше, чем вам кажется, когда вы находитесь в режиме
"Соло"). Иногда хорошо бывает поднять "низ" около 40 герц для придания звуку плотной основы.
ЭЛЕКТРО-ГИТАРА
Нижняя частота электрогитары - 80 Гц. Для устранения бочковатости надо вырезать частоту 200 Гц; для устранения неприятного резкого призвука - ослабить в районе 1 кГц. В любом случае, sweep эквалайзер надо настраивать на слух. Чтобы добиться высокого резкого звука, используйте фильтр плавного нарастания и спада (hi shelving control). Можно также поэкспериментировать с bell equaliser (6 кГц - 10 кГц). Чтобы "добавить яду", сделать "жалящим" звучание рок-гитары, просмотрите область от 1.5 кГц до 4 кГц, найдите нужную частоту и убирайте ее до тех пор, пока атака не станет такой, как нужно.
Эквализация гитары
Обычно при обработке звука гитары бывает необходимо лишь украсить его "поднятием" усиления в диапазоне от 3000 до 6000 герц и слегка опустить бубнящие 300 герц.
АКУСТИЧЕСКАЯ ГИТАРА
Основная проблема с акустическими гитарами, как правило состоит в том, что они звучат бочковато (из-за неподходящих микрофонов, положения микрофона, акустических характеристик помещения - или просто из-за того, что инструмент плохой). Для исправления этого недостатка можно использовать sweep equaliser:
область "вредной" частоты обычно находится между 200 Гц и 500 Гц; ее надо вырезать. Усиление в области нижней середины скорее всего сделает звук резким, поэтому всегда лучше применять верхний фильтр плавного нарастания и спада, если требуется придать звуку гитары особую яркость.
ВОКАЛ
Вокал также занимает большую часть частотного диапазона, при этом область 2-4 кГц регулируется для улучшения артикуляции. Стремитесь по возможности избегать большого усиления, так как естественное звучание голоса может быть потеряно. Пользуйтесь верхним фильтром плавного спада и нарастания для придания голосу яркости, если нужно; bell equaliser здесь вряд ли применим.
Эквализация вокала
Все голоса отличаются чрезвычайно. Принято не эквализировать вокал при записи по той простой причине, что в будущем будет сложно найти то же самое положение регуляторов при необходимости переписать фрагмент. Это прекрасно потому, что, в любом случае, голоса не эквализируют сильно - наше ухо наиболее чувствительно к звукам, лежащим в СЧ диапазоне, а именно там и находится АЧХ голоса.
Кроме того, наше ухо очень чувствительно к естественности звучания голоса, голос должен звучать лучше любого звука в мире, поэтому, важно эквализировать вокал как можно скупее - лишь немного убрать 300 герц, и так же немного 3000 - 4000 герц. Подъем АЧХ исходного сигнала в области верхней середины обусловлен не только гармонической структурой, присущей звуку, но, может быть и следствием
применения при записи дешевого или просто плохого микрофона. Так же полезно использовать ВЧ фильтр с частотой среза 60 герц, что бы избавиться от любых низкочастотных шумов и призвуков.
УДАРНЫЕ
Эквализация большого барабана
Звукорежиссеры часто пытаются получить один из трех типов барабанного звука:
1. "Мертвый глухой стук", характерный для барабанов с одним заглушенным пластиком и тяжелым предметом (кирпич, мешок с песком, основание микрофонной стойки) на корпусе или внутри него, Резонансный звон, получаемый от барабана с двумя пластиками с небольшим отверстием в переднем, "Унылый бум" от барабана с двумя пластиками без отверстий в них, характерный для рэпа, хип-хопа и техно.
Первые два типа имеют обычно избыток "мутной нижней середины" в районе 300 Hz - вплоть до 10 дБ - и подъем на несколько дБ верхне-средней части АЧХ (5000 - 6000 Hz). Третий тип тоже имеет небольшой избыток "мути" на 300 герцах и значительный подъем АЧХ в нижней части диапазона (от 40 до 100 герц). Можно слегка придавить и "верха", уменьшив тем самым нежелательную атаку звука.
Эквализация малого барабана
Звук малого барабана обычно имеет подъем в районе около 5000 - 6000 Hz , и, иногда, небольшой подъем в области 60 - 100 герц позволяющий тонкому барабану звучать "жирнее". Иногда следует "прибрать" усиление на 300 герцах и уменьшить "шлепок" на частотах от 800 до 1000 герц для придания звуку барабана "округлости".
Эквализация хай-хэта
Прежде всего, необходимо убрать все, находящееся в нижней и средней части диапазона, что бы избавиться от "мусора", создаваемого бочкой. Если в вашем распоряжении есть фильтр ВЧ, вы можете использовать его, установив значение частоты среза в районе 300 - 700 герц, причем, это не отменяет использование
эквалайзера для подавления "мусора" от ударной установки в целом.
Иногда неплохо добавить суперверха для получения чистого и яркого тембра и уменьшить уровень СЧ в диапазоне от 1000 до 4000 герц. Не забывайте при этом то, что было сказано о полосе пропускания фильтра СЧ - если вы выберете слишком широкую полосу подавления, результатом будет "унылый" шипящий звук.
Эквализация бас-гитары
При обработке звука некоторых бас-гитар необходимо убрать некоторое количество нижней середины (опять же - не переусердствуйте, иначе получите тонкий нечитаемый бас). Так же, часто необходимо поднять усиление в диапазоне около 2000 герц (значительно больше, чем вам кажется, когда вы находитесь в режиме
"Соло"). Иногда хорошо бывает поднять "низ" около 40 герц для придания звуку плотной основы.
ОБРАБОТКА
Delay
Самый простой способ определить необходимое время задержки - это подмешать delay к звуку любого инструмента, играющего постоянный паттерн (например, малый барабан), что бы легко услышать соответствие времени задержки темпу исполняемого произведения. Как только вы найдете искомое, можете быть уверены, что все кратные ему значения вам тоже подойдут. Задержка более 100 миллисекунд привносит в произведение легкий романтический шарм и используется преимущественно в медленных песнях с румовым объемом.
Delay занимает так много места в миксе, что иногда его включают только в конце строки - именно там, где для него есть место и где он может быть слышен. Вы часто могли слышать задержку 60 - 100 миллисекунд, обычно называемую "слэпом" на фонограммах многих артистов, например, Элвиса Пресли. Этот эффект может быть весьма полезен в случаях, когда "тонкий" звук инструмента (особенно голоса) необходимо сделать полнее, или если необходимо скрыть несовершенную вокальную технику. Фактически, слэп может похоронить несовершенство интонирования практически любого инструмента. С другой стороны, слэп может сделать вокал менее персонифицированным. Если ваш вокалист обладает невероятным голосом - избегайте
задержки, дайте его голосу сиять в атмосфере лишь легкой реверберации. Delay в диапазоне от 30 до 60 миллисекунд обычно называют "удвоение", поскольку он создает эффект, будто бы партия на инструменте была исполнено дважды. "Битлз" использовали удвоение регулярно - для увеличения кажущегося количества
исполнителей и инструментов. Задержка в диапазоне от 1 до 30 миллисекунд используется для уплотнения обрабатываемого сигнала. Уши и мозг не в состоянии уловить разницу между прямым и отраженным сигналом в случае, когда время задержки менее 30 миллисекунд - в этом случае мы слышим один звук, но как бы
более плотный. Помимо реверберации, удвоение - один из самых используемых эффектов в студии - возможно, потому, что вообще не воспринимается, как эффект.
Если вы поместите исходный сигнал в один стереоканал, а задержанный менее, чем на 30 миллисекунд - во второй, получается звук, "растянутый" между динамиками.
Реверберация
Реверберация - по сути - многократная задержка. Звук после своего рождения путешествует по стенам комнаты в темпе улитки - около 770 миль в час. Он отражается от стен, пола и потолка и возвращается к нам как сотни маленьких задержек. Все эти задержанные звуки собираются вместе, что бы дать нам тот звук,
который мы называем реверберацией.
Одно основное правило при работе с ревербератором - это установить такое время реверберации, например, на малом барабане, что бы эхо затухало ДО следующего удара в большой барабан. Если соблюдать это правило, звук большого барабана останется чистым и плотным. Это означает, что чем выше темп песни, тем меньше должно быть время реверберации. Хотя, конечно, это правило вполне может нарушаться.
Компрессор-лимитер
Звуки часто в той или иной степени компрессируются - это зависит от динамического диапазона исходного звука. Например, почти все акустические инструменты компрессируются в большинстве случаев, а вокал или бас-гитара компрессируются всегда. Многие звукорежиссеры компрессируют звук большого барабана, но если барабанщик действительно хорош и прекрасно управляет громкостью каждого удара, компрессией вполне можно пренебречь.
Многие инструменты компрессируются только тогда, когда помещаются в микс. Например, крайне редко фортепиано компрессируют само по себе - обычно, это делают, помещая его в микс (особенно, "заполненный" микс). Вышесказанное справедливо и для акустической гитары. Фактически, чем заполненней микс, тем
больше звуков и отдельных нот компрессировано. Общий уровень компрессии микса более значим, чем уровень компрессии любого из компонентов микса. Однако, независимо от того, каким методом добиваются необходимой глубины компрессии, разные стили музыки требуют индивидуального подхода.
Например, поп-музыка имеет значительно больший общий уровень компрессии, чем кантри или панк. Это можно услышать, как своего рода "глянец" (который иногда вызван перемодуляцией). По показаниям индикаторов кассетной деки можно оценить уровень общей компрессии музыкального материала. Чем "ленивее" двигаются индикаторы, тем сильнее компрессирован микс. Так что выбор правильного значения
общей компрессии - за вами, слушайте музыку, сравнивайте, и выбирайте свои собственные значения компрессии в соответствии со своим вкусом.
МИКС
Когда музыканты жалуются, что смикшированная песня не звучит так, как им бы хотелось (но не знают, почему), часто причиной этого является неправильный уровень громкости какого-то инструмента, помещенного в микс. В этом случае звукорежиссер начинает заново эквализировать треки, изменять применяемые эффекты, что бы удовлетворить группу, хотя реальная причина недовольства
музыкантов вполне может быть заключена в том, что ритм-гитара звучит слишком громко по отношению к вокалу или неправильно выбран баланс между большим барабаном и бас-гитарой.
В некоторых случаях, общая громкость микса может изменяться. При этом лучше не использовать мастер-фейдера - исключая, может быть, fade-in в начале микса и fade-out в конце. Плавное появление звука в начале песни создает очень красивую и гладкую динамику произведения в целом. "Битлз" использовали этот прием в "Eight Days a Week.". Мне даже приходилось слышать песни, где общая громкость плавно уменьшается в конце, потом снова возрастает до максимума, после чего снова уменьшается и возрастает опять. Не менее круто слушается эффект, когда общая громкость изменяется в середине песни. Такое изменение общей динамики может быть очень эффективным.
Вы можете делать и более тонкие динамические нюансы, незначительно изменяя общую громкость микса или отдельных инструментов в разных местах. Например, можно поднять громкость гитары в припеве или поднять уровень малого барабана с эффектом в паузах лидирующей партии. Или в проигрыше в конце песни немного
поднимите уровень бас-гитары и большого барабана. Такие маленькие, казалось бы, изменения баланса вполне могут придать дополнительное обаяние для вашего микса.
Панорамирование
Если вы правильно используете панорамирование, вы вполне способны получить прозрачный микс с ясно слышимыми инструментами. Но если вы считаете, что какие-либо правила - не для вас, что ж, можете творить. Иногда необычное панорамирование может положительно повлиять на драматургию вашего микса.
Рассмотрим типичное размещение некоторых инструментов в панораме микса. Но помните - не мешайте самой музыке диктовать свое панорамирование.
Очень редко случается, когда большой барабан расположен где-нибудь, кроме как в самом центре панорамы, прямо между динамиками. Когда звук размещен в центре между динамиками, вы, вместо одного заставляете оба динамика работать на вас, облегчая тем самым их задачу в передаче плотных звуков - таких, как большой
барабан или бас-гитара. В случае с большим барабаном это имеет смысл и потому, что он обычно расположен посередине ударной установки.
Но в случае, когда звучит ударная установка с двумя большими барабанами (double-kick), при их панорамировании может возникнуть интересная дилемма. В зависимости от того, как часто играет второй большой барабан, оба барабана слегка панорамируют - в левый и правый канал. Некоторые звукорежиссеры первый барабан оставляют в центре, а панорамируют только второй. Глубокое панорамирование двух барабанов по каналом обычно не применяется, хотя иногда и к этому можно подойти творчески.
Малый барабан тоже чаще всего размещают в центре, хотя некоторые звукорежиссеры предпочитают смещать панораму чуть в сторону - особенно при записи джазовой музыки. Но в случае, если звучание малого барабана плотное и сильное, с большим количеством реверберации, предпочтительнее, все же оставить его в центре. Хай-хэт в большенстве случаев помещают со смещением 45 градусов в любую из сторон - это естественное его положение в ударной установке. Однако, если ваш микс заполнен или необходим дополнительный пространственный эффект, допустимо поместить хай-хэт в один из каналов полностью. В музыке хаус или хип-хоп хай-хэт часто не только полностью панорамирован в одну сторону, но и перемещается по панораме в течение песни. Известны случаи, хай-хэт помещен в один канал, а delay
от него - во второй.
Для пущего "кайфа" томы располагают полностью слева и справа, хотя иногда можно поместить их ближе друг к другу - так, как они расположены в барабанной установке. Флор том обычно помещают глубоко сбоку, однако, он вполне может оказаться в центре, по той же причине, почему в центр помещаются большой барабан и бас-гитара - они обладают мощным звуком и привлекают к себе много внимания.
При записи джазовой музыки бас может располагаться не только в центре, но и быть панорамирован в одну из сторон.
Почти всегда против правил размещение лидирующего вокала где-либо еще, кроме центра. Если вокал прописан двумя микрофонами, спет дважды или обработан каким-либо эффектом со стереозвучанием, голосовые каналы размещают слева направо - в диапазоне между 11:00 и 01:00. Панорамирование бэк-вокальных треков всегда зависит от вокальной аранжировки. Когда у вас есть только одна партия бэков, вы
не можете поместить ее в центре, так как там уже присутствует основной голос.
Глубокое панорамирование бэк-вокала в одну из сторон тоже является ошибкой, потому что делает ваш мих несбалансированным.
Солирующее фортепиано обычно записывается стереопарой и панорамируется. Низкие стринги панорамируются налево, высокие - направо - именно так они расположены на фортепианной клавиатуре. Это, вероятно, самое строгое правило панорамирования. Вам лучше застрелить пианиста до записи, чем поместить высокие звуки фортепиано в левый канал! J
Панорамирование гитар основано на тех же принципах. Часто оно продиктовано необходимостью размещения в миксе "чего нибудь еще" - для уплотнения. В этом случае можно уплотнить звук гитары, стереофонизировав его. Духовые и стринги тоже лучше стереофонизировать. Для этого можно использовать при записи несколько
микрофонов, или записать их партию дважды, на разные треки. На худой конец, можно использовать временную задержку. В случае, когда микс достаточно заполнен, эти инструменты не следует максимально разводить по панораме - вполне достаточно будет "частичного стерео" или даже моно. Эффекты, как задержка, флэнжер, хорус фэйзер, гармонайзер, ревербератор могут быть панорамированы независимо от
инструментов, от которых эти эффекты произведены.
И что же в перспективе?
Все миксы в мире созданы при помощи всего четырех инструментов - громкость, эквализация, панорамирование и эффекты. Все, что вы делаете с ними - это их подбор. Фокус в том, что бы, использовать оборудование для улучшения, подчеркивания, оттенения, создания драматургии, или просто для того, что бы не мешать музыке жить своей жизнью - независимо от стиля самой музыки. И путь создания этого балланса только один - искусство сведения. Как музыканты изучают искусство создания музыки, так и звукорежиссеры должны изучать технологию и имеющееся оборудование, что бы владеть искусством звукозаписи. Разные люди по разному представляют себе, что такое "искусство". Однако, вы сами для себя должны уяснить, что же это такое. И только тогда начинайте творить его!
Аудио компрессия для меломанов
В понимании большинства людей слово меломан чаще всего ассоциируется с человеком, не просто любящим и коллекционирующим музыку, а еще и ценящим качественную музыку, причем не только в художественно-эстетическом плане, но еще и качество записи самой фонограммы. Подумать только, еще несколько лет назад эталоном качества музыки считался аудио компакт диск, компьютер же даже в мечтах не мог конкурировать с качеством CD. Однако, время - большой шутник, и часто любит переворачивать все с ног на голову. Прошло, казалось бы, совсем немного времени, какой-то год или два и… всё, компакт диск на PC отступил на второй план. Не спрашивайте "почему?", Вы ведь сами знаете ответ на этот вопрос. Всему виною революция в мире звука на компьютере - аудио компрессия (здесь и далее под аудио компрессией подразумевается сжатие с потерями, для уменьшения размера аудио файла), которая позволила хранить музыку на жестком диске, много музыки! Более того, появилась возможность обмениваться ею через Интернет. Вышли новые звуковые карты, способные "выжать" чуть ли не студийное качество из, казалось бы, бесполезной в плане музыки "железки". Сегодня, имея даже не очень шустрый по производительности компьютер, купив звуковую карту Creative SoundBlaster Live! и вспомнив, что еще с советских времен имеется хороший усилитель и добротная акустика, Вы получите ни что иное, как музыкальный центр высокого качества, звучание которого уступает разве что очень дорогой аудио аппаратуре (средней или даже высшей Hi-Fi категории). Прибавьте к этому общедоступность музыкальных файлов, и Вы поймете, что у Вас в руках - сила. И тогда происходит переворот, и Вы понимаете, что компакт диск - это уже и не так удобно, завораживает Вас совсем другое - магические знаки "MP3". Вы не можете ни есть, ни спать - перед Вами неразрешимый на первый взгляд вопрос "курицы и яйца": чем "сжимать" и, самое главное, - как "сжимать"…
Вот в этом то я Вам и помогу. Данная статья - начало моей новой серии информационных материалов о музыке на компьютере. За год разработки OrlSoft MPeg eXtension и ведения обширной базы MP3 файлов у меня накопилось огромное количество исследований касательно аудио компрессии. Именно этими исследованиями я и постараюсь с вами поделиться. Про сжатие аудио написано немало статей разными уважаемыми авторами, поэтому я постараюсь не писать то, что Вы легко можете найти в других источниках информации. Мне хотелось бы просто и ясно изложить мою позицию по рассматриваемому вопросу. Не будем рассматривать аудио компрессию как средство максимально компактно разместить аудио информацию на своём винчестере (с целью записать столько-то там часов музыки). Да, компрессия позволяет записать музыку более компактно, но я ставлю целью минимальную потерю качества при переводе "чистого" аудио в компрессированное. Именно поэтому рассматриваются только высокие битрейты и кодеры, сжимающие качественно именно в этих режимах. Потом, с компрессированным аудио значительно удобнее работать - мгновенный доступ к любому треку любого альбома, удобный софт для воспроизведения. Ну и, разумеется, финансовый вопрос также не забыт.
Из существующих на сегодня форматов компрессии аудио заслуживающими внимания, на мой взгляд, являются три: MP3 (или MPEG-1 Audio Layer III), LQT (как представитель семейства MPEG-2 AAC / MPEG-4) и совершенно новый формат OGG (Ogg Vorbis), разрабатываемый группой энтузиастов.
Семпл Roxette, на подобных семплах кодерам приходится работать в экстремальном режиме, из-за чего становятся легко слышны любые искажения, т.к. к уже имеющимся собственным искажениям оригинала добавляются еще и искажения кодирования. Вы спросите "а зачем тогда брать в качестве теста такой семпл?". Нужно и еще как. Подавляющее большинство выпускаемых в настоящее время альбомов именно таким образом и записано. Поэтому кодер должен приемлемо относиться к перегруженному звуку.
С семплами Клайдермана ситуация диаметрально противоположная. Исходно аналоговая запись после очень качественного цифрового ремастеринга записана на компакт диске, причем без динамической компрессии.
Великолепное звучание, очень приятные и мягкие "верха". На них мы и обратим особое внимание при проведении анализа, попытаемся их сохранить. А ведь именно эти частоты кодерам будет сложнее всего передать.
Мои исследования эталонного качества для разных битрейтов и кодеров формата MP3 выражены в программе OrlSoft MPeg eXtension. Параметры кодирования подобраны по результатам тестов.
Безусловный лидер качества на высоком битрейте - кодер LAME. Кодеры от Fraunhofer IIS по-прежнему хороши только для низких битрейтов - для 128 и 160 кбит/с. Про другие я даже говорить не буду. Только НИ В КОЕМ СЛУЧАЕ не связывайтесь с кодерами, основанными на коде XING (самый известный представитель - Audio Catalyst) - эти самые плохие, звук - просто ужас.
Для большинства пользователей формата MP3 проблема качественного звука обычно ставится следующим образом: "256 или 320? а может попробовать VBR?". И этот вопрос мучает их изо дня в день. Не все записи хорошо звучат в 256 - имеют место сильно слышимые и видимые (по измерениям) потери в области верхних частот. При использовании режима VBR (так называемый поток с переменным битрейтом) часто бывает, что музыка звучит на слух лучше, чем 256, но это нельзя брать за общее правило. Кодируйте мало ценные записи, либо не очень качественные - не ошибетесь. Параметры VBR у меня подобраны для получения максимального для VBR качества.
Для коммерческого формата LQT существует только фирменный кодер от авторов - Liquifier Pro. Им и жмем. Отмечу, что формат LQT изначально основан на VBR кодировании, поэтому для него существует просто несколько режимов типа "плохо", "хорошо" и "отлично". Естественно, для наших тестов берем режим "отлично" (Audiophile), в результате чего получается поток от 192 до 256, чаще всего 200-220 кбит/с. Напомню, что формат LQT основан на семействе алгоритмов MPEG-2 AAC. Более того, это наиболее качественная на сегодня реализация AAC (проверено на аналогах).
Формат OGG родственник формата MP3, однако содержит в себе иную психоакустическую модель и некоторые отсутствующие у MP3 технические новинки. Начать хотя бы с того, что OGG изначально поддерживает только режим VBR. Пользователь задает ориентировочную скорость потока, а кодер пытается сжать максимально ближе к нему. Диапазон изменения чрезвычайно широк: от 8 до 512 кбит/с, причем он значительно более дискретный, чем у MP3. Верхняя планка составляет целых 512 кбит/с, в то время как MP3 кодеры на сегодня реально "тянут" только до 320. Вы спросите "а разве бывает что и 320 мало?". Да, бывает, но редко.
Заключение
Что ж, попытаемся сделать некоторые окончательные выводы, представив их в виде практических рекомендаций:
LAME - лучший представитель кодеров формата MP3, выдает практически максимум того, что можно получить из MP3. Для всех очень громких и "плотных" записей я бы рекомендовал использовать LAME на 320.
OGG - некоторая структурная модификация формата MP3 с новой психоакустической моделью, математическая обработка и практическая реализация которой в корне отличается от MP3. Для малоценных и низкокачественных записей пойдет OGG в режиме 192 кбит/с (либо LQT в режиме 128 Transparent, в среднем получается 160-180 кбит/с).
В отличие от MP3 и OGG, которые являются представителями кодеров формата MPEG-1, формат LQT базируется на спецификации MPEG-2 AAC. Формат AAC передает значительно лучшее качество на более низких битрейтах за счет принципиально другой обработки звука. Для записей средней ценности рекомендую LQT (на максимуме), либо на выбор (разница между ними невелика): OGG в режиме 256 кбит/с, LAME на 256. VBR режим кодера LAME лучше не использовать, он заметно хуже.
Для очень качественных записей, на которых даже при кодировании в 320 кбит/с ясно слышно отсутствие чего-либо значительного в звучании семпла, попробовать закодировать семпл кодером Ogg Vorbis на 350 кбит/с.
Если сжатый с потерями звук Вас всё-таки не устроит, придется покупать понравившиеся композиции на CD-DA диске.
Борьба с шумом
Итак, рано или поздно, перед нами встаёт вопрос о том, чтобы перевести запись с обычных audio лент, в mp3. Естественно, для этих целей скорее всего будет использоваться обычный магнитофон. Самая главная проблема при такой записи, это наличие шумов. Они бывают нескольких видов. Первые, это высокочастотные шумы, которые возникают в следствии не очень качественной записи на ленту. Вторые, наиболее ощутимые, это низкочастотные шумы, которые сочетают в себе шумы самой ленты и шумы магнитофона. С этим можно и нужно бороться.
Наиболее хорош для шумоподавления Noise Reduction в Cool Edit. Звукорежиссеры хвалят Arboretum Ionizer, якобы из-за того, что он избавлен от внесения фазовых артефактов в обработанный материал, знакомые советуют Sonic Foundry Noise Reduction. Но мои уши пока что влюблены в CoolEdit-овский шумодав. Кроме того, ни в каком другом нет столько настроек и опций, да и то, что он работает медленнее (читай добросовестнее) других - тоже говорит о многом. Существует также весьма неплохая программа реставрации DART Pro , однако детальное сравнение всех этих программных продуктов выходит за рамки данной статьи.
Итак, после многотрудной фильтрации необходимо взять 1,5-1,6 секунд шума перед каждой (для максималистов) или какой-нибудь средней фанерой (но только с той же кассеты и стороны, откуда взята фонограмма). Далее:
1. Сделать профиль этого 1,5 секундного шума (Get Profile from Selection) с параметрами:
Snapshots in profile = 1024…4096
(в зависимости от мощности компьютера).
FFT Size = 4096
(эту цифру я нашел оптимальной для подавления шума после многочисленных экспериментов); Не рекомендую ставить максимальный размер FFT, так как это повлечет в результате увеличение так называемого Hiss-шума сигнале.
2. Теперь, отфильтрованную фонограмму выделяем и уничтожаем шум тем же Noise Reduction в Cool Edit. Параметры могут быть разными (поэкспериментируйте с кнопкой Preview). Но я, после долгих опытов, могу для магнитофона порекомендовать следующие параметры:
Precision Factor = 12
(для максималистов - все 14, для Preview - 8). Параметр определяет точность вычислений;
Smoothing Amount = 0 (именно 0!).
Параметр вносит допуск на погрешность вычитания спектра шума из спектра сигнала в дБ. Чем больше - тем хуже;
Transition Wide = 6
(для очень крутых аппаратов (400$) - 3, очень дешевых - 7…9). Параметр подобен предыдущему, только более гибко управляет процессом вычитания спектра (тоже в дБ);
Noise Reduction Level = 35…42
(при Transition Wide = 6, в зависимости от уровня записи сигнала на кассете. Если запись на ленте была точно под 0 дБ, ставьте 37). Параметр определяет уровень порога удаляемого спектра шума. Наиболее капризный параметр. Обратно зависит от величины Transition Wide.
Нередко приходиться повторно нормализовать фонограммы под -0,2 дБ (это стандарт для CD- Audio), так как шумоподавление может серьезно уменьшить энергию сигнала. Все готово к MP3- кодированию! Правда, бытует мнение, что нормализация перед сжатием в MP3 - это очень вредно, и Вы на это должны идти лишь в случае ощутимого различия между уровнями отдельных каналов или просто слабого (-3…-6 дБ) уровня фонограммы в конечном итоге. Это как раз тот случай, когда решать Вам.
Флагман музыкальной индустрии АudioMulch Interactive Music Studio
AudioMulch Interactive Music Studio — это открытая программная архитектура виртуальной студии. Впервые она появилась 24 марта 1998 года. С тех пор AudioMulch, одновременно представляя рынок независимых разработчиков, создает нешуточную конкуренцию “фирменным” коммерческим приложениям. С программой я столкнулся в первый раз примерно в начале 2000 года. Именно после ее обзора я пришел к тому выводу, что надо вводить понятие виртуальных студий. И не ошибся, под эту же концепцию в скором будущем подошли Arturia Storm, Propellerheads Reason, Image-Line Fruity Loops, Native Instruments Reaktor, Native Instruments Dynamo, Sonic Syndicate Orion и многие другие.
Программы и виртуальные студии отличаются своей концепцией. Это архитектуры, включающие инструменты и устройства различных типов с возможностью коммутации последних различными способами. В виртуальных студиях необязательно наличие мультитрекового блока и поддержки аудио-файлов и даже, в некоторых случаях, секвенсора и плэй-листа.
Перейдем к AudioMulch...
|