На страницах нашего онлайн портала alivahotel.ru мы расскажем много самого интересного и познавательного, полезного и увлекательного для наших постоянных читателей.
Довольно часто попадаются хорошие подкасты или аудиотрансляции с семинаров и конференций, однако интересная тема и интригующая манера подачи материала сводятся на нет невысоким качеством самой записи. Это может быть, как низкий уровень звука, так и сильные перепады громкости на разных отрывках. Они сильно портят впечатление и заставляют слушателя интенсивно мучать кнопки «громче-тише».
Отдельную проблему представляет фоновый шум, а также резкие вопли-кашли-чихания. Впрочем, все эти и многие другие недостатки можно устранить с помощью бесплатной программы Audacity. В данной статье я расскажу об обязательной минимальной обработке записи голоса или собственного подкаста, позволяющей сделать прослушивание комфортным.
Звуковой редактор Audacity бесплатен и имеет русский язык, он скачивается с официального сайта. Инсталляция не вызывает никаких проблем – опции при установке менять не требуется. Однако после инсталляции необходимо доустановить пару модулей, чтобы программа понимала различные аудиоформаты, а также самостоятельно могла экспортировать звук в mp3. Дело в том, что автор не стал связываться с юридической стороной вопроса легальности использования закрытых форматов и переложил эти проблемы на пользователя.
Настройка библиотек в Audacity. Сначала скачиваем, потом распаковываем, далее указываем.
Заходим в Правка-Параметры-Библиотеки. Здесь требуется установить библиотеки LAME и FFmpeg. Нажимаем на кнопку Скачать и в браузере откроется ссылка на нужную библиотеку – соответственно «LAME download page» и «Go to the external download page». После скачивания распаковываем содержимое архивов в папку с программой и указываем файл кнопкой Указать. Теперь редактор полностью готов к работе. Открываем нужную аудиозапись.
Необработанная аудиозапись в Audacity видна невооруженным глазом. Сильно выделяются пики, а общий уровень сигнала низкий.
В качественной записи общий уровень звука должен быть примерно одинаков, без резких скачков и всплесков. Зашкаливающие пики, мало того, что неприятно отдают в наушниках и колонках, так еще и будут мешать программе Audacity определить максимальный уровень сигнала. Удаляем всплески первым делом.
Удаление скачков и пиков
Сделайте несколько попыток. Контролируйте визуально, чтобы после применения фильтра срезались только скачки. Если упал уровень основной части, значит вы перестарались со значением Limit to (dB). В настройках есть кнопка Preview, позволяющая сразу прослушать обработанный фрагмент.
После обработки фильтром Hard Limiter в Audacity. Все пики срезаны, их остатки не превышают средний уровень.
Нормализация
Заходим в Эффекты-Нормировка сигнала (Normalize). Данный плагин поднимает (или снижает) общий уровень всей записи сразу. Тихий сигнал станет громче, а громкий еще громче.
Настройка нормализации в Audacity. Минус один Децибел обычно дает хороший результат.
После применения нормализации. Обратите внимание, как вырос уровень, хотя характер сигнала почти не изменился.
Компрессор
Следующий плагин – Компрессор, – он один из самых важных. При этом виде обработки слабые и тихие звуки делаются громче, а слишком громкие – тише. То есть после проведения компрессии шепот и громкий вопль будут почти одинаковы по уровню, не придется крутить слайдер громкости. После окончания работы плагина вы визуально должны увидеть выравнивание сигнала.
Настройка фильтра Компрессор в Audacity
Результат действия компрессора может сильно отличаться в каждом конкретном случае. Он может снизить или поднять общую громкость или же привести к появлению пиков (если не установлена галочка Компрессия по пикам в настройках плагина). Поэтому, если требуется, можно повторно применить Limiter или Нормализатор.
Посмотрите, как Компрессор изменил форму записи. Теперь и писк комара, и рев турбины имеют почти одинаковый уровень. Слушать такой аудиофайл комфортно.
Удаление шума
В этом разделе речь пойдет о негромком монотонном и непрерывном шуме, сопровождающем всю запись. Это может быть шелест вентилятора ноутбука или гул кондиционера, работающего неподалеку. Для чистки звука нам понадобится небольшой (3-10 сек) участок только с этим шумом (без голоса).
Удаление шума в Audacity
Программа проанализирует полученные характеристики, составит модель шумодава и попробует безболезненно изъять составляющие шума из общего спектра. Выделяем небольшой участок с шумом (и только с ним), далее запускаем плагин Эффекты-Подавление шума. Нажимаем Создать модель шума. Теперь можно применить фильтр на всей записи. Снимаем выделение (или выделяем весь файл целиком) и повторно запускаем плагин, но на этот раз выполняем саму чистку, нажав ОК. Дать конкретные рекомендации сложно. Сделайте несколько попыток с разными параметрами. Ползунок Подавление шума указывает насколько сильно снижать шум, а Sensivity указывает чувствительность – чем она выше, там сильнее может пострадать голос после чистки. Важно понимать, что предыдущий фильтр Компрессор поднимает слабые звуки, в том числе и шум. Поэтому запускать шумодав нужно перед компрессором.
Удаление вздохов, кашля и др
Эквалайзер.
Даже если с уровнем сингала у вас все в порядке, голос говорящего может не понравится. Например, слишком басовитый или слишком писклявый. Иногда это результат применения некачественного или ненастроенного микрофона, и исправляется эквалайзером (Эффекты – Эквалайзер). Не буду особенно вдаваться в настройки – это потребует отдельной статьи, скажу лишь, что на диаграмме кривыми показаны занижаемые или поднимаемые частоты.
Для простоты можете пользоваться пресетами, многие из которых полезны – Bass boost (усиление басов), Bass cut (удаление басов), Treble boost (усление высоких), Treble cut (удаление высоких), 100Hz Rumble (удаление самых низких составляющих баса – особенно хорошо подходит для живых выступлений, где микрофон дает слишком много басов при выдохе). Крутизна кривой показывает насколько сильно будет подниматься/опускаться определенная частота. По аналогии с предыдущими плагинами можно сразу прослушать результат обработки и что-то подстроить.
Эквалайзер в Audacity. В данном примере срезаются частоты ниже 100 Гц
Сохранение полученного результата. Выполняется командой Экспорт аудио (пункт Экспорт выделенного аудио сохраняет только выделенный фрагмент). Далее выбираем формат – я использую MP3 и OGG. Последний хоть и имеет лучшее качество, но все же менее распространен, и может не воспроизводится старыми плеерами и бытовой техникой.
В конце скажу, что статья дает лишь начальные знания по обработке звука, но даже проведя минимальную обработку и потратив всего лишь 20 минут, можно добиться существенного улучшения итогового качества звучания, приемлемого для прослушивания большой аудиторией. Через некоторое время, набрав опыта, вы будете без проблем выставлять нужные параметры плагинов на глаз.
Обычно при записи подкастов с участием одних и тех же голосов список фильтров почти не меняется. Можно воспользоваться встроенным руководством и детально изучить требуемые плагины, доведя обработку своего аудио до совершенства.
Подписка на печатную версию Весь 2015 год (12 номеров) Первое полугодие (6 номеров) Второе полугодие (6 номеров)
Подписка на электронную версию Весь 2015 год (12 номеров) Первое полугодие (6 номеров) Второе полугодие (6 номеров)
Подшивки старых номеров журнала (печатные версии) Весь 2014 год (12 номеров) Первое полугодие (6 номеров) Второе полугодие (6 номеров)
Audacity Обрабатываем микрофонную запись
Содержание
Риторический вопрос
В процессе редактирования записи Вы можете сохранять промежуточные результаты в виде проекта. Чтобы понять его структуру, необходимо кое-что знать о внутреннем представлении данных в программе. Audacity разбивает несжатый звук на блоки величиной примерно в 1 Мб. Каждый блок хранится в отдельном файле. Как объясняет Маццони такая структура упрощает редактирование больших объемов данных: локальная правка не затрагивает весь массив, облегчается откат изменений.
Энтузиасты, предрекавшие превращение Интернета в по-настоящему свободные СМИ, не учли, что количество не всегда переходит в качество, и речь идет не только о содержании, но и о форме. О форме, а именно о форме звука, мы и поговорим. Предположим, что вам надоело выкладывать на своем сайте одни только тексты и картинки, и вы решили опубликовать аудиозапись своих размышлений, а может быть, даже сделали историческое интервью, если не с Линусом Торвальдсом, то хотя бы с Аланом Коксом. В любом случае, записанный звук по уровню качества должен хотя бы отдаленно напоминать то, что транслируют сетевые радиостанции. Ваш материал, скорее всего, будет далек от идеала, а потому потребует доработки. Вот тут-то и пригодится Audacity. У него интересная история: проект начинался как любительский, и ведущий разработчик Доминик Маццони [Dominic Mazzoni] признается, что сперва плохо представлял себе, как пишутся аудио-редакторы. Сегодня это – мощный инструмент, которым не брезгуют и профессионалы.
Audacity и многие другие программы измеряют уровень сигнала в децибелах. В качестве опорной мощности (напомним, что Бел – это десятичный логарифм отношения двух мощностей) берется максимально возможное значение уровня. Таким образом, максимальному уровню сигнала соответствует 0 дБ (lg 1), а минимальному – минус бесконечность.
Контрольный осмотр
Прежде, чем приступать к работе, необходимо кое-что настроить. Перейдите в меню Правка > Параметры Audacity. Нас интересуют разделы Audio I/O и Качество. В первом из них вы можете выбрать устройства воспроизведения и записи звука. Группа настроек Задержка позволяет установить размеры аудиобуфера и величину запаздывания при выводе программой графических данных. Правильный подбор этих опций позволит вам добиться практически полного соответствия между тем, что воспроизводится экраном и динамиками.
Раздел Качество задает параметры сигнала по умолчанию. В настройках присутствует загадочный метод изменения частоты с помощью синхронной интерполяции. Налицо трудности перевода: оригинальное Sinc Interpolation не имеет ничего общего с Synchronous, а происходит от названия фильтра, который обязан своим именем sinc-функции [sinus cardinalis] – sin(x)/x.
В группе Звуковые файлы можно выбрать режим импорта: обработка исходного файла или его копии. Второй вариант требует больше времени, но зато уменьшает вероятность повреждения оригинальной записи.
Самая полезная настройка в разделе Интерфейс – это язык. Если при чтении английской документации к Audacity у вас возникнут трудности с сопоставлением названий, вы можете переключить его; правда, программу придется перезапустить.
Будем знакомы
Рис. 1. Главное окно Audacity. В центре — тихий сигнал, записанный с микрофона.
Одной из причин популярности Audacity, вероятно, является очень наглядное представление данных и прозрачность интерфейса (рис. 1).
Центральная роль отводится амплитудному спектру во временной области. Для специальных целей можно использовать и другие представления – например, частотный спектр. Audacity поддерживает работу с несколькими аудиодорожками, хотя для наших целей хватит и одной. В верхней части окна расположены кнопки, имитирующие панель бытового проигрывателя: пауза, воспроизведение, останов, перемотка вперед и назад, запись. Ползунки ниже регулируют громкость воспроизведения и записи, а справа находится группа кнопок, управляющих более сложными операциями.
Благодаря наглядному представлению сигнала в Audacity, выполнять базовое редактирование очень просто. Как говорит сам Маццони: «Начать работать с Audacity не сложнее, чем с web-браузером». Чтобы выделить звуковой фрагмент, достаточно очертить мышью соответствующую часть аудиодорожки. Затем ее можно прослушать и, убедившись, что выбрано именно то, что надо, вырезать или скопировать, как обычный текст. С помощью «лупы» можно приближать диаграмму сигнала до тех пор, пока не станут видны значения отдельных отсчетов. «Карандаш» позволяет изменить их (разумеется, для больших отрезков запи- си это не подходит, а вот для устранения артефактов вроде резких линий-щелчков – вполне). В процессе воспроизведения звука курсор движется по диаграмме, и при точной настройке буфера и задержек его положение всегда соответствует воспроизводимому фрагменту.
Давайте обработаем в Audacity запись, сделанную с микрофона. Если у вас такой нет – создайте ее прямо в редакторе, воспользовавшись кнопкой Запись. Необходимо также, чтобы микрофон был выбран в качестве устройства записи звука по умолчанию. Это можно сделать в выпадающем списке с пиктограммой микрофона, справа. Для новой записи будет создана своя дорожка. Audacity отображает уровень входного (и выходного) сигнала на индикаторах, также расположенных в правой части окна. Вы можете записать голос в любой другой программе – на данном этапе Audacity не применяет никаких эффектов (кроме скоростной передискретизации, но я советовал бы ее отключить). Все действия производятся над готовым роликом, и это правильно, если только вы не ведете прямую трансляцию.
Рис. 2. А вот что получается в результате нормализации. Выделенный фрагмент — шум.
Зачастую сигнал с микрофона оказывается слишком тихим: или из-за неправильных настроек аудиокарты, или из-за низкого качества самого устройства (рис. 1). Для его усиления можно применить нормализацию: Эффекты > Нормализация. Audacity выполняет ее по максимальной величине пика: производится поиск самого громкого участка, а затем каждый отсчет умножается на число, подобранное так, чтобы высота максимального пика сравнялось со значением, указанным пользователем (последнее ограничено 0 дБ). В результате уровень сигнала возрастает до приемлемого (рис. 2)
Удаление шума и пауз
Это – самые распространенные операции при обработке микрофонной записи. На рис.2 шум (хаотичный сигнал с низкой амплитудой) можно видеть невооруженным глазом. Как же Audacity избавляется от него? С помощью спектральной фильтрации. Вы указываете участок, который содержит только шум и ничего более (для речевой записи это сделать нетрудно), а программа создает частотный спектр шума и затем отфильтровывает сигнал, удаляя из него составляющие, которые соответствуют построенному спектру. Все это работает очень хорошо, если придерживаться нескольких простых правил. В основу метода положено предположение, что спектр шума во всей записи практически одинаков. Системный шум, возникающий при записи с микрофона, отвечает этому критерию, но необходимо следить, чтобы участок, выбранный для построения модели шума, не содержал нерегулярностей, таких как внезапные щелчки. Второе, о чем следует помнить – спектр шума всегда, хоть немного, но пересекается со спектром полезного сигнала, то есть при очистке записи может произойти ее искажение. Удаление шума представляет собой компромисс: минимум шума при минимуме искажений.
Ознакомившись, в самых общих чертах, с теорией, перейдем к практике. Выделим фрагмент, содержащий постоянный шум (рис. 2). Нетрудно видеть, что выбранный участок не содержит аномальных пиков, которые могли бы испортить спектр шума.
Рис. 3. Окно мастера удаления шумов.
Теперь выберем пункт меню Эффекты > Удаление шума…. Откроется диалоговое окно мастера, работающего в два этапа (рис. 3). Вначале предлагается выделить фрагмент записи, содержащий только шум (мы уже это сделали) и нажать кнопку Создать модель шума. Выбранный фрагмент будет скопирован в буфер программы. После этого окно мастера закрывается.
Далее, мы должны выделить фрагмент, из которого нужно убрать шум (то есть всю запись). Снова взываем мастер и переходим ко второму этапу. Обратите внимание на три ползунка: Удаление шума, Frequency smoothing и Атака/затухание. Они показывают, насколько агрессивно будет выполняться очистка (вспомните про компромисс). Первый ползунок задает снижение уровня шума в сигнале. Мы, конечно, хотим, чтобы шум был как можно тише, а в идеале – вообще исчез. Однако, идеал недостижим. Чем агрессивнее работает фильтр, тем вероятнее он захватит и часть полезного сигнала, в результате чего звук приобретет неприятные металлические нотки. Два других ползунка управляют сглаживанием результатов фильтрации в частотной и временной областях, соответственно. Если вы не очень понимаете теоретические основы происходящего, не отчаивайтесь: значения, заданные по умолчанию, обычно позволяют получить более чем удовлетворительный результат. Желающие поиграть с настройками могут пойти методом проб и ошибок: кнопка Прослушать в окне мастера дает возможность контролировать результаты до того, как изменения будут внесены в проект (и даже после этого вы всегда сможете воспользоваться командой Отмена). Сравните обесшумленный спектр сигнала (рис.4) с рис.2.
Рис. 4. Результат удаления шумов.
Наша следующая задача – удаление пауз. Длительные паузы можно вырезать вручную, и иногда этого хватает. Для более точного результата воспользуемся специальным инструментом: Эффекты > Вырезать тишину. На экране появится окно, которое определяет, что именно следует считать тишиной. Если отвлечься от поэтической стороны вопроса, пауза обладает двумя параметрами – пороговым уровнем сигнала и продолжительностью. Но, если вы примените мастер удаления тишины с настройками по умолчанию, он, скорее всего, вообще не окажет на сигнал никакого эффекта.
Причина проста: стандартное пороговое значение слишком мало для микрофонной записи. Его следует повысить, хоть и несильно. Важную роль играет и параметр Длительность. Тишина (как и движение) – это состояние, характерное для временного интервала. Не бывает «тишины в момент времени». Отвлекаясь от философии, скажем просто: в любой записи существуют паузы, которые не следует удалять, поэтому, занизив длительность, вы получите «скороговорку» (иногда это даже интересно, но чаще – нежелательно). Как и раньше, прежде чем применить эффект, вы можете оценить его действие нажатием кнопки Прослушать.
Компрессия
Нет, мы будем говорить не о сжатии аудиоданных хитроумными алгоритмами, а о динамическом диапазоне сигнала. Внезапные перепады громкости – довольно частое явление в записях, сделанных непрофессиональными дикторами вроде меня. Еще чаще они возникают, когда в один и тот же микрофон говорят несколько человек.
Компрессор Audacity выполняет две операции. Сначала программа понижает уровень сигнала в областях, где он превышает некое пороговое значение, а затем производится нормализация всей записи. Таким образом, нам потребуется определить пороговый уровень сигнала, который обычно соответствует участку записи с самым тихим звучанием. Откройте диалоговое окно мастера компрессии (Эффекты > Компрессор, рис.5).
Рис. 5. Мастер сжатия динамического диапазона.
Вы увидите ползунок, задающий пороговое значение, и график, который будет подробно рассмотрен ниже. При настройке порогового значения мы сталкиваемся с одним неудобством – оно измеряется в децибелах, тогда как на графике временной области отсчеты отображаются в долях максимально возможного уровня сигнала. Здесь нам поможет инструмент построения частотного спектра. Выделите тихий фрагмент и выберите пункт меню Анализ > Построить график спектра. В качестве порогового значения можно указать уровень максимального пика в частотном спектре.
Снова откройте окно компрессора. Ниже ползунка, устанавливающего пороговое значение, расположен еще один, определяющий коэффициент понижения уровня сигнала. Теперь взгляните на график, расположенный в верхней части окна. В отличие, например, от нормализации, компрессия нелинейна (понижающий коэффициент применяется только к тем областям, где сигнал превышает пороговое значение). График позволяет нам наглядно оценить нарушение линейности сигнала по сравнению с оригиналом. По вертикальной оси отсчитывается исходный уровень сигнала, по горизонтали – уровень после применения компрессии. Для сигнала, уровень которого не превышает порогового значения, тангенс угла наклона прямой равен единице, на других участках он меньше (мы ведь понижаем громкость) и определяется заданным нами коэффициентом. Чем круче излом линии при переходе через пороговое значение, тем выше нелинейность компрессии. Как обычно, кнопка Прослушать позволит вам ознакомиться с предварительными результатами преобразования.
Я не случайно несколько раз подчеркивал то факт, что компрессия нелинейна. Это означает, что в цепочке операций по обработке записи ее нельзя произвольно менять местами с другими действиями. Возьмем, например, уже знакомую нам операцию удаления шума. Как мы знаем, она эффективна в том случае, когда шум имеет постоянный спектр. Нелинейные операции же делают спектр шума переменным. Там, где уровень сигнала превышал пороговое значение, амплитуда шума уменьшается. Это может показаться странным, ведь сам шум вряд ли превышает пороговое значение. Дело в том, что наши алгоритмы всегда затрагивают не только целевой сигнал, но и его «окрестности», как в частотной, так и во временной области. Применяемые в процессе компрессии эффекты сглаживания спектра тоже добавляют искажения. Чтобы не быть голословным, приведу две частотных спектрограммы шума – до компрессии и после нее (рис. 6). На участках записи, не подвергавшихся обработке, шум, естественно, не изменился. Из всего сказанного следует простое правило: сначала удаляем постоянный шум, затем выполняем сжатие динамического диапазона.
Рис. 6. Спектр шума до сжатия диапазона и после него.
Помимо компрессора, в Audacity есть еще один инструмент, который может быть использован для сжатия динамического диапазона. В английской версии программы он называется leveller (именно так, с двумя l), а в русской – Выравниватель. Основная идея выравнивателя, как я ее понимаю, заключается в том, чтобы упростить процесс динамического сжатия. Вместо настроек пороговых значений в дБ, вам предлагается задать интенсивность выравнивания. Помимо сжатия, leveller удаляет и шум, но, на мой взгляд, делает это менее эффективно, чем описанные выше средства.
Долой щелчки и треск!
Для этих целей в Audacity тоже есть автоматизированный инструмент (Эффекты > Удаление щелчков и треска). Идея довольно проста. Под щелчками и треском понимаются области высокой амплитуды сигнала, имеющие не очень большую ширину (оба параметра задаются пользователем). Однако, на практике метод работает не слишком уверенно. Специально сгенерированные щелчки максимальной амплитуды фильтр заметил только при настройке на максимальную чувствительность.
Но даже при этом щелчки были не убраны, а только сглажены (их амплитуда снизилась до средней по сигналу, а не до амплитуды вокруг щелков, соответствующей полной тишине). Общий вывод таков – если щелчки заметны на диаграмме сигнала, лучше попытаться сгладить их с помощью карандаша.
После того, как обработка записи будет закончена, можно нанести последний штрих – воспользоваться эффектом Усиление басовых частот. Он не только делает мужской голос более сексапильным, но и позволяет скрыть некоторые артефакты, возникающие в процессе обработки голосовой записи.
Рассмотренные на данном уроке функции, конечно, не исчерпывают всех возможностей Audacity, но (я надеюсь) демонстрируют, что это приложение пригодится в хозяйстве любого пользователя, а не только начинающего звукорежиссера. LXF