Улучшить качество диктофонной записи. Увеличиваем громкость MP3-файла

Ставилась задача: Преобразовать плохую аудиозапись с диктофона в текст на бумаге.

Первая часть.
Установив аудио редактор правим фонограмму.

С помощью редактора удалось улучшить аудиозапись до разборчивого состояния.
Использовался «эффекты» - «компрессор » без галочки «компрессия по пикам »

Можно безболезненно повторять эту процедуру до четырех раз без потери качества сигнала.
Тонкие настройки рассматривать не будем. Это объёмный сложный раздел, требующий вдумчивого подхода и многих часов работы.

Можно поступить проще, усилив сигнал на 20 дб. Больше не советую, т.к. появятся искажения на ограничениях пиков. Компрессия дает лучший результат.

Порядок работы с аудио редактором:
В меню «Файл» - «импортировать» - «звуковой файл» из открывшегося окна загружается ваша аудиозапись.
Предпочтительно работать с несжатыми . WAV файлами но, к сожалению, простые диктофоны в таком формате файлы не пишут и сразу сжимают в . MP3 , что ведет к большой потере информации.
В окне аудио редактора сразу появится осциллограмма фонограммы.
Наведя мышку на интересующий участок, нажмите левую кнопку и проведите, не отпуская вправо или влево.
Выделится участок фонограммы, который вы можете прослушивать нажатием клавиши «пробел».
Подведя мышку к краю отмеченного участка, увидите указующий перст , с помощью которого можно раздвинуть участок просмотра.
Увеличивая или уменьшая масштаб записи можно визуально выделять и редактировать интересующий фрагмент.

Задействованы все привычные сочетания клавиш, как в текстовом редакторе.
Для работы с полной фонограммой имеются большие кнопки вверху. А внизу в окошечках показаны счетчики начала и конца фрагмента в секундах. Их можно править вручную.
Можно сделать копию фонограммы и мучить её в новом окне. Так даже лучше.
Можно в том же окне создать новый трек, поместив туда дубль, который предстоит улучшать.
«Дорожки»- «создать» - «монофонические дорожки»
Полезно дополнительно «дорожки» - «создать» - «дорожка пометок» , где помечается выделяемый для работы участок фонограммы,

Проигрывать варианты редактируемых дорожек, сравнивать качество звучания.
Не забыв перед этим в левой части окна дорожки нажать на «тихо» и прослушивать только «соло» интересующей дорожки.
Думаю, вам понравится эта фишка.
Дорожку можно свернуть, убрать, удалить.

Если редактирование закончено и всё устраивает, тогда сохраняем результат
«файл» - “ Export select audio” сохранить в формате.WAV
Для сохранения в.MP3 нужно прикрутить специальный плагин. Думаю, нет смысла.

Вторая часть.
Пишем аудио на бумагу.
Облом - с!
С микрофона пишет, а из файла толком не работает.
Причина: Война гигантов.
Корректное распознавание только из файлов.HTML5, да и то очень криво.

Потратил весь день и оставил эту затею.
Отрицательный результат тоже результат.
Кто-то, прочитав статью, сэкономит время.

В довершение, маленький

Несмотря на всю популярность онлайн-дистрибуции музыки, многие пользователи продолжают слушать любимые треки по старинке – загрузив их на телефон, в плеер или на жесткий диск ПК. Как правило, подавляющее большинство записей распространяются в MP3-формате, среди недостатков которого встречаются огрехи громкости: трек порой звучит слишком тихо. Исправить эту проблему можно, изменив громкость при помощи специального ПО.

Есть несколько способов изменить громкость трека в формате MP3. К первой категории относятся утилиты, написанные именно для такой цели. Ко второй – различные аудиоредакторы. Начнем с первой.

Способ 1: Mp3Gain

Достаточно простое приложение, способное не только изменять уровень громкости записи, но и позволяющее проводить минимальную обработку.

Это решение выглядело бы идеальным, если не учитывать клиппинг – вносимые в трек искажения, вызванные увеличением громкости. С этим ничего не поделать, такая особенность алгоритма обработки.

Способ 2: mp3DirectCut

Простой, бесплатный аудиоредактор mp3DirectCut обладает необходимым минимумом функций, среди которых есть опция усиления громкости песни в MP3.

mp3DirectCut уже сложнее для рядового пользователя, пусть интерфейс программы и дружелюбнее, чем у профессиональных решений.

Способ 3: Audacity

Еще один представитель класса программ для обработки звукозаписей, Audacity , также может решить задачу изменения громкости трека.

Запустите Аудасити. В меню инструментов выберите «Файл» , затем «Открыть…» .
Пользуясь интерфейсом добавления файлов, доберитесь к каталогу с аудиозаписью, которую хотите отредактировать, выберите её и нажмите «Открыть» .

После непродолжительного процесса загрузки трек появится в программе
Снова используйте верхнюю панель, теперь уже пункт «Эффекты» , в котором выберите «Усиление сигнала» .
Появится окно применения эффекта. Прежде чем приступать к изменению, поставьте галочку в пункте «Разрешить перегрузку сигнала» .

Это необходимо, поскольку пиковое значение по умолчанию равно 0 дБ, а даже в тихих треках оно выше нуля. Без включения этого пункта вы просто не сможете применить усиление.
Воспользовавшись ползунком, задайте подходящее значение, которое отображается в окошке над рычажком.

Предварительно прослушать фрагмент записи с измененной громкостью можно, нажав на кнопку «Preview» . Небольшой лайфхак – если изначально в окошке отображалось отрицательное число децибел, двигайте ползунком до тех пор, пока не увидите «0,0» . Это приведет песню к комфортному уровню громкости, а нулевое значение усиления избавит от искажений. Проведя необходимые манипуляции, нажмите «ОК» .
Следующий шаг – опять использовать «Файл» , но на этот раз выбрать «Экспорт аудио…» .
Откроется интерфейс сохранения проектов. Измените по желанию папку назначения и имя файла. Обязательно в выпадающем меню «Тип файлов» выберите «Файлы MP3» .

Внизу появятся опции формата. Как правило, в них ничего менять не нужно, разве что в пункте «Качество» стоит выбрать «Безумно высокое, 320 Кбит/с» .

Потом нажмите «Сохранить» .
Появится окно свойств метаданных. Если знаете, что с ними делать – можете подредактировать. Если нет – оставляйте все, как есть, и нажимайте «ОК» .
Когда процесс сохранения будет окончен, отредактированная запись появится в выбранной ранее папке.

Audacity – уже полноценный аудиоредактор, со всеми недостатками программ этого типа: недружелюбный в отношении новичков интерфейс, громоздкость и необходимость установки модулей-плагинов. Правда, компенсируется это небольшим занимаемым объемом и общим быстродействием.

Способ 4: Free Audio Editor

Последний на сегодня представитель ПО для обработки звука. Freemium, но с современным и понятным интерфейсом.

Довольно часто попадаются хорошие подкасты или аудиотрансляции с семинаров и конференций, однако интересная тема и интригующая манера подачи материала сводятся на нет невысоким качеством самой записи. Это может быть, как низкий уровень звука, так и сильные перепады громкости на разных отрывках. Они сильно портят впечатление и заставляют слушателя интенсивно мучать кнопки «громче-тише».

Отдельную проблему представляет фоновый шум, а также резкие вопли-кашли-чихания. Впрочем, все эти и многие другие недостатки можно устранить с помощью бесплатной программы Audacity . В данной статье я расскажу об обязательной минимальной обработке записи голоса или собственного подкаста, позволяющей сделать прослушивание комфортным.

Звуковой редактор Audacity бесплатен и имеет русский язык, он скачивается с официального сайта . Инсталляция не вызывает никаких проблем – опции при установке менять не требуется. Однако после инсталляции необходимо доустановить пару модулей, чтобы программа понимала различные аудиоформаты, а также самостоятельно могла экспортировать звук в mp3. Дело в том, что автор не стал связываться с юридической стороной вопроса легальности использования закрытых форматов и переложил эти проблемы на пользователя.

Настройка библиотек в Audacity. Сначала скачиваем, потом распаковываем, далее указываем.

Заходим в Правка-Параметры-Библиотеки . Здесь требуется установить библиотеки LAME и FFmpeg. Нажимаем на кнопку Скачать и в браузере откроется ссылка на нужную библиотеку – соответственно «LAME download page» и «Go to the external download page». После скачивания распаковываем содержимое архивов в папку с программой и указываем файл кнопкой Указать... Теперь редактор полностью готов к работе. Открываем нужную аудиозапись.

Необработанная аудиозапись в Audacity видна невооруженным глазом. Сильно выделяются пики, а общий уровень сигнала низкий.

В качественной записи общий уровень звука должен быть примерно одинаков, без резких скачков и всплесков. Зашкаливающие пики, мало того, что неприятно отдают в наушниках и колонках, так еще и будут мешать программе Audacity определить максимальный уровень сигнала. Удаляем всплески первым делом.

Удаление скачков и пиков

Заходим в Эффекты-Limiter (или Hard Limiter в зависимости от версии Audacity и плагина). На изображении показаны рекомендуемые параметры. Единственное, с чем стоить поиграться – Limit to (dB) – собственно он и указывает выше какого уровня пик будет срезаться. Конкретное значение дать затруднительно, многое зависит от характера звука, но я рекомендую от -2 до -6 dB.

Настройка плагина Limiter (Hard Limiter) в Audacity.
Главный параметр - Limit to (Db)

Сделайте несколько попыток. Контролируйте визуально, чтобы после применения фильтра срезались только скачки. Если упал уровень основной части, значит вы перестарались со значением Limit to (dB) . В настройках есть кнопка Preview , позволяющая сразу прослушать обработанный фрагмент.

После обработки фильтром Hard Limiter в Audacity. Все пики срезаны, их остатки не превышают средний уровень.

Нормализация

Заходим в Эффекты-Нормировка сигнала (Normalize). Данный плагин поднимает (или снижает) общий уровень всей записи сразу. Тихий сигнал станет громче, а громкий еще громче.

Настройка нормализации в Audacity. Минус один Децибел обычно дает хороший результат.

После применения нормализации. Обратите внимание, как вырос уровень, хотя характер сигнала почти не изменился.

Компрессор

Следующий плагин – Компрессор , – он один из самых важных. При этом виде обработки слабые и тихие звуки делаются громче, а слишком громкие – тише. То есть после проведения компрессии шепот и громкий вопль будут почти одинаковы по уровню, не придется крутить слайдер громкости. После окончания работы плагина вы визуально должны увидеть выравнивание сигнала.

Результат действия компрессора может сильно отличаться в каждом конкретном случае. Он может снизить или поднять общую громкость или же привести к появлению пиков (если не установлена галочка Компрессия по пикам в настройках плагина). Поэтому, если требуется, можно повторно применить Limiter или Нормализатор.

Посмотрите, как Компрессор изменил форму записи. Теперь и писк комара, и рев турбины имеют почти одинаковый уровень. Слушать такой аудиофайл комфортно.

Удаление шума

В этом разделе речь пойдет о негромком монотонном и непрерывном шуме, сопровождающем всю запись. Это может быть шелест вентилятора ноутбука или гул кондиционера, работающего неподалеку. Для чистки звука нам понадобится небольшой (3-10 сек) участок только с этим шумом (без голоса).

Программа проанализирует полученные характеристики, составит модель шумодава и попробует безболезненно изъять составляющие шума из общего спектра. Выделяем небольшой участок с шумом (и только с ним), далее запускаем плагин Эффекты-Подавление шума . Нажимаем Создать модель шума . Теперь можно применить фильтр на всей записи. Снимаем выделение (или выделяем весь файл целиком) и повторно запускаем плагин, но на этот раз выполняем саму чистку, нажав ОК . Дать конкретные рекомендации сложно. Сделайте несколько попыток с разными параметрами. Ползунок Подавление шума указывает насколько сильно снижать шум, а Sensivity указывает чувствительность – чем она выше, там сильнее может пострадать голос после чистки. Важно понимать, что предыдущий фильтр Компрессор поднимает слабые звуки, в том числе и шум. Поэтому запускать шумодав нужно перед компрессором.

Удаление вздохов, кашля и др

К сожалению фильтров, которые могли бы автоматически сделать удаление этих звуков нет (имеется в виду - без значительной потери качества основного сигнала), – это кропотливая ручная работа. Нужные участки выделяются курсором и либо заменяются тишиной (Создание–Создать тишину ), либо вырезаются (кнопкой Del ). В особых случаях, когда удаляемый участок звучит на фоне речи, его можно заглушить. Проблемные звуки все еще будут слышны, но они не будут привлекать внимание и портить речь.

Эквалайзер.

Даже если с уровнем сингала у вас все в порядке, голос говорящего может не понравится. Например, слишком басовитый или слишком писклявый. Иногда это результат применения некачественного или ненастроенного микрофона, и исправляется эквалайзером (Эффекты – Эквалайзер ). Не буду особенно вдаваться в настройки – это потребует отдельной статьи, скажу лишь, что на диаграмме кривыми показаны занижаемые или поднимаемые частоты.

Для простоты можете пользоваться пресетами, многие из которых полезны – Bass boost (усиление басов), Bass cut (удаление басов), Treble boost (усление высоких), Treble cut (удаление высоких), 100Hz Rumble (удаление самых низких составляющих баса – особенно хорошо подходит для живых выступлений, где микрофон дает слишком много басов при выдохе). Крутизна кривой показывает насколько сильно будет подниматься/опускаться определенная частота. По аналогии с предыдущими плагинами можно сразу прослушать результат обработки и что-то подстроить.

В данном примере срезаются частоты ниже 100 Гц

Сохранение полученного результата. Выполняется командой Экспорт аудио (пункт Экспорт выделенного аудио сохраняет только выделенный фрагмент). Далее выбираем формат – я использую MP3 и OGG. Последний хоть и имеет лучшее качество, но все же менее распространен, и может не воспроизводится старыми плеерами и бытовой техникой.

Для MP3 задается битрейт, чем он больше, тем лучше качество, но тем больше размер файла. Рекомендую использовать битрейт 192-320 kbps для стерео и в два раза меньший - для монофонической записи. Для OGG качество задается в условных единицах от 0 до 10.

В конце скажу, что статья дает лишь начальные знания по обработке звука, но даже проведя минимальную обработку и потратив всего лишь 20 минут, можно добиться существенного улучшения итогового качества звучания, приемлемого для прослушивания большой аудиторией. Через некоторое время, набрав опыта, вы будете без проблем выставлять нужные параметры плагинов на глаз.

Обычно при записи подкастов с участием одних и тех же голосов список фильтров почти не меняется. Можно воспользоваться встроенным руководством и детально изучить требуемые плагины, доведя обработку своего аудио до совершенства.

Микрофон направленного действия
«СУПЕР УХО 100»

Многие, кто пользовался диктофоном, не раз сталкивались с ситуацией, когда различные шумовые помехи настолько сильны, что записанная речь становилась неразборчивой. Запись на улице, где мимо проносятся потоки машин, в общественных места, при сильном ветре (если нет ветряной защиты на микрофоне), в движущемся транспорте, а если еще и расстояние до источника неблизкое, существенно снижают качество разборчивости речи. Как бы ни был хорош диктофон, но в подобных случаях без специализированных средств бывает, что и не обойтись. Что же обычно используют в подобных случаях. Первое, на что стоит обратить внимание -узконаправленные микрофоны или микрофоны направленного действия. Такие микрофоны имеют узкую диаграмму направленности и в полосе пропускания и некоторые модели из них могут усиливать звук до 100 Дб а то и более. Чтобы было понятно, что это означает, приведу пример -вы можете записывать негромкий разговор или пение птиц в лесу с расстояния до 100 метров. Но на это способны отдельные экземпляры, у большинства узконаправленных микрофонов характеристики поскромнее. Тем не менее, у них есть своя специфика применения -они предназначены для работы на расстоянии, т.е. вдалеке от источника звука. Это не поможет нам в случаях записи на небольшом расстоянии в сложно шумовой обстановке. В самом деле, вы же не будете держать перед собеседником длинный громоздкий диктофон в транспорте, или что делать, если источник звука движется? да и не всегда узконаправленный микрофон может оказаться под рукой в силу того, что он громоздкий и его не удобно носить с собой. Кроме того большинство узконаправленных микрофонов с хорошими характеристиками подключаются к аппаратуре через XLR разъемы, и что в этом случае делать если у большинства диктофонов микрофонный вход это разъем 1/8’’3,5 мм или так называемый mini-jack (хотя есть и такие модели, которые имеют и не один XLR разъем , ). В данном случае наиболее эффективно использовать системы шумоочистки. Это специализированные устройства, которые позволяют в режиме реального времени или в отложенном времени производить очистку сигнала от различного вида помех и шумов за счет обработки непосредственно сигнала, пропуская его через фильтры, анализируя спектральные составляющие сигнала. Сложно на словах получается да? Сразу мысли -как то все очень сложно, нет ли чего попроще. Есть и попроще и посложнее, например, -коробочка размером 10 на 11 см и толщиной примерно 5 см, подключается между источником записи и записывающим устройством (например между микрофоном и диктофоном или компьютером и диктофоном, диктофоном и программой звукозаписи на ПК и т.д.), всего пара рукояток, с помощью которых вы настраиваете оптимальное качество сигнала, и далее запись прогоняется через это устройство, которое очищает ее от шумов. Есть и посложнее например -которая содержит 7 адаптивных фильтров шумоочистки, позволяет сохранять настраиваемые параметры и использовать уже готовые настройки при похожих условиях записи, а так же прослушивание и обработку в циклическом режиме, или например -это можно сказать полноценный ПК задача которого очистка сигналов от шумов в потоковом режиме -он может подключаться к сети, имеет доступ через web-интерфейс, 9 алгоритмов шумоочистки, и сам пишет уже очищенный сигнал на карту памяти типа SD.

А есть ли софт, а то все дополнительные устройства. Есть - программное обеспечение шумоочистки звуковых сигналов Sound Cleaner может помочь в повышении разборчивости и в текстовой расшифровке низкокачественных фонограмм речи, записанных в сложных акустических условиях. Это уникальный продукт, предназначенный для шумоочистки и повышения качества звучания живого (то есть поступающего в реальном времени) или записанного звукового сигнала. И именно он может помочь в повышении разборчивости и в текстовой расшифровке низкокачественных фонограмм речи, записанных в сложных акустических условиях (в том числе архивных). Используя Sound Cleaner вы легко очистите вашу запись от типовых шумов и искажений каналов связи и звукозаписи, шумы помещений и улицы, работающих механизмов, транспортных средств и бытовой техники, голосовой «коктейль», медленная музыка, электромагнитные наводки систем питания, шумы компьютерной и другой техники, эффекты реверберации и эха. SoundCleaner имеет методы двухканальной адаптивной фильтрации, предназначенные для подавления как широкополосных нестационарных помех (таких как речь, радио или телетрансляция, шумы зала и т.д.), так и периодических (вибрации, сетевые наводки и т.п.). Существует 13 готовых схем обработки наиболее типичных зашумлений и искажений сигналов (электронаводка, шум транспорта, частотные и амплитудные искажения, помехи радиосвязи и др.), которые помогут в борьбе с различными видами известных шумов и помех. При этом каждая схема поддается корректировке, а более опытные пользователи могут разработать собственные схемы, которые потом можно сохранить в качестве типовых для повторного применения.

Как видим, арсенал средств повышения качества вашей записи достаточно велик. Выбор за вами.