Нормализация звуковых файлов. Нормирование громкости и максимально допустимый уровень аудиосигнала Программа нормализации уровня звука в аудиофайлах

13.04.2020

Нормализация звука в Sound Forge Pro 10

Поднять уровень звукового сигнала без риска потерять качество, позволяет функция «Normalize» . Алгоритм её работы заключается в следующем: программа вычитает уровень самого высокого сигнала из уровня максимально возможного сигнала, поднимая общий уровень громкости файла на получившуюся разность. Чтобы воспользоваться функцией «Normalize» откроем одноименное диалоговое окно, находящееся в пункте меню «Process». Основным параметром является «Normalize to» , указывающий максимально возможный уровень сигнала, который будет учитываться при нормализации звука в Sound Forge .

Существует возможность нормализировать сигналы нескольких файлов, что бывает полезно при записи компакт диска. Для этого, нажав кнопку «Scan levels» , просканируем аудио файл, на громкость которого будут ровняться остальные. Затем откроем следующий аудио файл и в диалоговом окне «Normalize» поставим флажок около переключателя «Use current scan level (do not scan selection)» . Нажимаем кнопку «OK» в диалоговом окне «Normalize to» . Программа произведет нормализацию громкости в аудио файле.

Функция «Normalize» также может выполнять более сложную обработку, вычисляя среднюю «воспринимаемую громкость» . Иногда возникает ситуация когда какой-либо звук в аудио файле, находясь на одном уровне громкости с остальными, звучит громче. Причина этому – свойства человеческого слуха. Sound Forge имеет возможность измерить данные файла с точки зрения человеческого восприятия. Для этого в диалоговом окне «Normalize to» нужно активировать переключатель . При этом будут доступны еще несколько параметров: «Ignore below» - значение этого параметра определяет порог допустимого уровня звука. Все значения ниже указанного порога, при сканировании «средней воспринимаемой громкости», будут проигнорированы. В большинстве случаев значение данного параметра приблизительно «-45 Db».

Параметр «Attack time» указывает программе, насколько быстро следует открывать цифровой шлюз сигнала, чтобы учесть допустимые уровни звука при сканировании данных. Поэтому если в аудио файле содержаться часто сменяющие друг друга звуки, например барабанные палочки, следует установить данное значение как можно ниже, в противном случае частые звуки учитываться не будут. В большинстве случаев значение равное 200 миллисекундам вполне справляется с постановленной задачей.

Параметр «Release time» указывает программе, насколько быстро следует закрывать цифровой шлюз. Если при сканировании данных нужно чтобы было учтено как можно больше материала, следует установить более высокое значение этого параметра.

Вследствие некоторой ограниченности человеческого слуха, очень высокие и очень низкие частоты услышать труднее, чем средние. Это положение можно исправить, установив флажок «Use equal loudness contour». Данная функция усиливает неслышимые спектры в частотах, поэтому в большинстве случаев её целесообразно установить.

После установки всех характеристик нажимаем кнопку «Scan levels» , чтобы запустить процесс сканирования «воспринимаемой громкости» .

При работе с функцией «Average RMS level (loudness)» , следует быть осторожными, настраивая параметр «Normalize to», так как выбор очень высокого значения может привести к деформации звука или отсечению данных. Если не превышать значение «-6 Db», искажения исключаются.

Для лучшей защиты от отсечения данных можно выбрать пункт «Apply dynamic compression» , находящийся в закладке «if clipping occurs» .

Нажимаем кнопку «OK». Программа нормализует громкость аудиоданных, учитывая значения текущих параметров.

(0)

Знакомство с программой Sound Forge Pro 10
	1.	Интерфейс	3:13	4	25906
	2.	Навигация в Sound Forge Pro 10	2:00	0	8937
	3.	Маркеры	1:50	0	6369
	4.	Области	4:23	0	5093
	5.	Поиск	4:01	0	4476
Основы редактирования в Sound Forge Pro 10
	6.	Инструмент «Magnify»	1:21	0	7006
	7.	Выделение	1:41	0	4729
	8.	Функции копирования и вставки. Часть 1.	3:20	0	7352
	9.	Функции копирования и вставки. Часть 2.	3:20	2	44121
	10.	Отмена действий	2:45	0	2863
	11.	Инструмент «Карандаш»	3:16	0	5686
Функции обработки
	12.	Смещение по оси амплитуды	2:16	0	5631
	13.	Изменение разрядности	2:17	0	4908
	14.	Изменение частоты сэмплирования	9:33	0	5605
	15.	Удаление фрагментов тишины	4:41	0	4850
	16.	Вставка тишины	1:05	0	3643
	17.	Изменение громкости звука. Часть 1.	1:09	0	8053
	18.	Изменение громкости звука. Часть 2.	1:09	0	9455
	19.	Нормализация звука	2:37	0	27550
	20.	Изменение каналов	4:31	0	4636
	21.	Панорамирование	3:26	0	3538
	22.	Эквализация, часть 1.	2:12	0	5807
	23.	Эквализация, часть 2.	2:12	0	5087
	24.	Эквализация, часть 3.	2:12	3	3056
	25.	Воспроизведение в обратном направлении	3:20	0	4656
	26.	Изменение скорости	1:57	0	18614
Эффекты в программе Sound Forge Pro 10
	27.	Эффекты эха	2:21	0	5897
	28.	Multi-Tap Delay	3:51	0	3021
	29.	Хорус (Chorus)	2:09	0	3275
	30.	Флэнжер (Flange)	2:25	0	2491
	31.	Pitch bend	2:42	0	3149
	32.	Pitch Shift	3:08	0	12197
	33.	Vibrato	2:47	0	2171

Нормализация аудиосигналов по пикам приводила к значительным различиям в громкости между каналами вещания;

Показания стандартизованного в европейских странах документом EBU Tech Doc 3205-E и обычно использующегося измерителя квазипиковых значений уровня QPPM не отражает громкость сигнала, т.к. это прибор изначально не предназначался для регистрации среднего значения сигнала;

При быстром росте цифрового производства фонограмм и цифровой дистрибуции аудиоконтента нормирование разрешённого максимального уровня аудиосигнала, определённое документом ITU-R BS. 645, не соответствует современным требованиям и изжило себя;

Документом ITU-R BS. 1770 определён международный стандарт измерения громкости аудиопрограмм, вводящий новый параметр аудиосигнала – единицу громкости.

В соответствии с вышеизложенным, Европейский вещательный союз рекомендует при измерениях аудиосигнала пользоваться новой единицей уровня LU (Loudness Unit) и LUFS (единицей громкости относительно полной шкалы). (Наименование “LUFS”, соответствует международной конвенции по терминологии и эквивалентно наименованию LKFS, которое используется ITU-R BS.1770-2).
Рекомендуется для полной характеристики передачи производить измерения по трём основным параметрам:

- Громкости программы (Program Loudness);
- Диапазону громкости (Loudness Range);
- Максимальному мгновенному уровню (Maximum True Peak Level).

Основные правила измерений этих параметров сводятся к следующим пунктам:

За номинальное значение громкости программы документом EBU R 128 рекомендуется принимать уровень равный -23 LUFS, а в случаях, когда точное поддержание номинального уровня недостижимо (например, при живой трансляции), допустимое отклонение от номинального уровня не должно превышать ± 1,0 LU.

Аудиосигнал передачи должен быть, как правило, измерен как единое целое без выделения отдельных специфических фрагментов, таких, как речь, музыка или звуковые эффекты.

Максимально допустимый мгновенный уровень передачи должен быть равен -1 dBTP (децибелы истинного пика).

Все измерения должны производиться измерителями, специфицированными соответствующими документами: ITU-R BS.1770, EBU Tech Doc 3341 и EBU Tech Doc 3342.

*EBU - European Broadcasting Union (Европейский вещательный союз)

Для справки, членами EBU (EBC) в России являются только "Первый канал", "ВГТРК", "Радио Маяк", "Орфей", "Голос России". Какими стандартами пользуются остальные вещательные компании остается только гадать.

Во вложении архив с документами EBU на русском языке, а именно:

EBU Tech 3341 ;
EBU Tech 3342 ;
EBU Tech 3343 ;
EBU Tech 3344 ;
Эссе_625в2 - эссе Анатолия Соколина: "Революция, которая потрясла мир аудио";
R68_2000_EBU - техническая рекомендация EBU R68-2000. Установочный уровень в оборудовании производства цифрового аудио и цифровых аудиорекордерах;
EBU R1771 - требования к приборам, измеряющим громкость и истинный пиковый уровень;
EBU R1770-1 - рекомендация МСЭ-R BS.1770-1. Алгоритмы измерения громкости звуковых программ и истинного пикового уровня звукового сигнала;

Здесь всегда можно получить актуальные оригиналы документов.

32044

Л юбителям музыки, полагаем, не раз приходилось сталкиваться с ситуацией, когда одни композиции одной подборки звучат слишком громко, а другие, напротив, слишком тихо. Такое бывает, когда пользователи скачивают музыку из разных источников, а ещё композиции с разной громкостью звучания часто встречаются в миксах, где собраны песни разных исполнителей. Ну, это понятно, только как вот в таких случаях поступать, не регулировать же громкость каждый раз, как только песня зазвучит громче или тише?

Нет, конечно, потому что громкость можно выровнять, причём очень просто. Для этого вам понадобится маленькая бесплатная утилита . Эта программка позволяет обрабатывать аудиофайлы популярных форматов в пакетном режиме в соответствии с заданным параметром громкости.

Итак, идем на страничку разработчика и скачиваем последнюю полную(!) версию . По умолчанию программа устанавливается на английском языке и, если вас это не смущает, устанавливайте её в обычном режиме, чтобы сразу получить интерфейс на русском языке, на втором шаге инсталляции необходимо установить галочку «Russian» в меню «Language files» .

В меню жмём кнопку «Добавить файлы» и загружаем в окно утилиты аудиофайлы , над громкостью которых нужно поработать. Далее нажимаем «Анализ трек» и ждём пока программа не завершит анализ файлов с целью выявления их громкости. Процедура эта может занять несколько минут, всё зависит от общего размера анализируемых файлов. На обработку сборки объёмом 1 Гб уходит примерно 10 минут.

После нужно установить желаемую громкость (по умолчанию это 89 Db) и нажать кнопку «Тип трек» . В результате обработки громкость всех аудиофайлов будет приведена к единому указанному значению. Изменение уровня громкости занимает меньше времени, чем анализ. Также стоит обратить внимание, что все файлы в процессе обработки и сохранения будут перезаписаны.

И напоследок пару слов о том, что означают параметры напротив каждого файла.

Уровень - текущая громкость.
Клиппинг - установленная напротив птичка Y указывает, что при текущей громкости на фоне трека имеются шумы (будете ли вы их слышать или нет, зависит от остроты вашего слуха).
Трек - показывает разницу в децибелах между текущим и установленным пользователем параметром громкости.
Наличие отметки в колонке «Клип (Т)» указывает, что фоновые шумы останутся и после обработки.

Чтобы этих шумов было как можно меньше, не рекомендуется выставлять громкость слишком высокую или слишком низкую. Оптимальным значением для параметра «Норма громкости» является примерно 85-95 децибел .

Так и со звуковыми файлами, только они не слышат, а хранят. Одни файлы хранят звук с уровнем громкости соответствующим норме . Другие же хранят звук с уровнем громкости, отклоняющимся от нормы . Однако уровень громкости исходного звукового сигнала от этого не меняется. Всё определяется только уровнем записи звукового сигнала. А уровень записи в целях не допущения искажений устанавливают таким образом, чтобы звуковой сигнал, подаваемый на вход аналого-цифрового преобразователя (АЦП) был немного ниже своего максимально возможного уровня при максимальных значениях (пиках) громкости. Иначе искажений не избежать и звук приобретает неестественный искажённый характер.. К тому же уровень записи может быть ниже ещё и по самым разным техническим причинам .

Для человека норма чувствительности слуха определяется диапазоном или двумя позициями соответствующими нижнему и верхнему уровню звука - это так называемый динамический диапазон или область слышимости. Одна позиция соответствует самому слабому уровню громкости звука (порогу чувствительности) ещё различимому человеком. Другая позиция соответствует самому сильному уровню громкости звука (болевому порогу) ещё воспринимаемому человеком.

Для звуковых файлов также существует норма, но это норма уровня записи громкости . Определяется она диапазоном или двумя позициями соответствующими нижнему и верхнему уровню записи громкости звука и это также так называемый динамический диапазон . Поскольку компьютер понимает и обрабатывает звук в цифровом виде то и хранит он его в файлах также в цифровом виде. И поэтому диапазон определяют два числа соответствующие верхней и нижней границе динамического диапазона . В зависимости от качества хранимого звука диапазон будет иметь разную ширину.

Говоря в дальнейшем о звуковых файлах мы будем иметь ввиду файлы с расширением .WAV , то есть wav-файлы . Поскольку это именно те файлы, которые используют для записи аудио компакт-дисков .

На аудио компакт-дисках звуковые файлы хранятся с расширением .RAW . При записи на жёсткий диск они при помощи специальной программы риппера или грабера преобразуются в wav-файлы . При записи на аудио компакт-диск звуковые файлы с расширением .WAV преобразуются в файлы с расширением .RAW .

Довольно часто уровень записи громкости звука на аудио компакт-дисках для разных музыкальных композиций оказывается неравным или ниже нормы , что создает неприятное ощущение при переходе от одной музыкальной композиции к другой. Также часто, оказывается неравными и значения по уровню записи громкости звука у двух стереоканалов одной музыкальной композиции. Для устранения этих недостатков необходимо выполнить нормализацию . Которую и придумали для этого.

Если не выполнить нормализацию , то низкий уровень громкости записи звука музыкальной композиции при воспроизведении аудио компакт-диска потребует компенсации в виде большего усиления со стороны звуковоспроизводящей аппаратуры. Что довольно неудобно и ведёт к возникновению совсем не обязательных искажений со стороны звуковоспроизводящей аппаратуры. Которые можно было бы избежать, воспользовавшись неискажающей обработкой звука в виде нормализации.

В качестве возможного инструмента для выполнения нормализации wav-файлов хотелось бы порекомендовать Вам условно-бесплатную (shareware) программу . Эта программа позволяет обрабатывать wav-файлы с обычным 8 и 16-битным цифровым форматом и одним или двумя стереоканалами. Открывая и обрабатывая звуковые wav-файлы программа Sound Normalizer 2.2 создаёт копию оригинального звукового файла, с которым она и работает. Позволяя тем самым в критических ситуациях избежать необратимого изменения оригинального файла. Также одним из достоинств программы является возможность независимой регулировки уровня нормализации звука по каждому каналу. В отличие от других подобных программ Sound Normalizer 2.2 обладает простым и понятным интерфейсом .

Нормализация осуществляется по пиковым или максимальным уровням звука. А это означает, что каждое значение уровня звука подвергнется пропорциональному изменению и тем самым сохранится естественное звучание всей музыкальной композиции.

Однако бывает и так что звук для двух стереоканалов после нормализации по максимальному уровню будет восприниматься как имеющий различные уровни громкости . Это объясняется тем, что восприятие громкости имеет ещё динамическую и частотную составляющие, которые могут настолько сильно отличатся в двух каналах, что вызывают сильный перекос среднего значения уровня громкости для каждого канала. В этом случае можно порекомендовать выполнить методом проб и ошибок ручную регулировку уровня нормализации для каждого канала.

Компьютерная программа позволяет выравнивать громкость музыкальных MP3-файлов. Первая версия данной утилиты существует ещё с 2002 года. Программа хороша тем, что совершенно не требует перекодирования файлов — это позволяет сохранить изначальное качество звучания. MP3Gain выравнивает уровень громкости как отдельно взятого файла, так и целой группы файлов (пакетное преобразование).
Не будем сильно погружаться во все тонкости настроек и возможностей программы — просто научимся как просто без лишних заморочек нормализовать уровень громкости в mp3-файлах.
Находим и .

Все достоинства программы
Программа полностью бесплатна.
Инсталлируется на любую версию ОС Windows.
Можно использовать и работать в режиме командной строки и графической оболочки для Windows.
Возможность пакетного анализа и обработки файлов.
Нормализация происходит без перекодировки файлов.
Можно преобразовывать один и тот же mp3-файл множество раз без риска его испортить.
Существует режим применения нормализации только к выделенным в рабочем окне трекам.
Программа полностью сохраняет ID3 теги и даты создания файлов.
Многоязычный интерфейс, в том числе присутствует русская локализация.
Локализованное справочное руководство на официальном сайте.

Установка MP3Gain
Забираем программу с SourceForge в виде инсталлятора. Установка предельно проста, единственный важный момент — необходимо включить чекбокс «Language Files», при этом будут установлены все языковые локализации программы, в том числе и русский. Если выбрать «Custom» установку, то можно самостоятельно выбрать директорию парковки программы.

Настройка MP3Gain
После установки программы запускаем её и первым делом выбираем русскую локализацию MP3Gain. Далее открываем подопытные mp3-файлы. В настройках программы ищем очень важный пункт «Изменение уровня без клиппинга» и на нём ставим галку. Для краткости, «клиппинг» — это превышение уровня сигнала, при этом происходит обрезание уровня и перекодирование mp3-файлов, но нам это не нужно. И ещё следует разобрать вопрос по настройке уровня громкости. По умолчанию «Норма» громкости установлена 89 децибел (лучше эту цифру не менять). По мнению специалистов 89,0 dB дают наиболее качественные результаты в плане нормализации и устранения клиппинга. Остальные пункты настроек предельно понятны и выставляются по личным предпочтениям или просто сделать всё как показано на картинке. Таких настроек вполне достаточно для простой нормализации уровня громкости в mp3-файлах.

Совет! На всякий случай надо сделать копии аудио файлов. В MP3Gain нет функции сохранения обработанных файлов под другим именем, программа переписывает исходные.

Использование MP3Gain
Чтобы понять, что делать с двумя рабочими кнопками «Анализ» и «Тип» надо вкратце разобраться с их доступными режимами.
Рассмотрим режимы «Трек», «Альбом» и «Константа».
Трек - программа рассчитывает уровень громкости, индивидуально для каждого трека. Затем корректирует громкость каждого трека в соответствии с требуемым уровнем. Например, имеется три песни с уровнем громкости 87, 95 и 91 dB. При применении «Тип Трек» для приведения их к требуемому уровню 89 dB, на выходе у всех этих песен будет уровень около 89 dB.
Альбом - общая громкость альбома будет отрегулирована в соответствии с требуемым уровнем, но разница в громкости между треками в альбоме будет сохранена. Например, имеется три песни с уровнем громкости 87, 91 и 89 dB, общая громкость этого альбома будет около 89 dB. При применении «Тип Альбом» для приведения их к требуемому уровню 92 dB, программа увеличит громкость каждой из этих песен на 3 dB.
Константа - этот режим похож на режим Альбом. При нём громкость всех треков просто увеличивается или уменьшается на заданное количество децибел без какой-либо нормализации относительно друг друга.

Итак, проведём эксперимент над открытыми ранее mp3-файлами на режиме «Трек». Первым делом запускаем анализ файлов кнопкой «Анализ Трек». Смотрим результат анализа исходных файлов. На картинке ниже видно, что в файлах «3.mp3» и «5.mp3» есть превышение уровня громкости, иначе говоря присутствует «клиппинг», в этих колонках появилась буква «Y» и все строки стали красными. Напротив, в файле «6.mp3» видно что он имеет пониженный уровень громкости.
И вот далее, по итогу проведённого анализа, вторым действием исправляем (нормализуем) эту разницу уровней нажатием на кнопку «Тип Трек». После благополучной нормализации, занявшей некоторое время (всё зависит от мощности компьютера), смотрим получившийся результат. На последней картинке видно, что уровень всех обработанных mp3-файлов очень близок к заданному значению в 89 dB. Т.е. треки «3.mp3» и «5.mp3» понизили свой уровень громкости, а трек «6.mp3» наоборот увеличил. Что и требовалось сделать!