Громкость – это просто!

Мы бы хотели немного поговорить о громкости поскольку когда часто в обиходе используешь какое-то понятие, его истинный смысл начинает ускользать. Итак, громкость — субъективное ощущение, позволяющее слуховой системе располагать звуки по определенной шкале. То есть это некая условная градация, когда человек может, основываясь на своих ощущениях, дать оценку уровню громкости того или иного сигнала.

Громкость – это просто!

Но ощущения не всегда напрямую связаны с реально происходящими физическими процессами, например, можно создать звуковые сигналы очень большой интенсивности и никакого ощущения громкости не вызвать (хотя слуховая система может быть при этом повреждена) – например, если эти сигналы будут слишком короткими (менее 35 мс) или слишком низкочастотными (ниже 20 Гц). Это происходит потому, что громкость (в восприятии) зависит не только от интенсивности, но и от частоты, длительности, спектрального состава и так далее. Связано это с нелинейностью нашего слуха и особенностями конструкции слухового анализатора, который включает в себя всю цепочку – от наружного уха до слуховой коры головного мозга. Вот как, например, выглядит распределение частотных максимумов по базилярной мембране улитки (части слухового аппарата, в которой происходит преобразование колебаний в нервные импульсы):

Громкость – это просто!

При демонстрации процессов оценки громкости обычно приводят иллюстрацию с кривыми равной громкости (Fletcher-Munson Curves), поскольку они достаточно полно описывают взаимосвязь объективных параметров и субъективно воспринимаемого психофизического уровня громкости.

Громкость – это просто!

Понять смысл этих графиков проще всего, узнав, как они были получены: человек надевает наушники и слушает эталонный тон с частотой 1000 Гц и заданным уровнем, в те же наушники подается тон другой частоты. От испытуемого требуется, чтобы он субъективно уровнял громкости этих тонов (отсюда другое название этих кривых – кривые равногромких звуков, или изофоны). Показания записываются в таблицу, строится график.

Соответственно, значения максимальной чувствительности слуха находятся в тех местах, где значения графика минимальны – это диапазон от 2000 до 5000 Гц (именно там находится основная область частот человеческой речи).

Обратите внимание и на тот факт, что с увеличением уровня звукового давления кривые спрямляются: восприятие становится более линейным. Это отчасти объясняет, почему нам кажется, что громче – это лучше. На использовании данного принципа основаны и так называемые тон-компенсаторы или кнопка loud в вашей магнитоле.

И это мы еще не берем менее известные особенности слуха, такие как дифференциальные слуховые пороги, маскировку звука и прочее. Этими вещами занимаются такие области акустики как психофизика слуха и психоакустика.

Также я хочу обратить внимание на так называемый диапазон комфортного прослушивания – посмотрите на картинку:

Громкость – это просто!

Оранжевая зона составляет всего 8 дБ. Это тот зазор, в котором вам не хочется каждые полминуты хвататься за пульт для увеличения или уменьшения громкости телевизора. В то же время значительная часть необработанного звукового контента обладает существенно бОльшим динамическим диапазоном, часто превышающим 20 дБ. Ещё выше разброс среднего уровня громкости для различного звукового материала.

Проблема приведения громкости в комфортный для прослушивания диапазон заключается в том, что традиционное лимитирование или компрессирование, зачастую используемые как инструменты регулирования громкости, достаточно примитивны и не учитывают психоакустических моделей восприятия. Нормализация звукового материала по пикам также не обеспечивает устойчивое субъективное ощущение равной громкости.

На практике вещательный сигнал формируется из различных чередующихся источников звука, которые могут являться очень разными по динамическим диапазонам и среднему уровню громкости. Особенно это заметно при рекламных вставках, громкость которых часто преднамеренно максимально завышена для лучшего привлечения внимания телезрителей к содержанию рекламы. В результате получается, что после тихой сцены фильма под -24 дБ вдруг вылетает реклама с уровнем пусть -10 дБ, приведенная по пикам, и вы с трудом успеваете дотянуться до пульта.

Громкость – это просто!

Международный союз электросвязи (ITU), в основном в ответ на жалобы потребителей о скачках громкости между программой и рекламными сообщениями, сформировал исследовательскую группу для изучения измерения и контроля громкости. В одном из докладов была приведена Рекомендация 128 (та самая R128) от Европейского вещательного союза: КОНТРОЛЬ ДОЛЖЕН ОСУЩЕСТВЛЯТЬСЯ НЕ ПО ПИКОВЫМ ЗНАЧЕНИЯМ СИГНАЛОВ, А ПО ЗНАЧЕНИЯМ ГРОМКОСТИ.

Иными словами, вместо того, чтобы сосредоточиться на том, насколько максимальный пиковый уровень программного материала приближается к 0dBFS (полная шкала), измерение будет в некотором смысле «плавать», когда сам динамический диапазон материала программы указывает на смещение «центра тяжести» громкости программы.

Разработанная и стандартизованная EBU процедура оценки громкости звуковых сигналов, несмотря на невысокую алгоритмическую сложность, позволяет достаточно точно определить субъектный уровень восприятия громкости.

Другим важным элементом этой рекомендации является требование ограничения максимального уровня звукового сигнала по истинным пиковым значениям. Этот метод позволяет обеспечить сохранение максимально возможного динамического диапазона, не допуская искажений в результате переполнения в процессе цифро-аналогового преобразования в звуковоспроизводящей системе.

Кроме того, используемые в вещании алгоритмы кодирования в процессе обработки могут изменять пиковые значения звуковых сигналов, что также может привести к эффектам переполнения или ограничения, и в результате, к слышимым искажениям.

И в этом случае предварительное ограничение истинно пиковых значений позволяет обойтись минимальным защитным интервалом, не рискуя переполнением.

Методика контроля громкости, используемая ФАС (в России) на сегодняшний день, хотя и основана на измерительной процедуре EBU, устанавливает жёсткие требования в части контроля скачков громкости во время рекламных пауз.

Одной предварительной нормализации, даже по среднему уровню громкости, подготавливаемых к эфиру программ часто недостаточно, чтобы выполнить требования по удержанию громкости и избежать штрафов. Особенно это касается программ с высоким динамическим диапазоном, прерываемых рекламой. Во время очень тихих фрагментов они могут выйти за рамки допустимых значений и привести к штрафным санкциям со стороны контролирующих органов. Процессоры позволяют уменьшить избыточный динамический диапазон, не нарушая микродинамики и частотного баланса звуковой программы. А благодаря уникальному блоку транзиентного контроля, эффективно устраняются и большие перепады уровня громкости.

Только использование процессоров автоматического контроля громкости позволяет эффективно справиться и со скачками громкости и обеспечить должный ее уровень для прямого эфира, когда предварительная обработка попросту невозможна.

С учетом особенностей человеческого восприятия и нормативной базы, с одной стороны, и автоматизации процессов – с другой, компании — разработчики процессоров создают алгоритмы и целые части автоматизации процесса телерадио-производства, которые ложатся в основу их устройств.  Они позволяют поддерживать средний уровень громкости, управляя динамическим диапазоном, компенсировать пики в программе и работать с метаданными громкости.

Особенностью оборудования является возможность удаленно, по локальной сети, осуществлять мониторинг значений громкости и пиков и, при необходимости, сохранять результаты измерения для последующего анализа.

Это может использоваться как для тонкой настройки оборудования, так и в качестве системы контрольной («полицейской») записи, позволяющей при необходимости эффективно реагировать на замечания со стороны контролирующих органов.

Таким образом, отпадает необходимость в дополнительном контрольно-измерительном оборудовании.

Громкость – это просто!

Для развернутого анализа записей может использоваться программное обеспечение Loudness Analyzer Playout от компании Теком, зарегистрированное Минкомсвязи (ныне Минцифрой) РФ.

Взаимодействуя с системами автоматизации вещания, этот пакет формирует развернутый отчет для контроля значений громкости каждого вещательного фрагмента. Также может автоматически формироваться отчет по методике измерения громкости, утвержденной ФАС России.

Подводя итог, хотим отметить, что наличие процессора для контроля за громкостью – идеальное решение как для радиостанции, так и для  телеканала, поскольку позволит вам легко и непринужденно соблюдать рекомендации в области нормирования звуковых сигналов в телерадиовещании.

Михаил Ефимов
efimov@tv-prospect.ru

Добавить комментарий