El número anterior hablamos de la forma en la que Dolby Digital comprime los archivos de audio y qué consecuencias tiene esto cuando se emplea para formatos 5.1, como los fenómenos de enmascaramiento en frecuencia, enmascaramiento temporal y el umbral adaptativo del oído. Ahora continuaremos con más respuestas al respecto.

Es muy importante hacer notar que las consideraciones son especialmente ciertas para el espectador promedio, es decir para el oído no entrenado, que constituye el 95 por ciento de la gente que consume música. A esta altura, cabría una pregunta: ¿Por qué se hace necesario reducir la cantidad de información en los canales de audio? Simplemente porque de otra forma no cabría: en un DVD promedio, más del ochenta por ciento del espacio disponible está ocupado por el video y el resto se asigna de manera proporcional entre el audio, los subtítulos, menús y demás. Si no comprimiéramos la cantidad de información que ocupa cada canal, no habría espacio físico en el disco para alojar seis canales de audio discreto y además la velocidad de transferencia de datos requerida por el audio PCM (sumada a la del video) sería imposible de alcanzar por el limitado lector óptico del reproductor de DVD.

 

En el caso del DVD particularmente, la complejidad adicional está dada por el hecho de que hay que comprimir 5.1 canales de audio en menos espacio del que ocuparía un canal PCM mono. Este problema de la falta de espacio y de ancho de banda, afortunadamente ya resuelto en el Blu-Ray, representa un dolor de cabeza para quienes trabajamos en la producción del audio surround y vemos que nuestro producto final sufre una reducción de datos cuya relación de compresión es similar a la de un MP3.


Otras particularidades

Además existe otro problema importante: ¿cómo determinar si el espectador reproducirá el audio en forma idónea o no? Para zanjar esta incertidumbre se puso en práctica una idea muy innovadora de Dolby, consistente en crear un sistema de codificación capaz de entregar parámetros de control (metadata) junto con el audio comprimido. Estos parámetros permiten por ejemplo determinar el nivel relativo de reproducción de sonido (conocido como dialnorm o Dialog Normalization), el ajuste de la Compresión de Rango Dinámico (conocida como DRC) y la configuración del downmix estéreo, es decir cuando se traslada la mezcla a dos canales. Todas estas opciones son deseables cuando se conocen sus efectos, pero al mismo tiempo pueden ser peligrosas en manos de quien no domina el tema, provocando una decodificación incorrecta del lado del usuario final, y en última instancia una degradación en la calidad de escucha. Hay que tener en cuenta que los espectadores pueden escuchar el audio de un DVD en una gran variedad de formatos, incluyendo los siguientes:

– 5.1 canales con rango dinámico completo
– 5.1 canales con rango dinámico reducido (conocido como Late Night Listening, para quienes no desean molestar a los vecinos con el sonido de explosiones y gritos)
– Downmix estéreo compatible con Dolby Surround
– Downmix estéreo normal
– Downmix mono

 

Dolby Digital atiende estas necesidades proveyendo múltiples configuraciones de audio, que van desde un canal único (configuración mono) hasta 5.1 canales discretos, con una reducción de cantidad de información entre 10:1 y 12:1. Los cinco canales discretos principales tienen un rango de frecuencias entre 3 Hz (filtrado con un pasaaltos para evitar la superposición de un nivel indeseado de corriente continua) y 20.7 KHz, mientras que el canal discreto destinado al LFE tiene un rango entre 3 Hz y 120 Hz.

Una opción interesante que ofrece Dolby Digital es la de optimizar el nivel de los canales traseros (Ls y Rs) y Central para ajustar a la preferencia del ingeniero en el downmix. Como la mayoría de los reproductores de DVD tienen ya prefijados de fábrica los parámetros de decodificación referentes al dialnorm, al DRC y al downmixing, es extremadamente importante que el ingeniero a cargo de la codificación utilice un decodificador profesional de tiempo real para monitorear las variables a ajustar. Por supuesto los valores que el ingeniero defina para cada una de estas variables tendrán un impacto directo en el comportamiento del decodificador, o dicho de otra manera: la codificación es esencialmente llevada a cabo por el decodificador de cada reproductor de DVD en el momento de la escucha.

 
Veamos entonces cuál es el concepto del dialnorm: cuando pasamos de un tipo de contenido a otro, por ejemplo de un programa de deportes a una banda de rock y luego a una orquesta, las diferencias de presión sonora pueden hacerse muy grandes, del orden de los 20 dB. Se hace necesario entonces medir esta diferencia para poder ajustarla de alguna manera. Para estos fines, el volumen de cada programa sonoro se mide utilizando el método LAeq (Longterm Average A-weighted sound pressure), cuyos resultados aproximan con bastante precisión a la percepción del espectador frente a la pantalla y se miden en dBFS LAeq. Por ejemplo, el nivel estándar con el que los ingenieros han venido mezclando el diálogo de las películas durante años está en el orden de -25 a -31 dBFS LAeq. Así, todos los programas sonoros pueden ajustarse de forma que mantengan una relación adecuada con este volumen de diálogo, dando origen al dialnorm como parámetro de control de volumen.

Lo interesante de este parámetro es que es ejecutado por el reproductor con base en una decisión que se toma en la etapa de codificación del audio. La fórmula de la atenuación que necesitamos introducir a un determinado programa sonoro para empatarlo con el nivel del diálogo es simplemente: 31 + dialnorm, donde dialnorm es un número siempre negativo. Dado que Dolby Digital tiene también gran aplicación en la codificación de películas y otro tipo de programas sonoros, hay muchos casos en los que el valor del dialnorm se prefija en el orden de -15 a -20 (típicamente para broadcasting).

 
 

En el caso de la música, si estamos conformes con la dinámica de nuestras mezclas y no queremos introducir atenuación al momento de la decodificación, lo correcto es darle al dialnorm un valor de -31. Esta es mi recomendación para la codificación de mezclas 5.1 con buena dinámica, donde no queremos que ningún parámetro de control las modifique. Es importante tener en cuenta que otros parámetros opcionalmente activables como el DRC dependen enteramente del ajuste del dialnorm, ya que su cálculo es relativo a este valor y no absoluto. Por lo tanto, ajustar adecuadamente el valor del dialnorm para cada programa sonoro es clave en la calibración de todo el sistema de control de rango dinámico.

Otros temas interesantes relacionados son, por ejemplo, el control de graves (también conocido como Bass Management) y la calibración de niveles en los distintos canales, por lo que recomiendo a quien esté interesado que consulte las Encoding Guidelines de Dolby.