Aguas calmas

Abordamos hoy un tema crítico; por un lado, la tecnología nos acompaña potencialmente para poder trabajar grabaciones súper realistas; sin embargo, cada día que pasa, parece que las cosas suenan peor. ¿Dónde están esas sorpresas de Queen, los fortísimos de la Séptima Sinfonía de Beethoven y los bajos “matadores” de los timbales de “Así habló Zaratustra”? En esta primera entrega acerca del rango dinámico nos centraremos en conceptos navegando tranquilamente en los fundamentos.

Una pequeña introducción

Esta breve oración que estoy escribiendo ahora, carece de variaciones de amplitud importantes…

¡sin embargo, esta segunda frase que leen tus ojos, tiene un importante rango dinámico!

De “eso” se trata precisamente el tema de esta ocasión. De las variaciones de amplitud. De las diferencias entre suaves y fortísimos; de la sorpresa, de la intensidad sonora. Todos estos aspectos no son solamente técnicos, sino que también son decisiones estéticas y forman parte de un concepto a veces bastante descuidado. Conozco muchísimos usuarios que son capaces de gastarse 1,200 dólares en una placa de sonido de 24 bits, pero usan micrófonos de 120 dólares. Semejante despropósito genera, entre otras cosas, la redacción de este artículo.

Fundamentos de la amplitud del sonido

Sólo para recordar algunos temas esenciales, repasemos conceptos básicos de la física del sonido. Básicamente, el sonido se produce por diminutos cambios en la presión atmosférica (oscilación o pulsación), provocados por un cuerpo elástico que se ha puesto en vibración. Dichos cambios se transfieren en una reacción en cadena que llega a las inmediaciones de nuestro oído externo, provocando el movimiento de los tímpanos (y su consecuente cadena de huesecillos), que baten dentro de la cóclea (una especie de caracol lleno de líquido y pelillos). Esas vibraciones dentro del líquido del oído interno hacen mover los pelillos (cilios cocleares), que producen un impulso eléctrico (Órgano de Corti), que viaja al cerebro por el nervio auditivo y provoca la sensación sonora. Las dos variables que provocan este fenómeno sonoro (y todos los fenómenos sonoros), tienen que ver con la amplitud del movimiento oscilatorio y el tiempo.

Algunos podrían pensar que la mayoría de lo que escuchamos en un estudio es un sintetizador, que produce todo el sonido de manera digital o eléctricamente. En realidad, es un error. Lo que produce la sensación sonora es el altavoz, ya que éste es el verdadero cuerpo elástico que produce las vibraciones (dado que es una membrana que oscila a partir de impulsos eléctricos), provocando micro cambios de presión en el aire que nos rodea y generando esa sensación de sonido.

Si pudiéramos colocar un lápiz en la punta del altavoz y hacer correr un papel por delante de él, obtendríamos una imagen que grafica los cambios de presión sonora a lo largo del tiempo. En concreto, este dispositivo se llama osciloscopio. En realidad no se trata de medir movimientos actualmente, sino diferencias de potencial eléctrico. Lo que sigue es un gráfico que representa dichas variaciones:

De dicho gráfico se desprenden varios conceptos importantes para la música en general y para que entendamos las cuestiones de niveles de sonoridad en los teclados:

Llamamos piso de ruido (Noise Floor) al nivel de amplitud del ruido de fondo que todo sistema acústico, eléctrico o digital posee. Cualquier señal debe despegarse del piso de ruido para ser escuchada. Cuanto más se despega, mejor resulta.

Rango dinámico: Es la distancia entre el silencio y el sonido más fuerte en amplitud que el sistema tolera. Desde el piso (silencio) hasta el techo (Headroom). Se mide en dB. (Los decibelios son una medida comparativa de la amplitud, no una medida absoluta). Cuanto más amplio es este número, mejor resulta.

El oído humano posee un rango dinámico que va desde el 0 dB SPL (Sound Pressure Level / Nivel de Presión Sonora) hasta los 140 dB SPL, que es el límite que tolera el tímpano. En realidad, el umbral del dolor está entre los 120 dB y 130 dB SPL. Sin embargo, el oído tiene un mecanismo de protección que hace que pueda retraer la contracción del tímpano para poder absorber una intensidad mayor inesperada, pero no debemos abusar de ese seguro, porque a la larga trae consecuencias irremediables en la pérdida de audición.

Relación Señal Ruido: Se define esta relación (Signal to Noise Ratio / SNR) como la diferencia que hay entre el rango dinámico posible y el piso de ruido. Cualquier aplicación de buena fidelidad de audio, la SNR no debe estar por debajo de los 90 dB de diferencia.

Picos y valles de la señal: Son los momentos de máxima amplitud y mínima que se suceden a lo largo del tiempo en una señal sonora. Si la amplitud es demasiado fuerte, básicamente se golpeará la cabeza contra el techo (Headroom), provocando una distorsión por amplitud (a veces llamada saturación). Si es demasiado baja, no podrá sobreponerse al piso de ruido (Noise Floor).

¿Qué es entonces el rango dinámico?

El oído humano puede, en teoría, ser capaz de escuchar sonidos tan leves como 14 dB/SPL y tolerar otros tan fuertes como de 140 dB/SPL. En 0 dB/SPL, encontraríamos el umbral del silencio. Ahora bien, todos los sistemas portan siempre algo de señal no deseada: ruido. Incluso el estudio mejor insonorizado del mundo tiene ruido. Cuando entramos al estudio y escuchamos la circulación de la sangre en nuestros oídos, ya tenemos algo de señal no deseada. Ese umbral de ruido existente (Noise Floor) es inevitable. Si estamos en una habitación común podremos escuchar con facilidad una serie de sonidos no deseados que constituyen nuestro piso de ruido.

Cualquier sonido que queramos percibir con atención, deberá tener una intensidad tal, que se imponga por sobre el Noise Floor existente, de tal modo que se despegue en amplitud del mismo, pero sin exceder el límite del sistema. (Headroom)

Imaginemos que nuestra habitación tiene un ruido ambiente de 20 dB/SPL. Para poder escuchar alguna señal deseada, la misma deberá elevarse por encima de esa intensidad y no elevarse demasiado al punto que nos rompa los tímpanos (160 dB/SPL), ya que ese es nuestro techo. Lo mismo ocurre con los sistemas eléctricos y electrónicos. Ya sean analógicos o digitales, tenemos siempre un piso de ruido y un pico máximo tolerable (peak level). Las señales sonoras usualmente se comportan dentro de una amplitud promedio; es decir, la mayor parte del tiempo están moviéndose en una intensidad que llamaremos “average” o intensidad nominal. En los equipos de Hi Fi suele llamarse RMS. Todo sistema admite una amplitud (o potencia) nominal específica y tolera algunos picos (peaks). Por encima de esos picos, el sistema se daña. Ese punto se llama Headroom o techo dinámico.

Definimos entonces rango dinámico útil como la diferencia de amplitud (medida en dB) entre el pico máximo posible y el umbral de ruido.

La relación señal ruido es, entonces, la diferencia entre el piso de ruido y el promedio (“average”) de la señal sonora utilizada dentro del margen del rango dinámico posible.

Un ejemplo del mundo real

Imaginemos estar en un cuarto pequeño escuchando de cerca un grupo de tres instrumentos tocando todos ellos a muy fuerte volumen:

La sensación auditiva en esa habitación será tolerable y probablemente agradable; la suma de los volúmenes individuales de los instrumentos llena nuestras expectativas sonoras, alcanzando los 110 dB/ SPL, con lo cual escucharemos fuerte y claramente cada instrumento.

Imaginemos en la misma habitación la suma de varios instrumentos del mismo tipo y algunos nuevos:

Forzosamente estaremos llegando al límite de tolerancia de volumen de nuestros oídos. Estaremos sobrepasando la capacidad auditiva y rozando el límite del dolor. (Lo que eléctricamente llamaríamos Distorsión por amplitud)

La manera de evitar este problema sin dejar que los instrumentos sigan tocando fuerte es pedir que los instrumentos toquen más suave (alterar las dinámicas individuales) o tomar distancia de las sumatoria de fuentes sonoras (alejarse):

Eso hará que podamos escuchar más instrumentos, pero claro, ahora, la sensación de volumen general del grupo es la misma, pero el volumen parcial de cada uno de ellos ha bajado en su individualidad. Esto es lo que ocurre cuando sumamos más pistas de audio a una grabación o más voces de polifonía o más instrumentos simultáneos a nuestro sintetizador y observamos que la sumatoria de esas señales no sobrepase el techo dinámico (headroom) de nuestro sistema.

En nuestra próxima entrega, trataremos el tema de la disyuntiva a la que se enfrenta un ingeniero de mezcla, un diseñador de un instrumento electrónico o un ingeniero de mastering, al lidiar con el tema de los niveles. ¡Hasta la próxima!

Por Diego Merlo*

*Diego Merlo es compositor, arreglador y director de orquesta. Con más de 35 años de experiencia docente en el tema, al frente del aula y como director. Técnico de sonido y Sound Designer para varias marcas internacionales como E-mu, Sound Blaster, Fairlight CMI, Akai, Roland y Korg.