Algunos detalles del sample rate

Durante muchos años se pensó que el sample rate o frecuencia de muestreo no influía decisivamente en la calidad final del audio digital; en la actualidad hay varios ingenieros que graban en 44.1K o 48K sin saber realmente por qué lo hacen. Con el advenimiento de nuevas y mejores computadoras, interfaces, puertos y protocolos, 88.2K, 96K y hasta 192K entraron en la mesa de discusión sobre el mejor sample rate a utilizar. Siempre ha sido tema de discusión entre ingenieros y audiófilos; algunos argumentaban que sí escuchaban la diferencia entre distintos samples rates y otros que no, y el tópico ha sido sujeto a millones de pruebas A/B con equipos de muy alta calidad, ocasionando todo tipo de opiniones encontradas e intransigentes, peleas y amistades de años rotas.

Si bien éste es un asunto básico de audio digital, siempre lo envuelve un halo de misterio, misticismo y magia (como todo tema de sonido), que bien vale la pena aclarar.

¿Qué es sample rate?

Este tema, aunque se da en la primera o segunda clase de audio digital, no siempre se entiende correctamente. En el pensamiento escolástico, sample rate se define como la cantidad de muestras de audio transportadas y tomadas por segundo. Al ser ésta una unidad de medición sobre segundo y con hechos que suceden cíclicamente, se utiliza el Hertz (1/Frecuencia) como unidad. Obviamente no podemos hablar de este tema sin referirnos al Teorema de muestreo de Nyquist, que fue probado por Shannon casi veinte años después de su publicación y en el cual se enuncia que para una señal de ancho de banda (B) limitado (por ejemplo, un vibráfono llega hasta los 14,917Hz), la frecuencia de muestreo debe ser dos veces su ancho de banda (2*B). Entonces, tomando el ejemplo anterior, podemos decir que: 2*B → 2*14,917Hz → La frecuencia de muestreo para 14,917Hz debería ser 29,834Hz. Esto equivaldría a 29,834 muestras por segundo (1/29, 834) para poder regenerar la señal de un vibráfono sin error. De ahí que se toma que la frecuencia más alta que escucha el ser humano son 20kHz y si aplicamos Nyquist debería ser 40kHz, pero se lleva a 44.1kHz para cumplir con los oídos exigentes y por una cuestión de múltiplos.

44.1K o 48K a 88.2K o 96K, la división correcta

En los albores de la era del audio digital se utilizó Nyquist para utilizar la resolución de sampleo de 44.1K, utilizada en el aquel entonces formato de CD de audio que reproducía a 16bit/44.1kHz.  Con el advenimiento del DVD y Blu Ray como formatos de video y audio, se empezaron a usar resoluciones como 24Bits/48K o 24Bits/96kHz. Si bien durante muchos años hubo grabaciones que se realizaban en 24Bits/88.2kHz o 24Bits/96kHz, en determinado momento de la masterización, antes de enviarlo a la duplicadora de discos, el audio sufría una mutilación que lo reducía a 16Bits/44.1kHz como lo ordenaba el formato de CD. Este proceso debía ser realizado con un equipo especialmente diseñado para esa función y en etapas para que el audio no sufriera un corte muy notorio y quedara evidenciada la mala conversión. Si bien se aplicaba desde ese entonces el viejo y querido Dither para compensar este proceso (algo como el “grano” en el cine. Vean una película sin “grano” y va a parecer HD aunque haya sido filmada en 1980 en cinta y se va a notar hasta el maquillaje del actor y el montaje de los efectos especiales, algo por demás desagradable).

Generalmente, para evitar que el audio se mutile o se le apliquen varias conversiones que lo degraden se decidía a qué resolución grabar antes de oprimir el botón REC (no mencionaremos a los que bajan directamente con su DAW de 24Bits/96kHz a 16Bits/44.1kHz en un solo paso para exportar el audio…hay un lugar reservado especialmente para ellos en el infierno). Si el audio iba a terminar en CD, generalmente se aplicaba un sample rate de 88.2kHz, ya que al momento del mastering, con el re-sampleo simétrico a la “mitad”, quedaba en 44.1kHz.

¿Suena mejor?

El punto subjetivo de esto es que esperamos que las grabaciones “suenen” mejor a más alto sample rate. La realidad es que si grabamos en altos samples rates, con un muy buen muestreo, nuestro sonido no va a “sonar mejor”, sino que será más detallado. Evidentemente, si nuestra fuente sonora es mala, nuestros micrófonos y preamplificadores también y demás, por más que grabemos a 192K, el resultado no será el mejor. Ahora, si utilizamos una buena fuente sonora, buena cadena de audio y un buen convertidor, todo será evidentemente bueno. Pero no confundir; estamos hablando aquí del detalle, no de si sonará más “cálido”, “gordo” o “con cuerpo”. Esto se traduce en una captura más homogénea de todo el espectro de frecuencias, tanto audibles como no audibles.

CPU, disco y plug-ins

Evidentemente, tener un sample rate más alto hace que nuestro procesador deba hacer mayor cantidad de cálculos, ya que ha de procesar más samples (o muestras de audio). Dependiendo de la cantidad de plug-ins que usemos ante un multitrack en alta resolución, nuestra utilización tanto de DSP como de procesadores nativos (el del equipo de cómputo), se incrementará notablemente, haciendo muy difícil o imposible trabajar. Hay varias opciones para salvar este problema, desde comprar más procesador o DSP, utilizar menos procesos o equipo externo (mezcla híbrida), hasta pedir una máquina prestada. La única opción que jamás debe pasarnos por la cabeza es bajar la resolución del audio, procesar y volverla a subir. El grave problema que trae esto aparejado es un recorte en el audio, el cual no es reversible y lo que es limitado y recortado, así se queda.

Otro de los aspectos a considerar es que la velocidad del almacenamiento debe ser acorde a la resolución de audio que usemos. Supongamos que queremos grabar a 24Bits/96kHz; la tasa de transferencia sería de: 2304kbits/segundo. Ahora, calculando la cantidad de tracks, deberíamos usar un disco que realmente nos alcance en velocidad para esta tasa de transferencia (tema a desarrollar en otro artículo).

En estos tiempos, el tamaño del almacenamiento no es un problema, pero sí la velocidad. Tener unidades de disco de tres terabytes, generalmente se utilizan para discos de plato de 5400 rpm; lo mínimo que se debería utilizar si no son discos de estado sólido, serían unidades de discos de plato de 7200 rpm. Obviamente, con discos de 5400 rpm, tendríamos un tercio de reducción en la velocidad final de transferencia y posibilidades de lectura y escritura denominadas “iops” (in out per second o entrada y salida por segundo), que tienen un número determinado, dependiendo del disco, capacidad y arreglo de los mismos (RAID) lo cual, dependiendo de cuánto exijamos en la resolución del audio, cantidad de canales, procesamiento (plug-ins) y latencia esperada (si grabamos con monitoreo en tiempo real), seguramente enfrentaremos algunos problemas como “clicks” y/o “pops” en nuestro audio.

Clock

La importancia de utilizar un buen clock (o reloj) y estar en sincronía con todos los elementos que pertenecen a nuestra cadena de audio es vital. Recordemos que unos artículos atrás hemos expuesto este tema a detalle, pero conviene reforzarlo en este artículo. Varios convertidores ADC y DAC de interfaces económicas no realizan el muestreo y la cuantización de la manera correcta o esperable; los clocks externos o protocolos como Dante ayudan a que la sincronía entre varios dispositivos sea la correcta y mejore la calidad del audio. Gran parte de la calidad final de nuestro trabajo en el audio está en esta parte del proceso y es importante que si nos tomamos en serio nuestro trabajo y pasión, empecemos a poner atención a este tipo de detalles que generalmente se pasan por alto.

¡Hasta nuestro próximo artículo!

*Músico de carrera, compositor, profesional del audio y la tecnología, residente en la Ciudad de México. Actualmente se desempeña como consultor en audio, productor, realizando grabaciones y masterización. Desde 2005 tiene su propio sello: Fusa Records (www.fusa-records.com). Estudiante avanzado de Ingeniería en la UTN, Argentina, colaborador en páginas sobre audio y tecnología. Miembro AES Full desde 2007, participando activamente en disertaciones sobre informática musical y tecnología aplicada al audio tanto en México como en Argentina. Contacto: mdiazvelez@fusa-records.com