En la actualidad se poseen varios protocolos de transmisión de audio digital, tanto por fibra óptica con conector tipo Toslink (la vieja fibra de ADAT), hasta las fibras negras que corren varios metros o kilómetros con conector Square Connector (SC) o Luncent Corporation (LC) y que se conectan a un Small Form-Factor Pluggable (SFP) de un switch para la transmisión de audio y video de un concierto en un estadio a modo de ejemplo. También tenemos los protocolos de audio que van por cable de red cobre como Dante o MADI (pueden correr en fibra óptica, pero MADI con más restricciones por la antigüedad del protocolo), y para concluir, están los formatos de audio digital que corren en cable coaxial de 110 Ohms o 75 Ohms, como AES y SPDIF.

¿Cómo funciona?

En esta entrega nos ocuparemos del AES3 o AES/EBU, un protocolo desarrollado por la Audio Engineering Society (AES) desde mediados de los años setenta, presentado en sociedad en su primera versión en 1985 y con una última revisión en 2003, la cual aparece descrita en los siguientes estándares de varias de las comisiones más importantes de la industria: IEC 60958 Tipo I (International Electrotechnical Commission) y EBU Tech 3250E (European Broadcasting Union). A diferencia de protocolos como SPDIF (que comentaremos más adelante en este artículo), éste es un sistema totalmente ausente de las interfaces de audio “entry level”, pero aún muy presente en las interfaces de media a alta gama. Este protocolo para los estudios de grabación profesionales, project studios y home studios, traen entradas y salidas que pueden salvarnos de algunos problemas, proveyendo dos canales de entrada y dos de salida, varias veces muy necesarios.

Los conectores para este protocolo son los clásicos XLR (tres polos o pines), hembra y macho respectivamente, para el flujo de la señal (aplica igual al audio análogo), si bien se permite usar una gran variedad de cables mientras que se respeten los tres polos (par trenzado de 110 ohmios con una pantalla general). Este cable no trasportará audio análogo, sino digital, e irá entre 2 y 7 voltios, por eso puede extenderse hasta cien metros sin afectar la señal, en el caso de que sea un buen cable. De ser cables de audio de mediana a baja calidad, la señal se empezará a corromper en unas pocas decenas de metros.

Sin embargo, a diferencia del cable para transporte de audio analógico balanceado, la interfaz no es sensible a la polaridad y en cambio se utiliza un código de marca bifásica en el que el contenido de datos binarios se indica mediante cambios de voltaje, no el voltaje absoluto. Cabe destacar que en 1995, la AES emitió una actualización de la interfaz AES3 para permitir conexiones no balanceadas, utilizando conectores BNC y cables de 75 ohms (como los cables para word clock); esta modificación fue llamada AES3-id y ha sido ampliamente adoptada en los círculos de profesionales de la televisión, cine y audio.

¿Cómo se compone este protocolo?

Se compone, como todo protocolo de audio digital, por bits (ver imagen adjunta del mapa de bits del AES3). Esta estructura interna del protocolo en las ráfagas de transmisión de datos de una palabra (word) de 32 bits (0 a 31) es llamada sub-frame y dentro de estas unidades se encapsula una muestra de un canal digital correspondiente a la señal transportada junto con otros datos de información y control. Cada uno de los bits que componen esta palabra se llaman “time slots”; recordemos que si bien el transporte es en paralelo de los canales, estos por separado son seriales.

Los sub-frames se unen por parejas (canal de audio R + canal de audio L), formando los frames como unidad contenedora y a su vez estos se agrupan en conjuntos de 192 frames (0 a 191), formando las unidades de más alto nivel, conocidas como “audio blocks” o bloques de audio para su transmisión.

Por este protocolo, como veremos más adelante, no sólo pasa audio, sino también bits de paridad, pulsos de clock y por supuesto, audio digital.  Varios “relojes” o clocks de la industria utilizan el protocolo AES para mantener la sincronía entre los dispositivos. No sólo se utiliza el word clock como protocolo de sincronía, sino que elementos de audio de distintas generaciones pueden convivir en sincronía, además del wordclock, con este protocolo.

Como siempre, en el audio digital, es necesario que la sincronía esté “atada” a un master (o maestro), el cual dictamina un sample rate (veremos en los siguientes párrafos este tema a detalle), para que todos los otros dispositivos esclavos sigan esa sincronía. En las interfaces se puede elegir el tipo de protocolo de sincronía que queremos utilizar como maestro y como esclavo. Normalmente, como dijimos anteriormente, se utiliza el word clock con el conector BNC de 75 ohms, pero también se puede utilizar Sony/Philips Digital Interface Format (SPDIF) con conector RCA, Alesis Digital Audio Tape (ADAT) con conector TOSLINK y AES3 con el mismo diagrama de cableado que un cable balanceado con conector XLR en ambas puntas.

Modos del cableado del AES3 o AES/EBU de cableado simple y doble

Como mencionamos en párrafos anteriores, el AES/EBU tiene dos esquemas de cableado: sencillo o doble. Originalmente existía el sencillo y luego el esquema de doble cable se inventó cuando los chips del controlador AES/EBU eran demasiado lentos para manejar el flujo de los datos del protocolo a una velocidad de reloj suficientemente alta.

En la actualidad y luego de sucesivas revisiones, éste ya no es el caso. El AES/EBU de doble cable no ofrece ninguna ventaja en términos de calidad de audio en comparación con AES/EBU de un solo cable. Vale la pena señalar que sólo se necesita cable doble para datos AES/EBU de velocidad doble o cuádruple (frecuencias de muestreo entre 96 kHz y 192 kHz). No se necesita doble cable para una sola velocidad (44.1 o 48 kHz). De hecho, el cable dual no se puede usar para datos de audio AES/EBU de una velocidad.

AES3 en sus distintas versiones y sabores

El SPDIF (formalizado en 1998), es la versión hogareña del AES3 y está documentada como IEC-60958 Tipo II. Desde la parte eléctrica, el SPDIF no es muy similar al formato AES3-id, ya que el primero transporta entre 0.5 y 0.6 voltios y el AES3-id transporta entre 1 y 1.2 voltios. Recordemos que el AES3-id o el AES3 desbalanceado requiere cables coaxiales de 75 ohmios como el SPDIF, pero el primero termina en conectores BNC y el segundo en RCA.

En este punto quiero hacer una pausa y comentar algo que he visto más de una vez. Debido a que se usan conectores muy comunes como los RCA, puede haber una mala tendencia a que algunas personas utilicen cualquier cable antiguo RCA a RCA para conectar equipos digitales. Si bien esto puede funcionar para distancias muy cortas, la transmisión de audio digital será considerablemente menos confiable y mucho más propensa a fluctuaciones tanto en la señal como en la sincronía. Antes de pasar a la siguiente variación del AES3, el SPDIF sólo soporta la distancia máxima de transmisión de diez metros.

La versión final sobre el tema AES3 es conocida como Multi-channel Audio Digital Interface (MADI), y tenía la intención de proporcionar una conexión sencilla (un solo cable) entre una consola digital y una grabadora multicanal. Cuando en 1991 se publicó por primera vez esta versión como AES10, se diseñó para transmitir 56 canales de audio (configurados como 28 pares de AES3) a través de un único cable coaxial con conectores BNC. Sin embargo, en 2003 (recordemos que ese año fue la última vez que se revisó el protocolo AES3), se introdujo una versión mejorada llamada Extended MADI o MADI-X, que proporciona 64 canales a 48 kHz y 32 a 96 kHz. Una diferencia significativa entre MADI y las otras versiones del protocolo basadas en AES3 es que no lleva un reloj incorporado. Siempre se requiere una señal de sincronización separada (clock por word clock), para sincronizar los dispositivos de origen y destino.

Para finalizar, invito a conocer el origen y uso correcto de estos protocolos de audio digital, poco estudiados o con cierta reticencia a ser usados.

*Músico de carrera, compositor, profesional del audio y la tecnología, residente en la Ciudad de México. Actualmente se desempeña como consultor en audio, productor, realizando grabaciones y masterización. Desde 2005 tiene su propio sello: Fusa Records (www.fusa-records.com). Estudiante avanzado de Ingeniería en la UTN, Argentina, colaborador en páginas sobre audio y tecnología. Miembro AES Full desde 2007, participando activamente en disertaciones sobre informática musical y tecnología aplicada al audio tanto en México como en Argentina. Contacto: mdiazvelez@fusa-records.com