Probablemente, lo usas a todas horas, pero ¿cuánto sabes acerca del formato MP3? Averigua aquí cómo se consigue ahorrar espacio con el audio…
El acrónimo MP3 deriva de Moving Pictures Experts Group Phase-1 Audio Layer 3, un estándar internacional para la codificación y la compresión de audio digital. No te confundas: “compresión de datos” nada tiene que ver con “compresión de audio” –en Informática, la compresión de tipo ZIP o RAR alude a la reducción del tamaño de los archivos sin pérdida alguna de su contenido informativo original. Y al igual que una imagen JPEG ocupa menos que esa misma imagen no comprimida, un archivo MP3 tiene menos bytes que la misma señal de música no comprimida (por ejemplo, en formato CD). Pero en estos casos, el contenido –una vez decodificado el formato– ya no coincide con el audio original.
MP3 y JPEG aplican compresión con pérdidas, desechando la información relativa o menos importante psico-acústicamente. Así, cuando amplías una imagen JPEG, se percibe menos nítida que la original, con menos detalle, y tal vez ciertos colores desajustados. Sucede más o menos igual con los archivos MP3, ya que el formato prescinde de algunos armónicos o bandas de frecuencia. Por fortuna, aunque el sonido se contamine con “daños colaterales” como ecos, siseos, leves distorsiones y demás, nuestro cerebro integra fácilmente esos mini-defectos y, por lo general, sólo un cuidadoso y objetivo análisis los pone en evidencia.
Manos a la obra
Así que los algoritmos de codificación MP3 desechan información no esencial basándose en esa incapacidad humana para discernir pequeñas diferencias en el contenido espectral de las señales de audio.
El proyecto de investigación que dio lugar al formato recurría a principios descubiertos en los 70 en el campo de la psicoacústica (estudio de la percepción sonora). En especial, se estudió la forma en que la presencia de un sonido enmascara a otro coincidente o incluso levemente alejado, imposibilitando su percepción. La eliminación selectiva de dichos elementos que resultan enmascarados posibilita la reducción del tamaño en el formato de archivos MP3. Mediante diversos algoritmos, se logra retener la información auditiva o musical más relevante para el sonido concreto.
El estándar MP3 vio la luz y fue patentado a escala mundial a principios de los 90 por la Sociedad Fraunhofer, un instituto de investigación alemán que había financiado buena parte de su desarrollo. Esta sociedad todavía posee las patentes, lo cual le genera al año decenas de millones de euros en ingresos por licencias. MP3 adquirió la categoría de estándar en 1993 dentro de las normas ISO (Organización Internacional para los Estándares).
El proceso de codificación MP3 funciona considerando una tasa de flujo de información como medida del grado de compresión aplicado. Se define en kilobits por segundo (kbit/s, kbps, o kb/s). En transferencias de datos, un kilobit (no confundir con kiloByte) se suele tomar como 1.000bit, aunque lo correcto sería interpretarlo como 1.024bit. Una tasa de 128kbit/s, si tenemos en cuenta esa laxitud, equivaldrá a 15,625kB (kiloBytes) por cada segundo de audio.
Así que un minuto de audio MP3 comprimido a una tasa de 160kbps ocupará 4,6875MB en el disco duro o en cualquier otro soporte digital. Con tasas menores, el algoritmo de codificación va desechando cada vez más información, y se notarán mucho más esos “efectos colaterales” a los que aludíamos, aunque el archivo en sí quede reducido de una forma impresionante. Una propiedad curiosa es que un archivo mono ocupa lo mismo que otro estéreo si se comprime en MP3 usando la misma tasa de kbps, pero la calidad percibida será mayor al no repartirse dicha tasa entre los dos canales de audio.
De todos modos, muchas aplicaciones que codifican o descodifican los archivos MP3, también soportan tasas variables, que consideran la evolución temporal de una señal de audio –si el espectro del audio varía con el tiempo, que será lo más usual, eso puede aprovecharse para minimizar las pérdidas de manera óptima en cada instante. Los archivos MP3 codificados con la técnica VBR (Variable Bit Rate) resultan aún más compactos.
Con independencia de estas consideraciones, el algoritmo debe ir examinando la señal original, y es posible elegir una u otra frecuencia para este proceso, sin considerar la tasa de compresión aplicada posteriormente. Aquí, el teorema de Nyquist dicta los requerimientos –al igual que en un WAV sin comprimir, el muestreo previo debe ejercerse como mínimo al doble de la frecuencia máxima a capturar, o se perderá información valiosa (aún así, debe considerarse el aliasing o interferencia debida a los armónicos superiores). La mayoría de archivos MP3 es producto de un muestreo a 44.1kHz, que parece suficiente para capturar con fidelidad señales de hasta 22.05kHz, que cubren el rango auditivo promedio de un adulto.
Dame LAME
Para una explotación óptima del formato MP3, trabaja con un buen codificador. Una de las mejores y más veloces opciones es LAME, que se ajusta muy bien al contexto de los creadores musicales que demandan lo mejor. Su descarga gratuita se realiza desde http://lame.sourceforge.net –bajo la sección ‘LAME Links’, escoge la compilación concreta destinada a tu sistema operativo. Nuestra práctica nos indica que entrega resultados mejores a los de los codificadores estandarizados que vienen con muchos secuenciadores.
En nuestra Redacción recurrimos mucho a LameBrain para Mac, que usamos para codificar nuestros ejemplos. Los algoritmos son los mismos que los de LAME, así que aseguran la misma calidad y musicalidad. Incluso notamos que los resultados suenan más precisos que los de otros codificadores autónomos desde los mismos archivos originales en calidad CD.
Si quieres que tu público disfrute con una versión óptimamente codificada de tu música, no la distribuyas hasta experimentar un poco con los distintos compromisos entre calidad y tamaño del archivo.
El dilema
MP3 conlleva inconvenientes, por supuesto. Su triunfo se ha visto acelerado por una exigencia universal de reducción de tamaño, más que nada de cara a la transmisión por vía telemática (Internet), la distribución, o el alojamiento de los archivos en medios cada vez más portátiles, y hasta integrados con la vestimenta.
Al satisfacer dichas “necesidades” –analizaremos su carácter espurio o mercantilista en otra ocasión–, MP3 se aseguró un inmenso hueco como estándar de facto en la compresión de audio. Para un músico, no obstante, la minimización raramente es el requisito primordial. A todos nos gusta que nuestra música se escuche en su pureza original, que esos de
talles y sutilezas que nos costaron llevaron desarrollar, completen su camino hasta el oído y el corazón del oyente. Pero a la vez uno se pregunta: ¿por qué grabo y creo con calidad prístina, si al final todo se oye en un “loro” con MP3 o en un iPod?
MP3 para rato
A pesar de las deficiencias de MP3, admitimos que es el formato dominante para distribución de audio digital. Los consumidores rehúsan el cambio en sus costumbres musicales a cambio de lo que considerarían una mejora mínima en la fidelidad. Este balance se manifestó en el fallido formato DVD-Audio. Musicalmente, superaba al formato CD de 44.1kHz y 16bit (DVD-A optaba por 192kHz y 24bit). Pero, al final, el 99 por ciento de soportes DVD contiene copias de seguridad de datos brutos, o películas con el audio en calidad CD, incluso para títulos de conciertos. El uno por ciento restante lo constituyen las decepcionantes “remasterizaciones”, que aunque maximizan la capacidad del audio de un DVD, se reducen a un puñado de compilaciones de jazz para entendidos… consumidores que, claro está, hubiesen invertido también en un reproductor DVD-A.
Como creadores musicales, no podemos pues deshacernos de esa tendencia por la que incluso grupos serios te pedirán algún día que les entregues el máster en MP3… Exageraciones a un lado, de momento seguirán siendo enviados archivos MP3 codificados a 160kbps para que los grupos evalúen una pre-mezcla, intercambien ideas, o promocionen su obra final en un portal o red social on-line.
Con todo, una vez en el estudio, haz los deberes y no te conformes con una calidad que suene aceptable, pero que “al microscopio” tenga un peor aspecto. Tus plug-ins profesionales, los buses de mezcla de tu secuenciador, e incluso tus mezcladores e instrumentos hardware, deben recibir y transmitir señales tan impolutas como te sea posible (otra cosa son los experimentos adrede en plan lo-fi).
Cuando no haya más remedio que distribuir tu audio en MP3, experimenta con distintos plug-ins o aplicaciones de codificación. El codificador LAME (lee en el cuadro lateral, más arriba) te sale gratis y es un buen punto de partida, con un rendimiento excelente a tasas relativamente altas.
Un plus de los archivos MP3 es que albergan etiquetas ID3: son metadatos que viajan cómodamente integrados en el formato. Aprovéchalos e identifica tus codificaciones con el título del tema, nombre del artista, y datos de contacto. Así, la persona que se tope con ellas sabrá de dónde proceden.
Es posible decodificar los MP3 sobre formatos WAV o AIFF, pero como te advertimos al comienzo, no recuperarás exactamente la señal original del audio. La compresión debería ser el último recurso cuando no sea posible conseguir una versión equivalente, pero en alta calidad. Si importas una muestra en MP3, ya estás en el dominio de la baja calidad relativa –ningún procesador te devolverá los detalles presentes en la señal de partida.
Por consiguiente, a la vez que disfrutes de la portabilidad, la conveniencia y la inmediatez del formato, ten siempre presente sus limitaciones, sus inconvenientes, y –¿por qué no?– sus implicaciones comerciales, sociológicas o culturales a medio y largo plazo.