Ya en otro artículo expliqué qué es el sonido, pero mucha gente lo confunde con audio, pero son bastante distintos. La diferencia consiste en que el audio es sólo una representación del sonido, pero no el sonido en sí. Hay varios tipos de representación, como el voltaje que si mueve un parlante suena o la posición del material magnetizado en una cinta de grabación. También está el audio digital que es una secuencia de números que representan el desplazamiento del aire en un punto.

Diferencia entre audio y sonido

¿Qué es el audio digital?

Como lo venía mencionando es la representación en números digitales, voy a explicar un poco más en detalle esto porque es vital para poderlo manipular y lograr los sonidos que queremos. Para entenderlo, les recomiendo mirar la gráfica de abajo. Supongamos que un sonido llega a un micrófono, éste mueve su membrana acorde a las vibraciones. Esas vibraciones son variaciones en la posición de dicha membrana. Así, podemos asociar un valor numérico a cada posición y ordenarlas según su ocurrencia en el tiempo. Esa secuencia de números ya es la señal de audio digital.

Qué es el audio
Cómo funciona la representación del audio

¿Qué es la frecuencia de muestreo?


Te puedes dar cuenta de que el sonido es continuo y en cualquier instante de tiempo hay una posición de la membrana. Sin embargo, la representación en números no puede tomar todas esas posiciones. En la gráfica puedes ver que entre "0" y "1", que son los primeros dos números, hay un movimiento, pero no hay números intermedios. Se podrían colocar, pero sin importar cuántos coloquemos, siempre pueden agregarse valores intermedios.

El estándar dice que debemos tomar datos (eso números) de la vibración de la membrana equiespaciados en el tiempo. O sea que el tiempo que pasa entre que tomamos un número y el siguiente será igual al intervalo de otros dos consecutivos, los que sean. Entonces podemos cuantificarlo en número de muestras (números) por segundo, esa cuantificación es la frecuencia de muestreo. Y si sabes algo de física sabes que esa cuantificación es la definición de hercio (Hz). 

Si la frecuencia de muestreo es lo suficientemente alta, no perderá información. El límite se conoce como frecuencia de Nyquist. Dice que debe ser el doble de la frecuencia del sonido. Dado que no oímos sonidos por encima de 20KHz, entonces con una frecuencia de muestreo mayor a 40KHz debería ser suficiente. Si no entiendes estos conceptos, te recomiendo aprender un poco más sobre qué es la frecuencia de un sonido.

¿Qué son los bits en una señal de audio (bit depth)?

Toda señal digital tiene una característica y es que está limitada a tener valores finitos tanto en tiempo, como en amplitud. ¿Qué quiero decir con eso? que al igual que no podemos tener todos los valores del desplazamiento en tiempo, la amplitud que podemos cuantificar es tampoco es infinita. Eso ocurre porque los computadores tienen límites. Y ahí se genera un concepto muy importante, que es el número de bits. 

Pongamos un ejemplo para entenderlo. Puede que tengamos el valor 0.8, pero no sea posible tomar el valor 0.008 porque 3 decimales es demasiado específico para el sistema de medición que tenemos. También, puede que con otros sistemas de medición se pueda tomar 0.0008, pero no se pueda 0.000008. 

En audio, uno de los estándares es 24 bits. Un bit es un número binario de una cifra (0 o 1), que tenga 24 implica que la amplitud debe ser representada por 24 bits. Eso significa que podrás tomar 224 números posibles, ya que son las posibles representaciones con esos bits. Todos usualmente representan una amplitud entre -1 y 1. El secreto de que quepan sonidos de alta intensidad o más baja es el preamplificador. Cuando el estándar es 16 bits, eso significa que sólo podrá tomar 216 posibles valores. 

Les doy un dato importante. Cuando con el amplificador envían una señal muy alta, implica que va a sobrepasar el valor máximo que se puede representar. Eso es lo que se conoce como Clipping en audio. En ese caso la señal es recortada y los valores que superen el máximo serán tomados como si fuera el máximo. Eso es una distorsión y por eso es indeseable. Así que cuidado con la luz roja del clipping al grabar.

Espero que te haya quedado clara la diferencia entre audio y sonido. Te invito a ver este otro artículo sobre reflexión y transmisión del sonido, te será muy útil. ¡Adiós!