reampin

Travessa Doná Paula 136 - Higienópolis - São Paulo 

11 96671-3059 - atendimentoreampin@gmail.com

  • Preto Ícone Facebook
  • Preto Ícone Instagram
Jul 24

Audio Digital - Conceitos Teóricos

0 comentários

Podemos entender o áudio digital seguindo em uma linha de raciocínio bem simples: ao gravarmos um som, estamos transformando uma energia mecânica em elétrica através de um microfone ou captador, e por fim estamos transformando um sinal elétrico em uma palavra digital. O mesmo processo acontece ao escutarmos esse som em um auto falante, a palavra digital é transformada em sinal elétrico, que por sua vez é amplificado movimentando um auto falante que produz som - novamente de forma mecânica.

Esse processo acima é chamado de AD/DA - que é a conversão de analógico para digital e digital para analógico. Ou seja, a sua interface de áudio é um conversor AD/DA

 

Agora vamos entender todos detalhes do áudio digital:

 

Números Binários:

 

O audio digital é codificado em dígitos binários, ou seja 0 e 1 (zero e um), e sempre aparecem em pares.

 

Bit e Sample Rate:

 

No protools você irá perceber que no dashboard inicial você deve escolher uma opção nos mostradores de Bit Depht e Sample Rate, e agora vamos entender o que são essas duas informações, a sua importância e sua aplicação na prática gerando os resultados sônicos.

 

Sobre o Bit Depht:

 

O que queremos definir com essa escolha da taxa de bits - e se traduzirmos ao pé da letra do inglês (bit depht), a profundidade de bit - a quantidade de informação ou possibilidades de registro de informações binárias.

 

A equação 2ˆn (2 elevado a n)explica a resultante de possibilidades de registro por bit, sendo 2 porque o audio digital é sempre uma linguagem binária N é a quantidade de bits teremos a seguinte tabela de possibilidades de escrita:

 

1 bit - 2ˆ1 = 2 possibilidades

2 bit - 2ˆ2 = 4 possibilidades

3 bit - 2ˆ3 = 8 possibilidades

6 bit - 2ˆ6 = 64 possibilidades

16 bit -2ˆ16 = 65536 possibilidades

24 bit - 2ˆ24 = 16777216 possibilidades

 

O Bit Depht está totalmente ligado a dinâmica do som. Antes de nos aprofundarmos nessa informação, lembre-se dos áudios de 8 bit e como eram artificiais. Isso por que tinham poucas possibilidades de escrita e a dinâmica acabava se limitando.

 

Tente entender que apesar de uma amplitude limitada, todo instrumento musical ou fonte sonora tem uma abrangência enorme de dinâmica se pensarmos no que compõem os timbres, e suas harmônicas. Quanto mais limitarmos esse detalhamento menos naturalidade teremos.

 

A equação 20.log(2ˆn+1 / 2ˆn)= 6dB

 

Isso significa que ao relacionarmos duas grandezas com amplitude digital (por código binário), onde uma delas acrescenta mais uma informação de 1 bit, teremos a quantização sônica de um bit.

 

Isso significa que 1bit = 6bB

 

Complicou quando falei sobre essa equação, não é? Porém é simples: essa segunda informação é a representação da descompressão, e assim como o áudio mecânico só existe através da pressão e descompressão, o áudio digital só existe com no mínimo uma sequência de dois bit de qualquer bit depht.

 

Com isso entendemos o conceito de falta de naturalidade de um áudio em 8bit. A clareza desse audio não está somente relacionada a capacidade de escrever uma informação digital binária relacionada a volume, mas toda a relação de volumes das diferentes harmônicas que são o que compõem o timbre.

 

Na tabela a seguir entenderemos a capacidade de quantização, ou seja a capacidade de entendimento de dinâmica que um bit pode escrever em informações digitais:

 

1 bit = 6dB

2 bit = 12dB

6 bit = 36dB

8 bit = 48dB

16 bit = 96dB

24 bit = 144dB

 

Ou seja, quanto mais dinâmica ou riqueza de timbre, maior é a quantidade de bit que precisamos. A cada amostra de audio, seus dsp's criam uma palavra digital que representa o valor mais próximo de acordo com o critério que lhe foi atribuído no Bit Depht.

 

Ou seja, nada que não tenha sido observado pelos seus dsp's nas pontas da dinâmica será amostrado, existem duas siglas que ilustram essa regra:

 

MSB - Most significant bit - Nada além do bit mais significativo é representado sonicamente

LSB - Least Significant Bit - É a ultima informação registrada, abaixo dele nada será representado.

 

Ou seja, tudo o que supostamente deveria estar acima do MSB ou abaixo do LSB não existe para o áudio digital.

 

A sigla dBFS (db Full Scale) define outra observação importante quando falamos de amplitude de sinal, sendo que o volume máximo entendido pelo conversor no processo AD/DA é 0dB (zero dB). Isso significa que a representatividade dessa amplitude é negativa, ou seja:

 

Para todos os bits o volume mais alto é 0dB e a amplitude real é:

8 bit: -48dB

16bit: -96bB

24bit: -144dB

 

32 Bit Float

 

A partir do Pro Tools 10 foi introduzido o Bit Depth de 32 Bit Float - ou 32 Bit flutuantes. Vamos entender o que é isso e o que significa na prática.

 

Um audio em 32 Bit Float na verdade é um audio em 24 bit com 8 bit adicionais exclusivamente aplicados ao volume. Ou seja com 32 Bit Float nós temos um Headroom de 48dB para volume exclusivamente.

 

Na prática isso funciona para redesenhar clips, por que a informação binária relacionada à qualidade ou a proximidade natural do audio que está sendo convertido ainda se aplica na capacidade de registro binário do bit depht de 24 bit. O que significa que você terá um áudio com a 16777126 possibilidades de registros binários e 256 possibilidades adicionais de amplitude de dBFS.

 

Sample Rate:

 

O Sample Rate é a taxa de amostragem do áudio. Em outras palavras significa a amplitude de sinal que a sua interface vai enxergar. Ao definir um Sample Rate você está dizendo para o seu conversor digital que está entrando um sinal elétrico com uma amplitude pré definida e limitada.

 

O que acontece é que a cada segundo a sua interface irá enxengar uma certa quantidade de amostras de áudio. A quantidade de amostras é o seu sample rate, e é muito fácil de entender com a seguinte tabela:

 

44.1kHz - 441000Hz = 44100 samples ou amostras por segundo

48kHz - 48000Hz = 48000 amostras por segundo

96kHz - 96000Hz = 96000 amostras por segundo

 

Todos nós sabemos que o ouvido humano é capaz de escutar uma amplitude sônica com a amplitude de 20Hz a 20kHz(20000Hz). Então porque o sample rate é sempre no mínimo um pouco mais que o dobro da frequência máxima que escutamos?

 

Isso é explicado pelo Teorema de Nyquist: "Para que um sinal seja amostrado com fidelidade, a frequência de amostragem deve ser no mínimo o dobro".

 

Na prática isso também para evitar reflexões de ruídos decorrentes da conversão digital para o a amplitude sônica que escutamos. Com isso, qualquer ruído digital nas harmônicas do audio que estamos amostrando, serão refletidas em uma abrangência sônica que não podemos escutar, e não serão reproduzidas por nenhum auto-falante.

 

Esse ruído é conhecido como ALIAS, e o valor da amostragem é maior do que o dobro para que diminua-se a possibilidade de formação de ALIAS durante a conversão digital. Isso é explicado pela seguinte equação:

 

Fs ≥ 2xFmax (teorema de nyquist)

Fs - F = Falias

 

Então:

44.100Hz - 20000Hz = 24.100Hz alias

 

Um outro motivo pelo qual a amostragem é o no mínimo o dobro da frequência real a ser amostrada é para possibilitar a reconstrução do sample. Essa reconstrução também é conhecida como OVERSAMPLING.