Compreendendo a taxa de amostragem e como isso afeta o mercado do áudio

30/01/2022

SalvarSalvoRemovido 6

Na indústria de áudio, há uma lista interminável de tópicos que geram controvérsias. Tópicos como cabos caros e áudio de alta resolução são alguns que sempre geram debates na comundiade. A definição de áudio de alta resolução afirma que qualquer arquivo de música gravado com uma taxa de amostragem e profundidade de bits superior a 44,1 kHz / 16 bits é considerado áudio de alta definição (HD).

Neste artigo, cobriremos os fundamentos da taxa de amostragem, profundidade de bits, juntamente com seu impacto na qualidade de áudio percebida e a relação com o mercado musical. Também abordaremos outro conceito: taxa de bits . A taxa de bits, ou taxa de bits, é comumente usada para descrever a qualidade do stream de áudio para serviços de streaming de música.

Como o som é gravado digitalmente?

Quando o som é produzido, ele cria uma onda de pressão que se propaga pelo ar. Se o diafragma de um dispositivo de gravação, como um microfone, estiver próximo, as ondas de pressão no ar criarão uma vibração no diafragma. Por meio da magia dos transdutores, essa vibração, por sua vez, cria um sinal elétrico que varia continuamente com as ondas no ar.

Esta variação contínua e proporcional é de onde vem o termo “analógico”.

O sinal criado pelo diafragma muitas vezes não é forte o suficiente por si só. Normalmente, um pré-amplificador primeiro aumenta o sinal para que ele possa ser gravado de várias maneiras.Ao longo da história, vários materiais foram usados para registrar e armazenar sinais analógicos. Isso inclui cera, discos de vinil e fitas magnéticas. Eventualmente, os registros digitais foram introduzidos e se tornaram comuns.

Os sistemas digitais (uns e zeros) gravam sinais analógicos (valores continuamente variáveis) por amostragem deles.

Acima a diferença entre uma taxa de amostragem baixa e uma taxa de amostragem alta

Ao obter amostras suficientes de um sinal analógico de entrada e salvá-lo na memória, os registros digitais são capazes de capturar e, posteriormente, reproduzir o referido sinal.Uma gravação de áudio digital típica tem até 44.100 amostras por segundo. No entanto, não é incomum ver 96.000 amostras por segundo com alguns formatos de áudio digital. Existem vários tipos de métodos de amostragem, mas a Modulação de Código de Pulso (PCM) é o padrão de fato.

O que é modulação por código de pulso?

O PCM serve como o padrão da indústria para armazenar ondas analógicas em formato digital. Em um fluxo PCM, a amplitude do áudio é amostrada em um intervalo uniforme. O PCM não tem proprietário, portanto qualquer pessoa pode usá-lo gratuitamente!

Exemplos de formatos de áudio proprietários são DTS , Atmos e Dolby Digital .

No entanto, é incomum encontrar áudio no formato PCM nos meios mais populares devido a dois motivos: Tamanho do arquivo e compatibilidade de reprodução.

Tamanho do arquivo:

Como o PCM é descompactado, o tamanho do arquivo de áudio gravado é enorme. É possível compactar arquivos de áudio usando algoritmos de compactação com ou sem perdas para manter a fidelidade do áudio enquanto reduz o tamanho do arquivo. Dolby e DTS são compressões de áudio com perdas, frequentemente usadas para essa finalidade, pois são capazes de reduzir o tamanho dos arquivos de áudio PCM em até 90%. Infelizmente, a maneira como Dolby e DTS codificam canais PCM em um fluxo de bits para armazenamento e depois os decodificam de volta para reprodução não é perfeita. O áudio resultante, embora menor em tamanho de arquivo, nem sempre é tão limpo e nítido quanto o original, resultando em uma queda na precisão e na qualidade. É aqui que entram os formatos sem perdas, como Dolby Digital TrueHD e DTS-HD Master Audio . Eles são capazes de decodificar os sinais de áudio PCM exatamente como foram originalmente capturados.

Compatibilidade de reprodução:

Infelizmente, os sistemas operacionais (SO) populares não oferecem suporte à reprodução de arquivos PCM nativamente. A IBM e a Microsoft definiram o formato Waveform Audio Format (WAV) para o sistema operacional Windows, enquanto a Apple usou o Audio Interchange File Format (AIFF) para o sistema operacional Macintosh. Ambos os formatos são apenas um invólucro do formato de áudio PCM com informações de áudio adicionais, como perfil do autor e título da faixa, etc

A fidelidade / qualidade de um fluxo PCM é representada por dois atributos:

. Taxa de amostragem

. Profundidade de bits

Esses dois atributos indicam a precisão da gravação digital em relação ao sinal analógico original.

O que é taxa de amostragem?

Pense nos filmes de animação de algumas décadas atrás.Os filmes eram apenas slides de imagens estáticas sendo exibidas uma após a outra para criar a ilusão de movimento. A velocidade da transição determinou a suavidade da animação resultante. Quanto mais rápida a transição, melhor será a ilusão de animação.A velocidade de mudança dos slides é igual à taxa de quadros quando se trata de vídeo moderno.

A onda sonora digital é como um instantâneo do sinal de áudio original. Quanto mais próxima a onda sonora amostrada se parecer com a onda sonora original, maior será a fidelidade da onda sonora digital.

Em gravações de áudio digital, a taxa de amostragem é análoga à taxa de quadros do vídeo. Quanto mais dados de som (amostras) coletados por período de tempo, mais próximos do som analógico original os dados capturados se tornam.

Acima você verá que uma taxa de amostragem mais alta fornecerá uma captura mais precisa do sinal de áudio original

P.s: Christopher D’Ambrose coloca a capacidade auditiva de um adulto normal de meia-idade em 12-14 kHz).

Teorema de Nyquist:

Comumente conhecido como teorema de Nyquist ou frequência de Nyquist, afirma que, para evitar qualquer perda de informação ao fazer a amostragem digital de um sinal, você deve amostrar a uma taxa de pelo menos duas vezes a frequência de sinal mais alta esperada.

Nesse caso, o uso de uma taxa de amostragem de 44.100 amostras por segundo ou 44,1 kHz permite a reprodução precisa de frequências em torno de 22 kHz.

Outros exemplos de taxas de amostragem comuns são 8.000 Hz em telefones e em qualquer lugar entre 96.000 Hz a 192.000 Hz para faixas de áudio Blu-ray. Uma taxa de amostragem de 384.000 Hz também é usada em certas situações especiais, como ao gravar animais que produzem som ultrassônico.

O que é profundidade de bits?

O computador armazena informações em 1 e 0s. Esses valores binários são chamados de bits . Quanto maior o número de bits indica mais espaço para armazenamento de informações.

Acima você tem um número binário de 4 bits

Quando um sinal é amostrado, ele precisa armazenar as informações de áudio amostradas em bits. É aqui que entra a profundidade de bits. A profundidade de bits determina quanta informação pode ser armazenada. Uma amostragem com profundidade de 24 bits pode armazenar mais nuances e, portanto, mais precisa do que uma amostragem com profundidade de 16 bits. Para ser mais explícito, vamos ver qual é o número máximo de valores que cada profundidade de bit pode armazenar.

16 bits: Somos capazes de armazenar até 65.536 níveis de informação

24 bits: somos capazes de armazenar até 16.777.216 níveis de informação

Você pode ver a grande diferença no número de valores possíveis entre a profundidade de dois bits.

Faixa Dinâmica:

Outro fator importante que afeta a profundidade de bits é a faixa dinâmica de um sinal. Um áudio digital de 16 bits tem uma faixa dinâmica máxima de 96dB, enquanto uma profundidade de 24 bits nos dá um máximo de 144dB. Áudio com qualidade de CD é gravado com profundidade de 16 bits porque, em geral, queremos apenas lidar com som que seja alto o suficiente para que possamos ouvir, mas, ao mesmo tempo, não alto o suficiente para danificar equipamentos ou tímpanos. Uma profundidade de 16 bits para uma taxa de amostragem de 44,1 kHz é o suficiente para reproduzir a frequência audível e a faixa dinâmica para a pessoa média, razão pela qual se tornou o formato de CD padrão.

Gravar em 192kHz / 24 bits?

Embora não haja limites para a taxa de amostragem e profundidade de bits, 192 kHz / 24 bits é o padrão ouro para áudio de alta resolução. (Já existem fabricantes promovendo a capacidade de profundidade de 32 bits) Usaremos 192kHz / 24 bits como referência para o auge da fidelidade de gravação.

Então, quando essa fidelidade é necessária?

Sabemos que quanto mais alta a taxa de amostragem e a profundidade de bits, mais semelhante nosso sinal digital será ao sinal analógico original. Mas também nos dá espaço extra. O espaço livre extra se refere à diferença entre a faixa dinâmica do sinal de áudio e o que é permitido pela profundidade de bits. É como dirigir um caminhão de 3 metros de altura por um viaduto com um vão vertical de 5 metros. Isso lhe dá 2 metros de altura livre para trabalhar, apenas no caso de você ter uma carga excepcionalmente alta para transportar.

A amostragem em 16 bits oferece aos engenheiros de áudio uma faixa dinâmica de 96db para trabalhar. Por outro lado, 24 bits aumenta a faixa dinâmica para até 144db, embora, realisticamente, a maioria dos equipamentos de áudio só possa ir até 125db. Com o headroom extra, os engenheiros de áudio podem minimizar, se não eliminar, a possibilidade de ruído excessivo ou corte , que ocorre quando as ondas sonoras basicamente se tornam achatadas e causam distorção audível.

O corte acontece quando o sinal elétrico de entrada não pode ser totalmente representado numericamente. Isso pode acontecer quando a profundidade de bits é rasa ou pouca, conforme imagem abaixo:

Como a faixa de sinal possível de equipamento de áudio profissional é muito maior do que a média de uma pessoa pode ouvir, o uso de 24 bits permite que os profissionais de áudio apliquem de forma limpa os milhares de efeitos e operações envolvidos na mixagem e masterização de áudio para torná-lo pronto para reprodução e distribuição .

Tamanho de arquivo maior:

Além do headroom potencialmente redundante, uma gravação de maior fidelidade cria um tamanho de arquivo muito maior.

Cálculo do tamanho do arquivo:

Para se ter uma ideia da diferença no tamanho do arquivo, vamos tentar criar um cenário hipotético envolvendo uma música não compactada de cinco minutos .

1) Primeiro, calcule a taxa de bits usando a fórmula frequência de amostragem * profundidade de bits * Nº de canais .

Premissa: áudio estéreo de 2 canais

44,1 kHz / 16 bits: 44.100 x 16 x 2 = 1.411.200 bits por segundo ( 1,4 Mbps )

192kHz / 24bit : 192.000 X 24 X 2 = 9.216.000 bits por segundo ( 9,2 Mbps )

2) Usando a taxa de bits calculada, nós a multiplicamos pela duração da gravação em segundos .

Divida megabit (Mb) por 8 para obter megabyte (MB)

44,1 kHz / 16 bits: 1,4 Mbps * 300s = 420 Mb ( 52,5 MB )

192kHz / 24bit : 9,2 MBps * 300s = 2760 MB ( 345 MB )

O áudio gravado em 192kHz / 24 bits ocupará 6,5x mais espaço do que uma amostra em 44,1kHz / 16 bits.

Então, quando você precisa gravar em 192kHz / 24 bits?

Tudo depende do que você deseja fazer com a gravação de áudio. Você deseja manipular a gravação e você tem armazenamento de memória ilimitado? Então esqueça 192kHz / 24 bits. Mas se você pretende entregar para o seu cliente em 192kHz / 24 bits ou disponibilizar em sites especializados áudios em alta resolução, aí sim !

O que é taxa de bits?

A taxa de bits (ou taxa de bits, se preferir) refere-se ao número de bits transmitidos ou processados por segundo, minuto ou qualquer unidade de tempo usada como medida. É como a taxa de amostragem, mas em vez disso, o que é medido é o número de bits em vez do número de amostras. A taxa de bits é usada mais comumente em um contexto de reprodução / streaming do que em uma gravação.

O termo taxa de bits não é exclusivo da indústria de áudio. Também é predominante em multimídia e redes. No entanto, na música, uma taxa de bits mais alta está comumente associada a uma qualidade superior. Isso ocorre porque cada bit em um arquivo de áudio captura uma parte dos dados que podemos usar para reproduzir o som original. Em essência, quanto mais bits você pode ajustar em uma unidade de tempo, mais perto se chega de recriar a onda sonora continuamente variável original e, portanto, mais precisa ela é como uma representação da música. Infelizmente, uma taxa de bits mais alta também significa um tamanho de arquivo maior, o que é um grande problema quando o espaço de armazenamento e a largura de banda são uma preocupação, como com serviços de streaming de música como Apple Music e Spotify.

Serviços de streaming de música

Na seção acima, vemos que para transmitir uma música não compactada de 5 minutos gravada em 44,1 kHz / 16 bits , será necessária uma taxa de bits de 1,4 Mbps, que é uma quantidade significativa de largura de banda. O Apple Music e o Spotify contornam esse problema de largura de banda compactando o áudio. Obviamente, a compactação de arquivos não vem sem consequências. Para começar, o Spotify limita a taxa de bits de arquivos de áudio a 160kbps para usuários de desktop e 96kbps para usuários móveis. No entanto, os assinantes premium têm a opção de ouvir áudio de 320 kbps em um desktop. Enquanto isso, os assinantes da Apple Music são “limitados” a uma taxa de bits de 256 kbps.

Acima, a qualidade de transmissão do Spotify

P.s: A Apple Music e o Spotify usam o formato AAC (Advanced Audio Coding) e o formato Ogg Vorbis, respectivamente, para seus serviços de streaming de áudio.

Também existem serviços de streaming de áudio para quem prefere ouvir música com taxas de bits mais altas. Tanto o TIDAL, Amazon Music Unlimited HD ( https://www.amazon.com/b?node=14070322011 ), quanto o Qobuz Sublime + são amplamente considerados os serviços de streaming de áudio preferidos para aqueles que preferem a melhor qualidade de streaming de áudio, com opções de Hi-FI disponíveis por uma assinatura mensal de US $ 19,99.

TIDAL suporta arquivos FLAC de 44,1 kHz / 16 bits que podem ser transmitidos a uma taxa de bits de 1411 kbps.

Acima o gráfico de qualidade do som das Tidal

Das duas, a assinatura TIDAL Hi-Fi oferece mais valor pelo dinheiro. Isso ocorre porque você obtém acesso a uma enorme biblioteca de arquivos FLAC de alta qualidade, bem como 50.000 músicas de qualidade master compactadas usando a tecnologia proprietária Master Quality Authenticated (MQA) para melhor qualidade de som.

A alta taxa de bits garante uma experiência auditiva superior?

Dado nosso exemplo anterior, uma música típica de cinco minutos a 44,1 kHz / 16 bits teria um tamanho de arquivo de 50+ megabytes descompactado. O codec MP3 foi desenvolvido para resolver esse problema, tornando possível compactar áudio com qualidade de CD sem grandes perdas de qualidade. Os primeiros codificadores de MP3 começaram com 128kbps ou 192kbps antes de finalmente passar para 320kbps para competir com outros codecs. No entanto, no streaming de áudio, Ogg Vorbis (Spotify) e AAC (Apple Music) são usados.

São de códigos aberto, de domínio público, e oferece alta qualidade em relação à largura de banda necessária para transmiti-lo. Experimentamos vários formatos de arquivo diferentes e fizemos outro ensaio há alguns anos, e o formato Ogg Vorbis saiu por cima.

Qualquer música com uma taxa de bits de 192 kbps ou superior se torna menos distinguível de seu áudio analógico original, desde que tenha sido devidamente codificada em um arquivo de áudio Ogg, AAC ou FLAC. Claro, isso não significa que uma taxa de bits alta não seja útil. Isso ajuda a garantir uma experiência auditiva superior. No entanto, isso só se aplica em situações mais específicas; Por exemplo, se você tiver um sistema de áudio Hi-Fi, fones de ouvidos de alta qualidade ou monitores profissionais em um ambiente acusticamente tratado que podem aproveitar as melhorias mínimas na qualidade do áudio ao fazer streaming de arquivos de áudio Hi-Fi.

Em geral, o ouvinte casual que usa um fone de ouvido comum ou o som do carro mais popular não se beneficiará com a transmissão de áudio maior do que 192 kbps.

Conclusão do autor

Em resumo, a taxa de amostragem é o número de amostras de áudio gravadas por unidade de tempo e a profundidade de bits mede a precisão com que as amostras foram codificadas. Finalmente, a taxa de bits é a quantidade de bits gravados por unidade de tempo.

Não foi tão difícil agora, foi? Daqui para frente, agora você deve ser capaz de pensar criticamente quando alguém lhe disser como um arquivo de áudio parece mais “claro” com base em seu processo de codificação. Mais importante, agora você deve achar mais fácil encontrar os formatos de áudio relevantes e serviços de streaming que atendam às suas necessidades auditivas.

Meus comentários extras

O mundo áudio está mudando e se reiventado, com isso aparecem mais consumidores vorazes por inovações, e mais plataformas se estruturam dispostas a ganhar financeiramente com essa revolução.

Tenho observado nos meus trabalhos e em minhas pesquisas aqui na Promaster studios em São Paulo que ja existem estúdios menores e técnicos de mixagens atentos a essas mudanças de qualidade e dos protocolos de áudio para as plataformas digitais, percebo isso na procura de meus serviços em masterizações e principalmente os indicados pela Tratore distribuidora. A nossa função como estúdio de masterização musical e entregar ao cliente o melhor som possível de suas mixes para a execução nos diversos tipos de plataformas musicais ( On lines e não On lines ), vale lembrar aqui que nem todas as plataformas on line normalizam o volumes das musicas ( não que isso tenha a ver com qualidade sonora ), outras como o Spotify já disponibilzam para seus assinantes premium a possibilidade de uma normalização com um certo ganho de volume na execução das musicas em relação ao não assinantes premium ( que são normalizadas de forma padrão em – 14 LFUs ).

Com relação a qualidade de execução musical, o consumo em alto padrão de taxa de amostragem sonora vem crescendo nos últimos anos, já existindo varios sites para esse fim como a Amazon Music Unlimited HD ( Com mais de 60 milhões de músicas em Alta Definição e milhões de músicas em Ultra Alta Definição – Que tem uma profundidade de bits de 24 bits, com taxas de amostragem que variam de 44,1 kHz a 192 kHz e uma taxa de bits média de 3730 kbps). Alguns estúdios já gravam em 192 Khz como o Play Co studio que para o som em Ultra HD ou HI FI esses áudios gravados em 192 khz devem ser mixados e masterizados sem alteração dessa taxa de amostragem.

O som nessa taxa é mais presente, mais definido e mais forte, e esses são detalhes importantes para o consumidor final mais específico e por consequência benéfico para a banda ou o artísta tambem.

Em minhas masterizações com summings analógicos, sempre porcuro fazer em 96 khz quando recebo as mixes em 48 khz, com isso elevo as definições do áudio ao passar por equipamentos analógicos ( compressor, equalizador e etc ), e na parte In the box ( ITB ) no Wavelab 9.5 eu cotinuo os processos restantes na taxa de 48 khz que após a aprovação do cliente, salvo em versões HI-FI ( 96 khz e 24 bits ) e nas demais versões em 48 khz e 44.1 khz, obedecendo é claro as configurações de cada plataforma onde a musica será executada.

*Compilação, tradução, revisão e comentários extras feitos por: Marlon Porto (técnico de mixagens e masterizações da Promaster studios).

Fontes: https://www.headphonesty.com/2019/07/sample-rate-bit-depth-bit-rate/

https://www.amazon.com/b?node=14070322011

Acesse o site para conhecer serviços ou cursos.