Anuncio topo
REPORTAGENS / Matérias Completas

#TBT Backstage: Psicoacústica

04/06/2020 - 14:45h
Atualizado em 30/07/2020 - 09:08h

 

Hoje o #TBT Backstage vai longe, quase 15 anos atrás, na edição 150, resgatar uma matéria bem atual sobre psicoacústica, com entrevistas da nata do áudio, da música e das universidades. E por que atual? Em tempos de realidade aumentada e som imersivo, os princípios da psicoacústica, mais do que nunca, são aplicados em nosso dia a dia. Mas o assunto já é estudado há mais de 80 anos. Quer saber mais? Pode ler aqui!

 

 

Não podemos acreditar em tudo o que vemos, certo? Mas também não podemos acreditar em tudo o que ouvimos. As limitações de nossos ouvidos também são usadas para criar uma série de “mágicas”. Afinal de contas, o ouvido percebe apenas uma porção da informação de um sinal de áudio. Assim como no cinema, as limitações dos nossos olhos em perceber todas as etapas do movimento são utilizadas para tornar possível a sensação de movimento de um filme, o nosso ouvido pode ser “enganado” para criar uma série de sensações acústicas. Com isso, se podem fazer pequenos – porém complexos - truques que podem tornar o ato de ouvir algo muito mais fascinante do que vibrações no ar balançando nossos tímpanos. Ou não podemos chamar de mágica colocar dez mil músicas em um minúsculo aparelho e o som ainda ser bom? Ou entrar em uma sala escura e, praticamente, participar de batalhas espaciais por meio de sons que nos colocam dentro da ação?

 

 

Psicoacústica no áudio nosso de cada dia

Temos a capacidade de distinguir se o som chega da esquerda ou da direita, de cima ou de baixo, se está longe ou perto, e de perceber a altura deste. Também ouvimos melhor as freqüências médias do que as graves e agudas, e se ouvimos mais de um som ao mesmo tempo, o mais forte inibe o mais fraco. Todas essas propriedades são estudadas pela psicoacústica. Por conta delas, nem sempre o que seria exato na teoria é o que parece correto à nossa audição. “Acho difícil conceber que algo é essencialmente teórico. Por exemplo: se estudamos os efeitos da audição estéreo para entendermos como esse fenômeno ocorre, e a partir de sua compreensão aprendemos a manipular as sensações de espacialidade e direção, como podemos chamar isso apenas de teoria se nasceu exatamente da observação e do estudo dos fenômenos naturais com os quais convivemos diariamente? Acredito que o conhecimento nos leva à compreensão e ao domínio daquilo que nos interessa e, nesse sentido, é fundamental àqueles que desejam melhor qualificação profissional e que, por conseqüência, lhes trará melhores resultados práticos”, explica Marcelo Claret, soundesigner e professor do IAV.

 

Claret considera que estereofonia, efeito Haas – importante na localização de uma fonte sonora em um ambiente reverberante (ver box) – e a forma como isso influencia as questões estéticas e artísticas que trazem mais realidade aos eventos acústicos são o básico que um técnico deve saber.

 

Um bom exemplo de psicoacústica no áudio cotidiano é o que acontece na mixagem de uma gravação multicanal. A equalização dos instrumentos não deve ser feita pensando neles individualmente. “A composição dos diversos sons resulta numa percepção diferente da soma do que seria ouvido individualmente”, explica Luiz Wagner Biscainho, pesquisador do Laboratório de Processamento de Sinais na Universidade Federal do Rio de Janeiro (UFRJ). Segundo ele, é preciso compensar ou utilizar diversos efeitos psicoacústicos durante a mixagem. Outra situação interessante é a da afinação de um piano, instrumento de extensão grande. Por motivos ainda não muito explicados, existe uma diferença entre a freqüência emitida e a percebida, que é chamada de pitch (ver box). Isto significa que o uso de afinador eletrônico não é a melhor maneira de afinar um piano. As notas da região aguda têm de ser afinadas um pouco acima do que seria “correto”; as mais graves, um pouco abaixo.

 

 

Há outros bons exemplos de aplicação das propriedades da psicoacústica, como a codificação perceptual, que é um sistema que reduz os dados de um arquivo de áudio sem que a qualidade dele fique sensivelmente alterada (ver entrevista de Regis Rossi e box). Para fazer isso, é usado principalmente o princípio acústico do mascaramento, onde um som mais forte inibe a percepção de outro mais fraco. Quanto mais próximos são os estímulos sonoros na freqüência ou no tempo, maior é o efeito de mascaramento. Ao se fazer a compressão de áudio de um arquivo digital, o princípio é “não codificar o que não será percebido”. Ou seja, a informação que não será percebida é retirada do arquivo. O MP3, por exemplo, é um sistema que se utiliza desta ferramenta. O Dolby digital, formato largamente utilizado para som 5.1 em cinemas e home theaters também. Nele, a informação chega a ser reduzida de 12 a 15 vezes sem que haja uma perda sensível de qualidade. Isto é o que permite a colocação de som e imagem no espaço de um DVD e faz com que milhares de arquivos de música caibam em um MP3 player.

 

A psicoacústica também é importante para simular um ambiente sonoro em três dimensões. Os conceitos envolvidos são a diferença de tempo interaural – o som mais à esquerda ou à direita da pessoa chega mais cedo à orelha que fica do mesmo lado do som – e a diferença de intensidade interaural – o som mais à esquerda ou à direita da pessoa chega mais forte à orelha que fica do mesmo lado do som. Neste caso, é possível fazer uma analogia com a visão: usamos dois olhos para perceber a profundidade (da imagem) assim como usamos dois ouvidos para perceber a profundidade de um ambiente sonoro. Marcelo Claret resume a psicoacústica: “Acho que o principal é entendermos que quem ouve efetivamente é o cérebro. Portanto, tudo o que estudamos em psicoacústica tem por objetivo alcançar efeitos de similaridade que nosso cérebro interprete como algo concreto, real, mesmo que saibamos tratar-se de uma ilusão”.

 

 

No cinema, o som faz a emoção do espectador

Ouvir é muito mais que a sensação das ondas sonoras entrando nos ouvidos. É também o que ocorre quando o som chega ao nosso cérebro. É a partir daí que o sinal acústico ganha sentido. A psicoacústica trata da interpretação que o ser humano faz dos estímulos auditivos. “Somente quando entendemos o que está sendo dito, ou reconhecemos uma música, é que conseguimos nos remeter ao lado emocional, trazendo algum significado, seja ele positivo ou negativo. Sem significado, não existe interação com o meio ambiente”, diz a fonoaudióloga Katya Freire.

 

 

Não é só na espacialização sonora e compressão de dados que é aplicada a psicoacústica. Quando o espectador entra na sala escura do cinema ele chora, ri, sente raiva e se envolve com as emoções que o diretor do filme quis passar. Essas reações não são provocadas apenas pelas imagens. A trilha musical, os efeitos sonoros, a musicalidade dos diálogos e o conceito de mixagem têm papel fundamental no envolvimento do espectador. “Quando escutamos uma música, ocorrem automaticamente respostas promovidas pelo sistema nervoso central mediante ao estímulo musical. Este processo é complexo e depende da interpretação dessa informação musical junto a uma carga individual que pode ser genética, adquirida e cultural”, diz Katya Freire. E isto se aplica perfeitamente no cinema.

 

José Luiz Sasso trabalha atualmente no filme Corpo, de Rubens Rewald e Rossana Foglia. O enredo gira em torno da procura da identidade de um corpo encontrado em estado perfeito numa vala comum da época da ditadura militar. A maior parte do filme se passa em uma sala do IML. Sasso explica que os diretores queriam um clima tenso e angustiante na sala gélida do necrotério: “Isso foi feito por meio do uso de ruídos de baixa freqüência, que remetem a coisas desagradáveis”. Para construir esse clima, ele misturou sons de motores de frigorífico, de starter de lâmpadas fluorescentes com defeito e outros pequenos ruídos, tendo cuidado para que um não anulasse o outro. No processo de arquitetura sonora do filme, Sasso manteve um intenso diálogo com os diretores e o editor de som Eduardo Santos Mendes.

 

 

Na hora da mixagem de um filme, o critério depende do objetivo do diretor. No caso de Corpo, Sasso evitou a pirotecnia sonora: “Se o foco é no texto, a pirotecnia pode acabar criando obstáculos para a compreensão dos diálogos”, explica. Mas em filmes de efeitos especiais, como X-Men, “a pirotecnia é linguagem”, complementa.

 

 

2001 e Psicose

Sasso lembra de um caso clássico de construção do ambiente sonoro: o filme 2001 – Uma Odisséia no Espaço, do diretor Stanley Kubrick. O filme tem uma trilha sonora composta especialmente para ele. No entanto, o diretor abriu mão da música e optou pelo silêncio para pontuar as sensações de opressão e solidão provocadas pela viagem espacial: “Por incrível que pareça, o silêncio é o som mais importante do filme”, diz o técnico.

 

O compositor David Tygel tem vasta experiência na composição de trilhas sonoras. Fez a música de O Homem Nu, de Hugo Carvana, e de Lamarca, de Sérgio Rezende. Ele explica que há duas formas de se compor para um filme: fazer a música para acompanhar a ação ou pontuar a narrativa psicológica. No primeiro caso, enquanto o personagem corre, pode-se tocar uma música rápida, de ação. No segundo, a música pode ser devagar, em sintonia com o estado de espírito do personagem, no contexto geral do filme.

 

 

David conta que um exemplo clássico deste tipo de trilha é a da famosa cena do assassinato no chuveiro no filme Psicose, de Alfred Hitchcock. A pontuação musical com os violinos angustiados foi composta por Bernard Herrmann. O compositor usou acordes com terça menor e sétima maior, que criam uma sensação de indefinição pelo contraste tonal: “Ele tirou as melodias e trabalhou mais os climas. Herrmann não queria que a música superasse o filme e que as pessoas saíssem do cinema assoviando melodias. Ninguém pagaria para assistir a um concerto com a música de Psicose, mas é a maior associação (de uma música com uma cena) da história”, comenta o músico.

 

 

Vendo a música e ouvindo a imagem

Já há algum tempo não temos mais o hábito de somente ouvir música. Com a propagação do DVD, a imagem tomou conta do mercado fonográfico. Neste segmento, a espacialidade do áudio, com a difusão dos sistemas 5.1 no mercado e mesmo com o som estéreo, é o aspecto da psicoacústica mais presente no trabalho cotidiano do técnico, “principalmente nas mixagens onde se consegue a tridimensionalidade com apenas dois canais. Profissionais que atingem esse grau de sofisticação numa mixagem estéreo terão experiências interessantes no surround e certamente estarão à frente daqueles que ainda não aprenderam como criar essas dimensões usando apenas dois canais”.

 

De qualquer forma, trabalhar em estéreo e em 5.1 são duas coisas diferentes. “Já houve muita discussão sobre isso nos congressos de áudio e parece que se chegou ao consenso que são dois processos de mixagem distintos. Pode-se fazer uma mixagem em surround a partir de uma estéreo, mas dessa forma ficamos limitados à maneira de conceber aquela mixagem em dois canais. Por outro lado, se você encará-los como dois produtos completamente diferentes, talvez consiga resultados estéticos surpreendentes”.

 

 

Mixando o som com imagem

Flávio Senna não esquece da primeira vez que fez uma mixagem olhando uma imagem. No final do trabalho, antes que qualquer outra pessoa ouvisse, colocou o CD em seu carro: “Vi que todos os solos e vozes estavam baixos, porque quando você mixa vendo a imagem, faz leitura labial. Você vê o solo da guitarra e ela fica mais alta”, comenta o técnico, que ainda fala de outra situação interessante: “Eu estava ouvindo um 2.0 do George Benson. Um dia, vi o DVD. Havia um músico tocando uma conga que eu nunca tinha ouvido. Depois também passei a escutar esta conga no CD. Quando você vê, as coisas se definem mais”, afirma Flávio. O técnico já mixou DVDs de Zeca Pagodinho e Fernanda Abreu, além de seu mais recente trabalho, o DVD de Ivete Sangalo no Maracanã.

 

 

A masterização deste DVD foi feita por Carlos Freitas, que tem a experiência de ouvir as mais diversas mixagens em 5.1: “Com o DVD, a imagem te induz a entrar no áudio”, diz o técnico. “No DVD da Ivete, por exemplo, fiz masterizações diferentes para o som estéreo e o do 5.1. Na primeira, procurei fazer uma um pouquinho mais nervosa, dando a impressão de que o show é pulsante, mas sem me preocupar com a espacialidade. Já na masterização do 5.1, nos preocupamos muito mais com essa sensação de que o ouvinte está no local do show. É uma diferença gritante”, diz Carlos.

 

 

Conseguindo a melhor ambiência

Para conseguir este efeito, Flávio procura ver o tamanho do lugar em que vai ocorrer o show. Depois escolhe um lugar de referência a partir do qual o espectador do DVD vai ouvir o som – tudo isto para planejar a gravação. Depois, na mixagem, manipula as condições sonoras com duas Lexicon 480, uma Lexicon 960 e um TC 5000. “Este é o meu kit básico. Uso isso somado com o ambiente do local. Às vezes, quando o lugar não é muito propício para gravação, ou a microfonação não fica tão boa, vou para o estúdio e simulo (a espacialidade)”, testemunha ele.

 

Usar as poderosíssimas máquinas digitais sempre é boa estratégia, mas a satisfação de Flávio com o resultado da mixagem do DVD de Ivete Sangalo o convenceu de uma vez por todas que, para criar um ambiente de acordo com o local do show, o ideal é sempre uma boa microfonação: “Com as ferramentas, eu consigo criar os ambientes. Mas quando se consegue fazer a captação de espacialidade como a que aconteceu no Maracanã, se percebe que máquina é muito mais artificial do que se pensava, mesmo as de última geração”, se espanta Flávio.

 

Na hora de mixar, o técnico manteve, inclusive, as características do delay do estádio. “Andei no gramado, nas arquibancadas, vi as torres de delay funcionando, tenho memória auditiva boa. Tive como ouvir as reflexões. Aquela sensação do som do P.A.indo e voltando é que faz você ter noção do tamanho do Maracanã. Então usei isso. É claro que dificulta. São cinco reflexões de delay (palco, marquise, palco) e cinco tempos diferentes. É meio complicado, mas dei sorte em conseguir um equilíbrio bom para isso”. No entanto, Flávio tomou alguns cuidados: “É claro que você prioriza isso nos inícios e finais das canções, nas que acabam para cima, naquela pancada”, comenta. “Hoje, mais do que nunca, volta a velha história: nada como uma boa microfonação. Você tem todas as máquinas, condições digitais e vê que quando microfona bem um ambiente, nada chega perto daquilo”, finaliza.

 

 

 

Psicoacústica no teatro

No som ao vivo, os parâmetros de psicoacústica são mais manipulados mesmo em trabalhos como musicais de teatro. “Uma das coisas mais interessantes que existem é quando o teatro dispõe de fosso para a orquestra. Essa configuração possibilita muitos efeitos de psicoacústica”, explica Claret. Neste caso, as pessoas nas primeiras fileiras ficam muito próximas ao som acústico da orquestra e precisam de reforço do som das vozes dos atores. É feito então um alinhamento específico para este local. “Com o alinhamento e posicionamento corretos das caixas – que normalmente ficam a um ou dois metros dessas fileiras – consegue-se dar a ilusão de que elas estão desligadas e que o som vem direto da boca do ator. Recentemente, um diretor de teatro chegou a perguntar aos técnicos durante o ensaio se as caixas tinham sido ligadas, porque ele não estava ouvindo o som “saindo” delas. Foi motivo de comemoração, pois provou que o alinhamento estava absolutamente correto”, diz Claret.

 

Essas são algumas das situações em que, às vezes, sem perceber, o técnico lida em seu cotidiano com a psicoacústica. São várias possibilidades para que os ouvintes – ou, às vezes, também espectadores – podem ser envolvidos pelo som de forma que aproveitem ainda mais o prazer de escutar. E isso tudo nas mãos do profissional de áudio. “Acho que a partir do momento que mostramos que é possível ouvir um show, um espetáculo ou qualquer outra forma de expressão artística que necessita de áudio, com nível de qualidade excelente, estabelecemos um novo parâmetro para as pessoas comuns e elas percebem e começam a exigir mais qualidade. Quem é que não critica uma sala de cinema onde o som estava ruim?”, fnaliza Claret.

 

 


 

O 5.1 trazendo recursos para o som de cinema

Até a década de 70, em geral o som era mono com faixa dinâmica de cerca de 55 dB e resposta de freqüência por volta de 60 Hz a 6 kHz. Para se ter uma idéia do que isto representa, basta saber que a resposta de freqüência no formato Dolby 2.0 é, em valores aproximados, de 35 Hz a 12 kHz e no 5.1, de 20 a 20.000 Hz. “A difusão do formato 5.1 foi importante para que houvesse mais recursos na criação de um ambiente sonoro. Afinal de contas, são cinco canais a partir dos quais é possível construir uma panoramização”, comenta o técnico de mixagem José Luiz Sasso. O 5.1 trazendo recursos para o som de cinema. 

 

No Brasil, a base de trabalho é o formato Dolby 5.1. Depois, é feita uma redução para o 2.0, na qual há perdas tanto no range de freqüências como na faixa dinâmica. “Isso faz diferença na criação do ambiente sonoro”, esclarece o técnico. Para construir a espacialidade de um filme, Sasso costuma usar efeitos do TC 6000, da TC Electronics, mixando em uma mesa holandesa Cinemix 5.1. “Em filme onde o som direto era de lapela (sem captação o vazamento de ambiente em uma catedral), os reverbs foram recriados no ambiente de trabalho usando os equipamentos TC 6000 ou Lexicon”.

 


 

Som “espacial”

A “brincadeira” com a espacialidade sonora se inicia desde o fim do século 19, mas começa a ficar séria com a invenção do som estéreo em 1931. Só em fins da década de 50 o som estéreo começa a se propagar no mercado fonográfico, até chegar à quadrafonia na década de 70. O histórico disco de Pink Floyd, The Dark Side of The Moon, foi lançado neste formato, um antecessor do 5.1 que há hoje em home theaters. “Nos anos 70, a quadrafonia entregava quatro canais, mas, além de ter surgido em diversos formatos incompatíveis, era criticada por só permitir a reprodução correta no centro do quadrado formado pelos alto-falantes”, explica Biscainho. O formato também não teve futuro por conta das limitações Som “espacial” da mídia de reprodução da época: o vinil. Era difícil fazer o corte de um disco com quatro canais. 

 

A primeira experiência com algo parecido com o som surround que temos hoje foi em 1940, no lançamento do desenho animado Fantasia, da Walt Disney. O sistema sonoro se chamava Fantasound e tinha a intenção de reproduzir a exuberância sonora da orquestra sinfônica que tocava no filme. O pan, por exemplo, que dá a sensação de que um determinado instrumento está mais para um lado que para o outro, foi uma das criações feitas para este filme. O surround que conhecemos surgiu na década de 70, com o Dolby Surround. A partir de 1994, aconteceu a popularização do formato 5.1, usado em larga escala até hoje.

 


 

Conceitos de psicoacústica

 

Luiz Wagner Biscainho descreveu alguns dos fenômenos mais populares estudados pela psicoacústica:

 

Audibilidade
Descreve a intensidade com que se percebe o som, em função de sua freqüência e de sua potência.
- A intensidade com que se começa a ouvir um tom varia com a freqüência.
- Considerando estímulos de mesma potência sonora, a intensidade com que se percebe o som é maior nas freqüências médias que nas baixas e altas.

 

Mascaramento
É a propriedade de um som mais forte inibir a percepção de outro mais fraco. Quanto mais próximos os estímulos na freqüência ou no tempo, maior é o efeito de mascaramento.
- Um tom de alta intensidade pode inibir inteiramente a percepção de outro tom de baixa intensidade em freqüência próxima.
- Um pulso de alta intensidade pode inibir inteiramente a percepção de outro pulso de baixa intensidade que ocorra pouco depois ou pouco antes (!) dele.

 

Percepção de altura do som
A altura (de grave a agudo) percebida do som é a definição moderna de “pitch”. Poderíamos dizer que ouvimos uma altura aparente, que difere da altura “física” em Hz. Por exemplo:
- Uma mesma nota musical reproduzida com intensidade variável é percebida com altura variável. - A oitava percebida se distancia da oitava física conforme o estado de cansaço do ouvinte.
- A diferença entre a altura percebida e a altura “física” varia com a própria freqüência. - Uma série harmônica f0, 2f0, 3f0, 4f0, tem “pitch” f0, mesmo se a componente f0 for removida Conceitos de psicoacústica

 

Localização espacial do som
Vários fatores que afetam a percepção de azimute (esquerda-direita, frente-atrás), elevação (alto-baixo) e distância da fonte sonora em relação ao ouvinte.
- Diferença de Tempo Interaural - sons mais à esquerda/direita chegam mais cedo à orelha esquerda/ direita que à orelha direita/esquerda.
- Diferença de Intensidade Interaural - sons mais à esquerda/direita chegam mais fortemente à orelha esquerda/direita do que à orelha direita/esquerda.
- Forma da orelha externa - em cada orelha, as ressonâncias características são alteradas pela direção (de cima ou de baixo) de chegada do som.

 

Efeito Haas
Efeito Haas, descrito por Helmut Haas em 1949, é o efeito da precedência, ou lei da primeira frente de onda.
- Se um estímulo sonoro chega ao ouvinte de duas fontes com um intervalo de tempo suficientemente pequeno, sua direção de origem será associada à primeira fonte, facilitando a localização de uma fonte sonora em ambiente reverberante.

 

Efeito Doppler
Fenômeno físico conhecido que explica que o”pitch” de uma fonte sonora aumente quando ela se aproxima e diminua quando ela se afasta do ouvinte. Em psicoacústica, descreveu-se o “Doppler ilusório”: variando-se dinamicamente a potência de um tom cuja freqüência varia ligeiramente, é possível intensificar ou até reverter a percepção da variação de “pitch”. Nesse caso, ele se liga mais a percepção de altura que de posição

 


 

 

MP3, iPod, AAC... O que isso tem a ver com psicoacústica? Regis Rossi, pesquisador associado do Laboratório de Sistemas Integrados (LSI) da USP, explica como o princípio do mascaramento ajuda a fazer os formatos de compressão de dados de áudio e sobre o projeto Audience, de som em 3D.

 

Dentro das aplicações no ramo de engenharia, a psicoacústica fornece ferramentas para eliminar das informações de áudio a parte que não é ouvida. Isto é estudado em uma linha de pesquisa que se chama Codificação Perceptual. A partir daí nasceram formatos como o MP3 e outros que podem ter o tamanho dos arquivos diminuídos em 10, 12 vezes ou até mais mantendo uma qualidade satisfatória do áudio. É feita uma análise de freqüências a partir da qual se escolhe as que podem ser eliminadas sem que o ouvido perceba, preservando a qualidade do som. “Essas ferramentas vem evoluindo rapidamente e de maneira muito eficiente nos últimos dez anos”, comenta Regis Rossi.

 

Onde são aplicados estes formatos comprimidos de áudio?
Regis Rossi -
A quantidade de aplicações é muito grande. Os mercados fonográficos de cinema e de telecomunicações aplicam intensivamente. Hoje está crescendo muito o mercado de música digital, e música digital hoje se vende em formato comprimido. Existem vários formatos: o MP3, o MP2 que é usado ainda, os formatos proprietários como o WMA, da Microsoft, o AAC, sucessor do MP3, o formato utilizado pela Sony, que é o Atrac, usado no Minidisc, e existem alguns outros por aí com uma penetração menor mas que são até mais antigos que o MP3, isto sem citar os codecs de voz.

 

Há diferença de qualidade entre eles?
Regis -
Todos têm diferenças de qualidade. Todos se comportam diferentemente em relação ao tipo de material sonoro e isso é muito comum. Por exemplo, você pode pegar o WMA saindo-se muito bem para codificar em uma determinada taxa de bits (kbits por segundo) e naquela mesma taxa o MP3 pode ter uma qualidade pior. Pode ser que o WMA não se comporte muito bem para instrumento de sopro tocando em um ambiente reverberante e o MP3 se saia bem. Então, dado que o funcionamento deles tem sempre peculiaridades e diferenças, também produzem qualidades diferentes. Mas isso é importante de dizer: a qualidade depende do material sonoro. Eu acho que o AAC é o que tem melhor qualidade no momento. E ele continua em evolução. O AAC High Efficiency (HE) foi criado para reduzir ainda mais o tamanho dos arquivos. Ele usa uma ferramenta muito interessante chamada SBR (Spectral Band Replication). Ela é usada em conjunto com o AAC base e a associação dessas ferramentas gera um perfil novo do AAC, que é o perfil High Efficiency. Ele permite que você tenha uma qualidade de áudio aceitável, por exemplo, de 32 a 48 kbits por segundo. Aquilo que você ouve hoje com 128 kbits por segundo em uma faixa MP3 pode ter uma qualidade muito próxima com o AAC-HE a 48 kbits por segundo. Existe também o Dolby AC-3, que tem uma vasta penetração no mercado cinematográfico, que é o famoso Dolby Digital, que tem em qualquer DVD. Tem também o DTS, que junto com o Dolby são os dois formatos mais usados no mercado de cinema. O DTS particularmente tem uma qualidade melhor que o Dolby, até porque sua taxa de bits é maior.

 

su

 

Todos esses sons digitais são comprimidos de alguma forma?
Regis -
São. Só lá no monitor dentro do estúdio que está fazendo a gravação é que você vai escutar o som sem compressão alguma de dados. O DVD é comprimido, o som que uma emissora de TV passa de um filme que ela comprou de Hollywood é comprimido, o som de rádio digital é comprimido, o de telefonia celular é extremamente comprimido.



Os mais usados hoje são então MP3, AAC, WMA, DTS...
Regis -
O AC-3 e também o Atrac. A Sony, a maioria dos MP3 dela utilizam o Atrac, porque o formato é dela. Mas existem outros formatos que são muito mais avançados. Eu trabalho com AAC, mas em um nível muito mais avançado: o AAC surround 5.1 e estou interessado também em trabalhar com codificadores para multicanal, com um número elevado de canais. O projeto que eu desenvolvo na USP é para desenvolver sistemas para produção e reprodução de áudio multicanal e som espacial (áudio 3D).

 

Para gravar, mixar e produzir?
Regis -
E poder disponibilizar esse material em multitrack para que, na reprodução, possa fazer o que a gente chama de áudio imersivo. O surround é “envolvente”, só que tem várias limitações técnicas no som surround. Primeiro, ele é plano. Você não escuta coisas de cima nem debaixo, ele não reconstrói campos sonoros 3D realisticamente, ele simplesmente explora o panorama estéreo e recria algumas ambiências, dá uma noção de reverberação, pode ser bom para criar efeitos do tipo vozes na frente, movimento de uma coisa passando de uma caixa para outra, efeitos, ele é ótimo para fazer isso, mas ainda está longe de ser um sistema realista onde você tem realmente a percepção de ter o som acima, atrás, do lado e construir uma cena virtual. Para isso, vai precisar de outros formatos.

 

 

Em que aplicações específicas podem ser usados os formatos comprimidos em multicanal? Gravação à distância, por exemplo?
Regis -
Há uma grande possibilidade de aplicações dessas tecnologias, muitas delas ainda não nasceram. A futura TV digital se beneficiará dos formatos de codificação surround mais avançados. Os formatos de grande compressão e alta qualidade permitem sim que músicos possam trabalhar colaborativamente à distância, inclusive considerar gravação à distância. É claro que um sistema assim não é só o codec, mas este é o coração para garantir qualidade em tempo real. Além desses existem iniciativas do grupo ISO/MPEG, que é o pai do MP3 e do AAC, para o desenvolvimento do MPEG Surround e sistemas para áudio espacial orientado a objetos, isto é, fontes sonoras individuais. As aplicações são em espacialização sonora e realidade virtual. Nós aqui temos desenvolvido um sistema para edição de palco sonoro interativo, num projeto que se chama Audience. Qual a relação dos formatos comprimidos de áudio com o projeto? Regis - Os formatos comprimidos tornam possível codificar e transmitir um número elevado de canais entre os componentes e blocos processadores do sistema utilizando uma banda razoável. Isso não seria factível com áudio não comprimido. Entretanto, como cada codec interfere na qualidade e fidelidade do sinal de forma diferente, é importante pesquisarmos quais são mais adequados para cada finalidade.

 

Como funciona o sistema?
Regis -
Trata-se de um sistema integrado de software e hardware. O software permite a integração com uma aplicação sonora, faz a composição da cena sonora que se deseja ouvir, processa a simulação acústica da cena, codifica os sons de cada fonte sonora num formato que permite a representação temporal e espacial do som e, finalmente, decodifica e reproduz o campo sonoro final através de alto-falantes, que podem estar montados em diversas configurações possíveis, inclusive em 5.1. O hardware consiste na integração de placas de som e amplificadores multicanal, mais um sistema de distribuição multicanal por cabos até cada alto-falante.

 

Como é produzida a sensação de áudio em 3D?
Regis -
Existem muitas formas, na verdade, de se produzir sensações de envolvimento sonoro e também a real percepção do áudio 3D. No Audience temos utilizado um formato de codificação espacial muito elegante, chamado Ambisonics. Nas camadas de simulação acústica e codificação espacial o software permite orientar a direção, calcula a intensidade e a temporização de cada som que se propaga pelo ambiente sonoro virtual que está sendo simulado. 

 

Quais as aplicações práticas desta pesquisa?
Regis -
São muitas. Como objetivo de qualquer projeto de pesquisa e desenvolvimento, temos a meta de produzir inovações e melhoramentos no estado da arte que possam ser incorporados pela indústria em novos sistemas de som, seja para produção, para distribuição ou para reprodução final. O sistema Audience nos permite pesquisar e produzir desenvolvimentos importantes em diversas áreas de áudio, como em composição, produção musical, edição de palco sonoro, criação de ambiências especiais e peças eletroacústicas sofisticadas, permite-nos testar e aprimorar técnicas de codificação de áudio modernas, como o AAC, o MPEG Surround, permite-nos utilizar técnicas de simulação acústica e codificação surround, como o Ambisonics e o Wave Field Synthesis, e finalmente permite-nos conceber projetos elaborados de sonorização multicanal utilizando um número escalável de altofalantes em diversas configurações possíveis, indo de estéreo até a um número bem elevado de canais. O foco final é sem dúvida a alta fidelidade, alta qualidade e realismo sonoro.

 

 

Há pesquisas similares fora do Brasil? O que o projeto Audience tem de diferente das pesquisas no exterior?
Regis -
Há muita pesquisa realizada no exterior nas diversas áreas que o Audience aborda, grande parte delas encomendadas pela indústria e realizadas em parcerias com universidades e centros de pesquisas. As pesquisas costumam focalizar aspectos puros de pesquisa básica, mas a maioria é orientada a aplicações e desenvolvimentos específicos, que permitem melhorar as técnicas de áudio e levam a produtos novos. Há também pesquisas importantes nestas áreas em realização por grupos no Brasil. Existem muito poucos projetos, entretanto, com a temática integrada de produção, distribuição e reprodução como ocorre no Audience. Nosso diferencial é estarmos desenvolvendo software e componentes seguindo uma arquitetura de sistema própria, que foi proposta por nós, e estarmos pouco a pouco demonstrando seus acertos e valor. Lá fora os grupos estão muito mais conectados com as empresas, que investem realmente em desenvolvimentos de tecnologia e protótipos, pois sabem que isso é o diferencial para lançar novos produtos que a concorrência não tem. Aqui esta cultura é um pouco tímida ainda, o que reflete numa também tímida inserção de inovações no mercado internacional.

 


 

  • COMPARTILHE
voltar

COMENTÁRIOS

Nenhum cadastrado no momento

DEIXE SEU COMENTÁRIO

Escreva sua opinião abaixo*