3.1 F RISKGÅRDENS TILTAK « ARBEIDSRETTET REHABILITERING »:
3.1.2 I NNHOLD I TILBUDET
Acker (1987) em um estudo preliminar com uma professora e atriz treinada pelo método Lessac (1967) verificou por meio das análises perceptivo-auditiva e acústica, e RX lateral, se existe um efeito de ressonância associado às mudanças da forma do trato vocal entre dois tipos de emissão projetada da vogal /o/: em ring - faringe e/ou a laringe aberta - e com constrição - faringe e/ou laringe tensa. Este efeito de ressonância faria com que a voz em ring fosse percebida como mais forte. As gravações foram julgadas por 10 sujeitos treinados que deveriam avaliar somente a loudness e não a qualidade da voz. 80% dos juízes selecionaram a emissão em ring como sendo mais forte e referiram que lhes dava uma sensação de vibração, de som claro, forte e não abafado. Na espectrografia, a amplitude relativa dos harmônicos for calculada, e o envelope de espectro mostrou uma queda a partir do quinto harmônico (1360Hz) nas emissões em ring, enquanto nas emissões tensas a amplitude caiu a partir do terceiro harmônico (816Hz). O ring teve maior amplitude na região de 1.3kHz, 2kHz e em 3.6kHz, um nível de pressão sonora maior - em média 3.8dB mais forte - e no RX, a abertura da mandíbula foi maior, a laringe mais alta e a língua mais afastada da parede da faringe. As semelhanças entre os envelopes de espectros sugerem a não existência de diferença de loudness entre as duas produções. O autor, com base nos seus resultados, questiona se esta percepção de loudness aumentada na emissão em ring estaria relacionada com o aumento de energia na região mais grave do espetro, resultado de uma determinada configuração do trato vocal, mais aberto, mais relaxado, e que propiciaria um efeito de ressonância – F1 próximo de f0 - ou se estaria relacionada com uma diferença na qualidade da voz evidenciada por uma inclinação menos acentuada da curva do espectro e que seria resultado da fonte glótica. Conclui que é preciso de uma casuística maior para que se possam
estabelecer correlações entre os aspectos fisiológicos, acústicos e perceptivo-auditivos destas emissões. O ring para Arthur Lessac (1967) é produto de um ajuste articulatório muito específico onde a mandíbula está bem aberta, os lábios arredondados e protruídos, a ponta da língua avançando sobre os dentes incisivos inferiores, o dorso da língua abaixado, o palato mole elevado. Existe uma sensação subjetiva de garganta aberta e ainda, o falante deve sentir uma sensação forte de vibração na cavidade oral. A voz do ator, quando bem projetada, apresentaria este ring.
Raphael e Scherer (1987) em outro estudo preliminar que envolveu 4 atores americanos – 2 homens e 2 mulheres - treinados pelo método Lessac (1967) avaliaram por meio da análise acústica as emissões em modo habitual e em call.- outra técnica do Método Lessac (1967). Os resultados apontaram para diferenças significantes inter-sujeitos quando comparadas as emissões: a região do F1 despontou no call e diminuiu na região do segundo formante, o que acabou por acentuar o primeiro formante. Segundo os autores nesta emissão ocorreu um ajuste entre F1 e segundo harmônico quando o ator “aumentou a abertura da mandíbula, protruiu os lábios, relaxou a língua e manteve a faringe aberta”. Já a energia na faixa de freqüência de 2.150 e 2.350Hz, região do F3, foi relativamente maior para três dos quatro sujeitos. A projeção do F1 e este pico de energia na região de F3, embora não coincidentes com o “formante do cantor” sugerem ser este aspecto importante para a percepção de uma voz projetada do ator.
Leino (1993), no primeiro artigo que buscava a existência de um “formante do ator”, investigou se o Long term average spectrum seria uma ferramenta eficiente para esta tarefa. 48 atores finlandeses foram então gravados e classificados auditivamente por profissionais da área em quatro grupos: vozes muito boas, razoavelmente boas, razoavelmente ruins e ruins. Os resultados indicam que o LTAS é um instrumento adequado para diferenciar estas qualidades de voz de acordo com os seguintes parâmetros: inclinação do envelope de espectro e o pico em 3.5kHz. O envelope do espectro diferenciou vozes muito ruins das outras vozes, mas não diferenciou entre si as vozes muito boas, razoavelmente boas e as razoavelmente ruins vozes. E o pico em 3.5kHz, calculado a partir da diferença entre o pico mais forte do espectro (região de F1) e o pico em 3-4kHz, caracterizaria o “formante do falante” ou “formante do ator” (FA), principal característica acústica das vozes muito boas. Este pico variou entre -15 e -25 dB para as vozes muito boas e ainda, quanto maior o pico, mais acentuado as regiões de vale que o circundavam, chegando a 10dB esta diferença entre pico e vale. Já para as vozes pobres, ficou em - 30dB. Segundo o autor, o “formante do ator” é mais fraco e está localizado quase que 1kHz acima do “formante do cantor”, podendo ser uma
fusão entre F4 e F5. Uma observação importante que Leino (1993) fez neste estudo é que o “formante do falante” não é “pré-requisito absoluto” para uma boa voz mas sim uma tendência pois na sua amostragem algumas boas vozes apresentaram este pico bem fraco enquanto vozes ruins apresentaram um pico forte. O autor questiona ainda, diante destes resultados se, para a nossa percepção auditiva de qualidade vocal, não seria de maior importância a distância entre F3 e F4 e a distância do vale ao pico do FA. O autor conclui que o “formante do falante” é resultado de um efeito de ressonância que ocorre quando a área do vestíbulo laríngeo é menor que a área da faringe o suficiente para atuar como um tubo de ressonância independente. A natureza do formante do ator ainda não está totalmente esclarecida.
Nawka, Anders, Cebulla e Zurakowski (1997) estudaram as vogais em fala encadeada emitidas por três grupos de falantesmasculinos alemães cujas vozes foram classificadas como normais, moderadamente roucas e trabalhadas (voz de ator). Aos atores foi ainda solicitada uma leitura em 3 níveis de intensidade: 60dB, 80dB e 100dB. No envelope de espectro, um aumento de energia entre 3.150 e 3.700Hz, região do quarto formante, foi estatisticamente confirmado durante a análise das vogais de vozes trabalhadas. A esta concentração de energia chamaram de “formante do falante”. Nos espectros, a queda de intensidade ao longo das freqüências foi menos acentuada nas vozes de qualidade sonora – dos atores – e nas suas emissões em intensidade mais forte, quando comparadas respectivamente às vozes normais e moderadamente roucas. Os autores concluíram que o formante do falante está relacionado com a qualidade “sonora” e “brilhante” de uma voz, e que é cerca de 10dB mais forte nas vozes masculinas profissionais que nas normais em intensidade de conversação em 60dB. Emitida em 80 dB, a freqüência central do formante aparece 30dB acima que a encontrada para as vozes normais; porém, em 110 dB, a energia do espectro aumenta somente nas bandas críticas adjacentes mas não na freqüência central.
Munro, Leino e Wissing (1996) propuseram mais um estudo preliminar onde a eficiência do o y-buzz, exploração da voz usada no método de Lessac (1967), foi avaliado. Por meio do LTAS compararam as emissões do próprio Lessac explorando o y-buz” e depois, lendo um texto em prosa. As mesmas tarefas foram solicitadas para atores sul-africanos treinados e não treinados. A eficácia do método foi comprovada ao mesmo tempo que reforçou a hipótese da existência do “formante do falante” uma vez que os espectros do professor Lessac e dos atores treinados, apresentaram em ambas as emissões, uma maior concentração de energia na região de 3-4kHz.
Pinczower e Oates (2005) em estudo preliminar com 13 atores australianos, procuraram determinar se o LTAS pode distinguir projeção vocal em níveis de pressão sonora confortável e máxima, investigar se existem diferenças perceptivas entre estas duas condições de projeção e determinar relações entre achados acústico e perceptivo-auditivo. Os autores mensuraram a diferença entre o NPS da região de 2-4 kHz e 0-2ekHz e a diferença entre os picos mais fortes no espectro do LTAS destas mesmas regiões. A análise perceptivo-auditiva feita pelos próprios atores e por especialistas considerou as seguintes qualidades de voz: tensão, aspereza, soprosidade e projeção. A projeção foi definida como “o quanto esta voz é clara e levada naturalmente, sem esforço”. E ainda, quanto uma voz tem “ressonância balanceada e rica”. Os resultados mostraram que quando o NPS aumenta, a diferença entre o NPS de 2-4kHz e 0-2kHz diminui. Em relação à análise perceptivo-auditiva, as vozes com projeção máxima foram melhores avaliadas em relação à percepção do grau de projeção. Atores também pareceram ter uma voz mais tensa na condição de máxima projeção que na confortável. A auto-avaliação feita pelos atores não mostrou diferenças estatisticamente significantes com a avaliação feita pelos especialistas, a não ser no grau de tensão. Quando a diferença entre estas regiões mais forte e mais fraca do espectro diminui, a projeção aumenta, a percepção de tensão aumenta e a percepção de soprosidade diminui. Em relação aos picos do espectro, a projeção e a percepção de tensão aumentaram com a diminuição da diferença entre os picos da região forte e fraca. Os autores concluem que o LTAS consegue diferenciar estas duas condições de projeção vocal e que atores que têm boa projeção de voz apresentam no espectro do LTA um pico semelhante ao fenômeno acústico do “formante do cantor”.
Bele (2002), comparando vozes de atores e professores noruegueses, observou as seguintes diferenças no LTAS: atores têm mecanismos de emissão mais eficiente em intensidades fortes e portanto, valores menores na relação entre L1 e L0, a região do “formante do falante” é mais forte para os atores mas não tão forte como referido pela literatura. Segundo a autora, a avaliação auditiva foi mais eficiente que o LTAS na diferenciação destas vozes, o que a leva a seguinte questão: algo afeta o nosso julgamento subjetivo de qualidade vocal, algo que não pode ser objetivamente mensurado. Em relação ao pico em 3.5kHz, Bele (2002) observa que este também pode estar relacionado com vozes nasalizadas, ásperas e em vocal fry, reforçando a necessidade de considerar a nossa percepção quando estivermos fazendo a análise com o LTAS.
I.5 Justificativa
A análise perceptivo-auditiva tem sido considerada como o “padrão ouro” da avaliação fonoaudiológica no que se refere à voz, seja ela profissional, não profissional ou disfônica e, como qualquer método de avaliação que envolve a subjetividade, o consenso entre autores sobre o emprego desta ou daquela terminologia, ou mesmo, a concordância inter e intra sujeitos no julgamento de uma voz, é pequena e gera bastante confusão.
A análise acústica computadorizada, por sua vez, se propõe a complementar a análise perceptivo-auditiva com dados mais objetivos.
Entre as opções de análise espectrográfica, o long term average spectrum (LTAS) tem sido apontado como uma ferramenta promissora por considerar a contribuição tanto da fonte glótica quanto do filtro para a qualidade de uma voz (Kitzing, 1986; Hammarberg, Fritzell, Gauffin, Sundberg, 1986; Kitzing e Akerlund, 1993; Mendoza, Valencia, Muñoz, Trujillo, 1996, 1996; Cleveland, Sundberg e Stone, 2001; White, 2001; Jorge, Gregio e Camargo, 2004).
Estudos feitos com o LTAS evidenciaram, nas vozes projetadas de atores masculinos, um pico de grande amplitude na região de 3.4kHz, o “formante do ator”, que estaria moderadamente relacionado com a percepção auditiva de projeção vocal, de brilho na voz (Leino, 1993; Bele, 2002; Laukkanen, Syrja, Laitala e Leino, 2004; Pinczower e Oates, 2005).
As características acústicas do espectro de uma voz projetada, sua relação com a análise perceptivo-auditiva e ainda, a própria análise perceptivo-auditiva que não contempla de maneira satisfatória a avaliação destas vozes profissionais, precisam ser melhor investigadas. Por outro lado, o “formante do ator”, sua natureza, a configuração do trato vocal que estaria na sua gênese, sua freqüência central e amplitude, sua relação com a qualidade da voz, são ainda assuntos controvertidos. E, finalmente, explicar a variância do “formante do ator” em função de parâmetros acústicos tais como NPS, modo de fonação, freqüência fundamental, NPS da freqüência fundamental, estrutura formântica das vogais, por si só, constitui um vasto e inexplorado campo de pesquisa.
No Brasil são poucos os estudos com LTAS, estudos estes que investigam especialmente as vozes disfônicas (Camargo, 2002; Camargo, Vilarim e Cukier 2004; Jorge, Gregio e Camargo, 2004; Soyama, Espassatempo, Gregio e Camargo 2005), e Navarro (2000), com voz profissional de locutores esportivos.
Estudos envolvendo a análise perceptivo-auditiva e determinados parâmetros acústicos relacionados à projeção vocal tais como - o nível de pressão sonora médio, a f0, o modo de fonação, a inclinação da curva do espectro, o “formante do ator” e outros parâmetros - em
emissões de longo termo, em diferentes loudness e ainda, por meio do LTAS, são inexistentes.
Conhecer as diferenças entre as vozes de atores e não atores nos seus aspectos perceptivos e acústicos, especialmente por meio do Long-term average spectrum, poderá contribuir para o re-direcionamento tanto da avaliação quanto da preparação vocal destes que buscam uma técnica vocal econômica e eficiente, os atores.
II. OBJETIVOS DO ESTUDO