De acordo com Nobre-Oliveira (2007), a teoria fonte-filtro (FANT, 1960) explica como as ondas sonoras são geradas e modificadas para produzir os sons da fala. Esta teoria dá a descrição de como os procedimentos motores interferem na geração e propagação dos sons da fala.
Nas palavras de Fant (1971), e de maneira bastante sintetizada, a teoria define-se da seguinte forma: “[...] somewhere in the vocal tract there originates a source, constituting the
filtering, a shaping of the raw material resulting in the speech wave” (FANT, 1971, p. 191).21
Em poucas palavras, a produção dos sons da fala é um processo que envolve a geração de fontes de sons e a filtragem dessas fontes pela passagem de ar através da glote (FANT 1960 apud STEVENS, 1999).
A princípio, a terminologia usada para definir a teoria acústica de Fant (1960) parece complicada, e por isso merece um pouco mais de destaque, para que se possa compreender melhor a maneira como se dá o processo de geração e filtragem dos sons da fala. Segue, abaixo, um apanhado geral de como diferentes estudiosos descrevem tal teoria.
Primeiramente, Maia (2001) argumenta que nunca se encontrará um espectro como aquele representado pela figura 7, neste texto. A autora explica que, “[...] embora os harmônicos se mantenham os mesmos, as suas amplitudes se alteram muito quando a voz é transmitida através das cavidades supralaríngeas, que constituem o trato vocal” (MAIA, 2001, p. 46). As variações de amplitude e sua conseqüente modificação na voz são resultado de um fenômeno denominado ressonância. Em termos gerais, ressonância é um modo natural de vibração de um corpo; este corpo que ressoa é chamado de ressoador.
Segundo Maia (2001), existem os ressoadores simples e os complexos. Aqueles denominados simples não contribuem muito para a modificação do som. A autora cita as cordas do violão como um exemplo de ressoador simples; ela explica que, “[...] qualquer que seja a força que você puxe a corda, o tom resultante será sempre o mesmo, variando apenas em intensidade e duração” (MAIA, 2001, p. 46). Os ressoadores complexos, em contrapartida, são chamados de filtros, e modificam enormemente o som original; tubos e urnas, de acordo com Maia (2001), são considerados os filtros complexos mais comuns.
Na produção dos sons da fala, principalmente na das vogais (pois elas são o objeto de estudo desta pesquisa), aquilo que foi nomeado por Fant (1960) como fonte corresponde à vibração laríngea, e o filtro corresponde ao ressoador. Como se está tratando aqui de produção de fala, o ressoador é o trato vocal, sendo este o filtro.
A fim de se entender este processo de geração e filtragem, a teoria acústica utiliza um aparato bastante diferente para representar o trato vocal: um tubo reto, aberto de um lado e fechado de outro, como mostram Fant (1960 apud KENT; READ, 1992), Clark e Yallop (1995), Stevens (1999), Fujimura e Erickson (1999), Johnson (1997), Nobre-Oliveira (2007), entre outros.
21 Em algum ponto do trato vocal existe uma fonte que constitui o material original do som, enquanto a
propagação da onda pelo trato vocal fornece um filtro, um modelo do material original que resulta na onda sonora de fala – tradução nossa.
Figura 18: Representação de um tubo complexo Fonte: Kent e Read (1992, p. 15)
Verifica-se então que, o trato vocal, ou melhor, o tubo “[...] é um filtro e é por isso que ele tem o poder de modificar o som original da voz” (MAIA, 2001, p. 47). Dentro do tubo, ocorre o fenômeno das ondas estacionárias. Nas palavras de Maia (2001), “[...] ao encontrar uma parede dura, o som tende a refletir-se, isto é, viajar de volta na direção oposta. Assim, a onda refletida soma-se à onda estacionária propagada criando uma onda estacionária que amplifica o som original” (MAIA, 2001, p. 47).
É importante destacar, neste momento, que, na literatura acústica, o termo “ressonância” recebe um nome técnico: formante. De acordo com Kent e Read (1992), existe um número infinito de formantes, mas, em geral, os estudiosos da área (sobretudo nas pesquisas sobre os segmentos vocálicos) utilizam somente os três ou quatro primeiros formantes, numerados em sucessão a partir de suas freqüências mais baixas, a saber: F1, F2, F3, F4, etc. Kent e Read (1992) e Nassif (2007) afirmam que essas freqüências mais baixas, especialmente F1 e F2, são determinantes para a diferenciação das vogais.
Sabe-se que existe uma relação entre o comprimento do trato vocal e os valores formânticos (NOBRE-OLIVEIRA, 2007). Assim como Fant (1960; 1971), Clark e Yallop (1995) e Ladefoged (2006) – entre tantos outros – Nobre-Oliveira (2007) explica que é possível calcular os valores de freqüência dos formantes da vogal neutra /«/ (denominada
schwa) por meio do comprimento do trato vocal, usando a fórmula F(n) = (2n-1)C/4L, na qual
n é o número inteiro, c é a velocidade de propagação do som (que, por sua vez, corresponde a
34000 cm/s) e l é o comprimento do trato, ou tubo.
Nobre-Oliveira (2007) demonstra o uso da fórmula para se chegar ao valor de F1 de /«/: considerando que o trato vocal de uma pessoa do sexo masculino tem aproximadamente 17 cm de comprimento, o valor de F1 é de 500 Hz, já que F(1) = (2.1-1)34000/4.17 =
se os seguintes valores para os próximos formantes: F2= 1500 Hz; F3= 2500 Hz; F4= 3500 Hz; etc. (FANT, 1971, p. 193).
Considerando os dados apresentados acima, faz-se, neste instante, a seguinte pergunta: por que levar em conta os valores dos formantes da vogal neutra /«/, o schwa? Ou melhor, qual a relação entre o schwa e o tubo uniforme?
Kent e Read (1992) afirmam que o schwa é produzido com a língua e outros articuladores posicionados de forma a criar uma seção transversal uniforme ao longo do comprimento do trato vocal. Diz-se “uniforme” em decorrência da posição do corpo da língua ao produzir o schwa: esta é uma vogal média central, isto é, ao produzir esse som, a língua não se encontra nem muito alta nem muito baixa, nem muito a frente nem muito atrás. É devido a essas características que o tubo reto uniforme representa a realização da vogal neutra.
Nassif (2007) diz que “[...] as vogais são basicamente definidas pelas regiões de amplificação inseridas na energia glótica” (NASSIF, 2007, p. 9). Dessa maneira, os formantes que caracterizam as vogais são resultado das regiões de constrição do tubo (LADEFOGED, 2006; Nobre-Oliveira, 2007). Isso significa que variações no tubo geram as diferentes vogais. Tendo em mente que os “[...] formantes são concentrações de energia por freqüência em determinados locais do espectro sonoro” (NASSIF, 2007, p. 9), as freqüências de ressonância individuais variam em torno das regiões de freqüência da vogal média-central – daí o fato de se tomar o schwa como referência para as outras vogais (KENT; READ, 1992).
Em resumo, “[...] the position of the articulators will […] determine which vowel
sound will be produced” (NOBRE-OLIVEIRA, 2007, p. 41).22
3.2.3 Características acústicas das vogais e a relação acústica entre os sons vocálicos e