• No results found

1 Introduction

1.2 Nucleic acids and proteins – a complex on and off relationship

1.2.4 Comparing three essential types of nucleic acid binding proteins; a transcription

2.2.1. Modelo Fonte-Filtro

A teoria acústica de produção da fala, proposta por Fant (1960) no chamado “modelo fonte-filtro” impulsionou a análise espectrográfica e é ainda muito utilizada nos estudos de Fonética Acústica. Este modelo baseia-se no conceito de que a onda sonora da fala é o resultado da interação do sistema de filtro do trato vocal a uma ou mais fontes geradoras de som (vibração das pregas vocais ou ruído gerado pela constrição dos articuladores). O modelo pressupõe, no entanto, uma independência entre a fonte e o filtro. Além da fonte e do filtro, este modelo incorpora um terceiro componente que é a irradiação ou a propagação do som (KENT e READ, 1992).

2.2.1.1. Vogais orais

Para a produção das vogais, o modelo fonte-filtro considera que a vibração das pregas vocais é a fonte de energia sonora e as cavidades supraglóticas do trato vocal são o filtro, por formarem um sistema de ressonância que modifica o som gerado na fonte. O filtro é, portanto, um sistema seletivo de freqüências que atua de maneira a reforçar certas freqüências de vibração que coincidem com a freqüência de vibração natural daquela cavidade e a diminuir outras que não coincidem. Por estar diretamente relacionado às dimensões das cavidades onde a onda está se propagando, o filtro reflete os padrões articulatórios (FANT, 1960).

O som glótico periódico pode ser decomposto em freqüência fundamental (F0) ou

primeiro harmônico, de maior amplitude, e seus múltiplos inteiros, denominados harmônicos, segundo a Análise de Fourier. Este som, ao interagir com o trato vocal, terá os harmônicos com freqüências próximas de uma freqüência natural de vibração, denominada formante ou zona de incremento, amplificados.

O trato vocal de um homem adulto pode ser comparado a um tubo com aproximadamente 17,5 cm de comprimento, com a largura variável em toda a sua extensão. No entanto, ele é um tubo dinâmico que se modifica com a movimentação dos articuladores, em especial, com a movimentação da língua. Estas modificações do trato vocal determinam as regiões de ressonância, ou formantes, correlatos acústicos dos diferentes gestos articulatórios dos sons vocálicos.

O deslocamento da língua no eixo vertical determina a composição do primeiro formante (F1) que varia inversamente à altura da língua. O deslocamento no sentido ântero-

posterior da língua, ou mais apropriadamente, o estreitamento do trato vocal, por sua vez, determina o segundo formante, conhecido por F2 (KENT e READ, 1992; PICKETT, 1980). Desta forma, quanto menos elevada a língua, maior o valor de F1 e quanto mais anteriorizada, maior o valor de F2.

Embora o número de formantes existentes seja infinito, os dois primeiros formantes, F1 e F2, são os responsáveis por caracterizar a identidade de uma vogal (FANT, 1960; SCHWARTZ, 1968; PICKETT, 1980; BEHLAU, 1984; KENT e READ, 1992; MAEDA, 1993). Assim, uma vogal é identificada acusticamente pela relação existente entre as freqüências de F1 e F2. Cada vogal possui suas freqüências de formantes próprias, impostas pela configuração geométrica tridimensional do trato vocal, necessária para sua articulação.

As freqüências dos formantes variam de acordo com as dimensões do trato vocal. Quanto maior o trato, menores são as freqüências dos formantes. Portanto, os formantes dos homens, que possuem um trato vocal mais comprido, são mais baixos do que os formantes das mulheres e crianças (FANT, 1960; PICKETT, 1980). Os formantes variam ainda de indivíduo para indivíduo, dependendo das características estruturais e funcionais do trato vocal de cada um (FANT, 1960).

Outros fatores como o arredondamento labial, a posição da laringe e o grau de abertura do palato mole e da mandíbula (FANT, 1960), bem como aspectos supra-segmentais também podem interferir nos valores dos formantes.

Resumindo, podemos dizer, de acordo com Fant (1960), que a fonte de energia sonora para a produção de uma vogal é a excitação glótica, causada pela vibração periódica das pregas vocais e que associado a cada vogal existe um conjunto de formantes, ou ressonâncias, localizadas em freqüências específicas. As diferenças para os valores dos formantes de vogal para vogal devem-se às diferentes configurações das cavidades do trato vocal durante a sua produção.

2.2.1.2. Vogais nasais

Segundo Teixeira et al. (2001), no caso das vogais nasais, a adição da cavidade/trato nasal torna este fenômeno mais complexo, ao adicionar novas ressonâncias (pólos) e, em especial, ao fazer aparecer anti-ressonâncias (zeros). Nestes casos não se pode facilmente relacionar as ressonâncias e anti-ressonâncias com uma das cavidades.

A cavidade nasal possui uma grande área de superfície acusticamente absorvente, o que acarreta no amortecimento do som nas nasais, resultando em grande largura de banda para os formantes nasais e anti-formantes, além da diminuição na amplitude geral dos sons

(OHALA, 1975). A cavidade nasal oferece uma baixa resistência à passagem do fluxo aéreo (WARREN, DUANY e FISCHER, 1969), em comparação com o MVF durante o fechamento e, quando aberto, oferece uma resistência variável (OHALA, 1975).

Vários estudos realizados ao longo das últimas décadas têm investigado as características espectrais das vogais nasais (HOUSE e STEVENS, 1956; HATTORI, YAMAMOTO e FUJIMURA, 1958; FANT, 1960; FUJIMURA e LUDQVIST, 1971; HAWKINS e STEVENS, 1985; MAEDA, 1993). Teixeira et al. (2001) comentaram que comparando vários estudos sobre as vogais nasais, alguns pontos em comum devem ser destacados e, dentre eles, que as principais marcas de nasalidade de uma vogal são: a modificação do espectro nas baixas freqüências, particularmente próximo a F1; a existência de um formante nasal ao redor de 250 Hz (característica também das consoantes nasais); a existência de um vale espectral, ou antiformante, que interage com o primeiro formante oral, reduzindo sua amplitude e aumentando sua largura de banda e a modificação do espectro nas freqüências mais elevadas, resultando numa distribuição mais difusa da energia.

De acordo com Ohala (1975), as vogais nasais/nasalizadas apresentam um espectro complexo pela presença de vários formantes orais e nasais misturados e anti-formantes de ambas as cavidades e a freqüência exata deles depende da configuração da vogal e do nível de acoplamento das cavidades oral e nasal.

Comparadas com suas correlatas orais, as vogais nasais, teoricamente, teriam uma elevação do valor de F1, uma diminuição da amplitude e um aumento da largura de banda para todos os formantes, além da presença de uma ressonância nasal adicional entre 250 e 300 Hz ou, esporadicamente, em outro local (HOUSE e STEVENS, 1956; FANT, 1960). Estudos posteriores (DICKSON, 1962; COLEMAN, 1963), embora tenham comprovado uma diminuição da amplitude e um aumento da largura de banda, mostraram dados conflitantes em relação à mudança da freqüência de F1. Estes estudos indicaram que as mudanças podem variar de acordo com a vogal em questão, havendo um abaixamento de F1 para vogais baixas e um aumento de F1 para as demais.

De qualquer forma, é a região de F1 onde ocorre a mudança acústica mais significativa na nasalização da vogal (OHALA, 1975). O primeiro formante do espectro das vogais nasalizadas pode ser decorrente da elevação de F1 da vogal oral ou a presença de um formante nasal (FUJIMURA e LINDQVIST, 1971).

O primeiro estudo encontrado na literatura que trata da caracterização das vogais orais e nasais do PB, padronizando as medidas dos formantes foi o de Behlau (1984), realizado com crianças, jovens e adultos, de ambos os sexos, falantes do dialeto de São Paulo. Os achados

indicaram diferenças nos valores dos formantes da vogal [a] comparada com sua correspondente nasal.

2.2.1.3. Consoantes orais

Para a produção das consoantes não fonologicamente vozeadas, a fonte de ruído é a turbulência produzida pela passagem de ar por uma constrição do trato vocal, que produz sons aperiódicos.

As consoantes oclusivas são produzidas com o bloqueio total e momentâneo da corrente aérea durante o gesto articulatório, com duração entre 50-100 ms (KENT e READ, 1992). As não vozeadas, apresentam um intervalo, caracterizado como um espaço em branco no espectrograma seguido pela explosão do som, que dura entre 5-40 ms e é reconhecido acusticamente pela presença de uma espícula (KENT e READ, 1992). As oclusivas vozeadas apresentam uma barra de vozeamento (vibração das pregas vocais), seguida de uma espícula (abertura da explosão).

2.2.1.4. Consoantes nasais

As consoantes nasais são todas vozeadas e semelhantes às consoantes oclusivas, com a diferença de que o MVF encontra-se aberto permitindo a passagem de parte do ar para a cavidade nasal. Elas são vozeadas devido à cavidade nasal oferecer resistência relativamente baixa à passagem do fluxo aéreo e, portanto, não permitir a formação de considerável pressão oral e redução concomitante da pressão glótica, o que inibiria o vozeamento (OHALA, 1975).

O espectro de consoantes nasais é caracterizado por ressonâncias combinadas do trato faríngeo e nasal e da anti-ressonância da cavidade oral (OHALA, 1975). No espectro desses sons observa-se um decréscimo na intensidade e na concentração de energia em baixas freqüências (FANT, 1960). As ressonâncias são relativamente estáveis, independente do ponto de articulação da consoante nasal. No entanto, as anti-ressonâncias variam de maneira inversamente proporcional ao comprimento da cavidade oral (FANT, 1960; FUJIMURA, 1962). A anti-ressonância da velar nasal é geralmente tão alta em freqüência que é perceptivamente menos evidente, visto que as freqüências são atenuadas em consoantes nasais (OHALA, 1975). De acordo com Rooney (1990), mudanças na cavidade orofaríngea e cavidade nasal podem gerar alterações no espectro das consoantes nasais e aponta a velar nasal, por ter o ponto articulatório bem posterior, como a menos propensa a sofrer interferências da cavidade orofaríngea.

A velar nasal, diferentemente das outras nasais, apresenta anti-ressonâncias insignificantes, com grande largura de banda. É mais parecida com uma vogal do que com qualquer outra consoante nasal (OHALA, 1975) e mais propensa a mudanças ou a desaparecer. Como o antiformante da velar nasal fica nas freqüências altas mais atenuadas, é menos perceptível do que os antiformantes das outras nasais (OHALA, 1975).

Em síntese, as consoantes nasais são descritas acusticamente com uma concentração de energia em freqüências baixas, caracterizadas por um formante baixo, por volta de 250 Hz e pelo enfraquecimento ou pela ausência de F2, o que também ocorre com os formantes mais altos. Há um formante típico em 2200 Hz que nem sempre é percebido na espectrografia devido a sua baixa intensidade (FANT, 1960). O aparecimento de anti-ressonância é comum na produção de consoantes nasais, sendo a freqüência delas variável de acordo com a vogal adjacente (FUJIMURA, 1962). Segundo esse mesmo autor, os valores dos formantes de cada consoante nasal são: para a nasal alveolar – picos em 300, 1000, 1400, 2300 e 2600 Hz; para a nasal velar - 350, 1050, 1900 e 2700 Hz; e para a bilabial - 280, 940, 1240, 1950 e 2560 Hz.