Os sons fricativos representam a segunda categoria de sons em nível de ocorrência na maior parte das línguas (CARTERETTE e JONES, 1974) e são produzidos por constrições muito estreitas no trato vocal, que causam turbulência ou fricção da corrente aérea (PETERSON e SHOUP, 1966).
Foneticamente, o Português brasileiro apresenta cinco consoantes fricativas não vozeadas /f, s, ʃ, X, h/ e cinco vozeadas /v, z, ʒ, ɣ, ɦ/, que são classificadas quanto ao ponto de articulação em labiodental, alveolar, alveolopalatal, velar e glotal (SILVA, 2001).
Diversos autores deram importante impulso à compreensão das propriedades acústicas dos sons fricativos (FANT, 1960; HEINZ e STEVENS, 1961; HIXON, 1966; SHINDLER, 1974; BORZONE DE MANRIQUE e MASSONE, 1981; LACERDA, 1982; SANTOS, 1987). Potter, Kopp e Green Kopp (1947) são os grandes pioneiros na utilização da espectrografia acústica no estudo dos sons da fala.
Através da análise espectrográfica é possível observar que as fricativas não vozeadas são formadas por uma fonte de ruído resultante da constrição do trato vocal, enquanto as vozeadas são formadas por duas fontes: a fonte de ruído e a fonte glótica, responsável pelo vozeamento (POTTER, KOPP e GREEN KOPP, 1947).
FIGURAS 2 e 3 – Oscilograma e espectrograma da fricativa coronal não vozeada [s] (à esquerda) e
da fricativa coronal vozeada [z] (à direita)
As figuras 2 e 3 mostram tanto o oscilograma quanto o espectrograma das fricativas coronais [s] (à direita) e [z] (à esquerda). O registro do espectro da fonte glótica torna-se visível no espectrograma pela barra de vozeamento. Já a fonte de fricção pode ser observada pelas regiões de incremento de frequências no espectrograma da fricativa coronal não vozeada [s].
Espectrograma
Oscilograma
Barra de vozeamento
Regiões de incremento de frequência Fricativa [s]
De acordo com a necessidade fonética, o uso da fonte de ruído e o da glótica pode ser sucessivo ou simultâneo. Quando o falante necessita produzir uma consoante sonora torna- se necessário o uso simultâneo dessas duas fontes, gerando um espectro misto, resultado da inserção da vibração glótica na turbulência aérea, revelada pela fricativa [z] na figura 3 (TOSI, 1979).
Santos (1987), em seu estudo sobre análise espectrográfica dos sons fricativos surdos e sonoros do português brasileiro, verificou que as características espectrais do som fricativo dependem do lugar da constrição no trato vocal, do formato do orifício na constrição e da queda de pressão nesta região.
Laderfoged e Maddieson (1993) também evidenciaram que as diferenças de natureza articulatória entre [s] e [ʃ], objetos deste estudo, irão influenciar no espectro da fonte de ruído, uma vez que este depende da forma do trato vocal pela qual a corrente de ar passa, além da velocidade do fluxo de ar através da constrição. Durante a produção do [s] temos a formação de um canal mais estreito. O canal mais largo para o [ʃ] faz com que o ar tenha menos velocidade. Devido à diminuição da velocidade da corrente de ar, da extensão maior do trato vocal e do arredondamento dos lábios, o [ʃ] tem maior concentração de energia espectral em regiões mais baixas quando comparado com [s].
Russo e Behlau (1993), em seus estudos das consoantes do português brasileiro, verificaram que estas diferenças articulatórias na produção das fricativas [s] e [ʃ] geram diferenças espectrográficas nestes sons. Desta forma, de acordo com as pesquisadoras, a fricativa alveolar [s] é um som forte, agudo, com uma faixa de frequência acima de 4500Hz, chegando a 8000Hz. Enquanto a alveolopalatal [ʃ] também apresenta uma faixa de frequência ampla, semelhante a [s], porém mais grave, entre 2500 e 6000Hz. Outros pequisadores confirmaram essa diferença espectrográfica dos sons fricativos alveolares e alveolopalatais.
Stevens e Klatt (1968) constataram que o espectro acústico das fricativas não vozeadas e vozeadas do inglês apresenta energia mais concentrada nas altas frequências. O espectro do som [ʃ] aparece com a principal concentração de energia na faixa de frequência de 2000 a 3000Hz. Para o som [s] o espectro mostra um aumento de energia que começa ao redor de 3560 a 4400Hz.
Shindler (1974) também descreveu as características dos sons fricativos do italiano e observou que o espectro do som [s] se localiza em torno dos 4000Hz e o [ʃ] em torno dos 2000Hz.
Borzone de Manrique e Massone (1981) em seu estudo sobre análise acústica e perceptual dos sons fricativos do espanhol argentino, verificaram que o som [s] apresenta picos ao redor de 5000 e 8000Hz e [ʃ] por volta de 2500 e 5000Hz.
Além dos autores supracitados, Lacerda (1982) realizou um estudo sobre a análise perceptual dos sons fricativos surdos do português europeu e concluiu, através de testes perceptuais, que o som [s] é melhor percebido quando o estímulo tem altos níveis de intensidade e picos espectrais na região de 5000Hz, e o som [ʃ] é normalmente associado com altos níveis de intensidade juntamente com picos espectrais na região dos 3000Hz.
Santos (1987) e Haupt (2007), após realizarem a análise acústica dos sons fricativos do português brasileiro, verificaram resultados semelhantes aos demais autores em relação aos valores das frequências dos sons [s] e [ʃ].
Outro parâmetro investigado nos sons fricativos é a duração. Diversos estudos evidenciaram que os sons fricativos alveolares [s, z] são mais longos que os alveolopalatais [ʃ, ʒ], e os sons surdos são mais longos que os sonoros (STEVENS e KLATT, 1968; BORZONE DE MANRIQUE e MASSONE, 1981; SANTOS, 1987; HAUPT, 2007).
Muitos estudos acústicos sobre os sons fricativos já foram realizados, porém não se verificou estudos que analisaram a propriedade acústica de amplitude do ruído fricativo no PB, fundamental para a criação das fricativas sintetizadas. Desta forma, o estudo piloto busca analisar principalmente quatro parâmetros dos sons fricativos: os valores dos formantes7 e as amplitudes do ruído de fricção, a duração desses sons e a região de maior concentração de energia no espectro. Tais parâmetros foram relevantes para a síntese destes
7
De acordo com Barbosa e Madureira (2015) somente uma classe de sons não produz formantes: as dos sons bilabiais, uma vez que estes sons são produzidos nos lábios e são emitidos sem passar por um tubo. Pode soar estranho falar de formantes para as fricativas, porém os formantes não se limitam às vogais. Barbosa e Madureira (2015, p. 95) relatam que “os formantes são, assim, propriedades de um tubo acústico: havendo tubo ressoante há possibilidade de ondas estacionárias ou ressoantes”. Assim, o ruído fricativo produz formantes.
sons no software Sensyn (Sensimetrics Org.) e são considerados pistas auditivas importantes para que os ouvintes façam a distinção entre as fricativas [s] e [ʃ]. Já a análise dos momentos espectrais dos sons fricativos (variância, assimetria e curtose) não foi realizada, uma vez que estes parâmetros não serão utilizados para a síntese.