• No results found

Nesta etapa da análise acústica foram tidos como base: a curva de frequência fundamental e os parâmetros relacionados à organização temporal. Os parâmetros analisados quanto à frequência fundamental foram:

1. F0 inicial e final: foi selecionado o primeiro ponto de F0 da curva

melódica e o último, obtendo a F0 inicial e final, respectivamente. A fim de desprezar as variações microprosódicas, foram desconsiderados os três primeiros e os três últimos ciclos do sinal de fala.

2. Tessitura do enunciado: foram selecionados os pontos máximo e mínimo

de F0 do enunciado. Em seguida, subtraiu-se o mínimo do máximo, obtendo como resultado a tessitura.

3. Pico de F0 (pF0): foi selecionado o valor máximo de frequência

fundamental no enunciado. A figura a seguir exemplifica a marcação dos pontos de F0 mencionados até aqui.

Figura 22: Exemplo de marcação dos pontos inicial, final e pico de F0 nas tiras de análise acústica.

4. Pretônica (preT): a sílaba que precede imediatamente a sílaba tônica

proeminente– foram retirados os valores de F0 máximo, mínimo, intervalo melódico e média, apenas da vogal da pretônica. O intervalo melódico refere-se ao resultado da subtração do valor de F0 máximo pelo de F0 mínimo.

5. Tônica Proeminente (TonP): a última sílaba acentuada do enunciado

(nuclear) - foram retirados os valores de F0 máximo, mínimo, intervalo melódico e média apenas da vogal da tônica.

6. Postônica (posT): a sílaba imediatamente após a sílaba tônica

proeminente – como a última vogal do enunciado nem sempre apresentava-se de forma clara no sinal de fala, optou-se por verificar apenas a presença ou ausência da mesma e não realizar medidas de F0 e duração da mesma.

A figura a seguir mostra as fronteiras das vogais da tônica e da pretônica a título de ilustração.

Figura 23: Exemplo de fronteiras das vogais da tônica e da pretônica da frase “ele volta a jogar”.

Dessa forma, para análise dos parâmetros de entonação foram criadas grade de textos para uma demarcação mais precisa como mostra a figura a seguir. Ressaltamos que os momentos de disfluências foram desconsiderados durante a análise – marcados na grade de texto como “df” – a fim de evitar possíveis erros.

Figura 24: Exemplo de marcação de fronteiras para a análide dos valores de F0 e intensidade.

Os parâmetros relacionados à organização temporal dividiram-se em duração, pausa e velocidade de fala. A primeira refere-se à duração das vogais tônicas, pretônicas e postônicas.

A pausa foi considerada quando ocorreu um momento de silêncio no sinal de

fala, sem qualquer indício de tentativas de produção de um som13. Quando foram

verificados tais indícios, o fenômeno observado foi classificado como disfluência. A figura 25 mostra um exemplo de como foi delimitada a pausa.

13

Na figura 24, por exemplo, tem-se um momento que, a princípio, poderia ser analisado como pausa

(segunda marcação “df” da grade de texto). Mas ao realizar um exame mais cuidadoso, é possível verificar leves barras de explosão, representando repetições sucessivas do som /p/.

Figura 25: Exemplo de fronteiras de pausas.

No exemplo acima é possível verificar que logo após a pausa há uma consoante oclusiva. Para delimitar a duração das consoantes oclusivas foram medidas as durações desses segmentos quando ocorriam entre vogais. A média encontrada foi de 0,102 segundos, medida utilizada na presente pesquisa. Dessa forma, como no exemplo dado acima, sempre que ocorria uma pausa seguida de consoante oclusiva foi considerado o tempo de 0,102 segundos antes da vogal como o tempo de oclusiva.

O último parâmetro da organização temporal estudado foi a velocidade de fala. A análise desse parâmetro é normalmente dividida em quatro partes :

1. Tempo total de elocução (referente ao tempo total gasto na elocução de

2. Tempo total de articulação (retira-se o tempo de pausas do tempo total de elocução a fim de averiguar qual o tempo exato foi utilizado apenas com a articulação)

3. Taxa de elocução (referente ao número de sílabas dividido pelo tempo

total de elocução)

4. Taxa de articulação (referente ao número de sílabas dividido pelo tempo

total de articulação)

Durante nossas análises, entretanto, nos deparamos com a seguinte questão: devemos ou não incluir a duração das disfluências no tempo de articulação? Responder a tal questão de forma afirmativa ou negativa tem suas implicações.

Incluir a duração das disfluências no tempo de articulação parece coerente, uma vez que as disfluências são tentativas articulatórias de produção de um determinado fonema. Como o próprio nome diz, o tempo de articulação inclui a duração total dos momentos nos quais segmentos foram articulados. Seguindo tal linha, é natural incluir a duração das disfluências no tempo total de articulação.

Por outro lado, optar por retirar o tempo das disfluências do tempo de articulação também apresenta pontos interessantes: a taxa de articulação visa, neste caso, determinar a duração média de cada sílaba produzida e apenas das sílabas efetivamente produzidas. Tal proposta é interessante uma vez que possibilita a comparação da duração média de cada sílaba entre a fala indivíduos sem gagueira e a fala fluente de indivíduos com gagueira.

Escolher uma das opções acima citadas implicaria, obviamente, em perder um certo tipo de informação. A escolha metodológica feita neste estudo não foi de excluir um tipo de resultado, mas de utilizar ambos.

Dessa forma, propomos neste estudo uma subdivisão dos quatro pontos descritos acima, da seguinte forma:

1. Tempo total de elocução

2. Tempo de articulação

2.1.Tempo de articulação com disfluência

2.2.Tempo de articulação sem disfluência

3. Taxa de elocução

4. Taxa de articulação

4.1.Taxa de articulação (com as disfluências)

4.2.Taxa de articulação sem disfluência

Assim, os aspectos referentes à organização temporal do discurso utilizados no presente estudo foram resumidos no quadro a seguir:

TTE Tempo total do discurso. Tempo de

articulção com disfluências

(TA)

Tempo total do discurso – pausas TA Tempo de articulção sem disfluências (TAd)

Tempo total do discurso – (disfluências + pausas)

NS Número de sílabas

P Duração das pausas

Disf Duração das disfluências

TxE Número de sílabas TTE TxA Número de sílabas TAxA TxA TxA-d Número de sílabas ______________________________ TxA-d Quadro 5: Resumo dos aspectos referentes à organização temporal.

A figura a seguir exemplifica como foi delimitada a marcação de fronteiras para a análise da organização temporal de cada enunciado.

Figura 26: Sinal de fala, espectrograma e grade de texto de um enunciado. Na grade de texto, três tiras: transcrição da frase, separação da frase em sílabas com a marcação da disfluência, duração da

disfluência encontrada (D).

O estudo contou ainda, para representação do nível fonético de análise, com a estilização da curva melódica. Assim, com o objetivo de inovar os procedimentos de análise prosódica, buscamos utilizar o sistema automático de síntese da melodia da fala MOMEL (MELodic MOdelisation), desenvolvido por Hirst e Espesser (1993).

4.3.2 MOMEL

Como foi visto na revisão da literatura, o resultado da aplicação do MOMEL são os pontos alvo que poderão ser alterados caso haja necessidade. No exemplo da

informante abaixo, não foi necessário realizar qualquer alteração nos pontos alvo fornecidos pelo MOMEL. O resultado está exemplificado na figura 27.

Figura 27: Sinal de fala, espectrograma com curva melódica e pontos alvo codificados pelo MOMEL da frase “Eu desliguei o fogão”

Durante a análise preliminar dos dados, observamos que algumas curvas melódicas apresentaram uma variação importante ao longo do enunciado e que essas, após passarem pela estilização, apresentavam muitos pontos alvo. Dessa forma, quanto maior o número de pontos alvo, maior a variabilidade apresentada em cada enunciado. Por exemplo, se uma curva melódica necessita de apenas três pontos alvo para ser estilizada, ela não apresenta muita variação na sua totalidade. Isso não significa que a mesma apresenta tessitura elevada ou não. O que tentamos expressar com variabilidade da curva melódica diz respeito às variações menores que ocorrem ao longo dessa.

Tomemos como exemplo a figura que segue: são duas curvas melódicas relativas à mesma frase.

Figura 28: Exemplo de duas curvas melódicas da mesma frase “Eu tranquei a porta”.

Apesar de ambas serem relativas à mesma frase, uma apresenta maior variabilidade (em vermelho) do que a outra (em preto). Claramente, a curva em vermelho necessitará de um maior número de pontos alvo para ser estilizada. Isso nos leva a refletir: uma boa forma de observar quantitativamente essa variabilidade é verificar quantos pontos alvo um programa de estilização da curva melódica necessita para estilizar cada curva. Seguindo esse pensamento, foi aplicado o programa MOMEL em todos os enunciados e foram contabilizados os pontos alvo da seguinte forma:

NPA 1/3 A: número de pontos alvo no primeiro terço do enunciado. NPA 1/3 M: número de pontos alvo no terço medial do enunciado. NPA 1/3 P: número de pontos alvo no terço final do enunciado. NPA T: número total de pontos alvo do enunciado.

Por fim, as medidas de alinhamento foram retiradas, seguindo uma abordagem fonético- fonológica.