• No results found

3 Results and discussion

3.1 Atmospheric deposition of Hg to Norway

2.1.1.1 CONCEITO DE QUALIDADE DE VOZ

Embora menos explorada nos estudos fonéticos devido à ausência de modelos descritos de natureza fonética até o advento do trabalho de LAVER (1980), a qualidade de voz desempenha papel muito relevante na expressão de emoções, e seus ajustes são comumente explorados por atores para a construção de personagens e seus estados emotivos.

Nesta tese, o termo “qualidade de voz” é conceituado de acordo com LAVER (1979, 1980, 2000). Para analisar as qualidades de voz, Laver utilizou de uma unidade analítica chamada setting (ajuste) que corresponde aos ajustes fonatórios e articulatórios que acompanham dois ou mais segmentos de fala, enunciados ou, mais extensivamente, a fala de um indivíduo.

Para a descrição dos ajustes de qualidade de voz, LAVER (1980) propõe um modelo fonético descritivo que tem como unidade básica o ajuste neutro. Esse ajuste neutro tem como base a ideia de que o trato vocal não é modificado pela ação da musculatura, ou seja, parte de um ponto de repouso.

Todos os ajustes propostos por Laver são delineados a partir desse ajuste neutro que se caracteriza pelos seguintes aspectos: não envolve nem tensão nem relaxamento do trato vocal; os lábios não se projetam a não ser para caracterizar sons que intrinsecamente envolvam a labialização; não há nasalidade, a não ser na pronúncia de segmentos nasais; a laringe não se encontra nem levantada nem abaixada; o diâmetro do trato vocal supralaríngeo mantém-se praticamente uniforme ao longo do seu comprimento; as articulações orais anteriores são realizadas pela lâmina da língua, pois a raiz da língua não está nem avançada nem recuada; os músculos da faringe formam constrições no trato vocal; a mandíbula não está acentuadamente aberta ou fechada, a vibração das pregas vocais é regularmente periódica, sem fricção audível.

São considerados três tipos de ajustes no modelo fonético: supralaríngeos, laríngeos e de tensão. Os ajustes supralaríngeos englobam mobilizações dos órgãos do trato vocal, dos lábios, da língua, da mandíbula, do véu palatino e da laringe, modificando as configurações das cavidades oral, nasofaríngea, orofaríngea e laringofaríngea. Os ajustes de tensão concernem ao trato vocal e ao laríngeo. Os ajustes fonatórios compreendem ajustes de extensão, aproximação e contato realizados pelas pregas vocais e com variados modos de fonação.

No módulo fonético descritivo de qualidade de voz proposto por LAVER (1980), dois princípios são postulados: o da susceptibilidade e o da compatibilidade. Eles são relevantes ao serem considerados na identificação dos ajustes.

Pelo princípio da susceptibilidade, postula-se que alguns segmentos fônicos são mais susceptíveis do que outros a determinados ajustes. Dessa maneira, os segmentos fônicos orais são mais susceptíveis ao ajuste de nasalidade do que os nasais, ou seja, a característica do ajuste da nasalidade será mais facilmente percebida se os segmentos fônicos forem orais.

A relação entre ajustes e segmentos deve ser observada para fins de identificação dos ajustes, pois, quando os ajustes têm atributos não comuns ao segmento, esses passam a ser mais susceptíveis à sua influência.

A análise acústica das qualidades de voz pode ser verificada por meio de variadas medidas de curto termo, tais como frequência de formantes e a relação entre harmônicos e o LTAS, medida de longo termo pela qual se verifica a variação da intensidade ao longo do eixo da frequência.

Baseado no modelo fonético descritivo de qualidades de voz, LAVER (1979, 1980, 2000) elaborou, para fins de avaliação das qualidades de voz, um roteiro denominado Voice Profile Analysis Scheme (VPAS), cuja versão mais recente data de 2007 (LAVER e MACKENZIE-BECK, 2007). Essa versão do roteiro foi traduzida e adaptada para o português brasileiro por CAMARGO E MADUREIRA (2008).

Essa versão adaptada do roteiro foi aplicada em treinamento de juízes, e os resultados da aplicação foram relatados em CAMARGO E MADUREIRA (2008). Para o treinamento, foi construído um corpus com frases que continham repetições de segmentos fônicos-chave (sons consonantais e vocálicos da língua portuguesa), de modo a facilitar a identificação dos ajustes de qualidade de voz. Dessa forma, frases constituídas somente por sons orais, por exemplo, tinha o objetivo de treinar a percepção de ajustes de qualidade de voz nasal; frases com vogais anteriores frequentes, para treinar a percepção de ajustes de corpo de língua recuada; e frases com sons alveolares, para treinar a percepção de vários ajustes de língua.

A versão do roteiro de CAMARGO E MADUREIRA (2008) também foi aplicada em vários trabalhos desenvolvidos no Laboratório Integrado de Análise Acústica e Cognição (LIAAC), da Pontifícia Universidade Católica de São Paulo, entre eles: PESSOA (2012); CAMARGO, RUSILO E MADUREIRA (2012); MADUREIRA e CAMARGO (2010) e MADUREIRA (2011) constituindo uma linha de pesquisa original sobre a investigação da qualidade de voz por considerar os ajustes articulatórios além dos fonatórios e de tensão comumente apreciados na literatura sobre qualidade de voz e relacioná-los a parâmetros acústicos robustos (BARBOSA, 2009).

2.1.1.2 QUALIDADE DE VOZ E EXPRESSÃO DE EMOÇÕES

A qualidade de voz é um elemento prosódico de relevância paralinguística (LAVER, 1980), aspecto que engloba a expressão de emoções. GOBLE E CHASAIDE (2003) investigam, a partir de estímulos originados por aplicação de

procedimentos de síntese de fala, sete tipos de qualidades de voz (modal, harsh voice, tense voice, breathy voice, whispery voice, creaky voice e lax-creaky voice) e os efeitos impressivos desses estímulos. Esses tipos de qualidade de voz corresponderiam a ajustes fonatórios e de tensão laríngea descritos no VPAS-PB. Para avaliar os efeitos impressivos da qualidade de voz, conduzem um experimento perceptivo em que os juízes têm de avaliar as impressões causadas pelos diferentes tipos de qualidade de voz. Os descritores utilizados foram: relaxado/estressado, contente/zangado, amigável/hostil, triste/ feliz, desinteressado/interessado, formal/informal, tímido/confiante e medroso/destemido. Como resultados, apontam que as qualidades de voz sinalizaram melhor emoções mais sutis do que emoções fortes, com exceção da raiva, e que não há biunivocidade entre qualidade de voz e tipo de afeto.

JOHNSTON E SCHERER (1999) investigaram a expressão de emoções em frase emitida por um ator com variadas emoções, realizando um experimento com técnicas de análise acústica e fisiológica (eletroglotografia, respirometria, eletrocardiograma e eletromiografia de superfície). Os resultados apontam valores mais baixos de frequência fundamental (f0) na expressão de emoções como tristeza, depressão, tédio e desapontamento, e mais altos para a alegria e raiva explosiva (hot anger) . A extensão de f0 revelou-se maior na expressão de alegria e menor na expressão de estados afetivos negativos, como depressão, tensão, tédio, ansiedade e irritação. O que também é compatível com os de outros estudos: KAISER (1962), VAN BEZOOIJEN (1984), SCHERER (1986), BANSE E SCHERER (1996) e LAUKKA (2007), e complementar aos achados de KIENAST E SENDLMEIER (1999) em relação à expressão de tristeza e tédio sobre a existência de redução de segmentos, taxa de articulação lenta e diminuição nos valores de frequência de formantes.

Os valores de jitter (índice de instabilidade na forma da onda sonora glotal, medido na variação ciclo a ciclo da frequência fundamental) correlacionaram-se com valores de f0, mostrando-se mais altos com a elevação de f0. Essa tendência não foi, todavia, verificada na expressão de ansiedade e tensão. Em relação ao parâmetro de jitter em análise de fala emotiva NUNES (2009) aponta que valores mais altos de jitter relacionaram-se com a expressão de desespero, medo raiva e tristeza e os mais baixos à alegria.

A análise do tempo de adução e abdução das pregas vocais mostrou que as emoções tiveram impacto no tempo de fechamento (adução), mas não no de abertura (abdução). Para as emoções com alto grau de ativação do organismo, caracterizadas por f0 alto e energia espectral alta, a glote fecha-se mais rapidamente. Isso revela esforço vocal maior ou tensão muscular laríngea.

Na expressão de irritação e felicidade, foi encontrada pouca energia espectral nas frequências baixas. Na expressão de tensão e ansiedade, entretanto, não foi verificada redução tão grande em baixas frequências, o que demanda, segundo os autores, a investigação de outros fatores além do esforço vocal.

A expressão de alegria foi caracterizada por maior variação de f0 e maior concentração de energia em frequências altas, mas menor quociente de fechamento (adução das pregas vocais). O parâmetro de f0 tem se mostrado muito relevante na análise de expressão de emoções, sendo um dos parâmetros mais investigados.

Em termos de número (12) e relevância (medidas de f0, intensidade e duração) de parâmetros acústicos analisados, o trabalho de BARBOSA (2009) traz uma importante contribuição para a análise da expressividade oral em geral e a investigação de emoções na fala. Esses parâmetros serão detalhados no Capítulo 3, ítem 3.6.

Nesse trabalho, a expressividade de fala de entrevistados em um programa de rádio é analisada por um método que detecta variação na expressividade da fala por meio da conjugação de três tipos de análise: uma Análise Dimensional, uma Análise de Componentes Principais e uma Análise de Regressão Múltipla.

O corpus constituído de 206 enunciados foi avaliado em termos de 4 dimensões expressivas por meio de teste perceptivo aplicado a 12 juízes. Três das dimensões concerniam os primitivos emocionais de ativação (relaxado-agitado), valência (agradável-não agradável) e controle (controlado-sem controle) e uma quarta dimensão relacionava-se ao envolvimento (envolvido-não envolvido).

Entre os resultados, foi verificado que o aumento do esforço vocal (valores mais baixos de inclinação espectral) diminui na fala empática, enquanto valores altos de f0 (representados pelo quantil 0,995) aumentam a empatia.

A análise de PCA explicou 97% dos dados e a Análise de Regressão Múltipla revelou-se capaz de predizer os valores de duas dimensões derivadas do PCA (a

prontidão e a empatia) a partir dos parâmetros acústicos obtidos automaticamente do conjunto de enunciados.

Os parâmetros propostos por BARBOSA (2009) serão utilizados para a análise de nossos dados. Serão integrados nessa análise os ajustes de qualidade vocal e aspectos da dinâmica vocal descritos pelo VPA, a expressão de valência e emoções e aspectos visuais. Com essa integração pretende-se contribuir para a reflexão sobre função paralinguística da fala e sua relevância comunicativa

2.2 PROSÓDIA VISUAL E SEU PAPEL NA CONSTRUÇÃO DA EXPRESSÃO