Empirical data Background
5. I NDUSTRY PERSPECTIVES
5.1 Clusters in Norway
O trabalho deMacWhinney et al.(2010) (Automated analysis of the Cinderella story) utilizou ferramentas do TalkBank1, um projeto amplo que provê métodos e ferramentas para o
estudo de uma variedade de tipos de linguagem, para a análise automatizada da fala de pacientes afásicos, utilizando textos do projeto AphasiaBank2.
O objetivo do TalkBank é construir uma base de dados compartilhada de recursos multimídia sobre a comunicação humana (MACWHINNEY et al.,2010). O projeto envolve outros sub-projetos, como o BillingBank3, de aquisição de segunda língua, o CABank4, de análise conversacional, entre outros. Nestes, inclui-se o AphasiaBank, um projeto que coleta e analisa amostras em áudio e vídeo de discurso afásico e não-afásico ao longo de diversas tarefas, com o objetivo de melhorar o tratamento da afasia (MACWHINNEY et al.,2010).
O estudo de MacWhinney et al. (2010) utilizou narrações da história da Cinderela, produzidas por sujeitos normais (n = 25) e por sujeitos afásicos (n = 24), transcritas utilizando o formato CHAT e um conjunto de programas denominado CLAN (MACWHINNEY,2000). O formato de transcrição CHAT tem sido desenvolvido nos últimos 30 anos para capturar características relevantes do uso da linguagem para análise em diversas disciplinas, como aquisição de primeira e segunda linguagem, análise conversacional, etc.; os programas CLAN, projetados para lidarem com o formato CHAT, permitem analisar diversas estruturas linguísticas
1 <http://talkbank.org/>
2 <http://talkbank.org/AphasiaBank/> 3 <http://talkbank.org/BillingBank> 4 <http://talkbank.org/CABank>
@G: Cinderella
*PAR: &guh a little bit I think, yeah. *PAR: was [//] what was the name ? *PAR: Secerundid [: Cinderella] [* nk].
*PAR: she was &guh &b angel for legwood@n. [+ jar]
*PAR: she was &guh &f for fendle@n for someone else. [+ jar]
*PAR: the other children [/] &gr &d children for her are three children or whatever . [+ es] *PAR: with her it was very closed [* wu] walking [* wu] in generalis@n . [+ jar]
*PAR: >h &th &p pezzels@n are going for the party.
*PAR: and she was &gf fen@n people [* wu] for prezzled@n (.) for the present [* wu]. [+ jar] *PAR: the present > (. . . .) was s(up)posed to be &uh thirty [/] &t &uh thirty or something. [+ es]
*PAR: she &gch &er had a ranned@n from home she &ha huddled [* wu]. [+ jar] *PAR: the &guh (..) people were +//.
*PAR: they found her letter.
*PAR: and <the pezzes@n> [//] &gw the other people wed [* wu] they found her. *PAR: found her for the prezzled@n and the calls this one so. [+ jar]
Figura 11 – Transcrição no formato CHAT da história da Cinderela (extraído de (MACWHINNEY et al.,2010)).
e discursivas (MACWHINNEY et al.,2010).
A Figura 11mostra um exemplo de transcrição no formato CHAT. O formato inclui diversos códigos de erros (como [* wu], que indica que o erro é uma palavra real e que a palavra pretendida é desconhecida), códigos ao nível da enunciação (como [+ jar], que indica uso de jargão), e códigos para repetição ([/]), revisão ([//]), fragmentos de palavras e preenchedores (&), trocas ([: palavra pretendida]) e pausas (.) (MACWHINNEY et al.,2010).
Com base nas transcrições, os autores utilizaram o CLAN para extrair características dos textos e, por meio delas, comparar os sujeitos normais com os afásicos. A primeira característica analisada foi a relação Tipo por Token, de onde se concluiu que os sujeitos afásicos possuem um discurso lexicalmente pobre quando comparado ao dos sujeitos normais (os sujeitos afásicos produziram 526 tipos de palavras, num total de 5330 tokens, enquanto os sujeitos normais produziram 839 tipos, para 13309 tokens).
O CLAN foi utilizado também para levantar os 10 substantivos e os 10 verbos mais frequentes tanto na fala normal quanto na afásica. Com base nos substantivos, os autores notaram que o discurso afásico, apesar de capturar os tópicos principais da história narrada, é mais vago, mais abstrato, que o dos normais (os afásicos, por exemplo, utilizam palavras como man, shoe, girl, menos intimamente ligadas à história da Cinderela que palavras como dress, fairy e stepdaughter, encontradas no discurso dos normais). Com base nos verbos, notou-se que os afásicos fazem uso mais intenso de light verbs, isto é, verbos com pouco conteúdo semântico por si só e assim formam um predicado com uma expressão adicional, por exemplo, tomar conta,
4.1. Abordagem lexical 81
indicando uma diversidade mais limitada para verbos (MACWHINNEY et al.,2010).
Os autores também exibiram o comando, que pode ser dado ao CLAN, para computar o número de erros, mas não compararam os textos com base nesses erros.
O site do AphasiaBank possui links para um documento de duas páginas sumarizando as orientações gerais para transcrição, um documento explicando a codificação de erros, um manual mais detalhado para treinamento de transcrição, e os manuais completos do CHAT e do CLAN (MACWHINNEY et al.,2010). Esses documentos poderão ser de grande valia para a definição do protocolo de transcrição utilizado neste trabalho. Os autores utilizaram um etiquetador morfossintático para anotar os textos e relatam que, apesar de ter sido treinado em um domínio de textos bem formados, o etiquetador apresentou bom desempenho nos textos orais afásicos. Apesar de utilizarem análise computadorizada dos textos transcritos, os autores não empregam classificação automática dos textos, o que é um diferencial do presente trabalho de mestrado.
O trabalho deThomas et al.(2005) (Automatic Detection and Rating of Dementia of Alzheimer Type through Lexical Analysis of Spontaneous Speech) apresenta diversas abordagens lexicais para a detecção e quantificação da DA, com o objetivo de explorar se técnicas automáticas baseadas na análise de fala espontânea podem fornecer medidas objetivas do nível de demência de pacientes com DA (THOMAS et al.,2005).
No estudo, o córpus utilizado foi composto com transcrições do Atlantic Canada Alzheimer’s Disease Investigation of Expectations(ACADIE), um estudo sobre a droga donepezil
(THOMAS et al.,2005). O estudo empregou oito métricas, extraídas dos textos do córpus:
1. Taxa de adjetivos (número de adjetivos dividido pelo número total de palavras). 2. Taxa de substantivos.
3. Taxa de pronomes. 4. Taxa de verbos.
5. Relação Tipo por Token (T T R). 6. Índice de Brunét (W ).
7. Estatística de Honoré (R). 8. Densidade de CSU’s.
Os valores dessas métricas foram utilizados em duas tarefas de classificação, uma com duas classes (alta e baixa) e outra com quatro classes (normal, leve, moderada, severa). As classes foram tomadas com base na pontuação de cada paciente no Mini-Exame do Estado
Cenário Melhor acurácia (%) Duas classes: alto e baixo 69,6
Quatro classes 50,0
Duas classes: normal e severo 94,5 Duas classes: normal e leve 75,3
Tabela 6 – Sumário dos resultados de acurácia de classificação deThomas et al.(2005).
Mental (FOLSTEIN; FOLSTEIN; MCHUGH,1975). Adicionalmente, foram feitas duas outras tarefas de classificação binária, utilizando-se sub-conjuntos das quatro classes. Foram realizados testes utilizando-se diversos cenários de seleção de atributos, e os melhores resultados são apresentados na tabela6.
Os autores do trabalho asseveram que, quando se deseja desenvolver novos testes de quantificação de demências que superem as deficiências dos métodos atuais, os pesquisadores devem procurar por métodos automáticos e objetivos que façam uso da análise de fala espontânea
(BUCKS et al.,2000). Os autores concluem que soluções puramente computacionais oferecem
uma alternativa viável às abordagens padrões de diagnóstico do nível de demência dos pacientes, embora reconheçam que mais deve ser feito para melhorar a acurácia desses métodos.