• No results found

5.5 Analyse av Elevundersøkelsen

5.5.4 Faktoranalyse: For mye evaluering og for lite undervisning?

Nas palavras com mais de uma sílaba, sempre existe uma sílaba que é pronunciada com maior intensidade do que as outras, mas isso não ocorre na escrita. A marcação da tonicidade das palavras é uma tarefa de maior importância para o conversor gráfico fônico. Limita-se a destacar os aspectos das sílabas e a distribuição do acento silábico na palavra do PB.

A sílaba tônica é produzida com maior pulso torácico, portanto, audivelmente percebida como sendo mais alta e de duração mais longa. Ela é marcada por meio de aspa dupla antes da sílaba, como na palavra <sabia> [sa"bia] em que a aspa indica que a sílaba subsequente é tônica . "As vogais tônicas estão em oposição às vogais átonas. Vogais átonas podem ser pretônicas ou pós-tônicas. Vogais pretônicas antecedem o acento tônico e vogais postônicas sucedem o acento tônico." (SILVA, 2014, p.77).

A distribuição do acento tônico nas palavras do PB ocorre de forma bastante previsível. A acentuação só pode recair nas três últimas sílabas da palavra. Segundo Seara, Nunes e Volcão (2015), as palavras proparoxítonas geralmente têm origem estrangeira e apresentam uma forte tendência ao apagamento na pronúncia da sílaba pós-tônica, como acontece com a palavra <fósforo> produzida como

["fOsfru]. A maioria das palavras oxítonas é finalizada por consoante, pois "O acento em PB é sensível ao peso da sílaba: o acento tem por tendência cair na sílaba finalizada por consoante - as sílabas travadas ou pesadas." (SEARA, NUNES e VOLCÃO, 2015, p. 128). As palavras paroxítonas constituem maior quantidade no PB e são preferidas quando a última sílaba é terminada por vogal.

Os aspectos da estrutura silábica e a distribuição acentual na palavra permitem a construção de um sistema que tenta descrever a relação gráfica e fônica de forma mais integrada e interdependente. A integração ocorre na concatenação dos elementos na divisão silábica que serve tanto para aplicação das regras fonológicas quanto para a marcação da tonicidade. A interdependência se apresenta na própria aplicação das regras em cascata. Existem algumas regras que exigem a utilização das regras precedentes. Por exemplo, a regra da coda depende da separação silábica bem formada para que sua aplicação seja satisfatória na transcrição. Se a separação silábica da palavra <cama> for <ca.ma>, então, essa regra não se aplica a essa situação, mas se for <cam.a>, então aplica-se a transcrição, mas de forma errada.

Desse modo, atendendo ao contexto do grafema, o Potigrafone considera que, se uma sílaba contém uma vogal com o acento gráfico, então, a sílaba é identificada como sendo tônica, logo, recebe a marca de tonicidade. Se não há marca gráfica, então, o sistema analisa os casos particulares:

a) se a palavra termina em <a>, <e> ou <o>, seguida ou não de <m|n|s>, então a sílaba <$> anterior à que contém <a>, <e> ou <o> é uma sílaba tônica ($tônica). Exemplo: <casa>, <cartas>, <cantam>.

b) se a palavra termina em <l>, <r>, <x> ou <z>, então <$>anterior será uma <$tônica>. Exemplo: cantar, papel, capaz, duplex.

c) se a palavra termina em <i> ou <u>, seguida ou não de <m|n|s>, então, <$> que contém <i> ou <u> será uma <$tônica>. Exemplo: paris, comum, Jesus, delfim.

O sistema faz apenas a marcação da sílaba tônica primária. As palavras derivadas morfologicamente, como é o caso dos advérbios de modo cuja terminação é <mente>, como em <rápido> → <rapidamente> - que deveria receber a marcação do acento secundário.

3.4 Conceitos computacionais

Nos tópicos anteriores, deste capítulo, mostramos os principais conceitos linguísticos que orientaram a implementação do conversor Potigrafone. Neste tópico, no entanto, apresentaremos os aspectos computacionais e formais desse sistema, destacando os conceitos de língua formal, de expressão regular e de transdutores de estados finitos além da distinção entre a forma subjacente e a forma de superfície, cuja ideia está relacionada às formas de entrada e às formas de saída, vistas no início deste capítulo.

3.4.1 Língua formal, expressão regular e rede de estados finitos

O termo língua é usado aqui no sentido geral para se referir a um conjunto de cadeias de caracteres, que são chamadas de string. Isso implica dizer que “Uma língua formal é um conjunto formado por sequências resultantes da concatenação de elementos extraídos de um conjunto de símbolos, chamado

alfabeto ou sigma”. (ALENCAR, 2011, p.19). Para melhor compreensão desse

conceito, suponham os elementos do conjunto ∑ = {b, a, h, !}, que podem ser repetidos e concatenados entre si. A partir de ∑ pode ser construída uma língua formal L1, a qual pode ter como palavras <baaah!> ou <bah!>, etc.

Alencar (2011, p.21) diz que uma língua formal é caracterizada pela "enumeração exaustiva de seus elementos" e pela "especificação de 'um critério de pertinência que é satisfeito por todos os elementos do conjunto e somente por esses elementos'". A língua L1 pode ser definida por meio das expressões regulares R1 = {b, a, a, h, !} ou R2 = b a^>1 h "!". Em R1, a língua é definida pela enumeração dos elementos e, em R2, por critérios de pertinência. Portanto, do conjunto formado pelos elementos, pode-se gerar um número de palavras que é aceito pela linguagem formal, ou seja, as regras para a linguagem são explicitamente declaradas em termos das cadeias de símbolos em que podem ocorrer.

A concatenação dos símbolos de L1 não ocorre de qualquer forma. A palavra <ab!h>, por exemplo, não pertence a essa língua, mesmo que todos esses elementos estejam contidos em L1, pois foi definida uma estrutura gramatical para ela. O primeiro elemento da língua deve ser obrigatoriamente um <b>, depois um ou mais <a>, com um <h> seguido de um sinal de exclamação <!>. Isso é chamado de

gramática de uma língua formal. "A gramática de uma língua formal é um mecanismo capaz de produzir todas e somente as cadeias pertencentes a essa língua", ou seja, são "dispositivos capazes de gerar uma língua". (ALENCAR, 2011, p.22). Na definição de uma língua formal, considera-se sempre a existência de uma gramática que a constitui e também os autômatos que são "os dispositivos capazes de reconhecer uma língua, isto é, determinar se uma dada sequência é elemento da língua." (ALENCAR, 2011, p. 22). Portanto,

Autômatos e gramáticas, não obstante constituírem dispositivos computacionais diferentes, estão estreitamente relacionados, porque, dado um autômato capaz de reconhecer uma dada língua formal, uma gramática capaz de gerar essa língua pode ser construída automaticamente, ou seja, de forma algorítmica. (ALENCAR, 2011, p. 23).

Esse autor acrescenta que a construção de um algoritmo capaz de gerar as cadeias pertencentes a uma língua é caracterizada por meio de uma gramática que consiste de quatro elementos ordenados, a saber G = (Φ, ∑, Γ, S). Temos, abaixo, a descrição de cada símbolo:

a) Φ é um alfabeto de símbolos não terminais;

b) ∑ é um alfabeto de símbolos terminais, com a condição de que Φ ∩ ∑ = Ø (com a condição que a intersecção dos símbolos não terminais com os símbolos terminais seja vazia);

c) Γ = Φ U ∑, onde Γ é a união dos símbolos não terminais com os símbolos terminais;

d) R é um conjunto de regras de reescrita do tipo <α, β>, ou seja, α é substituível por β;

e) S é o símbolo inicial com a condição de que S Є Φ.

Os elementos que compõem o conjunto de símbolos terminais ∑ da gramática são as vinte e seis letras do alfabeto latino, como foram mostradas no tópico sobre formas gráficas da língua, e está presente no módulo arquivo do sistema, no tópico 6.3. Os símbolos não terminais Φ são as letras dos constituintes

silábicos. Não existe intersecção entre os elementos do primeiro alfabeto ∑ com os

símbolos do segundo Φ, como pode ser comprovado no módulo arquivo, no apêndice B. O conjunto de regras de reescrita é aplicado aos elementos de entrada que os substituem no processo derivacional.

Uma língua formal é declarada por meio de uma expressão regular. Uma

classe de string23. Em outras palavras, ela "é uma composição de símbolos, caracteres com funções especiais, que, agrupados entre si e com caracteres literais, formam uma sequência, uma expressão." (JARBAS, 2012, p.19). Ela é interpretada como uma regra que indicará sucesso, se uma entrada (input) de dados qualquer unir-se com essa regra, ou seja, obedecer exatamente a todas as condições.

A língua L1 foi denotada por duas expressões regulares R1 ou R2, as quais são compiladas por meio de uma rede de estados finitos. A figura abaixo, também chamada de grafo de transição, mostra a rede de estados finitos - doravante finite

states transducer (FST) - produzida por essas expressões regulares.

Figura 10 – Grafo de transição de L1

Fonte: Elaborada pelo próprio autor.

Em uma FST, os círculos representam os estados e estes possuem um rótulo que é o nome da entrada para o estado. No Foma24, os rótulos recebem como nome um número. O estado inicial está assinalado pelo círculo que contém o rótulo zero (0) e o estado final é representado com duplo círculo, neste caso, o círculo que contém o rótulo cinco (5). As setas (ou arestas) representam os arcos e indicam o caminho dos estados. O rótulo de um arco é um símbolo do alfabeto da língua, ou seja, um elemento do sigma que, nessa FST, é constituído de quatro elementos, ∑ ={!, a, b, h}.

Beesley e Karttunen (2002, p. 44) sumarizam dizendo que “uma expressão regular denota um conjunto de cadeias (isto é, uma linguagem) ou pares de cadeias (isto é, uma relação). Ela é compilada por uma rede de estados finitos que codificam a linguagem correspondente ou a relação que pode ser infinita”25, como mostra a figura abaixo.

23Neste trabalho, utilizamos os termos string, em inglês, ou cadeia de caracteres - a tradução - para referirmo-nos à concatenação de um, dois ou mais elementos do alfabeto terminal e não terminal. 24No capítulo 6 mostramos com mais detalhes o uso da concatenação, união, intersecção de

elementos e a formação das redes de estados finitos por meio da linguagem Foma.

25Texto original: A regular expression denotes a set of strings (i.e. a language) or string pair (i.e. a

relation). It can be compiled into a finite-state network trat compactly encodes the corresponding language or relation that may well be infinite.

Figura 11 - Língua formal, expressão regular e rede de estados finitos

Fonte: adaptado de Beesley e Karttunen (2002, p. 44).

Portanto, Beesley e Karttunen (2002, p. 46) afirmam que “Um dos resultados fundamentais da teoria da língua formal é a demonstração de que os estados finitos de uma língua são precisamente um conjunto de línguas que podem ser descritas por uma expressão regular.”26 (Destaque dos autores). Esta inclui um

conjunto de operadores lógicos que diferem de uma linguagem de programação para outra.