Conforme visto na bibliografia selecionada, as Línguas de Sinais possuem regras específicas quanto ao uso das mãos, que atribuem significados diferentes aos sinais. A composição das diversas características das Línguas de Sinais amplia as possibilidades da língua, permitindo assim as diversas formas de expressão.
Como não há necessariamente um sinal correspondente para cada palavra ou estrutura gramatical própria de uma língua verbal, o reconhecimento dos sinais – gestos no contexto da máquina – torna-se complexo. Para facilitar o processo do reconhecimento, é muito usual a segregação da língua de sinais, semelhante ao conceito de gramática das línguas orais.
Para ilustrar a diferença de aprendizado da máquina, Chomsky(2005, p. 34) traz o seguinte exemplo: a criança aprende, em média, cerca de uma palavra por hora, com exposição muito limitada e sob condições muito ambíguas. O computador age mais como um dicionário, já que as regras do conhecimento da linguagem são programadas. A criança aprende a palavra de acordo com a experiência; o computador limita-se a entender e significar a palavra através de programação e busca em um banco de dados pré-definido.
É necessário fornecer elementos básicos que alimentarão um banco de dados, e que, através de programação, o computador consumirá. Birdwhisthell (1952, 1970) analisou a metodologia do estruturalismo linguístico, identificando nas
kinesics19 da comunicação:
...elementos menores e discretos, os chamados cinemas – análogo ao fonema, a menor unidade de discurso sonoro – formado por vários allokines – similar aos alofones ou variantes dos fonemas; os cinemas se combinam em construções morfológicas chamadas kinemorphs (análogos aos morfes, ou grupos de fonemas pronunciáveis que podem funcionar como morfemas), formando kinemorphemes (comparáveis aos morfemas, ou seja, palavras ou partes significativas das palavras) e construções kinesintáticas
(BIRDWHISTHELL apud POYATOS, 1974, p.132, tradução nossa20).
A segregação das Línguas de Sinais é especialmente observável em Sistemas de Transcrição; sistemas que transcrevem o conteúdo de uma Língua de Sinais.
Stokoe (1960) é o pioneiro desse estudo. Seu sistema, baseado no alfabeto latino, tinha como objetivo demonstrar que a ASL é uma língua natural. Stokoe provou, por meio dos itens lexicais da ASL, que os sinais não são gestos ou mímicas, sendo passíveis de decomposição em unidades menores, semelhante às Línguas Orais.
19
Kinesics, na definição dada por Birdwhisthell (apud POYATOS, 1974, p.32): movimentos físico-musculares
conscientes ou inconscientes resultando em posições estáticas, aprendidas ou somatogênicas, de percepção sinestésica visual, visual-acústica ou tátil, que, isoladas ou combinadas com a estrutura linguística ou paralinguística e outros sistemas comportamentais somáticos ou objetuais, possuem valor comunicativo intencional ou não intencional.
20
”…smallest discrete element, the cinema (analogous to the phoneme, or smallest speech sound unit), made up of various allokines (similar to allophones or phoneme variants); cinemas combine into morphological constructs called kinemorphs (analogous to morphs, or pronounceable phoneme groups that can function as morphemes), forming kinemorphemes (comparable to morphemes, that is, words or meaningful parts of words), and kinesyntactic constructions.”
Nesse sentido, muitos estudos se esforçam em identificar equivalências – análogas ou homólogas – às teorias da fala (ARMSTRONG et al.):
Linguistas propuseram vários candidatos como segmentos dos sinais, entre eles movimento e pausa (Liddell, 1984), movimento e localização (Sandler, 1986), movimento e posição (Perlmutter, 1988). Outros têm tomado outros rumos de proposições, em que a base compartilhada por línguas sinalizadas e orais se encontram no nível da sílaba (Wilbur, 1987). Outros ainda propuseram que as Línguas de Sinais simplesmente não possuem segmentos (Edmondson, 1987). Até agora, há poucas considerações sérias sobre as possibilidades que palavras sinalizadas, como as línguas orais, podem ser analisadas como complexos gestos musculares temporalmente ordenados, e não como representações de categoriais formais abstratas (1995, p. 11, tradução nossa21).
Stokoe divide o sinal em três aspectos: localização, o que age, e o movimento, denominando esses três aspectos como “tab”, “dez” e “sig” (LIDDELL, 2003, p.6):
• tab (tabula), a posição da mão no início do sinal,
• dez (designator), o formato da mão no início do sinal, e
• sig (signation), a ação da(s) mão(s) na fase dinâmica do sinal.
O tab pode ocorrer em qualquer local no espaço do sinalizador, que se estende desde acima do quadril, até a zona de alcance de suas mãos. O espaço de sinalização é mais diferenciado ao redor do rosto, podendo distinguir em cinco regiões distintas (STOKOE, apud DORNER, 1994, p.4). A tab também pode ser em um lugar perto ou acima da outra mão não ativa. Nesse caso, considera-se a tab
21 “Linguists have proposed various candidates as signed segments, among them movements and holds (Liddell,
1984), movements and locations (Sandler, 1986), movements and positions (Perlmutter, 1988). Others have taken the different tack of proposing that the common ground shared by signed and spoken languages will e found at the level of the syllable (Wilbur, 1987). Still others have proposed that signed languages simply do not have segments (Edmondson, 1987). So far, there has been little serious consideration of the possibility that signed words, like spoken words, may be analyzed as complexes of temporally ordered muscular gestures, not as imperfect representations of abstract formal categories.”
para o formato da mão não ativa e essa é descrita como uma posição dez. No total, existem doze possíveis localizações de tab.
O dez descreve o formato da mão: a posição dos dedos e a orientação da mão no espaço. Stokoe lista dezenove designadores possíveis, a maioria idêntica ou similar a algumas letras do alfabeto, geralmente a primeira letra da palavra que o sinal representa (STOKOE, apud DORNER).
O sig descreve as direções dos movimentos das mãos, com as possíveis rotações da mão, e a mudança do formato da mão durante o movimento. Existem basicamente duas possibilidades de mudança no formato da mão durante o sinal, aberto e fechado (STOKOE, apud DORNER). Stokoe lista o total de vinte e quatro diferentes sigs.
Com a evolução das pesquisas na área, foram encontrados problemas na notação sugerida por Stokoe (AMARAL, 2012, p. 16)
- Característica sequencial – os tabs, dez e sigs ocorrem de forma simultânea, e a notação não descreve explicitamente a simultaneidade de ocorrência dos eventos;
- Número finito de configurações de mão – Stokoe lista o total de dezenove dez (configurações de mão), atribuídos a um determinado símbolo. Caso seja necessário descrever uma nova configuração de mão, um símbolo já existente e que mais se aproxime à nova configuração de mão é utilizado;
- Falta de representação de aspectos não manuais – como visto na bibliografia das características das Línguas de Sinais, os aspectos não manuais, como as
expressões faciais e os espaços mentais, são essenciais para o entendimento de alguns sinais;
Melhorias ao sistema proposto por Stokoe vêm sendo desenvolvidos. O estudo de Miller (1994 apud AMARAL, 2012) considera a árvore genealógica dos Sistemas de Transcrição (figura 25).
-
Figura 25: Árvore genealógica dos sistemas de transcrição
Miller, C. (1994, apud AMARAL, 2012)
Apesar de significativos esforços na área, não há consenso sobre as estruturas das Línguas de Sinais:
Os linguistas da área buscam entender quais informações são relevantes e devem ser registradas nas transcrições. No entanto, as pesquisas linguísticas sobre língua de sinais existem há pouco mais de meio século, tendo como pioneiro o trabalho de Stokoe (1960). Diferentemente das línguas orais, que há milhares de anos têm sido representadas por um sistema quase-fonológico, o alfabético, as línguas sinalizadas carecem de qualquer sistema de escrita largamente aceito, que possa servir como base de uma transcrição própria. Desse modo, ainda não existe um sistema de transcrição tradicional e consolidado para a descrição das línguas de sinais, muito menos voltado para fins computacionais. (AMARAL, 2012, p. 6)
Dessa forma, quando utilizada, a segmentação das Línguas de Sinais é tratada de diferentes formas pelos desenvolvedores de interfaces de Reconhecimento das Línguas de Sinais. À exemplo, tais abordagens podem ser encontradas em estudos relacionados aos gestos, como em Fei & Reid (2003) e Wu & Huang (1999), que dividem o gesto em postura e movimento, e em Derpanis et al. (2004) que dividem o gesto em postura, movimento e local.
A importância de trabalhos relacionados como o de AMARAL (2012) é fomentar a discussão de padronizações da segmentação dos sinais. Com a formalização desses padrões, as interfaces podem trabalhar com uma base comum de reconhecimento, e os pesquisadores despenderem menos tempo focando na pesquisa ou desenvolvimento de técnicas relacionadas.