Pavlovic et al. (1997) oferecem uma definição de gesto manual que combina a evolução da postura e da posição no tempo, com a intenção de comunicar ou manipular.
Com relação à postura da mão, coexistem duas definições bastante aceitas: pode significar a configuração que a mão assume definida pelos ângulos formados por todas as articulações de todos os dedos, independente da posição e da orientação da palma, ou pode ser independente somente da posição e definida pelos ângulos das articulações dos dedos e também pelos três ângulos que definem a rotação da mão como um todo. Neste trabalho, adota-se essa segunda definição e, de acordo com ela, a postura da mão aparenta ter 20 graus de liberdade, correspondentes às flexões ou extensões das três articulações e à rotação lateral de cada um dos cinco dedos. Na prática, principalmente para movimentos não forçados (aqueles feitos naturalmente, com ou sem esforço mas sem que se use a outra mão ou qualquer outro apoio como auxílio), esses movimentos não ocorrem de maneira independente e a dimensionalidade do problema pode ser reduzida.
A Figura 1, adaptada de Pavlovic et al. (1997), mostra essas articulações e algumas das restrições de seus movimentos. Além dessas regras explícitas, o uso de técnicas estatísticas como análise de componentes principais pode reduzir ainda mais essa dimensionalidade (Wu, Lin & Huang, 2001).
Figura 1 - Articulações da mão Fonte: Pavlovic et al. (1997) A definição de Pavlovic et al. (1997) combina posturas e movimentos, o que de fato é aceita pela maioria dos autores, e limita-se a gestos voluntários, com a intenção de comunicar. Embora existam autores que incluam gestos involuntários em suas definições (inclusive podendo indicar a comunicação de diversos aspectos de que o gesticulador não está consciente), na maior parte das interfaces são úteis somente os gestos voluntários, por isso essa limitação da definição será mantida neste trabalho. A definição inclui também parâmetros espaço-temporais do gesto, como a velocidade com que é realizado. De fato, esses parâmetros podem alterar ou até inverter o significado do gesto. O mesmo movimento feito repetidas vezes com velocidade pode significar pressa ou rapidez, mas feito de forma lenta pode dar a entender calma ou que há tempo.
Essa definição peca, no entanto, em dois pontos: não inclui o local em que o gesto ocorre nem em relação a um referencial fixo no gesticulador nem a um fixo no ambiente. A maior parte dos autores concorda que o local onde o gesto é realizado (ou, por vezes, onde se inicia) pode modificar drasticamente seu significado. Por exemplo: um gesto feito com a mão em postura de apontar para o lado de dentro fazendo um movimento circular em torno de um eixo horizontal paralelo ao plano frontal do corpo pode significar continuidade, avançar ou voltar (dependendo do sentido de rotação) se for feito abaixo da altura da cabeça, mas quando feito
exatamente da mesma forma mas posicionado ao lado e próximo da cabeça, em geral indica demência. Em línguas de sinais, dentre outros contextos, a parte do corpo que é tocada ou não no início ou no final do gesto também pode alterar seu significado de forma semelhante. A posição do gesto em relação a elementos no ambiente e no contexto que cerca o gesticulador também pode modificar o seu significado, muitas vezes através do gesto de apontar, mas não necessariamente só nesse caso. Um gesto feito com uma das mãos enquanto a outra aponta para um prato de comida, por exemplo, pode assumir significado bastante distinto se ao invés disso apontar para uma pessoa.
Além disso, considera-se a tarefa de manipulação como distinta da gesticulação (poucas pessoas descreveriam o ato de pegar uma caneta, por exemplo, como um gesto). Por isso, neste trabalho é adotada a seguinte definição, que acrescenta àquela apresentada por Pavlovic et al. (1997) o local do gesto e elimina a manipulação: um gesto manual é uma seqüência temporal e voluntária de posturas e posições das mãos, tendo como referencial de local o corpo do autor do gesto, podendo fazer referência ao ambiente que o cerca e contida num intervalo limitado de tempo, com a intenção consciente de comunicar.
Embora esta definição inclua a evolução temporal do gesto, nada afirma sobre quando começa ou termina. Quek (1994) é um dentre a maioria dos autores que aceita uma divisão temporal dos gestos, proveniente de estudos psicológicos, em três fases: preparação, núcleo e retração. A preparação e a retração em geral são caracterizadas por movimentos rápidos da mão, respectivamente saindo de e voltando para uma posição de repouso, sem significado para a comunicação. O núcleo é a fase temporal do gesto em que ele assume significado, através da combinação dos fatores citados na definição acima. Pavlovic et al. (1997) discutem que a fase de retração pode ser suprimida, ou difícil de identificar, na transição entre dois gestos simultâneos. Quek (1994) afirma ainda que movimentos lentos entre as posições de repouso não constituem gestos e que gestos estáticos, aqueles definidos como uma única postura, devem ser mantidos por um certo tempo para terem significado.
Pesquisas da área de linguística (Liddell e Johnson, 1989) sugerem uma simplificação que pode ser aplicada à definição de gesto adotada ao afirmar que as mudanças na postura da mão que ocorrem durante o seu movimento não tem, em
geral, significado e, nesses casos, basta analisar as posturas assumidas pela mão antes de começar a se mover e depois que o movimento chega ao fim.
Com base no movimento, gestos manuais podem ser classificados como estáticos, definidos por uma única postura que, de acordo com Quek (1994), deve ser mantida por um certo tempo, e dinâmicos, em que há mudança de postura ou movimento da mão. Essa classificação é adotada neste trabalho, e os gestos dinâmicos são subdivididos em quatro tipos: aqueles em que ocorre somente uma rotação da postura em torno do pulso, os que consistem somente em uma mudança de postura, aqueles em que há somente movimento da mão e, por fim, os que combinam movimento e mudança de postura. É comum na literatura, no entanto, a utilização do termo "gestos dinâmicos" para indicar gestos definidos somente pelos movimentos da mão, ignorando mudanças na postura.
Classificações baseadas em outros fatores, como a função ou o significado dos gestos, são numerosas e raramente concordam. Neste trabalho adota-se uma combinação das classificações propostas por Nielsen et al. (2003) e Bowman et al. (2005):
• Gestos emblemáticos ou simbólicos são aqueles que tem significado próprio, sem a necessidade de imitar ou fazer alusão a nenhum objeto ou ação. Um exemplo é o gesto estático com o polegar levantado que indica aprovação e outro é o esfregar do indicador com o polegar que faz referência a dinheiro.
• Gestos mímicos em geral imitam um objeto ou uma ação para descrevê-los ou assumir seu significado, e podem ser exemplificados por fazer um círculo com as mãos ou imitar o ato de puxar um gatilho. Podem ser subdivididos em icônicos, que representam conceitos concretos como nos exemplos acima, ou metafóricos, que representam conceitos abstratos, como o gesto para indicar continuidade descrito anteriormente.
• Gestos deíticos são os gestos de apontar, indicando pessoas, objetos ou locais. • Gestos proposicionais fazem referência consciente ao espaço ao redor do gesticulador e em geral ilustram tamanhos (por exemplo ao separar as mãos) ou movimentos.
• Gestos de batida são repetitivos e usados para indicar ritmo ou velocidade, ou para enfatizar palavras.
Os dois primeiros tipos de gestos, com significado próprio e discreto são classificados por Quek et al. (2002) como semafóricos e, de acordo com os autores, são usados com baixa frequência durante a comunicação espontânea, mas estão entre os gestos mais úteis para interação, inclusive para a realização de tarefas secundárias e não as que são o principal foco da interação, como mostrado por Karam & Schraefel (2005). Os três últimos tipos em geral são utilizados juntamente com a fala e são classificados dessa forma e em conjunto por Bowman et al. (2005).
Oviatt (1999), mostra que, durante a comunicação espontânea, somente 20% dos gestos utilizados por pessoas são deíticos mas o uso desse gesto é muito comum em interfaces baseadas somente em gestos e principalmente nas que os combinam com fala. Epps, Lichman & Wu (2006) teorizam que isso se dá principalmente quando é utilizada a metáfora de janelas, por associação do gesto de apontar com o ponteiro do mouse. Em testes realizados por eles com vinte voluntários instruídos para interagir utilizando somente posturas de mão (mas podendo escolher qualquer postura para a realização de qualquer tarefa) com uma interface convencional baseada em janelas, mais de 70% dos usuários utilizou a postura de apontar com o indicador estendido ou uma variação dela, na média de todas as 36 tarefas. Para algumas tarefas, como seleção, essa porcentagem superou 90%, mas para nenhuma (incluindo, por exemplo, rotação) foi inferior a 50%.
A maioria dos autores cita ainda outra função ou classificação de gestos, as línguas de sinais. Como se tratam, no entanto, de línguas tão ou mais complexas que as verbais, com regras próprias complexas que inclusive regem sua evolução e que utilizam não só gestos da mão mas do corpo inteiro, além de expressões faciais, considera-se simplista classificá-las como meros gestos. Neste trabalho, o problema de língua de sinais não será abordado, exceto quando trouxer contribuições úteis para o uso de gestos em geral.