2.4 PRINSIPPER
2.4.3 Prinsipper for anvendelse av landmakt
Um sentido comum do termo “dialogar” tem a ver com a resolução de problemas. Praticamente todas as actividades humanas envolvem dialogar com outras pessoas como forma de levar a cabo as mais variadas acções.
Uma definição de diálogo num dicionário de referência da língua portuguesa [Infopedia, 2007] indica que se trata de um substantivo masculino, com o seguinte significado:
2. Troca de ideias para se chegar a um entendimento; 3. Obra literária ou científica em forma de conversação; 4. Alternância de dois factores complementares um do outro.
Um diálogo implica uma sequência de troca de informação que se mantém coerente ao longo do tempo e por definição implica uma “conversa”, entre dois ou mais interlocutores, uma troca de “ideias” com vista a um entendimento e uma alternância entre emissor e receptor [Oviatt, 2002]; [Trung, 2006]. O diálogo é um fenómeno social (possui regras) e um diálogo eficaz deve ser colaborativo. Se quisermos criar máquinas capazes de dialogar com pessoas, teremos de implementar sistemas capazes de “conversar”, ie, de trocar ideias, em alternância, e que progridam com vista a um entendimento e um resultado final. A criação de sistemas com essas capacidades apresenta desafios consideráveis. De acordo com James Allen, em [Allen
et al., 2001], os quatro principais desafios que se colocam são: i) gerir a complexidade
da linguagem (natural) a utilizar, associada à tarefa; ii) integrar o SD com o sistema de
back-end que disponibiliza o serviço pretendido; iii) a necessidade de reconhecimento
de uma intenção (por parte do utilizador humano) como aspecto chave do processo de entendimento, e; iv) suportar e possibilitar a iniciativa mista, onde tanto o sistema como o utilizador podem liderar a iniciativa do diálogo em diferentes alturas, tornando a interacção mais natural, mais eficiente e mais eficaz.
Embora para os humanos o diálogo (falado) seja a forma mais natural de comunicação, este inclui características que o tornam bastante complexo para sistemas computacionais, pelo que ainda não existem sistemas de diálogo robustos mesmo quando se considera apenas a fala isoladamente [Pallotta & Ballim, 2001]; [Oviatt, 2002]. Um diálogo efectivo envolve não apenas a fala (o que em si já introduz vários desafios, nomeadamente quando consideramos a “linguagem natural), mas também outras modalidades:
o Gestos: possuem um papel crucial na comunicação (ex.: apontar, acenar, desenhar, escrever, clicar, etc);
o O olhar e os sons vocais em geral, que também desempenham um papel importante numa comunicação efectiva.
Para a modelação de um diálogo, é necessário caracterizar as propriedades e as regras que definem o diálogo. Para isso, coloca-se a questão de saber que recursos e conhecimentos serão necessários para essa modelação, ou seja, que aspectos são relevantes para uma/a gestão do diálogo? Seguidamente apresentamos alguns dos aspectos que deverão ser de algum modo considerados na criação de um sistema de
diálogo [Allen et al., 2001]; [McTear, 2002]; [Armstrong et al., 2003]; [Melichar, 2005]; [Jurafsky & Martin, 2006]:
• Reconhecimento de fala: Os erros de reconhecimento são bastante comuns (ex. devido a interferência provocada pelo ruído);
• Interpretação (depende do contexto): Como reconhecer a intenção de cada contribuição para o diálogo? Implica a necessidade de revisões e correcções:
o Elipses e fragmentos: as pessoas utilizam frequentemente frases parciais por forma a evitarem a repetição. A informação em falta tem de ser reconstruída a partir do contexto do diálogo;
o Referências: palavras como “este / aquele / eu / ele / aquilo” apenas podem possuir significado se interpretadas em determinado contexto, e; o Significado indirecto: muitas expressões não possuem o seu significado
literal.
• Estratégias de diálogo: Como determinar a “sua vez de falar”? Como garantir que há um entendimento comum / partilhado entre as partes?:
o Vez de falar: no diálogo entre pessoas, a sobreposição é normalmente imperceptível e os compassos de espera entre cada vocalização3 são
muito reduzido (menos de 1/10 de segundo);
o Desambiguação de inputs do utilizador: as expressões naturais são muitas vezes ambíguas, pelo que o sistema deve implementar mecanismos para desambiguação de inputs do utilizador. A desambiguação pode ser implícita (deduzida do contexto) ou explícita (perguntando ao utilizador);
o Confirmação: o sistema deve requerer ao utilizador a confirmação de informação que tenha sido obtida com um grau de confiança demasiado baixo ou que não se enquadre no contexto do diálogo;
o Obtenção da informação em falta: o sistema deve tomar a iniciativa de obter a informação em falta de forma a completar a tarefa com sucesso;
3 Tradução de “utterance”: Significa enunciado, elocução, fala ou expressão oral. Implica a
utilização de sons em geral para comunicação, normalmente palavras mas também outros sons (consulta no Wordnet [Miller, 2006]). Em vez do termo vocalização também poderiamos dizer expressão oral (ou simplesmente expressão). Ao longo deste documento utilizaremos o termo “expressão” para nos referirmos a um input do utilizador, mesmo quando não corresponder apenas a uma vocalização e/ou ao seu texto, ie, mesmo que esse input incorpore outras contribuições, para além da fala (ex. fala + gestos).
o Detecção de confusão ou erro por parte do utilizador: uma vez que os sistemas de diálogo são imperfeitos, é importante implementar diferentes estratégias que permitam resolver os problemas que surgem na comunicação. Por ex.: se o utilizador não sabe como responder a uma questão, o sistema deve ajudá-lo. A indicação de confusão do utilizador pode ser detectada por ex.: se afirmar “Não sei” ou através de pistas audiovisuais. Nestas situações assiste-se a um não progresso do diálogo (e isso deve ser evitado), e;
o Descrição de acções semânticas que não seriam visíveis de outra forma: o sistema deve notificar sempre o utilizador nos casos em que assuma alguma coisa de forma implícita para a qual não tenha sido clara a concordância do utilizador.
• Iniciativa: Quem lidera a iniciativa? (o utilizador, o sistema, iniciativa mista); • Interrupções: Se o diálogo for interrompido, será que se manteve o
assunto/tópico? Há necessidade de alterar o tópico ou concluir o diálogo? o Alteração de tópico: o sistema deve ser capaz de reconhecer quando o
utilizador sai do contexto. Se possível, o sistema deve ser capaz de mudar para o novo contexto, ou então trazer o utilizador de novo para o contexto relevante/anterior;
• Personalização da interacção: Com base no histórico do utilizador? Com base no histórico do diálogor? Com base no perfil do utilizador?
Um sistema interactivo que suporte de forma robusta e completa todos os requisitos anteriores aproximar-se-á bastante daquilo que consideramos interacção natural, que corresponde à interacção usual Pessoa-Pessoa.