• No results found

Prinsipper for anvendelse av landmakt

2.4 PRINSIPPER

2.4.3 Prinsipper for anvendelse av landmakt

Um sentido comum do termo “dialogar” tem a ver com a resolução de problemas. Praticamente todas as actividades humanas envolvem dialogar com outras pessoas como forma de levar a cabo as mais variadas acções.

Uma definição de diálogo num dicionário de referência da língua portuguesa [Infopedia, 2007] indica que se trata de um substantivo masculino, com o seguinte significado:

2. Troca de ideias para se chegar a um entendimento; 3. Obra literária ou científica em forma de conversação; 4. Alternância de dois factores complementares um do outro.

Um diálogo implica uma sequência de troca de informação que se mantém coerente ao longo do tempo e por definição implica uma “conversa”, entre dois ou mais interlocutores, uma troca de “ideias” com vista a um entendimento e uma alternância entre emissor e receptor [Oviatt, 2002]; [Trung, 2006]. O diálogo é um fenómeno social (possui regras) e um diálogo eficaz deve ser colaborativo. Se quisermos criar máquinas capazes de dialogar com pessoas, teremos de implementar sistemas capazes de “conversar”, ie, de trocar ideias, em alternância, e que progridam com vista a um entendimento e um resultado final. A criação de sistemas com essas capacidades apresenta desafios consideráveis. De acordo com James Allen, em [Allen

et al., 2001], os quatro principais desafios que se colocam são: i) gerir a complexidade

da linguagem (natural) a utilizar, associada à tarefa; ii) integrar o SD com o sistema de

back-end que disponibiliza o serviço pretendido; iii) a necessidade de reconhecimento

de uma intenção (por parte do utilizador humano) como aspecto chave do processo de entendimento, e; iv) suportar e possibilitar a iniciativa mista, onde tanto o sistema como o utilizador podem liderar a iniciativa do diálogo em diferentes alturas, tornando a interacção mais natural, mais eficiente e mais eficaz.

Embora para os humanos o diálogo (falado) seja a forma mais natural de comunicação, este inclui características que o tornam bastante complexo para sistemas computacionais, pelo que ainda não existem sistemas de diálogo robustos mesmo quando se considera apenas a fala isoladamente [Pallotta & Ballim, 2001]; [Oviatt, 2002]. Um diálogo efectivo envolve não apenas a fala (o que em si já introduz vários desafios, nomeadamente quando consideramos a “linguagem natural), mas também outras modalidades:

o Gestos: possuem um papel crucial na comunicação (ex.: apontar, acenar, desenhar, escrever, clicar, etc);

o O olhar e os sons vocais em geral, que também desempenham um papel importante numa comunicação efectiva.

Para a modelação de um diálogo, é necessário caracterizar as propriedades e as regras que definem o diálogo. Para isso, coloca-se a questão de saber que recursos e conhecimentos serão necessários para essa modelação, ou seja, que aspectos são relevantes para uma/a gestão do diálogo? Seguidamente apresentamos alguns dos aspectos que deverão ser de algum modo considerados na criação de um sistema de

diálogo [Allen et al., 2001]; [McTear, 2002]; [Armstrong et al., 2003]; [Melichar, 2005]; [Jurafsky & Martin, 2006]:

Reconhecimento de fala: Os erros de reconhecimento são bastante comuns (ex. devido a interferência provocada pelo ruído);

Interpretação (depende do contexto): Como reconhecer a intenção de cada contribuição para o diálogo? Implica a necessidade de revisões e correcções:

o Elipses e fragmentos: as pessoas utilizam frequentemente frases parciais por forma a evitarem a repetição. A informação em falta tem de ser reconstruída a partir do contexto do diálogo;

o Referências: palavras como “este / aquele / eu / ele / aquilo” apenas podem possuir significado se interpretadas em determinado contexto, e; o Significado indirecto: muitas expressões não possuem o seu significado

literal.

Estratégias de diálogo: Como determinar a “sua vez de falar”? Como garantir que há um entendimento comum / partilhado entre as partes?:

o Vez de falar: no diálogo entre pessoas, a sobreposição é normalmente imperceptível e os compassos de espera entre cada vocalização3 são

muito reduzido (menos de 1/10 de segundo);

o Desambiguação de inputs do utilizador: as expressões naturais são muitas vezes ambíguas, pelo que o sistema deve implementar mecanismos para desambiguação de inputs do utilizador. A desambiguação pode ser implícita (deduzida do contexto) ou explícita (perguntando ao utilizador);

o Confirmação: o sistema deve requerer ao utilizador a confirmação de informação que tenha sido obtida com um grau de confiança demasiado baixo ou que não se enquadre no contexto do diálogo;

o Obtenção da informação em falta: o sistema deve tomar a iniciativa de obter a informação em falta de forma a completar a tarefa com sucesso;

3 Tradução de “utterance”: Significa enunciado, elocução, fala ou expressão oral. Implica a

utilização de sons em geral para comunicação, normalmente palavras mas também outros sons (consulta no Wordnet [Miller, 2006]). Em vez do termo vocalização também poderiamos dizer expressão oral (ou simplesmente expressão). Ao longo deste documento utilizaremos o termo “expressão” para nos referirmos a um input do utilizador, mesmo quando não corresponder apenas a uma vocalização e/ou ao seu texto, ie, mesmo que esse input incorpore outras contribuições, para além da fala (ex. fala + gestos).

o Detecção de confusão ou erro por parte do utilizador: uma vez que os sistemas de diálogo são imperfeitos, é importante implementar diferentes estratégias que permitam resolver os problemas que surgem na comunicação. Por ex.: se o utilizador não sabe como responder a uma questão, o sistema deve ajudá-lo. A indicação de confusão do utilizador pode ser detectada por ex.: se afirmar “Não sei” ou através de pistas audiovisuais. Nestas situações assiste-se a um não progresso do diálogo (e isso deve ser evitado), e;

o Descrição de acções semânticas que não seriam visíveis de outra forma: o sistema deve notificar sempre o utilizador nos casos em que assuma alguma coisa de forma implícita para a qual não tenha sido clara a concordância do utilizador.

Iniciativa: Quem lidera a iniciativa? (o utilizador, o sistema, iniciativa mista); Interrupções: Se o diálogo for interrompido, será que se manteve o

assunto/tópico? Há necessidade de alterar o tópico ou concluir o diálogo? o Alteração de tópico: o sistema deve ser capaz de reconhecer quando o

utilizador sai do contexto. Se possível, o sistema deve ser capaz de mudar para o novo contexto, ou então trazer o utilizador de novo para o contexto relevante/anterior;

Personalização da interacção: Com base no histórico do utilizador? Com base no histórico do diálogor? Com base no perfil do utilizador?

Um sistema interactivo que suporte de forma robusta e completa todos os requisitos anteriores aproximar-se-á bastante daquilo que consideramos interacção natural, que corresponde à interacção usual Pessoa-Pessoa.