• No results found

Belief Updating in Bayesian Networks

4.3 Triangulated Graphs and Join Trees

Figura 11:Interface do Sistema IATE de pesquisa de termos em vários idiomas. IATE(2008).

A IATE (2008) é uma iniciativa européia de um sistema que permite a um usuário entrar com um termo procurado, em um idioma e domínio também escolhidos, retornando termos similares ao termo procurado, nesses idiomas, dentro do domínio determinado. O sistema gerencia uma base de dados interinstitucional de terminologias. A base é alimentada com termos novos pelos terminologistas e tradutores com base nas informações de tradutores, administradores, juristas/lingüistas, peritos e outras fontes fiáveis.

Na IATE, pode-se encontrar terminologia e gíria específicas da União Europeia, bem como termos de todas as áreas imagináveis, como Direito, agricultura, Tecnologia da Informação e muitas outras. Possui 8,4 milhões de termos, incluindo aproximadamente 540 000 abreviaturas e 130000 expressões, e cobre todas as 23 línguas oficiais da UE. O sistema consiste da união de bases terminológicas de instituições européias. Ela reúne toda a informação anteriormente existente nas antigas bases terminológicas das instituições européias, como:

EURODICAUTOM (Comissão); EUTERPE (Parlamento); TIS (Conselho).

3.2.1.2 Universal Words Dictionary

O Universal Words Dictionary (UWDIC, 2010) é uma página web disponível para consultas a palavras universais da UNL. Seu uso é útil para consultas a palavras chave, e na associação destas aos termos da ontologia do modelo de Bueno (2008).

Figura 12:Página web do Universal Words Dictionary.

As palavras universais, seus termos equivalentes e variantes e explicações sobre essas palavras, termos e equivalências, estão em estrutura tabular, em formato HTML, e as explicações a respeito da palavra universal desejada pode ser requisitada via sintaxe HTTP. Dessa maneira, é possível automatizar a consulta a palavras universais e aos seus significados, para auxiliar na pesquisa de palavras disponíveis pelo EC responsável por construir parte da ontologia multilíngüe.

3.2.1.3 Dicionários on-line e Wordnet

Outra alternativa que pode ser automatizada para auxiliar o trabalho de tradução e verificação de termos e palavras universais na construção de ontologias multilíngues são os dicionários internacionais on-line. Uma procura na internet retorna uma série de títulos de páginas

que oferecem serviços de tradução e classificação semântica de termos a partir de palavras entradas em campos texto, tal como um dicionário. Vários desses dicionários podem ser acessados por uma sintaxe simples com o protocolo HTTP, retornando os resultados das definições da palavra de entrada em página HTML.

Em virtude de existir um número crescente de dicionários internacionais, e que é possível acessá-los e receber seu resultado via internet, e que cada página possui seu formato de entrada e saída, nota- se a necessidade de criar scripts para envio de requisições HTTP e de

parsing das páginas retornadas no formato HTML.

Quanto à Wordnet (2009), esta é uma base de dados léxica: substantivos, verbos, adjetivos e advérbios são agrupados em conjuntos de sinônimos cognitivos (synsets), cada um expressando um conceito distinto. Os synsets são interligados por meio de relações semânticas e léxicas. A rede resultante de palavras e conceitos com significado pode ser navegada com o browser. A WordNet está disponível publicamente para acesso e para download. A estrutura da WordNet a torna útil para as ciências da Linguística Computacional e Processamento de Linguagem Natural.

A WordNet pode ajudar no auxílio automatizado para consulta de termos, na construção de ontologias.

3.2.2 Ontologias

Segundo Gruber apud (Liu & Özsu, 2009), no contexto da Ciência da Computação e Informação, uma ontologia define um conjunto de primitivas de representação com as quais é modelado um domínio de conhecimento ou de discurso. As primitivas de representação são tipicamente classes (ou conjuntos), atributos (ou propriedades), e relacionamentos (ou relações entre os membros da classe). As definições das primitivas de representação incluem informações sobre o significado e as suas limitações em sua aplicação logicamente consistente. No contexto de sistemas de banco de dados, ontologias podem ser vistas como um nível de abstração de modelos de dados, análogo ao dos modelos hierárquicos e relacionais, mas que se destina à modelagem de conhecimento sobre os indivíduos, seus atributos e suas relações com outros indivíduos. Tipicamente, ontologias são especificadas em linguagens que permitem abstração além de Estruturas de Dados e Estratégias de Implementação. Na prática, as linguagens de ontologias estão mais próximas do poder expressivo de

linguagens de lógica de primeira ordem do que linguagens utilizadas para modelagem de bancos de dados. Por esta razão, se diz que as ontologias estão no nível "semântico", onde os esquemas de banco de dados são modelos de dados no nível "lógico" ou "físico". Devido à sua independência de modelos de nível inferior, ontologias são usadas para Integrar bancos de dados heterogêneos, permitindo a interoperabilidade entre diferentes sistemas e especificando interfaces entre serviços independentes, baseados no conhecimento. Na pilha de tecnologia dos padrões da Web Semântica (Berners-Lee et. al. (2001)), ontologias são consideradas uma camada explicita. Atualmente há linguagens padrão e uma variedade de ferramentas de código aberto e comerciais para criar e trabalhar com ontologias.

Berners-Lee et. al. (2001) levantam a possibilidade de um mesmo conceito estar presente em duas ou mais bases diferentes, e por isso ser definido por identificadores diferentes; citam como exemplo o código postal de endereços (zip code). Para resolver o problema de múltiplos identificadores para um mesmo conceito, os autores apontam o uso de ontologias, definidas como documentos que contêm relacionamentos entre termos. São exemplos as ontologias de taxonomias e suas respectivas regras de inferência. Nesse sentido, as ontologias podem ser usadas para refinar uma procura, evitando ambigüidades de palavras, ou ainda relacionar as informações de uma página a estruturas de conhecimento ou regras de inferência. Os autores ainda prevêem a possibilidade da existência de páginas feitas exclusivamente com redes de ontologias, nas quais agentes poderão refinar termos ambíguos usados em outras páginas, para descobrir informações sobre um determinado tema.

Desse modo, „ontologia‟ pode ser definida como um conjunto de termos para descrever e representar uma área do conhecimento, para que sejam usadas por pessoas, aplicações e bases de dados que precisam compartilhar informações sobre um dado domínio. Incluem definições de conceitos básicos e as relações entre eles, dentro de um domínio de conhecimento, para serem usadas por computadores. As ontologias têm em si codificadas o conhecimento que pertence a um domínio ou até mesmo vários domínios. Desta forma, o conhecimento torna-se reusável (OWL, 2004).

As ontologias têm sido utilizadas para descrever artefatos com diferentes graus de estrutura: taxonomias, esquemas de metadados, ou teorias lógicas. Há a necessidade de ontologias com diferentes níveis de

estrutura, e estas precisam de descrições para os seguintes tipos de conceito: classes de coisas, relações entre estas coisas e as propriedades que estas coisas devem ter. As ontologias são usualmente expressadas em uma linguagem de base lógica, de tal forma que distinções detalhadas, precisas, consistentes e relevantes podem ser feitas entre estas classes, propriedades e relações. Desta maneira, algumas ferramentas podem executar um raciocínio automático usando ontologias, oferecendo aplicações e serviços inteligentes tais como procura/recuperação conceitual ou semântica, agentes de software, suporte à decisão, compreensão de linguagem natural escrita e falada, gestão do conhecimento, bases de dados inteligentes e comércio eletrônico (OWL, 2004).

Por último, a previsão de que as ontologias serão usadas dentro da Web Semântica para representação da semântica de documentos, permitindo que esta semântica seja usada por aplicações web e agentes inteligentes. As ontologias podem provar que são úteis para uma comunidade como um caminho para estruturar e definir o significado dos termos metadados que são frequentemente coletados e padronizados. Desta forma, as aplicações podem trabalhar mais precisamente no nível conceitual humano (OWL, 2004).

Para Noy e McGuinness (2010), há a tendência dos processos de construção de ontologias passarem dos laboratórios de especialistas em inteligência artificial para as máquinas desktop de especialistas de domínio de conhecimento. Nesse sentido, os autores narram sobre algumas iniciativas de consórcios para a construção de linguagens para codificação de conhecimento em páginas web, que permitam que tal conhecimento seja processável por agentes inteligentes. Também apontam algumas aplicações de representação do conhecimento com o uso de ontologias, em que os especialistas podem compartilhar e anotar as informações em suas áreas. Por exemplo, no campo da Medicina, já foram produzidos grandes vocabulários padronizados e estruturados, tais como: a SNOMED (Price; Spackman, 2000) e a rede semântica da

Unified Medical Language System (Humphreys; Lindberg,1993). As ontologias de propósito gerais também estão emergindo, por exemplo: o Programa de Desenvolvimento das Nações Unidas e a empresa Dun & Bradstreet combinaram seus esforços para desenvolver a ontologia UNSPSC que oferece terminologias para produtos e serviços (Ver www.unspsc.org). Segundo os autores, uma ontologia define um vocabulário comum para pesquisadores que precisam compartilhar informação em um domínio. Este vocabulário comum inclui definições

de conceitos básicos em um domínio de conhecimento e das relações entre estes conceitos, interpretáveis por máquinas.

Noy e McGuinness (2010) apresentam cinco razões para a construção de ontologias: 1) Compartilhar uma compreensão comum da estrutura de informação entre pessoas e agentes de software; 2) Permitir o reuso do conhecimento do domínio; 3) Explicitar suposições/hipóteses dentro de um domínio; 4) Separar o conhecimento do domínio do conhecimento operacional; 5) Analisar o conhecimento de um domínio. Para os autores, uma ontologia é composta por quatro elementos: Classes; Papéis; Restrições de Papéis e Instâncias.