Ocorrência
Figura 2-3-4. Representação Gráfica de um Topic Map
Cada tópico possui um tipo correspondente em um relacionamento do tipo classe- instância. Os tipos são classes nas quais os tópicos são agrupados. O tipo de um tópico também é representado como um tópico.
As ocorrências de um tópico são identificadas por um URI (Uniform Resource Identifier). As ocorrências geralmente implementam a ligação do tópico com o mundo externo. Por exemplo, um tópico que represente a Lei nº 8.112 pode ter várias ocorrências externas ao Topic Map, como, por exemplo, o endereço do texto integral consolidado no sítio do Planalto26 ou o texto originalmente publicado no sítio do Senado Federal27. As ocorrências internas têm seu conteúdo armazenado no próprio Topic Map, e podem ser utilizadas, por exemplo, para armazenar informações de metadados.
26 <http://www.presidencia.gov.br/ CCIVIL/LEIS/L8112cons.htm>
2.3.1.3.2 Demais Constructos
Além dos três principais constructos (Tópico, Associação e Ocorrência), dois outros são importantes na construção de um Topic Map.
O “escopo” (Scope) é um constructo utilizado para evitar ambigüidade de nomes e facilitar a tarefa de navegação na medida em que permite a sua seleção por parte do usuário. É possível utilizar o escopo, por exemplo, para definir a abrangência espacial e temporal de uma norma. Além disso, o escopo pode ser utilizado para definir níveis de acesso, de expertise (básico, intermediário, avançado) etc.
A “identidade de assunto” (Subject Identity) permite definir pontos de ligação para a execução do merge de índices. Segundo Rath (2001), “dois tópicos são idênticos caso eles tenham o mesmo nome no mesmo escopo ou caso referenciem o mesmo identificador de assunto”.
2.3.1.4 SKOS – Simple Knowledge Organization System
O Simple Knowledge Organization System (SKOS) é um modelo para organização de esquemas conceituais criado pelo W3C (World Wide Web Consortium) que unifica em um único modelo as principais estruturas de tesauros, taxonomias, esquema de cabeçalho de assunto e sistemas de classificação.
2.3.1.4.1 Principais Constructos
Os principais constructos do SKOS estão em destaque no seguinte parágrafo que resume os objetivos do modelo:
Usando SKOS, recursos conceituais podem ser identificados usando URIs, rotulados com termos lexicais em uma ou mais línguas naturais, documentados com vários tipos de notas, relacionados entre si e organizados em hierarquias informais e redes de associação, agregados em esquemas conceituais, e mapeados para recursos conceituais em outros esquemas. Além disso, rótulos podem ser relacionados entre si, e recursos conceituais podem ser agrupados em coleções rotuladas e/ou ordenadas. (MILES & BECHHOFER, 2008)
O modelo SKOS define três tipos de rótulos para um conceito: a) skos:prefLabel – rótulo preferido do conceito.
b) skos:altLabel – rótulo alternativo, incluindo traduções para outras línguas. c) skos:hiddenLabel – rótulo oculto, utilizado para codificar expressões de termos com erros (comuns) de ortografia. Este rótulo não é apresentado para o usuário do sistema.
A documentação dos conceitos pode ser realizada incluindo vários tipos de nota, conforme abaixo:
a) skos:note – nota geral podendo ser utilizada para qualquer propósito. b) skos:changeNote – documenta as modificações do conceito.
c) skos:definition – explicação formal do significado de um conceito.
d) skos:editorialNote – nota editorial para editores, tradutores ou mantenedores. e) skos:example – apresenta um exemplo de utilização do conceito.
f) skos:historyNote - nota sobre a significação ou a utilização passada de um conceito.
g) skos:scopeNote - nota que ajuda a clarificar o significado de um conceito. O modelo SKOS define dois tipos de relacionamentos hierárquicos: o skos:broader/skos:narrower relaciona conceito geral e específico e o
skos:broaderTransitive/skos:narrowerTransitive é utilizado para o
mesmo fim, possuindo, no entanto, a propriedade de ser transitivo. A associação entre termos correlatos é definida pelo constructo skos:related.
Não existe constructo específico para relacionar conceito geral partitivo e conceito específico partitivo. Inexiste também o relacionamento de equivalência entre conceitos. Os criadores do SKOS optaram por utilizar os rótulos alternativos (skos:altLabel) para definir os termos preteridos.
Entre um esquema de conceito e um conceito, são definidos dois tipos de relacionamento: skos:inSchema - relaciona um conceito com um esquema específico, e skos:hasTopConcepts- relaciona os principais conceitos do esquema.
O modelo SKOS permite agrupar conceitos em coleções de dois tipos. Uma skos:Collection agrupa conceitos que possuem algo em comum sem considerar uma ordem específica, enquanto que uma skos:OrderedCollection organiza os conceitos da coleção na ordem estabelecida.
2.3.1.4.2 Relacionamentos entre Esquemas de Conceitos
Consideramos que a parte mais interessante do modelo SKOS é a que define os constructos que permitem relacionar conceitos de diferentes esquemas, listados abaixo:
a) skos:exactMatch – indica que dois conceitos de esquemas diferentes são suficientemente similares e podem ser usados de forma intercambiável em uma aplicação de recuperação de informação.
b) skos:broadMatch – define um relacionamento hierárquico entre um conceito geral e um conceito específico de um outro esquema de conceitos.
c) skos:narrowerMatch – define um relacionamento hierárquico entre um conceito específico e um conceito geral de um outro esquema de conceitos.
d) skos:relatedMatch – define um relacionamento associativo entre dois conceitos de diferentes esquemas.
Um esquema SKOS é codificado utilizando a notação RDF (Resource Description Framework). Uma das desvatagens do RDF é que, de forma diferente do Topic Maps, é necessário realizar duas definições para que se possa navegar em um relacionamento nos dois sentidos.
2.3.2 Ontologia
O termo “ontologia” vem sendo cada vez mais utilizado em diversas áreas. Guarino (1998) afirma que apesar de, no passado, ter sido objeto de estudo apenas da Filosofia, a sua importância tem sido reconhecida nos mais diversos campos de pesquisa, tais como: engenharia do conhecimento, representação do conhecimento, modelagem de informação, integração de informação, análise orientada a objeto, recuperação e extração de informação, organização e gerência do conhecimento, projeto de sistemas baseados em agentes, projeto de banco de dados, entre outros.
2.3.2.1 Definição
Uma das definições mais citadas de “ontologia” é a de Gruber (1993): “ontologia é uma especificação explícita de uma conceitualização”. Guarino & Giaretta (1995) ponderam que, dentre sete definições analisadas, esta é uma das mais problemáticas. As acepções analisadas no artigo “Ontologies and Knowledge Bases – Towards a Terminological Clarification” foram:
1) Ontologia como uma disciplina da Filosofia; 2) Ontologia como um sistema conceitual informal; 3) Ontologia como registro semântico formal;
4) Ontologia como uma especificação de uma “conceituação”;
5) Ontologia como uma representação de um sistema conceitual via uma teoria lógica; 5.1) caracterizada por propriedades formais específicas;
5.2) caracterizada apenas pelos seus propósitos específicos; 6) Ontologia como um vocabulário usado por uma teoria lógica; 7) Ontologia com uma especificação (meta-nível) de uma teoria lógica.
Segundo Guarino & Giarreta (1995), uma primeira distinção geralmente aceita é a existente entre “Ontologia” (com “O” maiúsculo e sem artigo indefinido) como sendo uma disciplina da Filosofia (definição 1), e “uma ontologia” (com artigo indefinido e “o” minúsculo) utilizada nos outros casos. Nas acepções 2 e 3 a ontologia é concebida como uma entidade semântica, tanto informal quanto formal respectivamente, enquanto que nas definições (5, 6 e 7) a ontologia é um objeto sintático específico.
A definição 4 é a mais discutida no artigo de Guarino & Giarreta (1995), podendo ser classificada como sintática. No entanto, o seu significado preciso depende do entendimento dos termos “especificação” e “conceitualização”. Segundo Guarino (1998a), Gruber (1993) utilizou a definição de “conceitualização” de um conhecido livro de inteligência artificial (GENESRETH & NILSON, 1987) que afirma ser a conceitualização uma estrutura <D, R>, onde D é o domínio e R é um conjunto de relacionamentos relevantes em D. Para que a definição de Gruber faça sentido, é necessário introduzir uma nova definição de conceitualização, que não considere os relacionamentos ordinários que refletem uma determinada situação das coisas, preocupando-se apenas com os relacionamentos conceituais. Enquanto relacionamentos ordinários são definidos em um certo domínio, relacionamentos conceituais são definidos em um espaço de domínios. O espaço de domínios é definido pela estrutura <D, W>, onde D é o domínio em questão e W é o conjunto de todos os estados possíveis deste domínio (também chamado de mundos possíveis). Por fim, a conceitualização, segundo Guarino (1998), é definida pela tripla ordenada C = <D, W, ℜℜℜℜ>, onde ℜℜ ℜℜ é o conjunto de relacionamentos conceituais no espaço de domínio <D, W>. A conceitualização é a estrutura formal da realidade (ou parte dela) da forma que é percebida e organizada por um agente, independentemente do vocabulário utilizado ou da ocorrência de uma situação específica.
Após redefinir conceitualização, Guarino (1998a) reconstrói a definição de Gruber (1993) e apresenta a seguinte proposta:
Uma ontologia é uma teoria lógica que corresponde ao significado intencional de um vocabulário formal, ou seja, um comprometimento ontológico com uma conceitualização específica do mundo. Os modelos pretendidos da linguagem lógica usando este vocabulário são delimitados pelo comprometimento ontológico. Uma ontologia indiretamente reflete este comprometimento (e a conceitualização subjacente) pela aproximação destes modelos pretendidos.
A Figura 2-3-5 ilustra a relação entre os seguintes elementos utilizados na definição apresentada: ontologia, conceitualização, comprometimento ontológico, modelos e modelos pretendidos.
Conceitualização C Comprometimento K Linguagem L Ontologia Modelos Pretendidos IK(L) Modelos M(L) Interpretação
Figura 2-3-5. Definição de Ontologia Fonte: Guarino (1998b)
2.3.2.2 Níveis de Precisão da Ontologia
Quanto menor for a área entre a ontologia e os modelos pretendidos melhor será a precisão e a cobertura da ontologia. A Figura 2-3-6 mostra algumas combinações com diferentes níveis de precisão e cobertura da ontologia.
Bom Menos Bom
Alta Precisão, Máxima Cobertura Baixa Precisão, Máxima Cobertura
Ruim Pior
Máxima Precisão, Baixa Cobertura Baixa Precisão e Cobertura
Figura 2-3-6. Qualidade da Ontologia – Precisão e Cobertura Fonte: Guarino (1998a, adaptado)
Welty (2000) define um espectro de tipos de ontologias, diferenciando-os em termos de sua profundidade ontológica, isto é, utilizando os termos de Guarino, ele os diferencia de
acordo com a capacidade de eliminar modelos não pretendidos. Em ordem de profundidade ontológica, da menor para a maior, são relacionados os seguintes tipos de ontologias:
1. Glossário (vocabulário com definições em linguagem natural). 2. Taxonomia simples.
3. Tesauro (taxonomia mais termos relacionados).
4. Taxonomia e Modelo Relacional (Restrições de tipos e relacionamentos “é um”, alguma noção de herança);
5. Teoria totalmente axiomatizada;
Segundo Welty (2000), caso aceitemos todos os itens deste espectro como tipos de ontologias, então seremos forçados a admitir que o importante não é como as ontologias são representadas, mas sim o que elas representam. Em outras palavras, o nível de precisão de uma ontologia irá depender da aplicação pretendida e está principalmente relacionado com o seu conteúdo. É possível, por exemplo, a existência de um simples glossário criado de forma criteriosa que atenda aos requisitos desejados de uma comunidade, como também é possível haver uma teoria axiomatizada que não atenda aos requisitos desejados de uma outra comunidade.
2.3.2.3 Tipos de Ontologia
Guarino (1998a) relaciona os seguintes tipos de ontologias, conforme ilustrado pela Figura 2-3-7:
- Ontologias de Alto Nível – descrevem conceitos gerais como espaço, tempo, matéria, objeto, evento, ação, de forma independente de um domínio ou problema particular;
- Ontologia de Domínio – descreve o vocabulário relacionado a um domínio genérico (como Medicina, Automóveis) pela especialização dos conceitos definidos na ontologia de alto nível;
- Ontologia de Tarefa – descreve o vocabulário relacionado a uma tarefa ou atividade genérica (como Diagnóstico, Vendas) pela especialização dos conceitos definidos na ontologia de alto nível;
- Ontologia de Aplicação – descreve conceitos dependentes, tanto de um domínio como de uma tarefa particular, utilizando a especialização das respectivas ontologias;
Ontologia de Alto Nível Ontologia de Domínio Ontologia de Tarefa Ontologia de Aplicação
Figura 2-3-7. Tipos de Ontologias Fonte: Guarino (1998a)
Guarino (1998a) esclarece a diferença entre uma ontologia de aplicação e uma base de conhecimentos. O propósito de uma ontologia, caso específico de base de conhecimento, é descrever fatos que são sempre verdadeiros para uma comunidade de usuários, em virtude de um consenso formado em torno de um vocabulário utilizado (comprometimento ontológico). Uma base de conhecimento genérica, por sua vez, descreve fatos e asserções relacionados a um determinado estado das coisas ou a um determinado estado epistêmico. Dentro de uma base de conhecimento genérica, podem-se distinguir dois componentes: a ontologia (contendo informações independentes de estado) e o núcleo da base de conhecimento (contendo informações dependentes de estado).
2.3.2.4 Estrutura Taxonômica da Ontologia
O relacionamento taxonômico28 é considerado a espinha dorsal da ontologia. Segundo Guarino & Welty (2000a), “talvez o problema mais comum que tem sido visto na prática com ontologias é que, enquanto se deseja criar uma ordem e estrutura para a informação, a sua estrutura taxonômica é freqüentemente pobre ou confusa”. Isto é exemplificado pelo uso incontido do relacionamento taxonômico na tentativa de realizar uma variedade de tarefas de representação e conceitualização. Os efeitos colaterais desta sobrecarga do uso da relação taxonômica (também conhecida como “IS-A overloading”) são vários e poderão ser percebidos, por exemplo, na dificuldade de reuso e integração de ontologias. Por outro lado, segundo Guarino & Welty (2000b), uma taxonomia bem formulada tem implicações significantes para o entendimento, reuso e integração de ontologias.
28 O relacionamento taxonômico é também conhecido, entre outros, pelos seguintes nomes: relacionamento de
Para resolver o problema do uso incorreto do relacionamento taxonômico, Guarino & Welty (2002) propõem a metodologia “Ontoclean” que permite avaliar a adequação dos relacionamentos taxonômicos de uma ontologia. Esta metodologia é baseada em quatro noções ontológicas fundamentais: identidade, unidade, rigidez e dependência. Essas noções são derivadas da “ontologia formal”, linha de pesquisa interdisciplinar fortemente influenciada pela Filosofia.
Guarino (1999), com o objetivo de discutir aspectos metodológicos da “Ontoclean” de uma forma clara, identifica os seguintes tipos de entidades:
- entidades do mundo incluídas no nosso domínio de discurso (particulares); - categorias utilizadas para falar sobre estas entidades (universais);
Com o objetivo de estabelecer um comprometimento ontológico mínimo neste domínio, Guarino (1999) propõe uma ontologia para os particulares e uma outra para os universais, apresentadas nas seções seguintes.
2.3.2.4.1 Ontologia dos Particulares
O Quadro 2-20 apresenta a “Ontologia dos Particulares” proposta por Guarino (1999), que trata das entidades do mundo incluídas no domínio do discurso.
Quadro 2-20. Ontologia dos Particulares Particular
Localização
Espaço (uma localização espacial) Tempo (uma localização temporal) Objeto
Objeto Concreto
Contínuo (uma maçã)
Ocorrente (a queda de uma maçã) Objeto Abstrato (Teorema de Pitágoras) Fonte: Guarino (1999)
A Ontologia dos Particulares diferencia inicialmente “Objeto” de “Localização”. A “Localização” pode ser tanto espacial quanto temporal. O “Objeto” é um particular que pode ser classificado como “Objeto Concreto”, caso possua uma localização no tempo e/ou no espaço, ou um “Objeto Abstrato” nos demais casos. Por sua vez, um “Objeto Concreto” pode ser classificado como “Contínuo” ou como “Ocorrente”. O “Contínuo” possui uma localização no espaço que pode variar no tempo, bem como pode possuir outros Contínuos
como parte. O “Ocorrente” é gerado por “Contínuos”, de acordo com o comportamento do “Contínuo” no tempo. Para que o “Ocorrente” exista, um “Contínuo” específico deve participar. Se o “Contínuo” muda a identidade, o “Ocorrente” tem igual comportamento, pois os “Ocorrentes” são rigidamente dependentes dos “Contínuos”. Exemplos de ocorrentes são eventos ordinários como a mudança de localização de um corpo, ou mesmo a sua permanência em uma determinada localização. “Ocorrentes” sempre têm outros ocorrentes como partes. Eles têm uma localização temporal única, enquanto que sua exata localização espacial é freqüentemente não clara. “Objetos Abstratos” não têm localização espacial e temporal. Guarino (1998b) alerta que muitas entidades são classificadas como “Objeto Abstrato” quando deveriam ser “Universais” e não “Particulares”. Como exemplos de “Objeto Abstrato”, em Guarino (1998b), são citados o “Teorema de Pitágoras” e o número “1”.
2.3.2.4.2 Ontologia dos Universais
O Quadro 2-21 apresenta a “Ontologia dos Universais”, proposta por Guarino (1999), que trata das categorias utilizadas para falar sobre essas entidades.
Quadro 2-21. Ontologia dos Universais. Universal
Propriedade
Tipo (pessoa) (+I +R)
Categoria (localidade, objeto) (-I +R)
Papel (~R +D)
Papel Material (estudante) (+I)
Papel Formal (paciente, parte) (-I)
Atribuição (vermelho, decomponível) (-I -R -D) Relacionamento (parte-de)
Fonte: Guarino (1999)
De acordo com Guarino (1999), considerando o número de argumentos, são identificadas as classes “Propriedade”29 e “Relacionamento”. Para auxiliar a definição de subclasses da classe “Propriedade”, são utilizados indicadores (meta-propriedades) que se referem às características de Identidade, Rigidez e Dependência da “Propriedade”. A seguir, é
29 Guarino (2004) utiliza o termo “Propriedade” no sentido de um predicado unário da lógica de primeira ordem.
Os predicados “ser uma maçã”, “ser uma mesa”, por exemplo, identificam o significado intencional de uma Propriedade. Dado um particular estado das coisas (mundo possível), podemos associar a cada Propriedade uma Classe (significado extensional), que é o conjunto das entidades que exibem esta propriedade em um mundo particular. Os membros desta classe são chamados de instâncias.
apresentado um resumo das meta-propriedades. Para uma abordagem detalhada deste tema, consultar Guarino (2000a).
A meta-propriedade Identidade (+I) indica que a entidade carrega um CI (Critério de Identidade), ou seja, é possível identificar uma condição suficiente para, por exemplo, identificar uma entidade como instância de uma classe ou re-identificar essa instância ao longo do tempo (persistência).
A meta-propriedade Rigidez (+R) indica que a entidade possui essa propriedade em todos os mundos possíveis. Por exemplo, enquanto “pessoa” é rígida, “estudante” não é.
A meta-propriedade Anti-Rígida (~R) indica que a entidade possui essa propriedade em um mundo possível, e não a possui em outros mundos. Por exemplo, “estudante” é anti-rígida. A meta-propriedade Dependência (+D) indica que a entidade desta classe depende da existência de uma outra entidade de outra classe. Por exemplo, “pai” é dependente, “pessoa” não é.
O “Tipo” é uma “Propriedade” que é rígida e que carrega um critério de identidade. Tipos desempenham o papel mais importante na organização de uma taxonomia. Quando um Tipo especializa um outro Tipo, ele adiciona critérios de identidade aos já existentes.
A “Categoria” é uma “Propriedade” que é rígida, mas que não carrega um critério de identidade. Por esse motivo, uma Categoria não pode especializar um Tipo, podendo aparecer apenas nos níveis mais altos de uma taxonomia. O seu papel é tornar mais claras as distinções mais gerais. Por exemplo, a “Categoria” Normatização pode ser especializada pelos “Tipos” Lei e Decreto.
O “Papel” é uma “Propriedade” que é anti-rígida e é sempre dependente. O “Papel Material” possui critério de identidade, enquanto que “Papel Formal” não possui. Papéis têm uma relevância limitada na organização de uma taxonomia. Um papel não pode especializar um Tipo, pois o primeiro é anti-rígido e o último é rígido.
A “Atribuição” é uma “Propriedade” que é não rígida, não dependente, e que não carrega nenhum critério de identidade. Atribuições não desempenham um papel útil na organização de uma ontologia de particulares.
2.3.2.5 Ontologia Formal
Segundo Guarino (1998), o estudo das distinções ontológicas formais pode ser organizado em torno das teorias núcleo, relacionadas a seguir: Teoria das Partes; Teoria dos Todos; Teoria da Identidade e Teoria da Dependência. Nas seções seguintes, detalharemos alguns pontos dessas teorias.
2.3.2.5.1 Teoria das Partes
A Teoria das Partes está na base de qualquer análise ontológica. Essa teoria endereça questões do tipo: o que consideramos como parte de uma dada entidade? Quais as propriedades do relacionamento parte-de? Quais os diferentes tipos de parte?
2.3.2.5.2 Teoria dos Todos
A Teoria dos Todos estuda as formas de conectar diferentes partes para formar um todo. Esta teoria endereça questões do tipo: o que consideramos como um todo? Como se faz um todo? Quais as propriedades dos relacionamentos de conexão? Qual o papel que as partes exercem em relação ao todo?
Para entender as várias formas da relação “parte-todo”, a Teoria das Partes tem que ser suplementada pela Teoria dos Todos, resultando em uma terceira, conhecida como Mereotopologia.
2.3.2.5.3 Teoria da Identidade
A Teoria da Identidade, baseada nas Teorias das Partes e dos Todos, estuda as condições nas quais duas entidades com diferentes propriedades podem ser consideradas a mesma entidade. Essa teoria endereça questões do tipo: Como uma entidade pode mudar enquanto continua mantendo sua identidade? Quais as propriedades essenciais de uma entidade? Em que condições uma entidade perde sua identidade? A mudança de uma parte afeta a identidade? A mudança de um “ponto de vista” muda as condições de identidade?
Para ilustrar esta última questão, Guarino (1998) cita o clássico exemplo do vaso de argila. Devemos considerar que o vaso e a argila fazem parte de dois indivíduos separados, ou são dois “pontos de vista” sobre o mesmo indivíduo? A resposta pode ser difícil, mas uma análise cautelosa nos mostra que as duas visões implicam diferentes critérios de identidade: quando o vaso perde sua identidade ao se quebrar no chão, a argila continua lá. Isto ocorre porque a argila é um critério extensional de identidade, pois ela sempre coincidirá com a soma das suas partes, enquanto que o vaso requer um determinado arranjo das partes, para que seja