No primeiro processo, o conhecimento requerido para a ontologia foi obtido de forma manual em diferentes fontes como artigos, livros e jornais, e o processo de aquisição de conhecimento ocorreu da seguinte forma:
• Extração manual do conhecimento requerido através da compreensão de artigos dispostos em livros e jornais.
• Investigação em artigos considerados extraordinários a fim de fazer uma análise racional dos motivos pelos quais tais artigos teriam sido classificados como extraordinários.
• Identificação de questões que “qualquer um” seria capaz de responder tendo apenas lido o texto. A base da Cyc seria ampliada a partir da capacidade de responder a tais questões.
Após a extração manual do conhecimento, o mesmo foi direcionado por meio de codificação (implementação através da linguagem CycL) à base de conhecimento Cyc.
O segundo processo foi conduzido de maneira automática, isto é, com uso de ferramentas computacionais de processamento de linguagem natural e aprendizado de
máquina capazes de usar conhecimento de senso comum suficiente para investigar e descobrir novos conhecimentos.
O terceiro processo foi conduzido por um número maior de ferramentas no sentido de gerenciarem a extração de conhecimento de senso comum (partes consideradas difíceis de serem interpretadas nas fontes de conhecimento envolvidas) na base Cyc.
O método Cyc vislumbra duas atividades, mostradas na Figura 46, que são executadas nos três processos elucidados acima: i) atividade de desenvolver uma ontologia de alto nível contendo conceitos mais abstratos; e ii) atividade de refinar a ontologia abstrata para representação do conhecimento desejado. Na primeira atividade deve-se identificar e codificar o conhecimento explícito e implícito existente nas fontes de conhecimento disponíveis, de forma que, na segunda atividade, novos conceitos e relações sejam inferidos com o auxílio de ferramentas de processamento de linguagem natural e aprendizado de máquina.
4.1.2 Integração
A base de conhecimento Cyc possui diferentes micro-teorias112 com o propósito de reunir o conhecimento de diferentes domínios a depender do contexto (LENAT, 1995). Desse modo, ontologias de variadas complexidades têm sido mapeadas ou integradas com a Cyc, incluindo a SENSUS, uma ampla parcela da WordNet, dentre outras (REED e LENAT, 2002).
Reed e Lenat (2002) apresentam propostas baseadas em padrões tecnológicos de indústria para integrar sistemas computacionais à base Cyc, como DAML, XML Schema e UML. No caso da DAML, a linguagem pode ser importada e exportada na Cyc, tendo em vista que as propriedades da taxonomia da DAML são bem similares aos predicados em Cyc. Alguns subconjuntos de bases de conhecimento têm sido criados no formato DAML113 . O
mapeamento de XML Schema para Cyc é naturalmente mais difícil do que mapear uma ontologia DAML, porque o XML Schema geralmente não inclui informação taxonômica para classes e propriedades. Entretanto, os autores esperam que ferramentas que empregam análise semântica através de nomes de tags XML possam melhorar tal deficiência. E, finalmente, os autores destacam o mapeamento do núcleo de elementos da UML em Cyc, permitindo à base de conhecimento Cyc compreender melhor as interfaces de sistemas computacionais e seus
112 Modelo formal do conhecimento a respeito de alguma área. 113 http://www.daml.org
componentes, quando modelados na UML. Nesse sentido, os autores acreditam que a linguagem de modelagem unificada possa ser suficientemente expressiva114 no sentido de
permitir que a ontologia Cyc modele sistemas, como, por exemplo, um vocabulário em Cyc para modelar sistemas derivados da UML.
114 A seção 2.3.2.2.1 apresentou algumas iniciativas de integração da UML com linguagens de representação de ontologias.
Desenvolvimento desenvolvimento Pós- Processos integrais Gerenciamento do projeto Pré- desenvolvimento Especificação de requisitos Modelagem
conceitual Formalização Implementação Manutenção Integração Avaliação Documentação
Ausente Ausente Simultânea à
fase de
implementação
Ausente Ausente Extração manual
e codificação do conhecimento requerido. Codificação e extração do conhecimento com apoio de ferramentas computacionais como processamento de linguagem natural e aprendizado de máquina. Ausente Padrões tecnológicos de indústria têm sido propostos no sentido de integrar sistemas computacio- nais à micro- teorias da base Cyc, como os padrões DAML, XML Schema e UML. Ausente Ausente
A metodologia foi proposta por Michael Gruninger e Mark Fox em 1995 (GRUNINGER e FOX, 1995), tendo como base para o seu desenvolvimento a experiência obtida no projeto Toronto Virtual Enterprise – conhecido como projeto Tove (FOX, 1992; FOX et al., 1997), cujos princípios teóricos e metodológicos encontram-se na Inteligência Artificial.
O objetivo do projeto Tove é criar um modelo de senso comum sobre empresas, isto é, um conhecimento compartilhado sobre o negócio que conduza a deduções de respostas sobre questões acerca do domínio (FOX, 1992). Tais questões seriam a base para uma caracterização rigorosa acerca dos problemas que o modelo empresarial seria capaz de resolver (GRUNINGER e FOX, 1994a). Para tal, ontologias são criadas no sentido de especificar modelos para organizações públicas e privadas, levando em consideração as seguintes características: a) capacidade de fornecer uma terminologia compartilhada para organizações, que possa ser compreendida e utilizada por cada aplicação, isto é, para cada tipo de negócio; b) definição da semântica de cada termo através de uma teoria lógica; c) implementação da semântica em um conjunto de axiomas que permita à ontologia deduzir de forma automática respostas às questões comuns no escopo das organizações; d) definição de uma simbologia para representar graficamente termos ou conceitos (GRUNINGER e FOX, 1996).
A metodologia foi usada no Enterprise Integration Laboratory (Laboratório de Integração de Empresas) da University of Toronto (Universidade de Toronto) para o projeto e avaliação de ontologias integradas. A Figura 47 ilustra a metodologia.
Figura 47 – Procedimentos propostos na metodologia de Gruninger e Fox
de primeira ordem na especificação de ontologias, obtendo vantagens acerca do poder de expressividade da lógica clássica (GRUNINGER e FOX, 1995). E pode ser usada como um guia para transformar cenários informais em modelos computáveis (FERNÁNDEZ-LOPEZ, GOMEZ- PEREZ e CORCHO, 2004, p.119).
As seções a seguir apresentam o ciclo de atividades da metodologia a partir dos procedimentos ilustrados na Figura 47, os quais possibilitaram o mapeamento para as seguintes categorias de análise: pré-desenvolvimento, especificação de requisitos, modelagem conceitual, formalização, implementação, integração e avaliação.