• No results found

4. Discussion

4.6 Practical implications

Esta seção descreve como foi conduzida a atividade de coleta e análise do material empírico. O primeiro passo desta etapa foi definir as categorias de análise que pudessem subsidiar a análise de conteúdo dos materiais envolvendo as metodologias e os métodos para construção de ontologias e a metodologia e a norma para construção de vocabulários controlados.

A maioria dos procedimentos de análise qualitativa organiza-se em torno de categorias (BARDIN. 1977). Na análise de conteúdo, as categorias são classes que reúnem um grupo de elementos (unidades de registro) em razão de características comuns. Segundo Bardin (1977), a escolha de categorias pode envolver vários critérios: i) semântico (temas); ii) sintático (verbos, adjetivos, pronomes); iii) léxico (juntar pelo sentido das palavras, agrupar os sinônimos, os antônimos); e iv) expressivo (agrupar as perturbações da linguagem, da escrita). De acordo com o autor, as categorias devem possuir certas características, a saber: i) exclusão mútua – cada elemento só pode existir em uma categoria; ii) homogeneidade – para definir uma categoria é preciso haver só uma dimensão na análise; iii) pertinência – as categorias devem dizer respeito às intenções do investigador, aos objetivos da pesquisa às questões norteadoras, às características da mensagem, etc.; iv) objetividade e fidelidade – se as categorias forem bem definidas, não haverá distorções devido à subjetividade dos analistas; e v) produtividade – as categorias serão produtivas se os resultados forem férteis em inferências, em hipóteses novas, em dados exatos.

Na análise de conteúdo feita nos documentos, descrita na seção 3.2, percebeu-se certa semelhança entre algumas fases de desenvolvimento dos instrumentos (ontologias e vocabulários controlados) e outras advindas do processo de desenvolvimento de software, conforme foi fundamentado na seção 2.3.3.5.1. Algumas dessas semelhanças foram identificadas principalmente nas atividades de análise de domínio, e nas abordagens técnicas para criação de modelos conceituais. Considerando que as ontologias de sistemas de informações são desenvolvidas segundo um processo de modelagem de domínio e

codificação, e dada a falta de uma estrutura de trabalho mais específica para análise de tais objetos, decidiu-se, na perspectiva deste trabalho, utilizar como subsídio para definição das categorias de análise o padrão aceito internacionalmente para desenvolvimento de software, a norma IEEE-1074 (1997).

O modelo de ciclo de vida de software, proposto na norma IEEE-1074, foi descrito na fundamentação teórica dessa pesquisa, e aqui é considerado um padrão aceitável para análise e comparação das fases de desenvolvimento de ontologias e vocabulários controlados. A justificativa para tal consideração é de que o modelo de ciclo de vida descreve o processo estruturado e metódico de desenvolvimento (PRESSMAN, 2002), e advém da “Engenharia de Software, uma disciplina considerada madura no sentido de possuir metodologias amplamente aceitas”109 (FERNANDEZ, 1999, p.1). E, como as ontologias podem ser consideradas

componentes de produtos de software, elas podem ser desenvolvidas de acordo com padrões usualmente indicados para software (FERNANDEZ, 1999). Tais padrões devem ser adaptados de acordo com o processo de construção de ontologias, conforme foi explanado na seção 2.3.3.5.2: i) planejamento; ii) especificação de requisitos; iii) aquisição de conhecimento; iv) conceitualização; v) formalização; vi) integração; vii) implementação; viii) avaliação; e ix) documentação.

Fernandez (1999, p.3) estabelece critérios para analisar metodologias para construção de ontologias. Alguns desses critérios foram utilizados para julgar a maturidade da metodologia frente à norma IEEE-1074 e são enumerados como segue: i) processos moldados no ciclo de vida de um software; ii) processo de gerenciamento de projeto; iii) processos de desenvolvimento orientado: pré-desenvolvimento, desenvolvimento e pós-desenvolvimento; e iv) processo integral. O critério i considera que uma ontologia deveria ser construída a partir das etapas do ciclo de vida de um software, ou seja, desde o planejamento até os testes de software; o critério ii busca a garantia da qualidade do produto a partir da gestão do projeto; em iii leva-se em consideração que o projeto passe por um estudo de ambiente, estudo de viabilidade, especificação de requisitos, conceitualização, formalização, implementação, avaliação, validação, manutenção e acompanhamento do uso pós-desenvolvimento; e, finalmente, o critério iv enfatiza a importância do treinamento dos usuários que ficarão responsáveis pela manutenção da ontologia, bem como o desenvolvimento de documentação em todo o ciclo de vida.

109 “Software Engineering […] can be said to have reached adulthood, because it has widely accepted methodologies.”

Finalmente, as categorias de análise de conteúdo do material empírico foram definidas a partir dos princípios elucidados por Bardin (1977) anteriormente. O critério de escolha das categorias foi o semântico, ou seja, de acordo com a norma IEEE-1074 (1997) e com a literatura da área de ontologias. Tais categorias foram, então, adaptadas diante aos processos extraídos da norma e características particulares às ontologias. São elas: i) gerenciamento do projeto; ii) pré-desenvolvimento; iii) especificação de requisitos; iv) modelagem conceitual; v) formalização; vi) implementação; vii) manutenção; viii) integração; ix) avaliação; e x) documentação.

Ressalta-se que a categoria formalização foi direcionada para o contexto das ontologias, que especificam modelos semi-computáveis através de uma linguagem formal, como também para o contexto dos vocabulários controlados, quando se define as suas formas de apresentação.

A definição das categorias de análise pode ser justificada a partir de uma visão genérica da engenharia de software, que abrange a análise, o projeto, a construção, a verificação e a gestão de elementos técnicos ou sociais (PRESSMAN, 2002). Desse modo, todas as categorias definidas nessa pesquisa se enquadraram em três fases genéricas, as quais, segundo Pressman (2002), independem da área da aplicação, do tamanho do projeto ou de sua complexidade: i) a fase de definição, que se concentra no quê, isto é, que comportamento é esperado do sistema; ii) fase de desenvolvimento, que focaliza o como, isto é, durante o desenvolvimento deve-se definir como os dados devem ser organizados (no caso das ontologias e dos vocabulários controlados, seriam os conceitos), implementados e testados; e iii) fase de manutenção, que se ocupa das modificações associadas com correções de erros, adaptações necessárias e melhoramentos frente aos requisitos levantados.

Definidas as categorias de análise, o próximo passo foi a elaboração dos instrumentos para coleta e registro dos dados. Para cada metodologia, método e norma envolvida foi elaborada uma tabela contendo um espaço dedicado a cada categoria de análise, conforme podem ser vistas no capítulo 4. Desta forma, tornou-se possível colher o conteúdo nos documentos envolvidos ( relacionados em anexo) a partir das categorias e registrá-lo formalmente em cada tabela. Se uma categoria não fosse pertinente a alguma metodologia ou método, a coluna era preenchida com o valor “Ausente”. A coleta dos dados passou pelas atividades de compreensão, análise e síntese de conteúdo, realizadas a partir do conhecimento adquirido na pesquisa. Tais atividades foram necessárias para a realização da etapa seguinte, que consistia em analisar comparativamente as categorias para cada metodologia, método e