• No results found

Commercial Gambling and the “Gaming Wars” of 1989-90

O texto científico impõe uma seleção cuidadosa de palavras fortemente orientada pela normalização, pois, sem um controle do vocabulário para fins de indexação, as palavras de um texto podem produzir efeitos indesejáveis na recuperação. Lancaster (1993) faz uma importante observação sobre o uso de normas ao promoverem a compatibilidade estrutural dos vocabulários, facilitando a conversão de um vocabulário para outro: a compatibilização de vocabulário controlado pode ocorrer no nível semântico, ligado à capacidade de ambos representarem o mesmo corpo de conhecimento e no nível estrutural que é responsável por garantir a conformidade das relações estabelecidas entre os elementos (SILVA, 2008).

Silva (2008) destaca que os primeiros estudos acerca da compatibilização de linguagens tiveram início na década de 60 e um dos principais resultados alcançados foi a definição de alguns conceitos centrais para a área e suas respectivas aplicações, sobretudo no âmbito da cooperação entre centros de informação. Porém, foi na década de 70 que esses estudos tiveram uma maior produção como o relatório UNISIST, publicado em 1971, que definiu ‘compatibilidade’ como a qualidade dos sistemas cujos produtos podem ser usados de maneira intercambiável sem nenhuma ‘conversão’42.

A Teoria do Conceito apresentada por Dahlberg (1978) e seus estudos de compatibilidade e convertibilidade entre linguagens são apontados como principais princípios metodológicos para criação de instrumentos de conversão e/ou desenvolvimento de linguagens compatíveis que viabilizem o acesso a múltiplas bases de dados operando em bases cooperativas. Segundo Campos (2007), essas bases teóricas da CI estão possibilitando identificar níveis de compatibilização lingüística e semântica visando apresentar propostas de harmonização terminológica e determinando diretrizes para as

42 Essa conversão é o processo de transformar registros de informação, baseado na transcrição

de códigos de estruturas de dados fazendo com que os mesmos sejam intercambiáveis entre dois ou mais serviços ou sistemas que utilizam diferentes convenções e mídias (DAHLBERG, 1981 apud SILVA, 2008).

atividades de integração e compatibilização de linguagens para futuramente possibilitar a viabilização de procedimentos automatizados.

Na CI, Dahlberg (1979; 1981; 1983) propõe um método de compatibilização e conversão de linguagens após verificar os princípios da classificação facetada, avaliando as diferentes facetas de um documento. Segundo Silva (2008), na matriz de compatibilização conceitual apresentada por Dahlberg (Quadro 8) é possível perceber as três fases propostas na compatibilização de linguagens: verbal, conceitual e estrutural.

O método de compatibilização e conversão de linguagens proposto por Dahlberg teve como base a integração de vocabulários e apresenta uma matriz de compatibilidade conceitual formada por três fases: a) coincidência conceitual quando dois conceitos combinam suas características e grau de equivalência; b) correspondência conceitual quando dois conceitos combinam a maior parte de suas características e similaridade; c) correlação conceitual quando dois conceitos são correlacionados através de símbolos matemáticos, estabelecendo uma medida de correlação, quando possuem diferentes níveis de detalhe, ou quando a relação entre eles não é de semelhança (SILVA, 2008).

Este método fornece resultados da análise de assunto sob os pontos de vista: compatibilidade conceitual, semântico e estrutural. A coincidência conceitual acontece quando dois conceitos combinam suas características possuindo uma relação de equivalência conceitual. Essa correspondência conceitual entre dois conceitos que combinam a maior parte de suas características possui uma similaridade sendo que nessa correlação conceitual pode ser estabelecida uma medida de símbolos matemáticos.

QUADRO 8 – Exemplo de seção da matriz de compatibilização conceitual de vocabulários

Neste quadro, as duas primeiras colunas correspondem ao sistema escolhido. As três colunas seguintes indicam o nível de equivalência entre termos dos outros sistemas, utilizando-se alguns símbolos: ‘≠’ para indicar divergência de conceitos, ‘<’ para conceitos mais genéricos do que o da segunda coluna, ‘>’ para os mais específicos e ‘>’ para a combinação de conceitos. A última coluna indica o número de coincidências, permitindo calcular o grau de compatibilidade.

Dahlberg (1979) destaca que é através das características de um conceito traduzidas em seus atributos que são realizados os processos de análise-síntese do conceito. Em geral, a quantidade total de complementos de um verbo é limitada à valência "natural" no predicado em questão ("funcionalidade" das características de um “conceito”) e maneira necessária de formar e ampliar enunciados para abranger os detalhes necessários à informação sobre determinados objetos informacionais. Mas, só é possível obter essas características formulando enunciados sobre os atributos necessários ou possíveis sobre determinado objeto em um contexto.

A matriz de compatibilidade conceitual é um mapeamento da potencialidade semântica dos instrumentos de vocabulário controlado criados pela CI, consistindo basicamente na extração de conceitos válidos na análise de assunto para traduzir o conteúdo numa linguagem documentária que sirva de intermédio entre usuário-documento (CAMPOS, 2001). Esses instrumentos, ao ligar semanticamente termos que tenham relação entre si, podem ajudar um leitor-interpretador a identificar outros termos-chave que seriam necessários para realizar uma busca completa em um domínio em bibliotecas digitais. Esses instrumentos facilitam o arranjo físico mediante uma linguagem artificial de códigos ou símbolos por reunir fisicamente os documentos em uma base de dados que tratam de assuntos de um mesmo domínio, estruturando um sistema de conceitos.

Os instrumentos de controle do vocabulário desenvolvidos na CI são comumente classificados quanto à coordenação dos conceitos em pré-coordenados e pós-coordenados. Os vocabulários pré-coordenados estabelecem a coordenação dos vários tópicos referentes a um assunto composto no momento da indexação. Os pós-coordenados consistem de entradas (termos indexadores) e de uma saída que permite a comparação das entradas de assunto para determinar coincidências que revelem documentos pertinentes ao assunto composto pesquisado. Assim, a coordenação dos elementos de um assunto composto na busca pode ser transferida, ou seja, pós-coordenação em relação ao momento da indexação, comparando termos formulados pelo usuário na busca de informação (PINTO, 1985).

De acordo com Kobashi (2002), para que um vocabulário controlado seja útil, deve refletir, de um lado, os objetivos do Sistema de Informação para o qual foi elaborado e,

de outro, a linguagem dos usuários. Por essa razão, sua construção é coletiva, requer trabalho integrado, colaborativo, envolvendo tanto os gerenciadores do Sistema de Informação quanto os usuários da informação. Além disso, os instrumentos utilizados para o controle do vocabulário propiciam uma linguagem dinâmica que se desenvolve em consonância com as áreas de conhecimento representadas no Sistema de Informação necessitando, portanto, de atualização periódica dos instrumentos de vocabulário controlado.

Esses instrumentos subsidiar as atividades de indexação e recuperação de conteúdos documentais retifica as dissonâncias terminológicas provocadas pelas multiplicidades de vocabulários envolvidos nos processos de tratamento documentário, pois o vocabulário controlado é representado por um único conceito-chave utilizado como descritor na estruturação semântica de um sistema de conceitos. Devido ao mapeamento de um vocabulário controlado em outro ser considerado uma tarefa intelectual cansativa e demorada, Silva (2008) destaca que alguns algoritmos foram desenvolvidos com o objetivo de automatizar pelo menos uma parte do processo.

Contudo, há necessidade de pesquisas interdisciplinares, envolvendo profissionais da organização e representação do conhecimento de diferentes áreas para integração dos processos de compatibilização. As dificuldades encontradas no processo de compatibilização são originadas, principalmente, na subjetividade da escolha de descritores e relações hierárquicas durante a construção desses vocabulários (SILVA, 2008). Lima (1998) destaca que, a partir do referencial terminológico da área do conhecimento a que pertence o acervo independente do suporte físico de seus documentos, pode-se evitar a diversidade de representações para a mesma informação, o que torna a Terminologia também um instrumento essencial quando há necessidade de compatibilizar vocabulário.

Quando esses instrumentos recebem atualização periódica, eles apresentam muitas vantagens de uso nos atuais sistemas de RI, tais como: controle de termos sinônimos; distinção de homógrafos; minimização de esforço intelectual na atribuição de termos descritores e consequente racionalização do trabalho e maior margem de consistência terminológica para indexação; restrição do número de descritores usados pelo sistema, evitando sua sobrecarga; expressão da linguagem no nível conceitual (ideia); aumento da consistência do vocabulário para o mapeamento de um domínio (KOBASHI, 2002). Silva (2008) estudou duas teses da base de dados do MHTX na tentativa de compatibilização de vocabulário controlado, utilizando mapa de tópicos com o objetivo principal de automatização do processo de compatibilização dessas estruturas.

A ideia de Silva era possibilitar o processo de fusão43

dos mapas de tópicos para promover o inter-relacionamento semântico entre os mapas conceituais e, consequentemente, entre os recursos de informação hipertextual. Entretanto, este processo apresentou grande complexidade exigindo um alto nível de interferência manual. O Anexo I apresenta a conversão manual das estruturas facetadas das duas teses em um único mapa de tópicos. Os principais objetivos alcançados foram: (a) a conceitualização detalhada do processo de fusão dos mapas de tópicos, considerando os níveis de compatibilização possíveis e a aplicabilidade dessa tecnologia na integração de estruturas facetadas; (b) a obtenção de uma sequência detalhada de passos que pode ser utilizada para a implementação de mapas de tópicos, a partir de estruturas facetadas.

Estudos futuros são sugeridos por Silva propondo novos modelos de análise de assunto para automatizar processos do tratamento documentário do MHTX utilizando ontologias e associações entre conceitos apresentados no mapa de tópicos da fusão. Por isso, acredita-se neste trabalho que a compatibilização de vocabulário é necessária tanto para o autor (produtor do texto) como para o leitor (usuário de um sistema de uma biblioteca digital). O autor, antes de publicar um documento cientifico, pode se beneficiar do modelo proposto neste trabalho tendo como referência os termos comuns utilizados em uma comunidade científica (categorizados e classificados em um sistema de conceitos). Assim, os usuários (autor, leitor e co-autor) deste modelo poderão “integrar”, “harmonizar”, “reconciliar”, “concordar” com os termos comuns utilizados no domínio da CI para compartilhar informação.

As palavras “integração”, “harmonização”, “reconciliação” e “concordância” são utilizadas para indicar o mesmo conceito de “compatibilização” apresentado por Maniez (1997) e reforçam as diferentes facetas do vocabulário usado em um documento científico. A compatibilização de vocabulário ocorre quando existe um termo correspondente para cada termo de uma linguagem, de mesmo significado, na outra linguagem, e por isso, é possível converter termos de uma linguagem em outra, sem alterações de significado (SILVA, 2008).

Seria muito interessante, que o mapa proposto neste trabalho possibilitasse a compatibilização semântica das diversas facetas de um domínio para ajudar um leitor- interpretador na busca pelo termo-chave correto. A ontologia servirá de base para explicitar “conceitos científicos” mapeados em um domínio e o novo sistema, mostrando os termos sinônimos das relações de equivalência que poderão ser indicados pelo próprio autor utilizando ferramentas de anotação semântica na modelagem informacional. Para isso, há necessidade de utilizar os padrões de metadados digitais propostos pelo W3C.

43

Neste trabalho, acredita-se que o mapa conceitual do MHTX representado como uma ontologia de domínio possa ser modelado por profissionais experientes em linguagens documentárias. Essas estruturas só adquirem significado quando integradas ao contexto semântico e à estrutura cognitiva de um leitor-interpretador diante de uma nova informação (conceito, ideia, proposição) para um usuário-sistema (SAYÃO, 2001; BASTOS, 2005). Por isso, propõe inserir um único mapa de uma ontologia de domínio no MHTX usando a fusão da estrutura apresentada por Silva (2008) para modelagem informacional.