• No results found

O termo tesauro teve sua origem no dicionário de Peter Mark Roget em 1852 – Thesaurus of English Words and Phrases. Em tal dicionário, os termos não estão organizados em ordem alfabética, como nos dicionários tradicionais, mas de acordo com o significado das palavras que o compõem (DODEBEI, 2002). Surge, dessa maneira, uma primeira concepção de estrutura organizada logicamente através de elementos semânticos relacionados entre si. A partir de 1940, o tesauro documentário começou a ser usado na Ciência da Informação com o propósito de recuperar informação em ambientes com uma diversidade de documentos especializados.

O programa Unisist (UNESCO, 1973, p.6) define tesauro como um “vocabulário controlado dinâmico de termos relacionados semântica e genericamente, cobrindo um domínio específico do conhecimento” e ainda como “um dispositivo de controle terminológico usado na tradução da linguagem natural dos documentos, dos indexadores ou dos usuários numa linguagem do sistema mais restrita” Uma outra definição pode ser encontrada no National Information Standards Organization (ANSI/NISO Z39-19-1993), que define tesauro como um “vocabulário controlado organizado em uma ordem conhecida na qual as relações de equivalência, hierárquicas e associativas entre os termos são claramente mostradas e identificadas através de indicadores de relação padrão”.

As ilustrações que se seguem mostram os tipos de relações que os tesauros comportam.

Figura 6 – Relação Gênero/Espécie

Fonte: Cintra et al. (2002)

Figura 7 – Relação Todo/Parte

Fonte: Cintra et al. ( 2002)

Figura 8 – Relação Enumerativa

Fonte: Cintra et al. (2002)

As Figuras 6, 7 e 8 mostram relações hierárquicas. No primeiro caso, há uma relação de subordinação entre gênero (denominado TG – termo geral) e espécie (denominado TE – termo específico). No segundo caso, há uma relação entre o todo e suas partes, conforme é mostrado na Figura 7: o termo Casco é uma parte e não um tipo de Navio. Já no terceiro caso, os termos específicos (Andes e Himalaia) são exemplos do conceito Regiões Montanhosas.

Figura 9 – Relação Associativa

Fonte: Cintra et al. (2002)

A Figura 9 mostra o tipo de relação associativa, na qual um termo pode estar relacionado a outro termo por alguma característica comum entre eles. A identificação TR é usada para

representar que o termo Algodão é um termo relacionado ao termo Tecido e vice-versa. As relações associativas são não-hierárquicas e teoricamente infinitas.

Figura 10 – Relação de Equivalência

Fonte: Cintra et al. (2002)

A Figura 10 mostra a relação de equivalência, na qual sinônimos e quase-sinônimos são remetidos aos termos envolvidos. No exemplo, a identificação USE é utilizada para representar que o termo Larídeos é sinônimo do termo Gaivotas, contudo Larídeos é o termo preferido. Já na identificação UP (usado para) o termo Falecimento é usado preferencialmente ao termo Morte.

Segundo Currás (1995), tesauro é definido como uma linguagem usada para fins documentários, composto de termos, simples ou compostos, os quais estão relacionados entre si sintática e semanticamente. A autora ressalta que os tesauros representam os assuntos dos documentos e podem auxiliar nas buscas por unidades de informação pela determinação de quais termos poderão ser usados no momento da busca; além de aproximar a linguagem do usuário à do sistema, permitindo uma introdução de novos termos e também uma alteração em sua estrutura quando se fizer necessário. Tal representação de assunto é feita pelo profissional indexador, o qual analisa o assunto do documento e depois faz o levantamento dos termos permitidos de um tesauro. Fujita (2003) destaca a análise de assunto como uma fase inicial do processo de indexação, que resultará em tópicos do assunto de um documento e posteriormente numa tradução desses tópicos em uma linguagem adotada pelo sistema, conforme foi visto na seção 2.2.2.

Em Moreira, Alvarenga e Oliveira (2004) pode ser visualizada a evolução histórica de construção de tesauros: a norte-americana e a européia, na qual as autoras embasam-se nas considerações de Lancaster (1986) para fazer tal explicitação. As autoras inserem o Unitermo (instrumento de representação do assunto por palavras únicas) como a primeira vertente, originária na América do Norte em 1951, tendo influenciado o aparecimento do primeiro tesauro. E a outra, a Teoria da Classificação Facetada, na qual continuou a ser desenvolvida pelo grupo de pesquisa denominado Classification Research Group (CRG) na Inglaterra. Este

grupo, formado por quatorze componentes29, ampliou as categorias do PMEST e desenvolveu diversas tabelas de classificação na década de 50. Deu-se, então, origem a uma técnica mais refinada para construção de tesauros – denominado Thesaurofacet, a qual permite o melhor posicionamento do conceito dentro do sistema de conceitos em uma área de assunto específica, através do uso de categorias. As autoras mostram também uma evolução recente, a dos tesauros-com-base-em-conceitos, também conhecido como tesauros terminológicos, cuja origem vem da junção da teoria do conceito de Dahlberg com a Teoria da Classificação Facetada de Ranganathan. Segundo Campos (2001), os tesauros terminológicos são elaborados dando ênfase na Teoria da Classificação, Teoria do Conceito e princípios terminológicos, tendo nas características do conceito um elemento essencial para evidenciar as relações entre os conceitos e seu posicionamento no sistema, além de defini-lo, permitindo uma comunicação mais precisa entre usuário e sistema.

2.2.3.3.4 Taxonomias

Segundo a norma ANSI (2005), as taxonomias são coleções de termos classificados em uma estrutura hierárquica, na qual emprega relacionamentos de generalização e especialização.

O termo taxonomia vem sendo utilizado para designar aplicações que organizam informação em ambientes eletrônicos e virtuais (Portais Corporativos, Bibliotecas Digitais, Intranets, Extranets, etc), tendo como principais atribuições: a) auxiliar os usuários no momento da escolha dos filtros destinados à busca em grandes bancos de dados; b) ajudar os usuários na busca da informação desejada e como usar a informação recuperada; c) ajudar os usuários na navegação em sistemas hipermídia; d) possibilitar uma terminologia padrão no âmbito organizacional; e) possibilitar e facilitar o compartilhamento de informação e conhecimento nas organizações (GILCHRIST, 2003).

Vickery (1980) complementa dizendo que uma taxonomia é um sistema de classificação de itens de um domínio apresentado hierarquicamente, cuja estrutura se organiza por meio de relações genéricas, tendo como prioridade a identificação de entidades.

Algumas semelhanças podem ser percebidas entre os tesauros, as taxonomias e as ontologias, sendo todos: instrumentos utilizados para organização de informação e de conhecimento; sistemas de conceitos; sistemas com base classificatória. As taxonomias

29 D.J.Campell, E.J.Coates, J.E.L. Farradane, D.J.Foskett, G.Jones, J.Milles, T.S. Morgan, B.I.Palmer, O.W.Pendleton, L.G.M.Roberts, B.C. Vickery, A.J.Walford, K.E.Watkins e A.J. Wells (LIMA, 2004).

identificam e classificam entidades, admitindo somente relacionamentos gênero/espécie e todo/parte, além de permitirem agregar dados em sistemas automatizados. Os tesauros representam conceitos e admitem um maior número de relações: hierárquicas, associativas e de equivalência. Já as ontologias necessitam de relações mais explicitadas, pois são instrumentos passíveis de interpretação por máquinas, diferentemente dos tesauros, concebidos, a priori, para serem manipulados por humanos.

2.3 Contribuições da Ciência da Computação para a Representação