• No results found

Os dados obtidos com a das três modalidades de formulação de estratégias de

busca, a saber: com a linguagem com a linguagem e com o uso simultâneo da

linguagem controlada e da linguagem natural, apresentaram resultados que confirmaram as hipóteses formuladas no presente estudo.

Os dados foram analisados separadamente para cada um dos de avaliação

a saber: Muito bom, para as citações altamente relevantes; Bom, para as citações periféricas e

Irrelevantes para as citações julgadas insatisfatórias. Os mesmos foram coletados nos

formulários de avaliação das referências (Anexo III), realizadas pêlos usuários solicitantes das buscas. Na Figura 8, apresenta-se uma comparação dos resultados das estratégias de busca considerando-se apenas os dados do índice Muito bom, com as três modalidades de estratégias: LC, LN e PESQUISAS 8 10 •LC •LN •LC LN Pesquisas 1 Fenomenologia 2 Doenças 3 Denegação 4 Agressividade 5 Divórcio 6 Casamento 7 Dependência 8 de crianças 9 Obesidade 10 Depressão e stress

O coeficiente de precisão entre o total de itens recuperados e o total dos itens considerados relevantes e classificados pêlos usuários como Muito bom, foi de:

- Linguagem controlada

- Linguagem natural 31.27% - Linguagem controlada + Linguagem natural 37.67%

A estratégia de busca formulada com a LC e a LN apresentou um desempenho melhor de recuperação e satisfação para os com 159 citações recuperadas de um total de 422 referências classificadas como relevantes pêlos usuários. A estratégia com a LC e com a LN obtiveram um resultado semelhante, com o índice de para as 132 citações classificadas como MB para a LN, e o de para as 131 citações da LC.

A Figura 3 demonstra que de um total de 708 referências recuperadas, 422 ou 59.60% foram dassificadas como relevantes ou Muito bom pêlos usuários. Desse resultado a teve um desempenho maior do que a LC e a LN, comprovando a hipótese 3:

"H3 - Os resultados de uma estratégia de busca de informação em bases de dados quando se utiliza simultaneamente a LC e a LN podem contribuir para o aumento de citações relevantes recuperadas na base de dados

Na Figura 9, são apresentados os dados relativos ao índice Bom.

PESQUISAS 10 Pesquisas 1 2 renais 3 4 Agressividade 5 Divórcio 6 Casamento 7 Dependência 8 de crianças 9 Obesidade Depressão e stress

O de precisão entre o total de itens recuperados e o total dos itens considerados

periféricos e classificados pêlos usuários corno Bom, foi de:

- Linguagem 25.35%

- Linguagem natural 32.40%

- Linguagem controlada + linguagem natural 42.25%

A estratégia de busca formulada com a LC+LN apresentou 90 itens recuperados, de um totat

de 213 referências classificadas de periféricas pêlos usuários, confirmando a observação de

(1993)

"Uma característica tamentável inerente ã recuperação de informação é uma melhoria de revocação em geral, implicar uma perda de precisão e 1983, p. 4).

Os dados classificados de Bom pêlos usuários comprovam que ao aumento de revocação correspondeu uma perda na precisão.

Apresenta-se na Figura 10, os dados comparativos dos resultados das estratégias para o índice irrelevante. PESQUISAS 8 10 Pesquisas 1 2 Doenças 3 Denegação 4 Agressividade 5 Divórcio 6 Casamento 7 Dependência 8 de crianças 9 Obesidade 10 Depressão e stress

O coeficiente de precisão entre o total de itens recuperados e o total dos itens considerados irrelevantes pêlos usuários foi de:

- Linguagem controlada 6.85% - Linguagem natural 45.20%

- Linguagem controlada linguagem natural 47.95%

A estratégia de busca formulada com a LC + LN apresentou um resultado de não relevância

maior do que a LC e a com um índice de 47.95% correspondendo à 35 das 73 referências como irrelevantes pêlos usuários.

Num cômputo geral, das 708 referências recuperadas, os itens classificados como irrelevantes pêlos nas três modalidades de estratégias de busca executadas, corresponderam a 73 referências, sendo: 5 para a LC; 33 para a LN e 35 para o uso concomitante da LC+LN. A precisão da LC na estratégia de busca foi confirmada, com os índices maiores de

ocasionados pelo uso da LN, ocorrendo também, na LC+LN, quando do resultado da soma lógica dos resultados da LC com a LN. A desvantagem de uso da LN, em relação a LC, fica evidente pois, ocorreu uma significativa incidência de respostas negativas, ou de relações entre os termos usados na estratégia, provavelmente, por falta de normalização dos termos da linguagem natural. Assim, nos temas de busca: doenças renais, denegação, divórcio e de crianças, o índice de irrelevância foi de quase 50% em relação ao total de citações recuperadas, o que pode ser considerado altamente insatisfatório para os usuários.

Pode-se inferir pêlos dados apresentados nas Figuras 8, 9 e 10, que o melhor desempenho de formulação de estratégia de busca ocorreu com o uso simultâneo das linguagens controlada e natural, embora tenha ocorrido um elevado índice de citações consideradas pêlos usuários com o uso dessas linguagens em conjunto.

Como bem ressalta HARTER (1986), (1991), (1986, 1993),

(1994), SVENONIOUS (1986, 2000) , e outros autores, a prática e a experiência dos

intermediários ainda comanda a dos termos para as estratégias de busca. Embora a experimentação persistente possa resolver em parte, a questão de qual tipo de linguagem deva ser

utilizada nas estratégias de busca, existe uma crescente evidência de que buscas com termos na

LC e na LN, na verdade se complementam mutuamente, o que veio de encontro aos resultados alcançados no presente estudo.

5. CONCLUSÕES

Introdução

A análise efetuada neste estudo possibilitou a consecução dos objetivos pretendidos, subsídios para um melhor entendimento do complexo processo de recuperação de

informação em bases de dados em CD-ROM ou em linha. O propósito do estudo era o de

examinar o processo de planejamento de estratégia de busca, num ambiente de bases de dados em CD-ROM, verificando qual o tipo de vocabulário deveria ser empregado na mesma. Como objetivos específicos foram estudados: identificar a adequação do uso da linguagem controlada na elaboração da estratégia de busca; identificar a adequação do uso da linguagem natural e identificar o uso simultâneo da linguagem controlada e da natural na elaboração da estratégia de busca.

Três hipóteses foram testadas. A primeira (H1) foi a de que os resultados de uma estratégia de busca de informação em bases de dados quando se utiliza a linguagem controlada não contribuem para o aumento de citações relevantes. A segunda (H2) foi a de que os resultados de uma estratégia de busca de informação em bases de dados quando se utiliza a linguagem natural não contribuem para o aumento de citações relevantes. E finalmente a terceira foi a de que os resultados de uma estratégia de busca de informação em bases de dados quando se utiliza simultaneamente a LC e a LN podem contribuir para o aumento de citações relevantes recuperadas na base de dados PSYCLIT. A metodologia empregada neste trabalho

pode ser aplicada à bases de dados de outras áreas do conhecimento, tendo em vista as

peculiaridades de terminologia de outras áreas do campo científico e tecnológico.

Os dados para esse estudo foram obtidos a partir do atendimento às solicitações de busca dirigidas à UCB/ - Serviço de Busca Bibliográfica por usuários da área de Psicologia. Foram elaborados três conjuntos de dez buscas com os seus respectivos planejamentos das estratégias, que foram operacionalizadas especificamente com termos extraídos da LC, da LN e com a soma

lógica proveniente dos resultados da LC+LN. Essas formulações de estratégias resultaram na

composição definitiva da amostra, totalizando trinta estratégias de busca diferenciadas umas das

outras tipo de vocabulário que foi empregado. Os resultados das buscas foram limitados aos

últimos dois anos, de janeiro de 1998 até março de 2000, e com o máximo de trinta referências

para cada estratégia.

Foram obtidas com as três modalidades de estratégias de busca um total de 708 referências, sendo que 422 referências, ou seja, 59.60% desse total, foram classificadas pêlos usuários como citações relevantes. Desses resultados 213 citações foram classificadas como periféricas,

correspondendo a 30.09% do total de citações, com mais do que o interesse

do usuário podendo vir a ser úteis em futuro próximo. As referências classificadas como

irrelevantes por todos os usuários participantes desse estudo foram na ordem de 73, para as três modalidades de estratégias de busca, correspondendo à de participação no resultado final.