Os dados obtidos com a das três modalidades de formulação de estratégias de
busca, a saber: com a linguagem com a linguagem e com o uso simultâneo da
linguagem controlada e da linguagem natural, apresentaram resultados que confirmaram as hipóteses formuladas no presente estudo.
Os dados foram analisados separadamente para cada um dos de avaliação
a saber: Muito bom, para as citações altamente relevantes; Bom, para as citações periféricas e
Irrelevantes para as citações julgadas insatisfatórias. Os mesmos foram coletados nos
formulários de avaliação das referências (Anexo III), realizadas pêlos usuários solicitantes das buscas. Na Figura 8, apresenta-se uma comparação dos resultados das estratégias de busca considerando-se apenas os dados do índice Muito bom, com as três modalidades de estratégias: LC, LN e PESQUISAS 8 10 •LC •LN •LC LN Pesquisas 1 Fenomenologia 2 Doenças 3 Denegação 4 Agressividade 5 Divórcio 6 Casamento 7 Dependência 8 de crianças 9 Obesidade 10 Depressão e stress
O coeficiente de precisão entre o total de itens recuperados e o total dos itens considerados relevantes e classificados pêlos usuários como Muito bom, foi de:
- Linguagem controlada
- Linguagem natural 31.27% - Linguagem controlada + Linguagem natural 37.67%
A estratégia de busca formulada com a LC e a LN apresentou um desempenho melhor de recuperação e satisfação para os com 159 citações recuperadas de um total de 422 referências classificadas como relevantes pêlos usuários. A estratégia com a LC e com a LN obtiveram um resultado semelhante, com o índice de para as 132 citações classificadas como MB para a LN, e o de para as 131 citações da LC.
A Figura 3 demonstra que de um total de 708 referências recuperadas, 422 ou 59.60% foram dassificadas como relevantes ou Muito bom pêlos usuários. Desse resultado a teve um desempenho maior do que a LC e a LN, comprovando a hipótese 3:
"H3 - Os resultados de uma estratégia de busca de informação em bases de dados quando se utiliza simultaneamente a LC e a LN podem contribuir para o aumento de citações relevantes recuperadas na base de dados
Na Figura 9, são apresentados os dados relativos ao índice Bom.
PESQUISAS 10 Pesquisas 1 2 renais 3 4 Agressividade 5 Divórcio 6 Casamento 7 Dependência 8 de crianças 9 Obesidade Depressão e stress
O de precisão entre o total de itens recuperados e o total dos itens considerados
periféricos e classificados pêlos usuários corno Bom, foi de:
- Linguagem 25.35%
- Linguagem natural 32.40%
- Linguagem controlada + linguagem natural 42.25%
A estratégia de busca formulada com a LC+LN apresentou 90 itens recuperados, de um totat
de 213 referências classificadas de periféricas pêlos usuários, confirmando a observação de
(1993)
"Uma característica tamentável inerente ã recuperação de informação é uma melhoria de revocação em geral, implicar uma perda de precisão e 1983, p. 4).
Os dados classificados de Bom pêlos usuários comprovam que ao aumento de revocação correspondeu uma perda na precisão.
Apresenta-se na Figura 10, os dados comparativos dos resultados das estratégias para o índice irrelevante. PESQUISAS 8 10 Pesquisas 1 2 Doenças 3 Denegação 4 Agressividade 5 Divórcio 6 Casamento 7 Dependência 8 de crianças 9 Obesidade 10 Depressão e stress
O coeficiente de precisão entre o total de itens recuperados e o total dos itens considerados irrelevantes pêlos usuários foi de:
- Linguagem controlada 6.85% - Linguagem natural 45.20%
- Linguagem controlada linguagem natural 47.95%
A estratégia de busca formulada com a LC + LN apresentou um resultado de não relevância
maior do que a LC e a com um índice de 47.95% correspondendo à 35 das 73 referências como irrelevantes pêlos usuários.
Num cômputo geral, das 708 referências recuperadas, os itens classificados como irrelevantes pêlos nas três modalidades de estratégias de busca executadas, corresponderam a 73 referências, sendo: 5 para a LC; 33 para a LN e 35 para o uso concomitante da LC+LN. A precisão da LC na estratégia de busca foi confirmada, com os índices maiores de
ocasionados pelo uso da LN, ocorrendo também, na LC+LN, quando do resultado da soma lógica dos resultados da LC com a LN. A desvantagem de uso da LN, em relação a LC, fica evidente pois, ocorreu uma significativa incidência de respostas negativas, ou de relações entre os termos usados na estratégia, provavelmente, por falta de normalização dos termos da linguagem natural. Assim, nos temas de busca: doenças renais, denegação, divórcio e de crianças, o índice de irrelevância foi de quase 50% em relação ao total de citações recuperadas, o que pode ser considerado altamente insatisfatório para os usuários.
Pode-se inferir pêlos dados apresentados nas Figuras 8, 9 e 10, que o melhor desempenho de formulação de estratégia de busca ocorreu com o uso simultâneo das linguagens controlada e natural, embora tenha ocorrido um elevado índice de citações consideradas pêlos usuários com o uso dessas linguagens em conjunto.
Como bem ressalta HARTER (1986), (1991), (1986, 1993),
(1994), SVENONIOUS (1986, 2000) , e outros autores, a prática e a experiência dos
intermediários ainda comanda a dos termos para as estratégias de busca. Embora a experimentação persistente possa resolver em parte, a questão de qual tipo de linguagem deva ser
utilizada nas estratégias de busca, existe uma crescente evidência de que buscas com termos na
LC e na LN, na verdade se complementam mutuamente, o que veio de encontro aos resultados alcançados no presente estudo.
5. CONCLUSÕES
Introdução
A análise efetuada neste estudo possibilitou a consecução dos objetivos pretendidos, subsídios para um melhor entendimento do complexo processo de recuperação de
informação em bases de dados em CD-ROM ou em linha. O propósito do estudo era o de
examinar o processo de planejamento de estratégia de busca, num ambiente de bases de dados em CD-ROM, verificando qual o tipo de vocabulário deveria ser empregado na mesma. Como objetivos específicos foram estudados: identificar a adequação do uso da linguagem controlada na elaboração da estratégia de busca; identificar a adequação do uso da linguagem natural e identificar o uso simultâneo da linguagem controlada e da natural na elaboração da estratégia de busca.
Três hipóteses foram testadas. A primeira (H1) foi a de que os resultados de uma estratégia de busca de informação em bases de dados quando se utiliza a linguagem controlada não contribuem para o aumento de citações relevantes. A segunda (H2) foi a de que os resultados de uma estratégia de busca de informação em bases de dados quando se utiliza a linguagem natural não contribuem para o aumento de citações relevantes. E finalmente a terceira foi a de que os resultados de uma estratégia de busca de informação em bases de dados quando se utiliza simultaneamente a LC e a LN podem contribuir para o aumento de citações relevantes recuperadas na base de dados PSYCLIT. A metodologia empregada neste trabalho
pode ser aplicada à bases de dados de outras áreas do conhecimento, tendo em vista as
peculiaridades de terminologia de outras áreas do campo científico e tecnológico.
Os dados para esse estudo foram obtidos a partir do atendimento às solicitações de busca dirigidas à UCB/ - Serviço de Busca Bibliográfica por usuários da área de Psicologia. Foram elaborados três conjuntos de dez buscas com os seus respectivos planejamentos das estratégias, que foram operacionalizadas especificamente com termos extraídos da LC, da LN e com a soma
lógica proveniente dos resultados da LC+LN. Essas formulações de estratégias resultaram na
composição definitiva da amostra, totalizando trinta estratégias de busca diferenciadas umas das
outras tipo de vocabulário que foi empregado. Os resultados das buscas foram limitados aos
últimos dois anos, de janeiro de 1998 até março de 2000, e com o máximo de trinta referências
para cada estratégia.
Foram obtidas com as três modalidades de estratégias de busca um total de 708 referências, sendo que 422 referências, ou seja, 59.60% desse total, foram classificadas pêlos usuários como citações relevantes. Desses resultados 213 citações foram classificadas como periféricas,
correspondendo a 30.09% do total de citações, com mais do que o interesse
do usuário podendo vir a ser úteis em futuro próximo. As referências classificadas como
irrelevantes por todos os usuários participantes desse estudo foram na ordem de 73, para as três modalidades de estratégias de busca, correspondendo à de participação no resultado final.