3. Evaluering av IA-avtalen
3.2 ECON-rapport 2003-047
3.2.3 Hvilke endringer har funnet sted på handlingsnivået?
De acordo com a classificação adotada por Silva e Menezes (2001, p.20-22) a pesquisa realizada é exploratória, pois visou proporcionar maior familiaridade com o problema com vistas a torná-lo explícito, e envolveu a apresentação de exemplos para estimular a compreensão. Do ponto de vista dos procedimentos técnicos, podemos classificá-la como estudo de caso — houve um estudo profundo de alguns objetos de forma a detalhar o conhecimento. A pesquisa gerou conhecimentos para aplicação prática dirigidos à solução de problemas específicos e, como o processo e seu significado são os focos principais de abordagem, esta pesquisa foi predominantemente qualitativa, muito embora haja variáveis quantitativas trabalhadas no modelo geral.
O trabalho consistiu na elaboração de um modelo geral de sistema de recomendação de perfis de usuário. Primeiramente foi realizada uma pesquisa em recuperação de informação, com ênfase nas abordagens de recomendação, identificando conceitos importantes e técnicas que se aplicassem ao projeto. O levantamento bibliográfico resultou na identificação de pesquisas sobre o tema e de ferramentas que utilizam recomendações para a recuperação de informação.
Dentre as técnicas estudadas, foi definido que o melhor algoritmo de construção de um sistema de recuperação de informações baseado em recomendações deveria adotar uma abordagem híbrida de filtragem baseada no conteúdo e filtragem colaborativa. Com a utilização conjunta de ambas as técnicas de programação, diversas abordagens de recomendação poderiam ser aplicadas e foram escolhidas as que melhor se adaptavam ao domínio de recuperação de informação de perfis de usuário.
Para propor o modelo, objetivo deste projeto, estudou-se um sistema que trabalha com perfis de usuário que é amplamente conhecido no
meio acadêmico, o sistema Currículo Lattes, um dos componentes da Plataforma Lattes43.
Foram identificadas muitas situações onde os ganhos com o uso de recomendações seriam perceptíveis a ponto de justificar a pesquisa. Além dessas, há outras situações no contexto de recuperação de perfis de usuário que nos fornecem mais material de trabalho: a necessidade de localização de perfis para montar grupos de projeto para a concorrência em editais, como no caso dos editais do Ministério da Ciência e Tecnologia; ou ainda o caso de um profissional de educação física que precise localizar outros profissionais de perfis semelhantes para convidar a montar uma sociedade em uma academia de ginástica.
Outros cenários foram identificados na recuperação de informações para o modelo genérico, que poderiam ser solucionados através do uso de recomendações. Tais cenários forneceram uma base para a melhoria do modelo tradicional baseado em busca booleana. A nova proposta é flexível o suficiente para ser aplicada em qualquer sistema de recuperação de perfis de usuário, utilizando indicadores que não sejam aplicados somente na recuperação de currículos.
Por isso, a fim de verificar se a proposta foi alcançada, o modelo geral foi aplicado em um domínio diferente, o da recuperação de perfis de usuário em um site de relacionamentos. Os indicadores identificados no levantamento de requisitos para o sistema genérico — sistema de recomendação de perfis de usuário — foram correlacionados com os indicadores da recuperação de currículos. A implementação e funcionamento do modelo de recomendação proposto em um site de relacionamentos teve por objetivo demonstrar a sua aplicação real. Como os indicadores são diferentes em cada subdomínio, foram estabelecidos alguns rótulos possíveis para o modelo genérico.
Um indicador genérico poderia ter o rótulo “indicador de eficiência”. Na recuperação de currículos acadêmicos, poderíamos utilizar
pontuações atribuídas ao número de publicações para formalizar o indicador de eficiência nesse contexto — o sistema entenderia que quanto mais o profissional publica, mais interessado ele está em realizar pesquisas. Na recuperação de perfis em um site de relacionamentos, o mesmo indicador poderia ser pontuado pela estatística de uso do sistema pelos usuários — o sistema entenderia que uma maior freqüência de uso da ferramenta implicaria em maior interesse por encontrar um relacionamento. Estes dois exemplos são apenas para mostrar como um indicador genérico pode ser aplicado em diferentes casos de uso.
A flexibilidade na utilização dessas variáveis — os indicadores — é que tornou o modelo genérico reutilizável, quer dizer, o modelo poderá ser usado em diferentes situações, segundo as especificações de cada sistema de perfis de usuário, ou mesmo em outros sistemas de recomendação de informação, desde que bem determinadas as variáveis correlacionadas.
Com a aplicação real em funcionamento, a tarefa seguinte foi transpor tal aplicação para o modelo genérico e, em seguida, transpor o modelo para o Currículo Lattes, demonstrando que a generalização do modelo é realmente funcional e adaptável.
O modelo geral é o resultado do trabalho e deve servir de base para o desenvolvimento de novos sistemas.
Foi escolhido o site de relacionamentos pela impossibilidade de validar a aplicação baseada na recomendação de currículos junto ao CNPq, conforme será explicado na Seção 6.3.1 (p.133).
Como se trata de uma aplicação baseada na Web, optou-se pela linguagem de programação PHP com banco de dados MySQL. A escolha de PHP deve-se ao fato de que se trata de uma linguagem extremamente modularizada — o que a torna ideal para instalação e uso em servidores web —, livre44, pode ser trabalhada com recursos de orientação a objetos e
44
Software livre é qualquer programa de computador que pode ser usado, copiado, estudado, modificado e redistribuído com algumas restrições.
possui forte suporte a várias bases de dados, o que torna simples a construção de páginas dinâmicas.
A escolha de MySQL deve-se primeiramente ao fato da facilidade de integração com PHP e da grande quantidade de tutoriais grátis disponíveis para programação. Fora isso, é um banco portável, possui excelente estabilidade, exige poucos recursos de hardware, é reconhecido pelo seu desempenho e robustez e também por ser multitarefa e multiusuário. É possível utilizá-lo em sistemas de produção de alta exigência e em aplicações sofisticadas.
Para finalizar, este trabalho confirmou que as recomendações são úteis na recuperação de perfis de usuário, através da demonstração de que um modelo genérico de recomendação de perfis de usuário pode encontrar resultados que não seriam alcançados por um modelo tradicional de sistema de recuperação de informação.