Regression model 5 (Nordea and DNB sample; Inaccuracy and Bias) 44

4.2 The regression models

4.2.5 Regression model 5 (Nordea and DNB sample; Inaccuracy and Bias) 44

Para cada um dos documentos do corpus estabeleceu-se uma codificação, cuja listagem está disposta no APÊNDICE A. Os documentos foram identificados pela tipologia, sendo utilizada a letra “t” para as teses e a letra “d” para as dissertações. Junto às letras, foram atribuídos algarismos arábicos, de forma sequencial, iniciando em 001, até o último item, acompanhados do ano de defesa do documento, sendo apresentadas em ordem decrescente de defesa. Como exemplo, tem-se t001-2009, t002-2009 e d001-2009, d002- 2009, e assim, sucessivamente.

Após a determinação do recorte temporal e do levantamento do material empírico (corpus), passou-se à identificação do domínio, do usuário e de suas necessidades, uma vez que antes de modelar um serviço de informação é necessário fazer essa identificação.

5.2 Identificação do domínio, do usuário e de suas necessidades

Nesta etapa houve a análise do corpus da pesquisa com a finalidade de identificar a qual domínio ele pertence, qual sua função dentro desse ambiente e as razões subjacentes para os fluxos de informação nesse campo (HJORLAND, 2002a). Além disso, identificou-se o usuário da BDTD, em relação ao tipo de informação contida no corpus, assim como de suas necessidades de informação. Para isso, foi utilizado o método da teoria da análise de domínio (TAD), com procedimentos realizados a partir das quatro etapas que se encontram descritas na fundamentação, no Capítulo Quatro, itens 4.5 e 4.5.1.

a) Identificação do domínio: a partir das indagações propostas para esta etapa da TAD, determinou-se que o domínio é o programa de pós-graduação stricto sensu da ECI- UFMG, limitado à linha de pesquisa OUI, cujos trabalhos acadêmicos do tipo teses e dissertações têm como característica comum apresentar resultados de pesquisa com tema único e escopo definido, analisando-o de forma sistemática e científica, por meio de fundamentos teórico-metodológicos.

b) Análise de dados: a caracterização do domínio foi obtida por meio dos questionamentos propostos para esta etapa, que indicou que o produtor do tipo de informação contido nas teses e dissertações é sempre um pesquisador de carreira ou de circunstância. Determinou, ainda, que todo pesquisador é um cientista e, como tal, é membro da comunidade científica. A finalidade dessa produção é ser aprovado perante uma banca de doutores, também da área acadêmica, buscando a aprovação de seus pares, dentro de uma mesma área de conhecimento ou entre áreas interdisciplinares. Em sentido stricto sensu, todo pesquisador tem como objetivo de ação empregar uma sistemática metodológica, apresentando seu tema, o problema de pesquisa, a proposta de solução, a fundamentação teórico-metodológica e os resultados alcançados. Essa sistemática faz parte da atividade profissional do pesquisador, e é exigida a sua observância para que a produção seja considerada e aceita como conhecimento científico. Para avançar em seu conhecimento, um pesquisador precisa saber o que já foi estudado sobre seu tema de pesquisa e sob quais condições, teóricas e metodológicas, esse tema foi abordado.

c) Modelagem do domínio: acolhendo ao recomendado para esta etapa e em atendimento ao objetivo proposto, considera-se que, em atividade profissional, o pesquisador necessita de informações sobre ideias, abordagens, teorias, métodos e técnicas que possam ser empregadas em sua própria produção, de modo que possa avançar a partir de resultados já atingidos. Seguindo a lógica indicada no método da TAD, tem-se: a) quem produz: a comunidade científica; b) quem comunica: as instituições (quando disponibilizam digitalmente); c) quem usa: a própria comunidade acadêmica. A BDTD é disponibilizada pela instituição (ECI-UFMG) e o serviço de informação atenderá prioritariamente aos pesquisadores da OUI.

d) Coleta e seleção de dados e validação: atendendo ao prescrito nesta etapa, foi realizada uma pesquisa especializada para encontrar fontes de informação que dessem respaldo à execução da etapa anterior (modelagem de domínio). Dessa maneira, para identificar e fundamentar a escolha do tipo de informação que seria disponibilizado ao usuário, foram utilizadas as fontes: 1) o estudo de Targino (2000); 2) as ideias de Kuhn (2006); 3) o dicionário da área de Biblioteconomia e Arquivologia de Cunha e Cavalcanti

(2008); 4) Alvarado e Oliveira (2008)69; 5) os três livros utilizados na etapa de desenvolvimento da TAFNAVEGA (descrita no item 5.3 deste capítulo), que são: Severino (2007), Marconi e Lakatos (2010) e Silva (2010). Nessas fontes, foram identificadas as seguintes necessidades de informação do pesquisador, em sua atividade profissional: a) temas que já foram investigados, com o intuito de entender o que já foi feito e para avançar em seu conhecimento; b) métodos e teorias utilizados nas pesquisas, com a finalidade de ampliar o conhecimento e aprimorar teorias e métodos científicos existentes; c) resultados alcançados nas pesquisas, para entender, ampliar e aplicar o conhecimento científico já conhecido, sem incorrer em retrabalhos. Além disso, para dar respaldo à identificação do produtor (autor) dos trabalhos acadêmicos do tipo teses e dissertações e dos responsáveis pela comunicação do conhecimento acumulado nesses documentos foram utilizadas as seguintes fontes: 1) a legislação brasileira70 sobre programas de pós-graduação stricto sensu, incluindo seus decretos; 2) as resoluções e portarias do Ministério da Educação71 (MEC); 3) as normas e resoluções da Coordenação de Aperfeiçoamento de Pessoal de Nível Superior72 (CAPES); 4) as resoluções internas do PPGCI-UFMG73. Todas essas quatro fontes estabelecem diretrizes para os programas de mestrado e doutorado, identificando quem pode ser produtor de teses e dissertações e sob quais condições, além de determinar as instituições que têm permissão para oferecer tais programas stricto sensu.

Tendo sido identificados o domínio, o usuário e suas necessidades de informação, passa-se ao desenvolvimento da taxonomia facetada navegacional (TAFNAVEGA), iniciando pela determinação das categorias fundamentais temáticas e depois passando à apresentação do algoritmo utilizado para a extração de conceitos dos documentos do corpus desta pesquisa.

5.3 Criação da taxonomia facetada navegacional

Para a criação de uma taxonomia facetada navegacional (TAFNAVEGA), visando uma representação sistematizada e semântica do conteúdo de teses e dissertações capaz de facilitar a busca e a recuperação das informações, primeiramente concebeu-se a modelagem das informações tendo em mente o usuário e suas necessidades de informação, obtidos a partir da etapa anterior, no subcapítulo 5.2, o que pode ser sintetizado conforme os dados a seguir:

69_{Estudo que discorre sobre “A Comunidade científica da Biblioteconomia e Ciência da Informação brasileira”}

apresentando suas características e necessidades de informação. Disponível em: <http://revista.ibict.br/pbcib/index.php/pbcib/article/view/1051>.

Disponível em: < http://www4.planalto.gov.br/legislacao>.

Disponível em: <http://portal.mec.gov.br/index.php?option=com_content&view=article&id=12899:pos- graduacao-normativos&catid=323:orgaos-vinculados>.

Disponível em: <http://www.capes.gov.br/sobre-a-capes/legislacao/2341-resolucoes>.

Usuário: pesquisadores

Necessidades de informação: temas, métodos, teorias e resultados das

pesquisas.

Em seguida, no subcapítulo 5.3.1, apresenta-se o desenvolvimento das categorias fundamentais temáticas da TAFNAVEGA e, posteriormente, no subcapítulo 5.3.2, descreve-se e aponta-se o algoritmo para o processo de extração de conceitos dos documentos.

In document The difference in bias and inaccuracy between commissioned and traditional sell-side equity research : evidence from Nordic investment banks after MiFID II implementation (sider 51-76)