2.1 Demokratisk beredskap
2.1.1 Kunnskaper og ferdigheter
A análise léxica contribui para a interpretação das questões abertas ou textos, a partir da descrição objetiva, sistemática e quantitativa do seu conteúdo. Junto à análise léxica,
normalmente são empregadas outras técnicas como análise de citações, análise de cocitações, agrupamentos bibliográficos e co-word analysis (CALDAS; TINOCO; CHU, 2003).
Por meio da análise léxica é possível identificar quais os termos mais frequentes utilizados em um texto e, aliado à técnica de coocorrência de palavras é possível identificar a frequência com que esses termos repetem-se nos demais elementos de um texto.
A análise léxica, muitas vezes é confundida com a análise de conteúdo. A análise léxica, de acordo com Freitas e Moscarola (2002) consiste em se passar da análise do texto para a análise do léxico (o conjunto de todas as palavras encontradas nos fragmentos de um texto: título, palavras chaves, resumo, introdução, etc., utilizando atos de linguagem, enquanto a análise de conteúdo consiste em uma leitura aprofundada do texto a fim de obter uma ideia do todo.
Freitas (2000), explica que os atos de linguagem são formas de expressão ligadas ao contexto social e dependem da variedade individual de quem está se expressando. Assim, os pesquisadores apresentam um vocabulário certamente abstrato para demais áreas, mas particular entre os pares.
A coocorrência de palavras consiste em uma técnica baseada na premissa de que a repetição de palavras em elementos distintos de um texto proporciona identificar o grau de parentesco entre os itens de elementos analisados gerando informações tanto em pares quanto individuais. As informações em pares permitem identificar quantas vezes uma palavra se repete no texto junto a outras palavras. Quanto mais pares de itens coincidentes houver, maiores as chances de correlação entre os itens. (IGAMI, 2011)
A coocorrência pode ser identificada também entre elementos distintos tais como: tema com autor, autor com citações, orientador e membros de bancas, orientador e temas, etc. Um estudo baseado na coocorrência de autores, em que a informação foi extraída do campo autor(es) vai revelar a estrutura social da área e o relacionamento entre os autores daquela área. (IGAMI, 2011).
Para o processamento e análise de dados para esse tipo de estudo utilizam-se softwares especializados e operações matemáticas que aplicam algoritmos para criar listas de frequência dos termos, aqui denominados conceitos inerentes à determinada área e possibilitam aplicar filtros retirando palavras supérfluas, dentre elas conectivos de ligação, adjetivos, pronomes, etc., que não constituem um léxico. (NOYONS; VAN RAAN, 2002)
As análises léxicas e de coocorrência de palavras são técnicas difundidas na ciência da informação (IGAMI, 2011; LOUREIRO-ALVES, 2010; SAES, 2005) e vêm se destacando nos estudos voltados a outras áreas.
Nascimento (2010) utilizou a coocorrência de palavras para realizar o mapeamento temático das teses defendidas nos programas de pós-graduação em educação física no Brasil, no período de 1994 a 2008. O estudo revelou que os programas estão organizados em doze áreas temáticas e 42 linhas de pesquisa. Há, no entanto, várias linhas de pesquisa com baixa produção. A autora aborda a importância de se explorar as bases de dados das teses e dissertações, uma vez que fornecem subsídios para a compreensão do processo de produção científica e pode contribuir no conhecimento de pontos isolados que influenciam no processo de institucionalização de uma área.
Loureiro-Alves (2010) utilizou as técnicas na análise das teses e dissertações em Ciência da Informação produzidas no Brasil no período de 1985 a 2007, em relação à institucionalização social e à cognitiva. O estudo apontou para um reduzido número de periódicos ligados aos programas de pós-graduação da área, bases de dados da área fragmentadas e dispersas e inconsistência nas informações registradas. Quanto ao enfoque cognitivo, identificou que as temáticas abordadas nas teses e dissertações estão subdivididas em cinco grupos, portanto, apresentam baixa dispersão e o método de pesquisa de maior ocorrência foi o estudo de caso.
Saes (2005) utilizou a técnica em sua tese para mapear a produção científica na área da saúde, da base Web of Knowledge, do período de 1990 a 2002, totalizando cerca de 38.000 publicações.
Com a evolução tecnológica, evoluíram também as técnicas para análise de textos ou conteúdo de grandes bases de dados. Atualmente há no mercado, disponível aos pesquisadores, soluções e softwares que combinam a estatística lexical e os métodos de análise de dados, a análise sintáxica, e a navegação lexical ou a leitura assistida por computador (FREITAS, 2000).
Neste estudo, que valeu-se das técnicas de correlação de palavras e análise léxica para o mapeamento temático das teses e dissertações, foi utilizado o software Sphinx®, cujos detalhes da aplicação serão tratados no subtítulo 5.1 referente às classificações em relação à metodologia.
A utilização desse software tem sido observada em pesquisas em diversas áreas como direito (NORONHA et al, 2011); psicologia (NASCIMENTO; MENANDRO, 2006) e (ESCOBAR; MELLO, 2003); doutoramento em desenvolvimento sustentável (OLIVEIRA, 2012); informática (RODRIGUES; AZAMBUJA; DALFOVO, 2002); educação (MARIUCI; FERRI; FELICETTI, 2012), administração (FARIA; DIAS; RUAS, 2005; MOTTER JUNIOR, 2002), dentre outros.
Faria, Dias e Ruas (2005) utilizaram o software para analisar as publicações do ENANPAD, no período de 2000 a 2004 relacionadas à abordagem competências na perspectiva estratégica. Analisaram os métodos empregados nas pesquisas, e o crescimento do tema nas pesquisas em administração.
Motter Junior (2002) em sua dissertação, refere-se ao software Sphinx Léxica® como uma ferramenta de apoio, que permite navegar pelo texto, fazer contagens, identificar ideias- chave e criar dicionários que reduzem o texto a categorias, fazer cruzamentos, tabelas e mapas.