Aker Kværner Holding AS - STATENS EIERBERETNING 2014

A análise estatística inicial do IRaMuTeQ apresentou 42.525 ocorrências, que são as palavras com significado para o(s) autor(es) das obras citadas e para o pesquisador autor da presente tese. Essas palavras com significado foram extraídas a partir da leitura integral e sistemática dos textos que compõem o corpus da temática CTS (quadros 9, 10 e 11). Essas 42.525 ocorrências (palavras, formas ou vocábulos) foram separadas pelo programa IRaMuTeQ em 1.045 Segmentos de

Texto (ST32), com aproveitamento de 879 ST, o que equivale a 84,11% dos ST aproveitados e que seguiram em análise, indicando boa representatividade do material (nos manuais do IRaMuTeQ orienta-se que se considere somente corpus com aproveitamento superior a 70% dos ST). Consta, ainda, nessa análise estatística preliminar um universo total de 7.376 palavras distintas, das quais 3.645 são registros de uma única ocorrência.

O conteúdo analisado foi categorizado pelo IRaMuTeQ em 4 classes conforme figura 8, que traz os ST e respectiva porcentagem de representação da classe no ST. No IRaMuTeQ, os ST são classificados em função dos seus respectivos vocabulários, e o conjunto deles é realocado considerando a frequência das formas reduzidas, que são colocadas em matrizes de cruzamento dessas formas reduzidas de ST (repetidos testes do tipo x²). A partir desse procedimento, o programa aplica um método denominado Classificação Hierárquica Decrescente (CHD), do qual se obtém a classificação definitiva. Essa análise visa obter classes de ST que, ao mesmo tempo, apresentam “vocabulário semelhante”, e esta foi a base de meu interesse adotada para auxiliar na proposição e organização dos NS da temática em voga.

32_{Os segmentos de texto (ST), na maior parte das vezes, têm o tamanho de três linhas, dimensionadas pelo software em}

função do tamanho do corpus. Os segmentos de textos são os ambientes das palavras. Podem ser construídos pelo pesquisador, ou automaticamente pelo software. Embora seja o pesquisador que demarca os textos, nem sempre é ele que controla a divisão do corpus em segmentos de texto (ST). Numa análise padrão (standart), após reconhecer as indicações dos textos (pelas linhas com asteriscos) é o software que divide o material em ST. O pesquisador pode configurar a divisão dos segmentos, por exemplo: no caso de uma grande quantidade de respostas curtas a uma pergunta aberta de um questionário, aconselha-se cada texto seja definido como um único ST.

Figura 8. (CTS) ST e respectiva porcentagem de representação

Fonte: Elaboração própria.

Os primeiros indicativos de nucleação, nesse sentido, são extraídos do dendograma representado na figura 9, que ilustra as relações entre as classes e as principais palavras com significado que compõem cada classe.

Figura 9. Relações entre as classes e as principais palavras com significado

O software executa cálculos e fornece resultados que nos permite a descrição de cada uma das classes, principalmente pelo seu vocabulário característico (léxico) e pelas suas palavras e variações (lematização). Isso significa que o software, ao agrupar os ST e os vocabulários, correlaciona-os em conteúdo por tema e por semelhança em um esquema hierárquico de classes, permitindo que o pesquisador, ao olhar o conteúdo de cada um desses grupos de palavras correlacionadas, possa dar nome às classes com base na compreensão teórica que o ele tem do conteúdo ou temática em voga.

Nesse sentido, considerando o dendograma representado na figura 9, consigo identificar que existe uma relação hierárquica entre os temas e contextos diferentes presentes no corpus em análise (temática CTS – quadros 9, 10 e 11). No dendograma em questão, são apresentadas 4 classes de palavras que compõem 4 dicionarizações específicas, identificadas pelo software, ao comparar com sua base de dados. Essas relações hierárquicas foram distribuídas em proximidade, em um primeiro nível hierárquico, da classe 1 com a classe 4. Depois, seguindo a análise, o programa propôs que a classe 4, por sua vez, apresenta relação hierárquica com as classes 2 e 3 simultaneamente. Colocando esse quadro hierárquico em um panorama geral, para uma primeira análise grosseira, identifico que a classe 1 trata da temática educação e ensino envolvendo CTS, a classe 4 tem temática relacionada à educação, pesquisa e divulgação de conhecimentos e profilaxias referentes à saúde pública, física e mental.

A classes 2 tem proximidade com a participação social e políticas públicas direcionadas a interesses no processo de desenvolvimento científico e tecnológico, assim como as possíveis relações com a sociedade. Por fim, a classe 3 trata mais diretamente da relação entre o desenvolvimento das tecnologias e possível progresso social.

O IRaMuTeQ fornece, também, uma forma de apresentação dos resultados por meio de análise fatorial de correspondência que é feita a partir da CHD. Com base nas classes escolhidas (no tratamento de dados são escolhidas as classes de palavras mais importantes, ou que o pesquisador quer levar em conta em sua análise; no meu caso, dei especial atenção a uma classe de palavras que não é classificada pelo software, ou seja, aquelas formadas a partir de um conjunto de

termos, que para a análise textual, necessitava de ser entendidos como uma unidade, como exemplo: tomada_de_decisão e ensino_de_ciências, ambas com 52 registros no corpus total CTS). Esse tipo de apresentação fornece para o pesquisador um panorama visual sobre os ST mais característicos de cada classe, permitindo a contextualização do vocabulário típico de cada classe, vide figura 10, de um gráfico cartesiano de proximidade entre as ocorrências analisadas.

Figura 10. Gráfico cartesiano de proximidade entre as ocorrências analisadas

Essas classes de palavras e segmentos de texto, no tratamento do software, são compostas de vários segmentos em função de uma classificação segundo a distribuição do seu vocabulário. Para a interpretação do significado dessas proximidades, levei em consideração o marco teórico de minha pesquisa, referente à PCC e à RPS dos artigos e textos que compõem as obras que consolidaram o

corpus de análise da temática CTS.

Segundo Camargo e Justo (2016), na maior parte das vezes não há coincidência entre o número de classes e o número de representações teóricas envolvidas na investigação e no ideário do pesquisador, o qual precisa compor o seu conteúdo de análise em relação direta com fatores ligados ao plano geral de sua pesquisa.

Para o entendimento do significado das classes e suas relações na CHD fornecida pelo IRaMuTeQ, passo em seguida a nomear e interpretar as classes propostas pelo software.

 Classe 1: A educação e ensino dentro dos objetivos CTS.

 Classe 2: Desenvolvimento CT suas relações com as PCT e o envolvimento da sociedade civil.

 Classe 3: Relação entre desenvolvimento histórico em tecnociência e progresso social de cultura e valores.

 Classe 4: Inter-relações entre: educação, pesquisa e divulgação dos conhecimentos e profilaxias referentes à saúde pública, física e mental e a processos de compensação de degradação ambiental antropocêntrica.

Esse procedimento de análise será associado à análise da nuvem de palavras gerada pelo corpus geral CTS (figura 11). Com isso, posso apresentar os indicadores em cada uma das classes, somando-os com os indicadores extraídos da visão geral proporcionada pela nuvem de palavras, para, em um segundo momento, consolidar as nucleações.

Figura 11. Nuvem de palavras gerada pelo corpus geral CTS

In document STATENS EIERBERETNING 2014 (sider 54-62)