Grønlandsforskningen etter bergenshumanistene

específica para que cada texto fosse identificado através desse procedimento, respeitando a temática e categoria estabelecida no subcorpus, conforme o quadro 10, exemplificado com os códigos atribuídos.

QUADRO 10: Codificação do recorte do corpus de estudo

CÓDIGO SUBDIVISÃO

DOCORI Documentos orientadores

PAR Pareceres críticos

TEIN Textos informativos Fonte: Elaboração do autor

Como apresentado no quadro 10, o subcorpus foi dividido em três partes: Documentos Orientadores, Pareceres Críticos e Textos Informativos. Para cada grupo também foi criada codificações específicas a partir desse código primário, observada especificidades desses grupos bem como o número de cada documento orientador, parecer e, para os Textos Informativos, o ano, mês e data da publicação, observado no quadro 11.

QUADRO 11: Exemplo de códigos atribuídos ao subcorpus e seus significados

CÓDIGO SIGNIFICADO

DOCORI_013 Documento Orientador número 13 PAR_001 Parecer Crítico número 01

TEIN023_20160120 Texto Informativo publicado em 20 de janeiro de 2016. Fonte: Elaboração do autor

Esse procedimento foi adotado a fim analisar e observar como o fenômeno da circunstância de ângulo ocorre em cada grupo específico e, também, como ela pode introduzir elementos avaliativos de engajamento nesses textos para, posteriormente, traçar uma análise contrastiva de como e quando ocorre em todos os textos do corpus de estudo.

Para observar aspectos estatísticos do texto, utilizamos a WordList, como vemos na figura 11:

FIGURA 11: Amostra dos dados de todos os textos do corpus a partir da WordList

Berber Sardinha (2008, p. 174-175) exemplifica que

Tokens: Indica o total de ocorrências de palavras do texto. Também chamado de “running words”, significa o total de palavras, levando em conta as repetições, desde a primeira até a última de todos os arquivos selecionados. Por exemplo, o trecho abaixo possui 16 “tokens”: O (1) gato (2) viu (3) o (4) cão (5), o (6) galo (7) viu (8) a (9) galinha (10), e (11) o (12) coelho (13) viu(14) a (15) lebre (16). Types: Mostra o total de itens, formas ou vocábulos do(s) arquivo(s), sem levar em conta as repetições. O mesmo trecho acima possui 10 “tokens”: O (1) gato (2) viu (3) o cão (4), o galo (5) viu a (6) galinha (7), e (8) o coelho (9) viu a lebre (10).

Ainda segundo o autor, a observação desses dados estatísticos serve para neutralizar o tamanho do texto, ou seja, textos com grande número de palavras tende a resultar em um resultado expressivo de itens repetidos, podendo ludibriar o estudo comparativo de textos; é importante que o balanceamento seja feito a fim de analisar um fenômeno a partir do indicador numeral real em que ele ocorre nas sentenças ou períodos sem repetições de palavras.

Na tabela 1, são apresentadas essas subdivisões do corpus, bem como a quantidade de textos coletados, o tamanho total de palavras presente em cada grupo e os números de ocorrências por palavras corridas (tokens - somatória) e de tipos diferentes de palavras (types – média) individuais e totais em cada grupo de texto:

TABELA 1: Total de Itens e Formas do corpus de estudo

SUBDIVISÃO TEXTOS ITENS FORMAS

DOCUMENTOS ORIENTADORES 33 192.854 11.551

PARECERES CRÍTICOS 11 46.480 6.178

TEXTOS INFORMATIVOS 32 30.461 4.020

TOTAL 76 269.795 19.339

Fonte: Elaboração do autor

A tabela 1 apresenta a quantidade de textos coletados, no período informado, para análise de cada subdivisão do corpus. Devido ao grande fluxo de textos sobre a temática da elaboração e construção de uma Base Nacional Comum Curricular, foi necessário traçar alguns aspectos importantes para a coleta desses textos, como também já explicitado: para os pareceres críticos foram coletados todos os arquivos do Portal da Base referentes ao componente de Língua Portuguesa, isto é, onze (11) pareceres.

Em relação aos documentos orientadores foram selecionados trinta e três (33) textos que apresentassem orientações aos profissionais da educação e comunidade em relação àquilo que estava sendo discutido e o porquê de se discutir tal tema, dentre esses documentos resoluções específicas de estados e municípios, estudos que contribuíram para a construção

das duas versões da Base, orientações encaminhadas do estado e município para as escolas e órgãos específicos que se reuniam para produziram relatórios técnicos de contribuições da versão pública do documento.

Já os textos informativos são compostos por textos de diferentes gêneros tais como notícias, reportagens e entrevistas retiradas do site da BNCC e de webjornais brasileiros, de ampla circulação na internet e com seu conteúdo gratuito para download. Todo corpus de estudo da dissertação então é composto, aparentemente, por um número baixo de textos. Porém, para justificar, recorremos às ideias de Berber Sardinha (2004, p.41), quando diz que

O corpus é uma amostra de uma população cuja dimensão não se conhece (a linguagem como um todo). Desse modo, não se pode estabelecer qual seria o tamanho ideal da amostra para que represente essa população. Uma salvaguarda é tornar a amostra a maior possível, a fim de que ela se aproxime ao máximo da população da qual deriva, sendo portanto mais representativa.

Nessa lógica, a quantidade total de texto é justificada pelo grande número de produções acerca dessa temática em voga. Como procedimento metodológico e de análise, houve a necessidade de estabelecer critérios de escolha dessas produções para composição do

corpus de estudo, de acordo com aquilo que já foi dito: a) pertinência temática; b) produção

vinculada ao portal do MEC e às regiões do país; c) fornecimento de orientações e discussões relacionadas à construção da BNCC.

O site foi construído para que toda a população brasileira conheça e interaja na construção da BNCC que versará e atingirá todos os currículos de todas as escolas, desde o Ensino Fundamental I ao Ensino Médio, ou seja, unificarão o que deve ser ensinado em cada disciplina em todas as etapas de escolarização. Nessa página, apresentam abas específicas para que possamos navegar em todas as informações disponíveis sobre a proposta, como por exemplo o que é a Base, quem são os protagonistas, etc., e, em local específico, exemplificam como a população pode fazer o download dos documentos, notícias e pareceres críticos em relação à BNCC, conforme a figura 12:

2.1.2 Corpus de estudo: descrição e constituição

In document Erik Valkendorf og grønlandsforskningen : fra middelalderen til moderne tid (sider 64-69)