5 Valutahåndtering i staten og Forsvaret
Anbefaling 3: Rapportering og oppfølging
7.1 Videre arbeid
Esta pesquisa é de cunho qualitativo com o uso de quantificação. A LSF busca estudar as funções sociais da língua em uso, as quais somente podem ser compreendidas dentro do contexto sociocultural em que a língua ocorre. Portanto, este trabalho foca os dados em seu contexto, observa-os quantitativamente e analisa-os qualitativamente como uma pesquisa de natureza antropológico-social e de análise de discurso.
Como abordagem metodológica optou-se pela Linguística de Corpus (LC), a qual proporciona ferramentas de análise e trabalha com a coleta e análise de dados linguísticos reais – um corpus (BERBER SARDINHA, 2000:325) –, o que permite abarcar grande quantidade de textos. Tal abordagem presta-se, portanto, à diversidade de universos teóricos como a semântica, a sintaxe e a análise do discurso (MCENERY e WILSON, 1996). A LC busca esclarecer o fenômeno linguístico a partir de generalizações baseadas em exemplos reais de comunicação (Idem), dando ao estudo da linguagem um caráter empírico:
A Linguística de Corpus está baseada na análise de quantidade de textos como objeto de estudo e como fonte de evidências para a descrição linguística e argumentação.
Kennedy (1998:4)29
Para Berber-Sardinha (2000), um corpus pode ser assim denominado desde que os textos coletados sejam compilados e interpretados segundo critérios linguísticos. Ressalta, entretanto, que não há nada que impeça a pesquisa em LC de ser empreendida tendo como base arquivos, bancos de dados eletrônicos (definidos como coleções de informações que são projetadas para facilitar a entrada e a recuperação de informação) ou textos individuais que tenham sido compilados para outras propostas.
Alguns critérios devem ser considerados para que um conjunto de dados linguísticos possa ser denominado corpus. Berber Sardinha (2004) elenca os seguintes critérios: a origem (os dados devem ser autênticos e escritos por falantes nativos; quando não pertencerem a falantes nativos, devem receber outro nome – corpora de aprendizes); o propósito (os dados devem ser objeto de estudo linguístico); a composição (os dados devem ser selecionados e coletados sob determinados critérios); a formatação (os dados devem ser legíveis por computador); a representatividade (o corpus deve ser o maior possível, e assim representar determinadas produções linguísticas de uma dada língua ou de uma variedade linguística); e a extensão (o material deve ser extenso para ser representativo).
Para Kennedy (1998), a LC seria uma linguística descritiva acrescida de novas tecnologias. Além disso, o autor afirma que as análises baseadas em corpora têm consequências além da descrição linguística, afetando até mesmo as metas da teoria linguística. Algumas divergências sobre o estatuto da Linguística de Corpus são expostas por Berber-Sardinha (2004), incluindo três visões de diferentes pesquisadores sobre o tema. A primeira visão considera a Linguística de Corpus como uma metodologia. Isso se justifica pelo fato de que é possível aplicar o seu aparato livremente, mantendo a orientação teórica da disciplina de origem. Nessa perspectiva, a LC é compreendida como um “modo típico de aplicar um conjunto de pressupostos de caráter teórico” (p.6).
A segunda visão sustenta que, mais que uma metodologia, a Linguística de 29 “Corpus linguistics is based on bodies of text as the domain of study and as the source of evidence for linguistics description and argumentation.”
Corpus é uma teoria. Se considerarmos que toda metodologia só existe em correlação com uma teoria, e que os linguistas de corpus produzem conhecimento novo que muitas vezes não é passível de aquisição com base em outros pressupostos teóricos, a LC pode efetivamente ser considerada uma teoria.
O terceiro e último grupo vê a Linguística de Corpus como uma abordagem, uma perspectiva, uma maneira de enxergar a linguagem. Berber-Sardinha (2000) lembra que a LC trabalha dentro de um quadro conceitual formado por uma abordagem empirista e uma visão da linguagem enquanto sistema probabilístico. No empirismo, uma doutrina filosófica, o conhecimento tem origem na experiência. No campo linguístico, o empirismo significa dar primazia aos dados provenientes da observação da linguagem, em geral reunidos sob a forma de corpus. O empirismo se coloca em oposição ao racionalismo, segundo o qual, em linhas gerais, o conhecimento provém de princípios, estabelecidos a priori. O segundo elemento central da conceituação em que a Linguística de Corpus se baseia é a visão probabilística da linguagem. A perspectiva hallidayana (LSF) descreve a probabilidade dos sistemas linguísticos, dados os contextos em que são empregados pelos falantes. Essa abordagem analisa o texto e o respectivo contexto de uso. Uma análise pautada na sistêmico-funcional leva em consideração três aspectos conceituais, os quais se configuram e combinam com o intuito de constituir a interpretação de uma manifestação linguística: o contexto (tudo o que circunda um texto); a semântica (a escolha linguística, dentro de um sistema paradigmático de opções, em relação à função a ser desempenhada no momento e na situação de uso); e o texto (a concretização autêntica dos dois elementos anteriores). A visão da linguagem enquanto sistema probabilístico pressupõe que, embora muitos traços linguísticos sejam possíveis teoricamente, eles não ocorrem com a mesma frequência. Nesse sentido a língua, na visão dos linguistas de corpus, é usada de forma padronizada, através de colocações recorrentes, com itens ou sequências de itens tendendo a ocorrer em contextos particulares.
Citando Berber-Sardinha (2000:40), a padronização é uma "regularidade expressa na recorrência sistemática de unidades concorrentes de várias ordens (lexical, gramática, sintática etc.)". Segundo o autor, os padrões podem ser de três tipos: a colocação – tipo de padrão mais enfocado nos estudos de corpora – vem a ser a "associação entre itens lexicais, ou entre léxico e campos semânticos"; a
coligação, que é a "associação entre itens lexicais e gramaticais"; e a prosódia semântica, que por sua vez é a "associação entre itens lexicais e conotação (negativa, positiva ou neutra) ou instância avaliativa".
Para Biber, Conrad e Reppen (1998), o uso da LC em Análise do Discurso procura responder à questão central de como a análise de padrões gramaticais e de palavras em um texto pode contribuir para a compreensão do seu sentido. Para Kennedy (1998), o uso de corpora não constitui por si só um ramo separado da Linguística. A Linguística de Corpus seria, segundo o autor, essencialmente uma linguística descritiva adicionada de novas tecnologias. Kennedy ressalta que as análises baseadas em corpora têm consequências além da descrição linguística, afetando até mesmo as metas da teoria linguística.
O advento da Linguística de Corpus, ainda segundo Kennedy, comprova e ratifica a teoria de Firth no sentido de que o uso da linguagem inclui considerável uso de construções recorrentes pré-fabricadas.
Vale ressaltar, entretanto, que os corpora não nos dizem tudo a respeito de como uma língua funciona. Para Kennedy (1998), nem sempre eles podem apontar, por exemplo, quais estruturas e processos não são passíveis de ocorrência. A questão é que o simples fato de uma estrutura não aparecer em um corpus considerado extenso não traduz a impossibilidade de ocorrência dessa estrutura.