• No results found

11. Results and General Discussion

11.2 Molecular characterization of Giardia in NHPs

Na seção anterior, mencionamos diversos critérios de categorização de corpus. Entre estes, segundo o critério de autoria, temos o corpus de língua nativa e de aprendizes de LA. Hoje, os dois tipos de corpus são bastante utilizados para o ensino na sala de aula em termos de lexicografia, gramática, estilística, tradução e assim por diante.

Os corpora de língua nativa, em geral, possuem um grande número de palavras, como os famosos BNC52 e Banco de Português53, que servem para vários tipos de pesquisa. No ensino de LA, eles propiciam evidências para as intuições sobre a linguagem dos falantes nativos e muitas vezes mostram que estas podem apresentar problemas quando se trata de questões tais como semântica e gramática (O´KEEFFE, MCCARTHY & CARTER, 2007, p. 21).

Existem também, corpora de língua nativa comparáveis54 e paralelos55. Corpora comparáveis consistem nos corpora monolíngues a partir de planejamentos semelhantes e estão disponíveis para duas ou mais de duas línguas; corpora paralelos são compilados também em duas ou mais de duas línguas, compondo textos originais e suas traduções. Ambos podem ser aplicados ao ensino, à tradução e à comparação de línguas. No entanto, é difícil de encontrar os corpora monolingues baseados no mesmo planejamento, sendo construídos por corpora em mesma língua, tanto nativa, quanto de aprendizes. Nossa pesquisa é uma tentativa de compilação desse tipo de corpora cuja forma, de certa maneira, enfrenta o problema discutido pelo debate sobre até que ponto os exemplos retirados nos corpora servem como exemplos para o ensino de LA.

Segundo O´Keeffe, McCarthy e Carter (2007), há linguistas que acreditam que uma importante função de corpora da língua nativa aplicados em sala de aula é oferecer experiências de uso autêntico da linguagem, ao invés de exemplos criados. Em sua contrapartida, existem três argumentos contrários: o primeiro é que a linguagem, logo que extraída do contexto em que apareceu pela primeira vez e armazenada em grandes bases de dados eletrônicos, perde seu caráter autêntico; segundo, textos autênticos são incorporados em determinadas culturas, podendo ser opacos para os aprendizes de culturas diferentes e, por fim, textos criados talvez sejam mais fáceis e adequados para os alunos em diferentes níveis de competência e proficiência.

Seja como for a fonte dos exemplos e materiais para o ensino e estudo, esses devem ser escolhidos cuidadosamente pelos professores e pesquisadores. A nossa posição básica é

52 British National Corpus – http://sara.natcorp.ox.ac.uk/ 53 http://www2.lael.pucsp.br/corpora/bp/index.htm

54 Comparable corpora 55 Parallel corpora

equilibrar as questões discutidas acima, tentando construir um corpus de falantes nativos para fins específicos. Em outras palavras, a coleta de dados é feita a partir dos mesmos assuntos temáticos, em uma determinada cultura proposta e semelhantes contextos autênticos para formar um corpus de referência, contribuindo ao estudo de aquisição de LA. Elaboramos, também, o corpus de aprendizes, cuja concepção será apresentada agora. Segundo Granger (2002, p. 4), ―a área de pesquisa linguística conhecida como corpus de aprendizes, a qual só começou a existir no final dos anos 80, criou uma ligação importante entre os campos da linguística de corpus e da pesquisa de LA‖.

Corpora de aprendizes (ou learner corpora) são construídos a fim de observar e descrever os aspectos marcantes e típicos no processo de aprendizagem de LA. A sua contribuição, além de ser uma fonte de identificação das dificuldades gramaticais, lexicais e discursivas, também propicia aos aprendizes e educadores a apresentação das competências comunicativas e tradutórias dos aprendizes de LA.

Granger (2002, p. 7) retoma a definição de corpora de aprendizes de Sinclair (1996):

Corpora computadorizados de aprendizes são bancos eletrônicos de textos autênticos de LE/SL, organizados de acordo com critérios planejados e explícitos para um propósito particular na ASL/TLE. Eles são codificados a partir de maneira padronizada e homogênea e documentados quanto a sua origem e procedência.‖

Diferente dos outros tipos de corpora, o corpus de aprendizes é ―uma compilação de textos, não publicados, produzidos em um ambiente de ensino ou treinamento, geralmente para serem avaliados‖. (SCOTT & TRIBBLE, 2006, p. 133). Segundo Berber Sardinha (2004, p. 265), ―o mais importante, historicamente, é que o corpus de aprendiz redefine o conceito original de corpus, que previa (na prática, não na teoria) que a linguagem permitida no corpus tinha de pertencer à variedade nativa.‖

O primeiro projeto de corpus de aprendizes de âmbito internacional foi o ICLE56, lançado em 1992 e compilado por 10 milhões de palavras. Este é constituído de vários subcorpora de textos escritos por aprendizes de inglês como LA, que propicia comparações quantitativas e qualitativas entre os dados produzidos pelos falantes nativos e não-nativos, ou

56 International Corpus of Learners of English – http://www.uclouvain.be/en-cecl-icle.html

entre os dados variados produzidos por falantes não-nativos.

No Brasil, o corpus pioneiro de aprendizes é COMET57, projeto orientado por Stella Tagnin. Os Corpora, que estão sendo desenvolvidos desde o ano 2000, são compostos por três subcorpora: CorTec58, CoMAprend59 e CorTrad60.

Os corpora de aprendizes, de acordo com Berber Sardinha (2004, p. 271), permitem além da descrição da interlíngua, também o auxílio no desenvolvimento de materiais de ensino, porque ―um problema com os materiais de ensino desenvolvidos a partir de uma variedade nativa é que ignoram as necessidades reais dos alunos‖. Assim, para realizar a observação das necessidades e características da aquisição de PLA, comparando-as com a fala nativa, apresentando as produções mais naturais possíveis, resolvemos elaborar dois tipos de corpora falados, cujas técnicas de compilação serão apresentadas na próxima seção.