PART 1: OVERVIEW OF THE THESIS
2. THEORETICAL FRAMEWORK
2.3 T HE IMPACT OF ENTREPRENEURSHIP EDUCATION ON CAREER REFLECTIONS
2.3.3 Entrepreneurship education as a career exploration intervention
O corpus linguístico de estudo, adotado para a realização desta pesquisa, é um subcorpus do ESTRA, um corpus literário compilado para o desenvolvimento de pesquisas interessadas na análise de Estilo da Tradução. Até o presente momento, o ESTRA possui em torno de 6 milhões de palavras e passa por um tratamento que possibilitará o acesso online e a validação estatística.
A composição do corpus que será analisado neste trabalho reúne três obras literárias do escritor argentino Ernesto Sabato, escritas em língua espanhola, em sua variante rio-platense, e suas respectivas traduções feitas para o português brasileiro pelo tradutor literário Sergio Molina. Os títulos dos TOs são El túnel (1982 [1948]), Antes del fin:
65
mesmo ano (2008), pela editora Companhia das Letras, sob os nomes O túnel (2000), Antes
do fim: memórias (2000) e A resistência (2008), sendo usada nesta pesquisa a 2a reimpressão de O túnel e a 1a reimpressão dos outros dois textos.
Tal como observado pelo próprio Sabato em cada uma das publicações, os textos correspondem a três tipologias diferentes de narrativas, a saber: ficcional, autobiográfica e epistolar, respectivamente. No âmbito da teoria literária, Santos e Oliveira (2001, p. 18) questionam até que ponto o processo de ―criação de imagens‖ não ocorre também em textos não considerados especificamente ficcionais. Esses autores indagam se, na escrita de um diário ou de um texto autobiográfico, por exemplo, a simples ―seleção‖ de imagens que o próprio autor deseja projetar de si mesmo não estaria construindo um sujeito ficcional, como ―narrativas de nós mesmos‖ em que haveria uma espécie de ―simulação do eu‖. A diferença, segundo os autores, é que ―certos textos tentam negar tal simulação, acreditando ser possível apresentar um sujeito uno, exatamente ‗como ele é‘. Outros textos vão apostar na direção contrária, exibindo seu próprio caráter ficcionalizador‖. Em O escritor e seus fantasmas, Sabato (1963, p. 126) afirma que, ―dada a natureza do homem, uma autobiografia é inevitavelmente mentirosa. E unicamente com máscaras, no carnaval ou na literatura, os homens se atrevem a dizer suas (tremendas) verdades últimas‖. Em Antes do fim, nas
Palavras preliminares que prefaciam o livro, Sabato (2008, p. 11) também alude a essa
dicotomia entre autobiografia e ficção, alertando seus leitores da seguinte maneira: ―não esperem encontrar neste livro minhas verdades mais atrozes; só as encontrarão em minha ficção, naqueles sinistros bailes de máscaras que, por isso mesmo, dizem ou revelam verdades que não ousariam confessar de rosto descoberto‖.
O Quadro 2.1 informa o nome das obras que compõem o Corpus de Estudo, das editoras e datas de publicação.
Quadro 2.1: Corpus de Estudo
Obras Autor/Tradutor Editoras Ano 1a Publicação
El túnel Ernesto Sabato Sudamericana-Planeta 1982 1948
O túnel Sergio Molina Companhia das Letras 2008 2000
Antes del fin: memorias Ernesto Sabato Seix Barral 1999 1998
Antes do fim: memórias Sergio Molina Companhia das Letras 2008 2000
La resistencia Ernesto Sabato Seix Barral 2000 2000
66
Os dados estatísticos mais gerais do Corpus, apresentados a seguir, foram obtidos com a função Statistics da ferramenta Wordlist do programa WordSmith Tools® (WST) em sua versão 5.024. De acordo com a nomenclatura e explicação feita por Berber Sardinha (2004),
(1) os itens (tokens) ou palavras corridas (running words) indicam a totalidade de ocorrências ou palavras contidas, seja no corpus geral (primeira coluna), seja em cada um dos TOs ou TTs (demais colunas);
(2) as formas (types) indicam a quantidade de palavras diferentes, isto é, computadas uma única vez em cada um dos textos; e
(3) a Razão forma/item (type/token ratio) é a porcentagem resultante da seguinte fórmula: 𝑎
𝑖 𝑥 100 = 𝑎𝑧ã 𝑎/𝑖 25. Essa relação também é oferecida pelo
programa.
Cabe ressaltar que, para essa primeira leitura com a ferramenta do programa, foi utilizado o corpus cru, isto é, os textos em sua versão original, sem a inserção de quaisquer etiquetas. O procedimento de etiquetagem será descrito mais adiante. A Figura 2.1 apresenta uma visão parcial dos dados estatísticos do Corpus de Estudo:
Figura 2.1: Corpus de Estudo
24
A presente pesquisa se serve de alguns dos pressupostos metodológicos da Linguística de Corpus, principalmente pela aplicação das ferramentas Wordlist, Concord e KeyWords, além do utilitário Viewer &
Alligner, do programa para computador WordSmith Tools (WST), em sua versão 5.0. Os princípios básicos da
Linguística de Corpus, adotados nesta pesquisa, estão baseados em BERBER SARDINHA (1999; 2000; 2004; 2009).
25
Para explicar o modo como é processada a porcentagem na ferramenta WordList, Berber Sardinha (2004, p. 94) apresenta a fórmula formas : (itens : 100), com a qual se chega aos mesmos resultados.
67
Diferentemente dos itens, a totalidade das formas (21.028) proporcionada pela ferramenta do programa e ilustrada na Figura 2.1 não pode ser considerada, uma vez que o corpus geral está composto por textos escritos em duas línguas diferentes. O valor resultante tampouco poderia ser alcançado por meio da soma das formas de cada um dos textos, haja vista que uma grande quantidade de formas de um texto também ocorre nos outros textos. Para obter os totais das formas do corpus, considerando separadamente os TOs e os TTs, foi realizada uma leitura independente para os textos em espanhol e outra para os textos em português, com a ferramenta Wordlist. Também foi calculada a significância estatística (coluna p-valor) das diferenças entre as proporções, na relação entre cada TO e TT, e ainda entre o conjunto de TOs e TTs. Os resultados26 podem ser observados na Tabela 2.1, apresentada a seguir, que reúne os dados gerais do corpus.
Tabela 2.1: Corpus de Estudo
A escolha do corpus da presente pesquisa foi motivada, em primeiro lugar, pelo intuito de expandir a constituição do Corpus ESTRA, inaugurando uma linha de investigação, composta por obras literárias de um mesmo autor, de diferentes tipologias textuais, traduzidas por um mesmo tradutor, para o português brasileiro contemporâneo. Por outro lado, a expansão do referido corpus também esteve atrelada à consideração do par linguístico espanhol/português, ainda com escassa representação, tanto nos corpora já compilados no escopo do ESTRA, como também nas pesquisas internacionais no âmbito dos ETBC.
26
Os resultados apresentados na Tabela 2.1 serão retomados, analisados e discutidos no Capítulo III da tese.
Corpus Itens Formas Razão
forma/item % Razão forma/item padronizada % p-valor ET_Sabato 31.741 5.183 16,33 45,26 0,0040 ET_Molina 30.635 5.259 17,19 47,31 ADF_Sabato 31.379 7.099 22,68 50,33 0,0000 ADF_Molina 29.815 7.348 24,72 54,13 LR_Sabato 20.474 4.643 22,80 46,70 0,0000 LR_Molina 19.599 4.811 24,70 50,43 TOTAIS 83.594 [es] 80.049 [pt] 163.643 12.120 [es] 12.568 [pt] 14,53 [es] 15,75 [pt] 47,53 50,60 0,0000
68
Num primeiro momento, o propósito consistiu em compilar um material linguístico de análise que contemplasse o conjunto mais vasto da obra de um autor, traduzida por um mesmo tradutor, tal como proposto por Malmkjaer (2004; 2005), com o objetivo também de investigar aspectos relacionados ao estilo da tradução, mas incorporando na análise aspectos como os usos do itálico e da pontuação, além de elementos paratextuais. Em segundo lugar, o presente estudo também possui características em comum com o trabalho dessa autora, se observado que Malmkjaer, de origem dinamarquesa e de atual residência na Inglaterra, analisa o conjunto de obras de um mesmo autor, Hans Christian Andersen, escritas na língua materna da pesquisadora e traduzidas por um mesmo tradutor, Henry William Dulcken, para a língua inglesa.
Ainda pode ser apontado que, em relação à constituição do corpus com tipologias textuais diferentes, a presente pesquisa guarda um vínculo com o modelo de Semino e Short (2004), por um lado, se considerado que esses autores procuraram verificar a aplicabilidade das categorias de AFE&P propostas por Leech e Short (1981), em seu estudo de estilo em obras de ficção em língua inglesa, em análises de textos não ficcionais na referida língua. Mas, por outro lado, este trabalho de investigação vai além da proposta daqueles autores, uma vez que aplica o quadro da AFE&P em corpora paralelos, com o intuito de verificar a instanciação da voz do tradutor, acrescenta um conjunto de marcadores e de anotação às (sub)categorias e ainda estabelece uma relação entre estas e o ponto de vista narrativo e aspectos linguísticos tais como a dêixis espaço-temporal e pessoal.
No caso particular desta tese, além de eu ter participado da audiência para a qual Sabato dirigiu suas obras, por haver nascido na Argentina, em Buenos Aires, lugar onde transcorrem as narrativas, e por ter conhecido, acompanhado e lido desde cedo o trabalho desse autor, posso considerar que, depois de duas décadas de residência no Brasil, também participo da audiência para a qual são destinadas as traduções dessas obras, feitas por Sergio Molina, para o português brasileiro atual. É nesse quadro motivacional que se insere inicialmente a escolha do corpus desta pesquisa.
Com a atenção em elementos que possam se constituir em indícios de estilo dos textos traduzidos e que, em consequência, revelem a presença discursiva do tradutor, procurou-se aplicar uma triangulação dos dados decorrentes do cruzamento da análise da AFE&P, do exame das palavras-chave, do estudo sobre os usos do itálico e de alguns sinais gráficos de pontuação, além de um conjunto de elementos paratextuais. Em concomitância
69
com cada um desses níveis de análise, também foram observados diversos aspectos sintático- semânticos, correspondentes à transitividade, dêixis espaço-temporal e pessoal, tempo e modo verbal, entre outros.
Para a análise da apresentação do discurso (AFE&P), instância que demandou o emprego de etiquetagem, foi realizado um recorte do corpus, com o propósito de observar, por um lado, a aplicabilidade e a eficácia dos procedimentos adotados, por outro, a significância dos resultados a ser alcançados, nesse nível de análise, antes de proceder à etiquetagem de uma porção maior do corpus. Nesse sentido, foram tomados, para a compilação do Corpus de análise da AFE&P, aproximadamente 9.000 itens de cada um dos TOs e TTs, distribuídos da seguinte maneira: 3.000 itens do início, 3.000 do meio e 3.000 do fim de cada texto. Foi respeitada a paragrafação nos TOs, no sentido de observar a conclusão dos parágrafos. Ainda se tomou o cuidado para que os fragmentos compilados dos TTs correspondessem ao mesmo ponto em que concluíam os TOs, independentemente do número de itens.
A Tabela 2.2 apresenta os resultados27 do Corpus para análise da AFE&P:
Tabela 2.2: Recorte do Corpus para análise da AFE&P
Nas próximas seções, são ilustrados os procedimentos metodológicos desenvolvidos neste trabalho.
27
Os resultados apresentados na Tabela 2.2 serão retomados, analisados e discutidos no Capítulo III da tese.
Corpus Itens Formas Razão
forma/item % Razão forma/item padronizada % p-valor ET_Sabato 9.445 2.412 25,54 45,04 0,0720 ET_Molina 9.120 2.431 26,70 46,97 ADF_Sabato 9.108 2.875 31,65 49,60 0,0000 ADF_Molina 8.761 3.028 34,67 53,56 LR_Sabato 9.452 2.572 27,36 45,98 0,0005 LR_Molina 9.063 2.672 29,66 49,40 TOTAIS 28.005 [es] 26.944 [pt] 54.949 5.894 [es] 6.065 [pt] 21,10 [es] 22,59 [pt] 46,87 49,84 0,0000
70