Drivkrefter og utviklingstrekk
Boks 4.1 Grønn omstilling
4.1.6 Endring i arbeidsformer – fjernarbeid og bruk av hjemmekontor
A pesquisa de equivalentes, neste caso, de língua inglesa, foi realizada num
subcorpus de chegada, em inglês, tendo em linha de conta de que se está perante um
corpus comparável, ou que apresenta algum paralelismo pontual. O subcorpus obtido a partir dos resumos em inglês foi processado de forma idêntica ao português como anteriormente discutido. Este corpus apresenta um volume inferior de palavras (2 353 palavras) devido ao facto de ser unicamente constituído por resumos em sentido estrito e não por resumos “alargados”, como no caso do português.
A procura por equivalentes fez-se por pesquisa de marcadores que revelassem ligações semânticas e morfossintáticas com outras formas, estabelecendo uma correspondência com a língua de chegada, adaptando parte da estratégia seguida por Aker et al. (2013). As formas simples e mais frequentes do subcorpus inglês (e também as mais genéricas) foram analisadas utilizando a funcionalidade «Structuration» do TermStat em conjunto com o AntConc. Após determinar o eixo sintagmático de cada uma delas, pode-se então verificar a existência do equivalente lexical por comparação com o subcorpus português.
Outra estratégia consistiu em recorrer à utilização das siglas/acrónimos como marcadores dos equivalentes, uma vez que muitas formas abreviadas mantêm a grafia inglesa (por exemplo, IMTA ou PUFA). Por outro lado, tratando-se de uma área científica, o uso de prefixos e/ou palavras compostas de origem greco-latina é bastante abundante e transversal a ambas as línguas, constituindo assim outra estratégia de marcação para a extração de equivalentes.
Em caso de não ser possível determinar uma correspondência nos corpora, procurar- se-á encontrar o equivalente em recursos externos que partilhem a mesma tipologia de textos.
5.5.1. Pesquisa de equivalentes – exemplos
Após processamento no TermStat, com a função «Structuration», do subcorpus constituído pelos resumos em inglês, obtiveram-se as formas simples e compostas. Na Tabela 23, a título de exemplo, apresentam-se as dez primeiras ocorrências no corpus inglês, ordenadas por frequência. As formas simples comuns mais frequentes estão marcadas a cinza:
Tabela 23 – Comparação das formas de reagrupamento mais frequentes nos dois subcorpora
À semelhança do que aconteceu no corpus português, as formas simples mais frequentes não constituem exatamente candidatos a termos. Sendo muitas delas palavras do léxico comum (fish, growth, diet, production), podem ser utilizadas como marcadores discursivos para estabelecer uma referência. Deste modo, as formas que em português estão associadas a peixe, crescimento, dieta e produção (Tabela 23) podem estar igualmente associadas aos equivalentes em inglês.
Veja-se os exemplos dos pares crescimento/growth e aquacultura/aquaculture, começando pelo resultado do agrupamento com a função «Structuration» do TermStat (Tabela 24): Frequência PT Candidato de reagrupamento PT Candidato de reagrupamento EN Frequência
EN Candidatos a termo incluídos -EN
130 crescimento fish 82 marine fish - juvenile fish
117 dieta growth 56 growth rate
112 peixe diet 53
100 espécie aquaculture 47 offshore aquaculture
87 produção production 47
78 larva quality 38 water quality
76 cultivo study 35
70 tanque system 33
65 taxa feed 29
crescimento crescimento da larva - crescimento larvar - taxa de crescimento
growth growth rate
Tabela 24 - Reagrupamento para crescimento / growth (TermStat)
Neste exemplo, o TermStat só extraiu uma forma composta a partir da forma inglesa
growth. Este facto está associado em parte ao menor tamanho do corpus e ao facto de os
corpora português e inglês não serem paralelos. No entanto, as concordâncias do AntConc (Figura 26) confirmam o primeiro equivalente e revelam uma nova forma composta associada também a uma sigla: specific growth rate, ou SGR. Esta forma, não detetada na análise feita pelo TermStat, é confirmada pelas concordâncias do AntConc no corpus inglês e no português como Taxa de Crescimento Específico (SGR):
Figura 26 – Concordâncias para growth (AntConc)
No caso de aquacultura, o TermStat não apresenta nenhuns termos associados em inglês. Porém, sabe-se que o termo genérico do domínio está associado semanticamente por relações de hiperonímia-hiponímia a muitas outras formas compostas: aquacultura
em mar aberto, aquacultura multitrófica integrada (ou IMTA), aquacultura semi-
intensiva, aquacultura intensiva, aquacultura com recirculação de água (RAS), entre outras.
aquacultura
aquaculture offshore aquaculture
Nas concordâncias em português, surge a forma aquacultura em mar aberto, acompanhada de uma explicação do termo equivalente em inglês (offshore), permitindo estabelecer a equivalência com offshore aquaculture:
Outros exemplos foram encontrados que ilustram o processo de extração de equivalentes mediante o processo de associação com diferentes tipos de marcadores lexicais (Tabela 26):
PT EN Observações
taxa de conversão de alimento food conversion rate associação taxa<>rate aquacultura semi-intensiva;
piscicultura semi-intensiva
semi-intensive aquaculture concordâncias com aquacultura aquacultura multitrófica integrada;sistemas integrados multitróficos integrated multitrophic aquaculture
acrónimo inglês IMTA
sistema de aquacultura com recirculação de água (RAS)
recirculating aquaculture systems
acrónimo inglês RAS
água verde; técnica da água verde
green water technique associação verde<>green
alimento vivo life food associação
alimento<>food Tabela 26 –Extração de equivalentes com diferentes tipos de marcadores lexicais
O trabalho efetuado nestes corpora demonstra que os especialistas nem sempre realizam uma tradução direta dos seus textos, modificando-os por vezes bastante
«Em Portugal, a aquacultura em mar aberto (offshore) é uma atividade emergente com elevado potencial económico. Com o desenvolvimento recente da zona APPA (Área de Produção Piloto Aquícola) ao largo da costa algarvia, surgiu o interesse na realização do presente trabalho com o objetivo de fornecer informações sobre a gestão, manutenção e operação de uma unidade em mar aberto.»
resumos/abstracts e as lacunas que apresentam devem ser colmatadas com recurso aos textos que lhes serviram de base. Porém, estes textos apresentam grau ainda menor de correspondência, uma vez que são textos redigidos de forma total e completamente independente uns dos outros. Para os poder utilizar, será necessário estabelecer uma metodologia de trabalho em corpora comparáveis utilizando técnicas de processamento de linguagem natural. Face ao problema de extração em textos bilingues não-alinhados, os programas apresentados mostram limitações de restrições impostas pelos seus dicionários e eletrónicos e gramáticas locais (TermStat) e pela morosidade de automatização do processamento de corpora de maiores dimensões (AntConc). Sendo assim, os corpora dos resumos podem ser muito úteis para estabelecimento de um referencial, um golden standard, para utilização não só como uma lista de palavras- chave ao procurar equivalentes, mas também como “treino” para programas semiautomáticos de processamento de linguagem natural (por exemplo, Unitex) no desenvolvimento de dicionários e gramáticas locais especificas para detetar unidades terminológicas simples e compostas.
Após a obtenção deste referencial, poderá recorrer-se a outras estratégias de seleção, com recurso a outros textos da área, como sejam, teses de doutoramento e artigos publicados em revistas científicas. Aqui, e ao longo de todo o processo de gestão terminológica, a colaboração dos especialistas com os terminólogos é fundamental para realizar uma seleção adequada dos textos representativos do domínio de especialidade (Silva, 2014), permitindo uma seleção dos documentos mais relevantes como também dos mais atuais. Mais ainda, chama a atenção para a importância de envolver os especialistas na organização conceptual do domínio, de o estruturar em subdomínios mais específicos e de evitar a variação terminológica não justificada, de modo a garantir a qualidade.
Por outro lado, verificou-se que também surge neste tipo de documentos alguma inconsistência terminológica e incoerência lexical. Este aspeto leva a considerar a relevância de um recurso como o presente, mesmo para os especialistas, podendo contribuir para uma maior harmonização terminológica e para um melhoramento da qualidade dos textos de especialidade.