• No results found

The need for Future Research

In document Causes of Ceasefire Failure (sider 93-111)

7 Conclusion

7.1 The need for Future Research

O IATE (InterActive Terminology for Europe) é disponibilizado pela Unidade de Terminologia do Parlamento Europeu e é uma das mais utilizadas e completas bases de dados terminológica a nível internacional. Com equivalentes nas 24 línguas oficiais da UE, dados os valores do multilinguismo consagrados pelo Parlamento Europeu, esta base de dados é da responsabilidade conjunta de vários organismos da União Europeia, nomeadamente da Comissão Europeia (CE). Para extração dos termos são utilizadas memórias de tradução, partilhadas por diferentes organismos e elaboradas a partir dos documentos bilíngues alinhados gerados pelo processo de tradução na UE. Este conjunto de grandes dados está alojado no gigantesco sistema de informação multilíngue da Direção Geral de Tradução, Euramis (European Advanced Multilingual Information System)49.

Este é o único recurso que permite a transferência parcial ou total da base de dados. Assim, foi obtido da página de transferências50 do sítio em linha da IATE um ficheiro

49 DGT's Translation Memory. Disponível em linha em https://ec.europa.eu/jrc/en/language- technologies/dgt-translation-memory#dgt-memory [acedido em 25/09/2017]

comprimido contendo toda a coleção da base de dados. Este ficheiro foi seguidamente processado por uma aplicação Java fornecida pela própria Unidade de Terminologia, IATExtract, que permite a obtenção de um ficheiro em formato tbx. Esta aplicação permite filtrar alguns dados relevantes, nomeadamente ao selecionar as línguas de trabalho e o domínio. Foram então selecionadas as entradas para português e inglês e o domínio #5641 «Pescas». De realçar que durante a descompressão do ficheiro geral foram apenas selecionados termos com equivalentes nos dois pares de línguas (EN e PT). Ficaram assim excluídos termos em inglês sem equivalente em português ou vice- versa. O recurso permite a transferência da seguinte informação terminológica:

Seguidamente, o ficheiro tbx resultante foi convertido em formato xml o qual permite a leitura em folhas de cálculo51. Paralelamente, o ficheiro tbx também foi convertido para formato sdltb utilizando para este efeito o plug-in Glossary Converter

51 O processo não é totalmente reproduzível, só possibilitando esta conversão para Excel 2013 e não para versões anteriores do software.

Tabela 9 - Informação terminológica transferida da IATE

Language Independent Level:

 Entry ID  Subject domain  Domain note Language Level:  Language code Term Level:  Term  Term type  Reliability code  Evaluation

da SDL. Esta aplicação permite a abertura e gestão da base de dados em Multiterm (SDL) e a visualização das entradas completas como fichas terminológicas.

A análise realizada em Excel forneceu 3849 entradas (#Entry ID), mas um número significativamente mais elevado de termos em inglês (6058) e português (5165). Esta grande diferença explica-se pela quantidade de repetições, formas abreviadas (siglas e acrónimos) e variantes. Na conversão para Multiterm (Figura 14), o número de entradas manteve-se, mas o programa identificou um número ligeiramente inferior de equivalentes em inglês e português: 5987 (EN) e 5117 (PT).

Como seria de esperar, as entradas obtidas incluíram muitos termos específicos da pesca, em sentido estrito, muitas classes taxonómicas (zoologia e botânica) e nomes vulgares de organismos aquáticos (peixes, moluscos, aves, mamíferos, plantas). Para selecionar os termos específicos do domínio «aquacultura» foi aplicado um filtro às entradas contendo o valor do subdomínio 5641001 (identificado no campo «subject Domain» como «aquaculture». Esta informação só fica visível após descompressão do ficheiro. A conversão direta para Multiterm, para uso imediato como glossário, não permite filtrar entradas desejadas, gerando obrigatoriamente um recurso de grandes dimensões, mas pouco eficaz. Utilizando este descritor do domínio obtêm-se apenas 26 entradas, correspondentes a 60 termos em inglês e 45 em português. Repetindo todo o Figura 14 - Análise do conjunto de dados da IATE em Multiterm

três vezes superior de entradas (72) correspondentes a 127 termos. O que significa que a cobertura para a língua inglesa é superior à bilingue para o par EN<>PT.

Porém, o descritor 5641001 exclui muitas entradas consideradas relevantes neste âmbito de atividade e inclui outras cuja inserção no domínio levanta algumas dúvidas, nomeadamente grupos de entradas sobre anatomia do sistema excretor de invertebrados. Por conseguinte, foi necessário verificar as entradas individualmente, eliminando as consideradas como não pertencentes ao domínio (ou não relevantes) e suscetíveis de causar ruído, e manter outras não cobertas pelo descritor 5641001. Do ficheiro principal, eliminaram-se as seguintes categorias e tipos de entradas:

a) Nomes de espécies zoológicas e botânicas e categorias taxonómicas não relevantes (por exemplo, blue whiting/verdinho, entrada IATE 785693, ou entradas referentes a mamíferos marinhos); mantiveram-se alguns nomes comuns e categorias taxonómicas gerais consideradas de interesse para a aquacultura (Direção Geral dos Recursos Naturais Segurança e Serviços Marítimos, 2013); por exemplo, mantiveram-se alguns nomes comuns de peixes (robalo, dourada, salmão) ou de moluscos bivalves (ostra e amêijoa); b) Organizações internacionais, convenções, acordos e programas

especificamente relacionados com a atividade da pesca e a gestão pesqueira (Tabela 10), e respetivos acrónimos e siglas, celebrados a nível nacional ou internacional.

IATE ID Language code Term

IATE-238635 en WUF

IATE-238635 en World Underwater Federation

IATE-238635 pt CMAS

IATE-238635 pt Confederação Mundial das Atividades Subaquáticas

IATE-760948 en Convention on Future Multilateral Cooperation in the Northwest Atlantic Fisheries

IATE-760948 en NAFO Convention

IATE-760948 pt Convenção NAFO

IATE-760948 pt Convenção sobre a Futura Cooperação Multilateral nas Pescarias do Noroeste do Atlântico

c) Termos relacionados com legislação, implementação de políticas de pesca e regulamentação da atividade pesqueira (Tabela 11):

d) Terminologia náutica e específica de artes e tecnologias de pesca (Tabela 12):

IATE ID Language code Term

IATE-889868 en rudder stock

IATE-889868 en rudderstock

IATE-889868 pt madre do leme

IATE-2247934 en electric pulse trawl IATE-2247934 en electrical beam trawl

IATE-2247934 en pulse trawl

IATE-2247934 pt rede de arrasto com impulsos elétricos

Tabela 12 - Terminologia náutica e artes e tecnologias de pesca

e) Eliminação de entradas (em inglês e português) repetidas ou variantes gramaticais (formas plurais ou nomes compostos com diferentes grafias); sempre que possível, optou-se pela escolha da entrada classificada com o grau de fiabilidade («reliability code») mais elevado, e/ou eliminando entradas classificadas no campo de avaliação («evaluation») como termos obsoletos («obsolete») ou rejeitados («deprecated»); de notar que, como no exemplo apresentado na Tabela 13, muitos termos surgem classificados como «deprecated» sem que haja aparente justificação para tal, uma vez que correspondem à mesma denominação e possuem o mesmo ID:

IATE ID

Language

code Term

IATE-784585 en catch quota

IATE-784585 en fishing quota

IATE-784585 pt quota de captura

IATE-784585 pt quota de pesca

Tabela 11 – Exemplos de entradas excluídas, estritas do domínio «pescas»

Term Entry

IATE ID Domain Note Language code Reliability Code Term Evaluation

1653 IATE-895563

Taxono

my pt 3 ostra-portuguesa fullForm

2648 IATE-1491715 mollusc pt 3 ostra-portuguesa fullForm

3595 IATE-1860220 mollusc pt 3 ostra-portuguesa fullForm

3595 IATE-1860220 mollusc pt ostra-portuguesa deprecatedTerm-admn-sts

Tabela 13 - Entrada IATE para ostra-portuguesa

O conjunto total de entradas e termos selecionados encontra-se no Apêndice 2. Após esta seleção, o número de entradas foi reduzido para 242 entradas e 693 termos, distribuídos da seguinte forma:

5641 Antes da seleção Após a seleção

# Entradas 3849 242 6,29%

# Termos 11225 693 6,17%

# Termos EN 6058 372 6,14%

# Termos PT 5165 320 6,20%

Tabela 14 - IATE: Distribuição dos termos selecionados

Pode-se assim constatar que o número de entradas relativas à aquacultura constitui apenas 6,29% do total do domínio 5641 (pescas), e o número de termos em inglês e português, 6,17% e 6,14%, respetivamente. De notar que ainda estão incluídos nestas entradas alguns nomes de espécies e os termos relativos às patologias.

In document Causes of Ceasefire Failure (sider 93-111)