um contexto comunicativo que agiliza a comunicação.
A interpretação da representação e da informação contida nos mapas conceptuais depende, no entanto, de factores como o público‐alvo; o propósito da representação; o nível de conhecimento e os perfis dos diferentes interlocutores e a familiaridade com as
convenções do domínio. Os diferentes interlocutores devem, preferencialmente, possuir um
sistema de referências comum, para que a comunicação exista e para que a negociação se
torne viável.
Aos especialistas que desenvolvem a representação compete, então, conhecer, por
um lado, as regras gerais de percepção visual e, por outro lado, as experiências visuais
comuns, em termos de estruturação do conhecimento, que os seus interlocutores possuirão,
de forma a poderem comunicar com eficiência e validar as propostas dos seus parceiros. A
construção desses modelos de modo consistente representa, assim, um desafio, sobretudo
quando se pretende seguir um formalismo de representação semiformal de estruturas conceptuais.
3.7.2. Aplicações e recursos linguísticos de suporte à localização
A definição de uma estratégia de localização depende do modo como
percepcionamos, por um lado, o conteúdo a localizar – no nosso caso, uma ontologia – e,
por outro, os diferentes interlocutores que participarão no processo; o contexto em que se
inserem e que sustentará o desenvolvimento do processo; os limites temporais a que este
está sujeito; e o processo definido para a obtenção de feedback e para a sua integração. Para que a localização decorra num ambiente que permita aos elementos de uma rede uma participação efectiva e eficiente, torna‐se, assim, necessário definir um conjunto
apropriado de ferramentas que possa lidar com uma tipologia mista de recursos
monolingues, bilingues e multilingues.
A esta definição surgem associadas um conjunto de dificuldades, uma vez que os actuais serviços de tradução são quase exclusivamente focalizados na tradução de documentos, não prevendo a participação dos utilizadores finais, nem disponibilizando
aplicações que auxiliem a ultrapassar o problema das barreiras causadas pela presença de
diferentes línguas de trabalho num mesmo espaço colaborativo e de partilha do
conhecimento. Estas ferramentas não incorporam, tradicionalmente, as necessidades de
comunidades que funcionam em rede, nem prevêem a participação do (potencial) utilizador
final no processo.
Estas condições implicam a necessidade de disponibilizar um espaço de trabalho que
promova a localização da representação conceptual num contexto que permita a
comunicação entre os interlocutores; espaço que considere a estrutura social e
organizacional da comunidade, bem como o tipo de competências existentes.
Para tal, será necessário identificar e considerar os ambientes e fluxos de trabalho já desenvolvidos e definir um que disponibilize um conjunto de ferramentas e recursos linguísticos mínimos e facilmente acessíveis, que promova a participação dos diferentes interlocutores e línguas e que funcione como uma solução de auxílio ao processo de localização orientada para os requisitos idiossincráticos da rede.
Sendo a localização uma actividade baseada no conhecimento (Wilss, 1996), a selecção de técnicas, métodos e ferramentas apropriadas à localização dos termos da ontologia, depende, no entanto, dos recursos disponíveis para cada língua em particular e para o domínio a ser representado. Como é previsível, quer o número quer o tipo de recursos (ex.: terminológicos, lexicográficos) diferem bastante dependendo da língua de origem ou de destino, destacando‐se, como referimos já, a oferta de recursos em língua inglesa.
O mesmo acontece com as ferramentas de tradução e de localização que se
encontram em estádios de desenvolvimento diferentes e cujos resultados continuam a ter graus díspares de granularidade, de qualidade ‐ em muitos casos insatisfatória e causadora de ruído ‐ e de interesse, dependendo do par de línguas ou da aplicação em uso, pelo que o seu uso deve ser analisado criticamente à luz das necessidades de localização de uma língua de especialidade. Propomos, assim, que o processo de localização da ontologia, executado a partir da representação conceptual em mapas de conceitos, seja assistido pelo recurso a um conjunto de ferramentas cujas características auxiliem e promovam o acesso e o trabalho num
ambiente multilingue de conceptualização, ferramentas como sistemas em linha de tradução automática (ex.: Google Translator122, Microsoft Bing Translator123, ou o Linguee124), bases de dados terminológicas (ex.: IATE), bases de dados lexicais (ex.: Wordnet125), dicionários (ex.: Wiktionary126, OmegaWiki127) e outros recursos mais genéricos como o LazyTerm128, que poderão, no entanto, não contemplar ainda algumas das línguas para as quais a ontologia deverá ser localizada.
Foram considerados outras ferramentas129 como o EuroWordNet130 ou Babelnet131, mas a utilização implicaria instalações locais, sendo o seu uso de maior complexidade para os utilizadores. Por outro lado, não abrangem uma parte das línguas que nos interessam
mais directamente, nalguns casos também a portuguesa, sendo os resultados que obtivemos
no seu uso comparativamente menos interessantes e completos do que os das aplicações
acima identificadas.
Uma das razões para a escolha e uso daquelas aplicações prende‐se com o grau de
facilidade de acesso e o uso intuitivo que as ferramentas oferecem aos diferentes utilizadores sem competências específicas de tradução ou localização. Como indica Kargioti (2010: 02), o carácter intuitivo e a usabilidade das aplicações do tipo Web 2.0, “further enhanced with semantic technologies for “intelligent” information processing, and combined with automated translation services, can open participation to individuals regardless of educational, professional or language background”.
Naturalmente que o recurso a este tipo de ferramentas tem desvantagens,
nomeadamente as oriundas do facto de alguns dos seus utilizadores não possuírem
122 http://translate.google.pt/ 123 http://www.microsofttranslator.com/ 124 http://www.linguee.com/ 125 http://wordnet.princeton.edu/ 126 http://www.wiktionary.org/ 127 http://www.omegawiki.org/Meta:Main_Page 128 http://terminotrad.info/RogerMcKeon/LazyTerm/TerminoParesse-Rev.3e.html
129 Uma dessas possibilidades passa pelo recurso e consulta a sítios multilingues de referência para o domínio que possuam informação facilitadora da identificação e selecção dos equivalentes.
130
http://www.illc.uva.nl/EuroWordNet/
131
conhecimentos específicos quanto ao seu uso ou não possuírem formação ou competências mínimas em tradução, como já dissemos, pelo que se torna necessário desenvolver e fornecer um conjunto de orientações que promovam o seu uso efectivo e o processo de pesquisa e selecção da informação. Estas orientações devem considerar os propósitos da rede colaborativa; o perfil dos seus utilizadores; as suas necessidades de acesso à informação multilingue; o contributo expectável dos utilizadores e, finalmente, o domínio a ser representado e localizado.
A escolha de um conjunto de ferramentas e recursos que tenha em consideração os
elementos descritos implica que se explore uma abordagem conducente à obtenção de uma
localização com qualidade, que assentará necessariamente na validação dos resultados obtidos com base na colaboração dos especialistas de domínio, cuja intervenção e papel serão descritos com mais pormenor no ponto 3.7.
Na aplicação do método não consideramos, para efeitos de localização, todos os elementos linguísticos que constituem a ontologia (ex.: as definições), uma vez que o processo de localização centrar‐se‐á ao nível dos termos que designam os conceitos da ontologia.
Os métodos de localização, no caso específico de uma rede colaborativa têm, assim,
que se adaptar aos actores dessa mesma rede e ao modo como se espera que contribuam
para o processo de conceptualização e localização. Para tal, existem diferentes possibilidades, como o recurso à tradução directa, caso se verifique a existência de recursos fiáveis, nomeadamente glossários e dicionários bi ou multilingues de especialidade ou tesauros específicos do domínio que abranjam as línguas de trabalho da rede. Na falta deste tipo de recursos, poder‐se‐á considerar o recurso a outras técnicas, como as baseadas na tradução automática ou em corpora.
Do mesmo modo, deve‐se ter em conta os diferentes momentos já descritos, e as diferentes necessidades de localização a que poderão conduzir, uma vez que, numa primeira fase, a língua de partida é o inglês, língua utilizada na rede para efeitos de comunicação, negociação e estruturação do conhecimento e, numa segunda fase, a língua de partida poderá vir a ser uma das línguas de trabalho dos utilizadores da rede.
3.8. Fluxo de trabalho do método
O desenho do método teve em conta, como descrevemos, o contexto de
estruturação e de uso do conhecimento, os objectivos a atingir com esse uso, e os meios
disponíveis para a apreensão da complexidade e riqueza semântica do domínio e para a sua
representação em termos multilingues (ponto 3.2) numa ontologia de domínio.
O método para a especificação multilingue de ontologias foi concebido de modo a ser integrador e criar um fluxo de trabalho que conduzisse a um enriquecimento linguístico gradual das representações conceptuais e que permitisse e promovesse a iteração constante entre especialistas e recursos lexicais, terminológicos, entre outros; a iteração com aplicações de tradução e localização; bem como a iteração entre os especialistas e entre estes e o terminólogo.
Tal como se sistematiza na figura seguinte, o método propõe diferentes fases
conducentes à construção de uma ontologia representada em mais do que uma língua.
Fig. 13 – Fluxo de trabalho do método para a especificação multilingue de ontologias
Na primeira fase da construção da ontologia procede‐se à construção de uma
representação conceptual inicial do domínio, construída numa língua de trabalho
previamente acordada (normalmente a língua inglesa), a partir da qual se desenvolve o