• No results found

EKSTRAKSJON, OPPARBEIDING OG ANALYSER

In document OR-65-83.pdf (8.424Mb) (sider 21-56)

um contexto comunicativo que agiliza a comunicação.  

A  interpretação  da  representação  e  da  informação  contida  nos  mapas  conceptuais  depende, no entanto, de factores como o público‐alvo; o propósito da representação; o nível  de  conhecimento  e  os  perfis  dos  diferentes  interlocutores  e  a  familiaridade  com  as 

convenções do domínio. Os diferentes interlocutores devem, preferencialmente, possuir um 

sistema de referências comum, para que a comunicação exista e para que a negociação se 

torne viável. 

Aos especialistas que desenvolvem a representação compete, então, conhecer, por 

um  lado,  as  regras  gerais  de  percepção  visual  e,  por  outro  lado,  as  experiências  visuais 

comuns, em termos de estruturação do conhecimento, que os seus interlocutores possuirão, 

de forma a poderem comunicar com eficiência e validar as propostas dos seus parceiros. A 

construção desses modelos de modo consistente representa, assim, um desafio, sobretudo 

quando  se  pretende  seguir  um  formalismo  de  representação  semiformal  de  estruturas  conceptuais. 

 

3.7.2. Aplicações e recursos linguísticos de suporte à localização   

A  definição  de  uma  estratégia  de  localização  depende  do  modo  como 

percepcionamos, por um lado, o conteúdo a localizar – no nosso caso, uma ontologia – e, 

por outro, os diferentes interlocutores que participarão no processo; o contexto em que se 

inserem e que sustentará o desenvolvimento do processo; os limites temporais a que este 

está sujeito; e o processo definido para a obtenção de feedback e para a sua integração.  Para  que  a  localização  decorra  num  ambiente  que  permita  aos  elementos  de  uma  rede uma participação efectiva e eficiente, torna‐se, assim, necessário definir um conjunto 

apropriado  de  ferramentas  que  possa  lidar  com  uma  tipologia  mista  de  recursos 

monolingues, bilingues e multilingues. 

A  esta  definição  surgem  associadas  um  conjunto  de  dificuldades,  uma  vez  que  os  actuais  serviços  de  tradução  são  quase  exclusivamente  focalizados  na  tradução  de  documentos,  não  prevendo  a  participação  dos  utilizadores  finais,  nem  disponibilizando 

aplicações que auxiliem a ultrapassar o problema das barreiras causadas pela presença de 

diferentes  línguas  de  trabalho  num  mesmo  espaço  colaborativo  e  de  partilha  do 

conhecimento.  Estas  ferramentas  não  incorporam,  tradicionalmente,  as  necessidades  de 

comunidades que funcionam em rede, nem prevêem a participação do (potencial) utilizador 

final no processo. 

Estas condições implicam a necessidade de disponibilizar um espaço de trabalho que 

promova  a  localização  da  representação  conceptual  num  contexto  que  permita  a 

comunicação  entre  os  interlocutores;  espaço  que  considere  a  estrutura  social  e 

organizacional da comunidade, bem como o tipo de competências existentes. 

Para tal, será necessário identificar e considerar os ambientes e fluxos de trabalho já  desenvolvidos  e  definir  um  que  disponibilize  um  conjunto  de  ferramentas  e  recursos  linguísticos  mínimos  e  facilmente  acessíveis,  que  promova  a  participação  dos  diferentes  interlocutores  e  línguas  e  que  funcione  como  uma  solução  de  auxílio  ao  processo  de  localização orientada para os requisitos idiossincráticos da rede.  

Sendo  a  localização  uma  actividade  baseada  no  conhecimento  (Wilss,  1996),  a  selecção  de  técnicas,  métodos  e  ferramentas  apropriadas  à  localização  dos  termos  da  ontologia, depende, no entanto, dos recursos disponíveis para cada língua em particular e  para  o  domínio  a  ser  representado.  Como  é  previsível,  quer  o  número  quer  o  tipo  de  recursos  (ex.:  terminológicos,  lexicográficos)  diferem  bastante  dependendo  da  língua  de  origem  ou  de  destino,  destacando‐se,  como  referimos  já,  a  oferta  de  recursos  em  língua  inglesa. 

O  mesmo  acontece  com  as  ferramentas  de  tradução  e  de  localização  que  se 

encontram em estádios de desenvolvimento diferentes e cujos resultados continuam a ter  graus díspares de granularidade, de qualidade ‐ em muitos casos insatisfatória e causadora  de ruído ‐ e de interesse, dependendo do par de línguas ou da aplicação em uso, pelo que o  seu uso deve ser analisado criticamente à luz das necessidades de localização de uma língua  de especialidade.   Propomos, assim, que o processo de localização da ontologia, executado a partir da  representação conceptual em mapas de conceitos, seja assistido pelo recurso a um conjunto  de  ferramentas  cujas  características  auxiliem  e  promovam  o  acesso  e  o  trabalho  num 

ambiente multilingue de conceptualização, ferramentas como sistemas em linha de tradução  automática (ex.: Google Translator122, Microsoft Bing Translator123, ou o Linguee124), bases  de  dados  terminológicas  (ex.:  IATE),  bases  de  dados  lexicais  (ex.:  Wordnet125),  dicionários  (ex.:  Wiktionary126,  OmegaWiki127)  e  outros  recursos  mais  genéricos  como  o  LazyTerm128,  que  poderão,  no  entanto,  não  contemplar  ainda  algumas  das  línguas  para  as  quais  a  ontologia deverá ser localizada. 

Foram  considerados  outras  ferramentas129  como  o  EuroWordNet130  ou  Babelnet131,  mas a utilização implicaria instalações locais, sendo o seu uso de maior complexidade para  os  utilizadores.  Por  outro  lado,  não  abrangem  uma  parte  das  línguas  que  nos  interessam 

mais directamente, nalguns casos também a portuguesa, sendo os resultados que obtivemos 

no seu uso comparativamente menos interessantes e completos do que os das aplicações 

acima identificadas. 

Uma das razões para a escolha e uso daquelas aplicações prende‐se com o grau de 

facilidade  de  acesso  e  o  uso  intuitivo  que  as  ferramentas  oferecem  aos  diferentes  utilizadores sem competências específicas de tradução ou localização. Como indica Kargioti  (2010:  02),  o  carácter  intuitivo  e  a  usabilidade  das  aplicações  do  tipo  Web  2.0,  “further  enhanced with semantic technologies for “intelligent” information processing, and combined  with  automated  translation  services,  can  open  participation  to  individuals  regardless  of  educational, professional or language background”.  

Naturalmente  que  o  recurso  a  este  tipo  de  ferramentas  tem  desvantagens, 

nomeadamente  as  oriundas  do  facto  de  alguns  dos  seus  utilizadores  não  possuírem 

       122  http://translate.google.pt/  123  http://www.microsofttranslator.com/  124  http://www.linguee.com/  125  http://wordnet.princeton.edu/  126  http://www.wiktionary.org/  127 http://www.omegawiki.org/Meta:Main_Page  128  http://terminotrad.info/RogerMcKeon/LazyTerm/TerminoParesse-Rev.3e.html 

129 Uma dessas possibilidades passa pelo recurso e consulta a sítios multilingues de referência para o domínio que possuam informação facilitadora da identificação e selecção dos equivalentes.

130

 http://www.illc.uva.nl/EuroWordNet/ 

131 

conhecimentos específicos quanto ao seu uso ou não possuírem formação ou competências  mínimas  em  tradução,  como  já  dissemos,  pelo  que  se  torna  necessário  desenvolver  e  fornecer  um  conjunto  de  orientações  que  promovam  o  seu  uso  efectivo  e  o  processo  de  pesquisa  e  selecção  da  informação.  Estas  orientações  devem  considerar  os  propósitos  da  rede  colaborativa;  o  perfil  dos  seus  utilizadores;  as  suas  necessidades  de  acesso  à  informação multilingue; o contributo expectável dos utilizadores e, finalmente, o domínio a  ser representado e localizado. 

A escolha de um conjunto de ferramentas e recursos que tenha em consideração os 

elementos descritos implica que se explore uma abordagem conducente à obtenção de uma 

localização  com  qualidade,  que  assentará  necessariamente  na  validação  dos  resultados  obtidos  com  base  na  colaboração  dos  especialistas  de  domínio,  cuja  intervenção  e  papel  serão descritos com mais pormenor no ponto 3.7. 

Na  aplicação  do  método  não  consideramos,  para  efeitos  de  localização,  todos  os  elementos  linguísticos  que  constituem  a  ontologia  (ex.:  as  definições),  uma  vez  que  o  processo  de  localização  centrar‐se‐á  ao  nível  dos  termos  que  designam  os  conceitos  da  ontologia.  

Os métodos de localização, no caso específico de uma rede colaborativa têm, assim, 

que se adaptar aos actores dessa mesma rede e ao modo como se espera que contribuam 

para  o  processo  de  conceptualização  e  localização.  Para  tal,  existem  diferentes  possibilidades, como o recurso à tradução directa, caso se verifique a existência de recursos  fiáveis,  nomeadamente  glossários  e  dicionários  bi  ou  multilingues  de  especialidade  ou  tesauros específicos do domínio que abranjam as línguas de trabalho da rede. Na falta deste  tipo  de  recursos,  poder‐se‐á  considerar  o  recurso  a  outras  técnicas,  como  as  baseadas  na  tradução automática ou em corpora. 

Do  mesmo  modo,  deve‐se  ter  em  conta  os  diferentes  momentos  já  descritos,  e  as  diferentes necessidades de localização a que poderão conduzir, uma vez que, numa primeira  fase,  a  língua  de  partida  é  o  inglês,  língua  utilizada  na  rede  para  efeitos  de  comunicação,  negociação  e  estruturação  do  conhecimento  e,  numa  segunda  fase,  a  língua  de  partida  poderá vir a ser uma das línguas de trabalho dos utilizadores da rede. 

3.8. Fluxo de trabalho do método   

O  desenho  do  método  teve  em  conta,  como  descrevemos,  o  contexto  de 

estruturação e de uso do conhecimento, os objectivos a atingir com esse uso, e os meios 

disponíveis para a apreensão da complexidade e riqueza semântica do domínio e para a sua 

representação em termos multilingues (ponto 3.2) numa ontologia de domínio. 

O método para a especificação multilingue de ontologias foi concebido de modo a ser  integrador  e  criar  um  fluxo  de  trabalho  que  conduzisse  a  um  enriquecimento  linguístico  gradual das representações conceptuais e que permitisse e promovesse a iteração constante  entre  especialistas  e  recursos  lexicais,  terminológicos,  entre  outros;  a  iteração  com  aplicações  de  tradução  e  localização;  bem  como  a  iteração  entre  os  especialistas  e  entre  estes e o terminólogo. 

Tal  como  se  sistematiza  na  figura  seguinte,  o  método  propõe  diferentes  fases 

conducentes à construção de uma ontologia representada em mais do que uma língua. 

 

  Fig. 13 – Fluxo de trabalho do método para a especificação multilingue de ontologias 

 

Na  primeira  fase  da  construção  da  ontologia  procede‐se  à  construção  de  uma 

representação  conceptual  inicial  do  domínio,  construída  numa  língua  de  trabalho 

previamente  acordada  (normalmente  a  língua  inglesa),  a  partir  da  qual  se  desenvolve  o 

In document OR-65-83.pdf (8.424Mb) (sider 21-56)