• No results found

9 Et stabilt klima og ren luft

9.3 Langtransporterte

A  eventual  imaturidade  do  software  Open  Refine  poderá  ter  contribuído  para  estes  resultados.  É  um  software  em  constante  desenvolvimento,  recebendo  por  isso  bastantes incrementos, alterações e adaptações. Pesa aqui também o facto de facto de  ser  software  Open  Source  ‐  desenvolvido  menos  para  o  mercado  mas  mais  a  nível  académico, tendo em vista a sua fruição pelas instituições culturais, conhecidas pelos  seus  fracos  recursos  financeiros  no  que  toca  à  divulgação  dos  seus  acervos  e  fundos  culturais. 

Quanto  ao  modelo  de  dados  EDM,  mesmo  lançado  em  2012,  também  se  encontra em desenvolvimento. No entanto, é de frisar que a Europeana detém outros  meios para adaptar os dados que recebe das instituições culturais. Mesmo solicitando  a estas que os seus dados sejam remetidos já conformes com este modelo recente, a  própria  Europeana  detém  meios  informáticos  e  de  programação  próprios,  que  possibilitam  a  correta  integração  destes  nos  seus  datasets,  para  divulgação  no  seu  Portal. Determinadas classes e propriedades deste modelo de dados só conseguem ser  aplicadas nos dados recebidos pela própria Europeana, após essa integração.  

De  frisar  que,  no  decurso  dos  testes  dos  RDFs  das  amostragens  no  SPARQL  Endpoint  já  referido,  foi  estabelecido  contacto  com  o  sector  de  desenvolvimento  informático  da  Europeana,  a  fim  de  indagar  da  disponibilização  de  um  motor  de  pesquisa  /  SPARQL  Endpoint  para  os  mesmos.  Foi  obtida  resposta  da  inexistência  deste,  mas  verificou‐se,  em  meados  de  agosto  do  corrente  ano,  que  a  Europeana  disponibiliza online um SPARQL Endpoint, mas mais destinado à pesquisa dos dados já  integrados nas suas bases de dados. 

Outro fator  tido em conta foi a falta de datasets de dados Linked Open Data,  contendo registos de dados culturais portugueses, como foi verificado aquando da fase  de  reconciliação  dos  dados  das  amostragens  dos  fundos  documentais  do  AH‐OTDU  com os datasets internacionais (Freebase, DBPedia e Sindice). Tendo em atenção que,  no  presente  momento,  o  Portal  Europeana  divulga  bastantes  recursos  culturais 

portugueses61,  foi  feita  uma  pesquisa  pelas  entidades  do  estudo  em  apreço,  mais  focado  nos  autores  de  projetos  OTDU  contemplados  nas  amostragens  ‐  donde  nada  resultou.  

Neste  sentido,  cumpre  aqui  referir  que,  quer  o  motor  de  pesquisa  inter‐ repositórios  online  disponibilizado  através  do  Portal  Português  de  Arquivos  (PPA)62,  quer  o  motor  de  pesquisa  online  do  Ficheiro  Nacional  de  Autoridades  Arquivísticas  (FNAA)63 se encontram desativados, não possibilitando por isso a eventual recolha de  informação  e  links  para  integração  no  ficheiro  RDF  "Autores_OTDU".  É  importante  salientar o potencial contributo que estes dois projetos de divulgação online de fundos  documentais  portugueses  (ou  os  seus  sucedâneos)  poderão  vir  a  ter  no  futuro  como  motores de disseminação de dados Linked Open Data. 

A  mesma  situação  se  verificou  com  o  dataset  disponibilizado  pelo  Geonames.org  ‐  a  sua  ligação  deverá  ser  possível  através  do  Portal  Europeana,  após  integração dos dados AH‐OTDU nesta e processamento de reconciliação. 

No que reporta à utilização das normas de descrição arquivística internacionais,  e  como  já  referido  anteriormente, a  ISAD(G) é uma norma que contém regras gerais  para a descrição arquivística, podendo estas serem  aplicadas independentemente da  forma ou do suporte dos documentos e serem adaptadas às necessidades específicas  das instituições. No entanto, e visando a reconciliação de dados Linked Data através do  software  Open  Refine,  provou‐se  ser  mais  fácil  adaptar  os  campos  de  descrição  originais dos fundos documentais que já detinham registos na BD AH‐OTDU (ex: IGT ‐  peças desenhadas e peças escritas) e na BD‐EUC do que os campos de descrição dos  fundos  documentais  que  foram  feitos  de  origem  conforme  as  ISAD(G)  e  as  ODA  (ex:  fotografias dos álbuns fotográficos).          61 Em consulta feita em 25 de Agosto de 2015, O Portal Europeana disponibilizava online 42459 registos  (by providing country), na sua maioria provenientes do Registo Nacional de Objectos Digitais (RNOD), da  Fundação Calouste Gulbenkian e da EuropeanaLocal ‐ Portugal.  62 Integrado na Rede Portuguesa de Arquivos (RPA), gerido pela DGLAB. O seu acesso faz‐se através do 

link http://portal.arquivos.pt/, mas este encontra‐se desativado (consultado a 25 Ago. 2015). 

63

  O  seu  acesso  faz‐se  através  do  link http://autoridades.arquivos.pt/,  mas  o  mesmo  encontra‐se  desativado (consultado a 25 Ago. 2015). 

Tendo em atenção de que o alerta para a necessidade de se ter de recorrer à  granularidade e subdivisão de campos de descrição já se encontra referida na terceira  versão  das  ODA64,  nos  casos  das  amostragens  feitas  com  as  ISAD(G),  viu‐se  a  necessidade de proceder à atomização de alguns campos. Por exemplo, foi necessário  subdividir o campo de descrição "Coverage" nos campos "País", "Distrito", "Município"  e "Localidade" ‐ o que facilitou a reconciliação com outros datasets. Com a informação  concentrada  num  só  campo  (como  ocorria  no  campo  "coverage"),  no  processo  de  reconciliação provou‐se ser difícil o seu reconhecimento de dados pelo software. 

Ainda no contexto deste estudo de caso, e visando uma melhoria de resultados  nos  processos  de  reconciliação  de  dados  Linked  Data,  recomenda‐se  a  criação  de  webpages  que  detenham  as  informações  das  unidades  de  instalação  /  documentos  compostos  respeitantes  aos  processos  dos  fundos  documentais  em  apreço,  reconhecidas  pela  Europeana  como  landing  pages. Como  já  referido,  existindo  uma  webpage própria para cada processo (ex: um Plano), onde estariam replicados os links  para as suas peças processuais (ex: peças desenhadas e peças escritas), à semelhança  do que ocorre no formato analógico, seria assim mais fácil estruturar um ficheiro RDF e  serviço de reconciliação próprio que eventualmente pudesse estabelecer ligações com  outros datasets. Esta autonomização beneficiaria os utilizadores, no sentido que estes  não só teriam a informação respeitante aos níveis da estrutura da descrição (conforme  indicados  pelas  ODA)  e  organização  da  documentação,  como  também  veriam  esta  replicada  na  apresentação  dos  resultados  de  pesquisa,  facilitando  assim  a  sua  navegação e pesquisa por correspondentes linked data dentro destas landing pages.  

Neste estudo de caso, viu‐se a necessidade de lidar com fontes de informação  variadas  e  distintas  umas  das  outras,  face  às  características  próprias  de  cada  fundo  documental pertencente ao AH‐OTDU. Dessas características ressalta o facto de alguns  dizerem  respeito  a  processos  de  arquitetura,  urbanismo  e  obras  (IGT  e  EUC),  outros  respeitarem  apenas  a  coleções  fotográficas  (os  álbuns  fotográficos  e  as  fotografias        

64  ODA,  v.3,  pg.  26:  "Na  prática,  verifica‐se  que  uma  maior  granularidade  de  informação  descritiva 

contribui  para  a  uma  maior  precisão,  consistência,  coerência  e  normalização  da  descrição.  (…)  Uma  maior granularidade permite igualmente taxas mais efetivas de recuperação de informação pertinente,  sobretudo tendo em conta a possibilidade de combinação, na pesquisa, de diferentes campos, bem como  a possibilidade de ordenação das ocorrências recuperadas." 

aéreas)  e  ainda  os  fundos  bibliográficos.  É  também  de  salientar  que  nem  todos  os  fundos documentais se encontravam descritos, e naqueles que já detinham registos de  descrição,  estes  não  cumpriam  o  estipulado  nas  normas  de  descrição  já  referidas,  havendo até casos de falta de campos de descrição ditos fundamentais (ex. a indicação  dos  autores).  Neste  sentido,  e  visando  a  conciliação  destes  universos  informativos  diferentes  e  a  seguir  o  modelo  de  dados  EDM,  foi  necessária  a  criação  de  tabelas  e  ficheiros RDF auxiliares (ex. Autores_OTDU), feitos manualmente, uma vez que não era  possível o alinhamento da sua informação com os datasets Linked Data já referidos. 

Outra  recomendação  a  sugerir  é  a  adoção  de  soluções  tecnológicas  menos  dadas  à  obsolescência  a  curto  e  médio  prazo  e  conducentes  a  uma  maior  interoperabilidade.  Isto  prende‐se  com  o  facto  de  o  SNIT/AH‐OTDU  recorrer  à  tecnologia Silverlight, tecnologia esta que já não é suportada por algumas versões de  web  browsers  mais  recentes,  e  para  a  qual  já  existe  um  fim  anunciado  para  o  seu  suporte65.  Uma  vez  que  o  campo  de  descrição  "LinkZoom"  é  de  grande  importância,  dado que é por este link que se tem acesso à visualização da representação digital da  peça  documental  pretendida,  julga‐se  necessário  envidar  esforços  ou  determinar  outros formatos de visualização mais duradouros antes da submissão destes dados à  Europeana.  Tomando  em  consideração  o  facto  de  esse  fim  anunciado  implicar  alterações na estruturação dos RDFs e na definição dos URIs, o facto de aqui se estar a  lidar com formatos de conteúdos complexos e dependentes de aplicativos para a sua  visualização,  e  a  fim  de  evitar  enormes  custos  ‐  quer  financeiros,  quer  humanos,  e  também  em  termos  de  preservação  digital  destes  ‐  e  mesmo  considerando  que  não  seja  fácil  de  todo  determinar  qual  a  melhor  solução  dada  a  rapidez  da  evolução  tecnológica,  as  opções  possíveis  poderiam  passar  pela  adoção  de  tecnologias  Open  Source  e  formatos  de  visualização  normalizados  e  estáveis,  menos  dependentes  de  fabricantes de software. Para este último, e mesmo considerando as leis de copyright,  a Europeana aqui teria a sua palavra ‐ mesmo recebendo apenas os metadados, é esta 

      

65 Como já referido anteriormente, o seu fim de vida foi anunciado em 2012, a possibilidade do seu uso 

em novas versões de web browsers terminou na primeira metade de 2015 e o fim oficial do suporte da  tecnologia  por  parte  da  Microsoft  está  previsto  para  outubro  de  2021  (fonte: 

instituição  que  acolhe  os  datasets  e  disponibiliza  o  link  para  visualização  das  representações digitais provenientes das instituições aderentes. 

Em  termos  da  apresentação  dos  resultados,  constatou‐se  que  o  SPARQL  Endpoint  utilizado  não  os  apresenta  de  uma  forma  amigável  para  o  utilizador.  Não  sendo  esse  o  intuito  do  presente  estudo  de  caso,  julgou‐se  conveniente  não  envidar  pelo  desenvolvimento  de  uma  interface  de  apresentação  de  resultados  de  pesquisa,  uma vez que esta é considerada uma etapa de um processo complexo, para o qual são  necessários outros meios informáticos e de programação, deixando essa tarefa a cargo  da Europeana, instituição que detém estes meios. 

Conclusão 

Como  nota  final,  com  este  estudo  de  caso  comprovou‐se  a  complexidade  do  procedimento  destinado  ao  tratamento,  adaptação  para  o  modelo  de  dados  EDM  e  reconciliação  dos  dados  do  AH‐OTDU  com  os  datasets  Linked  Data  internacionais  existentes.  

No entanto, cumpre aqui referir a importância de uma eventual participação da  Direção‐Geral  do  Território,  através  do  SNIT/AH‐OTDU,  no  projeto  do  Portal  Europeana, podendo o presente trabalho constituir‐se como um ponto de partida para  um  posterior  desenvolvimento  mais  aprofundado.  Mesmo  tendo  em  consideração  o  esforço  financeiro,  tecnológico  e  humano  que  esta  adesão  possa  implicar,  a  mesma  trará  benefícios,  quer  para  a  instituição,  quer  para  o  utilizador,  e  também  como  contributo para as Humanidades Digitais (Digital Humanities).  

Para  além  de  a  sua  documentação  ficar  descrita  conforme  uma  norma  ou  orientação internacionalmente aceite, a instituição ganha visibilidade além‐fronteiras,  na medida em que a divulgação dos seus fundos é feita através de um portal agregador  europeu.  

Para os utilizadores, principais beneficiários deste projeto, a pesquisa e acesso  digital a estes fundos documentais tornam‐se assim mais fácil e imediato. A partir do  momento  em  que  a  informação  contida  nos  dados  do  AH‐OTDU  esteja  conciliada  e  ligada  com  registos  informativos  de  datasets  de  Linked  Open  Data,  tal  será  outro  benefício  para  os  utilizadores,  na  medida  em  que  estes  já  não  terão  que  saltar  de  motor de pesquisa para outro motor de pesquisa, na senda da informação pretendida.   Por  fim,  e  a  fim  de  ser  possível  compreender  o  percurso  histórico  do  ordenamento  do  território  e  do  desenvolvimento  urbano  português,  salvaguardado  pela Direção‐Geral do Território e suas antecessoras, cumpre referir a importância e a  necessidade de os fundos documentais do AH‐OTDU serem digitalizados e divulgados  online.  Assim,  e  tentando  evitar  ao  máximo  a  existência  de  "coleções  escondidas"  (hidden colections), através de todos estes meios e recursos, será possível preservar a  memória ‐ institucional, comunitária e até mesmo dos direitos e deveres dos cidadãos. 

REFERÊNCIAS BIBLIOGRÁFICAS