9 Et stabilt klima og ren luft
9.3 Langtransporterte
A eventual imaturidade do software Open Refine poderá ter contribuído para estes resultados. É um software em constante desenvolvimento, recebendo por isso bastantes incrementos, alterações e adaptações. Pesa aqui também o facto de facto de ser software Open Source ‐ desenvolvido menos para o mercado mas mais a nível académico, tendo em vista a sua fruição pelas instituições culturais, conhecidas pelos seus fracos recursos financeiros no que toca à divulgação dos seus acervos e fundos culturais.
Quanto ao modelo de dados EDM, mesmo lançado em 2012, também se encontra em desenvolvimento. No entanto, é de frisar que a Europeana detém outros meios para adaptar os dados que recebe das instituições culturais. Mesmo solicitando a estas que os seus dados sejam remetidos já conformes com este modelo recente, a própria Europeana detém meios informáticos e de programação próprios, que possibilitam a correta integração destes nos seus datasets, para divulgação no seu Portal. Determinadas classes e propriedades deste modelo de dados só conseguem ser aplicadas nos dados recebidos pela própria Europeana, após essa integração.
De frisar que, no decurso dos testes dos RDFs das amostragens no SPARQL Endpoint já referido, foi estabelecido contacto com o sector de desenvolvimento informático da Europeana, a fim de indagar da disponibilização de um motor de pesquisa / SPARQL Endpoint para os mesmos. Foi obtida resposta da inexistência deste, mas verificou‐se, em meados de agosto do corrente ano, que a Europeana disponibiliza online um SPARQL Endpoint, mas mais destinado à pesquisa dos dados já integrados nas suas bases de dados.
Outro fator tido em conta foi a falta de datasets de dados Linked Open Data, contendo registos de dados culturais portugueses, como foi verificado aquando da fase de reconciliação dos dados das amostragens dos fundos documentais do AH‐OTDU com os datasets internacionais (Freebase, DBPedia e Sindice). Tendo em atenção que, no presente momento, o Portal Europeana divulga bastantes recursos culturais
portugueses61, foi feita uma pesquisa pelas entidades do estudo em apreço, mais focado nos autores de projetos OTDU contemplados nas amostragens ‐ donde nada resultou.
Neste sentido, cumpre aqui referir que, quer o motor de pesquisa inter‐ repositórios online disponibilizado através do Portal Português de Arquivos (PPA)62, quer o motor de pesquisa online do Ficheiro Nacional de Autoridades Arquivísticas (FNAA)63 se encontram desativados, não possibilitando por isso a eventual recolha de informação e links para integração no ficheiro RDF "Autores_OTDU". É importante salientar o potencial contributo que estes dois projetos de divulgação online de fundos documentais portugueses (ou os seus sucedâneos) poderão vir a ter no futuro como motores de disseminação de dados Linked Open Data.
A mesma situação se verificou com o dataset disponibilizado pelo Geonames.org ‐ a sua ligação deverá ser possível através do Portal Europeana, após integração dos dados AH‐OTDU nesta e processamento de reconciliação.
No que reporta à utilização das normas de descrição arquivística internacionais, e como já referido anteriormente, a ISAD(G) é uma norma que contém regras gerais para a descrição arquivística, podendo estas serem aplicadas independentemente da forma ou do suporte dos documentos e serem adaptadas às necessidades específicas das instituições. No entanto, e visando a reconciliação de dados Linked Data através do software Open Refine, provou‐se ser mais fácil adaptar os campos de descrição originais dos fundos documentais que já detinham registos na BD AH‐OTDU (ex: IGT ‐ peças desenhadas e peças escritas) e na BD‐EUC do que os campos de descrição dos fundos documentais que foram feitos de origem conforme as ISAD(G) e as ODA (ex: fotografias dos álbuns fotográficos). 61 Em consulta feita em 25 de Agosto de 2015, O Portal Europeana disponibilizava online 42459 registos (by providing country), na sua maioria provenientes do Registo Nacional de Objectos Digitais (RNOD), da Fundação Calouste Gulbenkian e da EuropeanaLocal ‐ Portugal. 62 Integrado na Rede Portuguesa de Arquivos (RPA), gerido pela DGLAB. O seu acesso faz‐se através do
link http://portal.arquivos.pt/, mas este encontra‐se desativado (consultado a 25 Ago. 2015).
63
O seu acesso faz‐se através do link http://autoridades.arquivos.pt/, mas o mesmo encontra‐se desativado (consultado a 25 Ago. 2015).
Tendo em atenção de que o alerta para a necessidade de se ter de recorrer à granularidade e subdivisão de campos de descrição já se encontra referida na terceira versão das ODA64, nos casos das amostragens feitas com as ISAD(G), viu‐se a necessidade de proceder à atomização de alguns campos. Por exemplo, foi necessário subdividir o campo de descrição "Coverage" nos campos "País", "Distrito", "Município" e "Localidade" ‐ o que facilitou a reconciliação com outros datasets. Com a informação concentrada num só campo (como ocorria no campo "coverage"), no processo de reconciliação provou‐se ser difícil o seu reconhecimento de dados pelo software.
Ainda no contexto deste estudo de caso, e visando uma melhoria de resultados nos processos de reconciliação de dados Linked Data, recomenda‐se a criação de webpages que detenham as informações das unidades de instalação / documentos compostos respeitantes aos processos dos fundos documentais em apreço, reconhecidas pela Europeana como landing pages. Como já referido, existindo uma webpage própria para cada processo (ex: um Plano), onde estariam replicados os links para as suas peças processuais (ex: peças desenhadas e peças escritas), à semelhança do que ocorre no formato analógico, seria assim mais fácil estruturar um ficheiro RDF e serviço de reconciliação próprio que eventualmente pudesse estabelecer ligações com outros datasets. Esta autonomização beneficiaria os utilizadores, no sentido que estes não só teriam a informação respeitante aos níveis da estrutura da descrição (conforme indicados pelas ODA) e organização da documentação, como também veriam esta replicada na apresentação dos resultados de pesquisa, facilitando assim a sua navegação e pesquisa por correspondentes linked data dentro destas landing pages.
Neste estudo de caso, viu‐se a necessidade de lidar com fontes de informação variadas e distintas umas das outras, face às características próprias de cada fundo documental pertencente ao AH‐OTDU. Dessas características ressalta o facto de alguns dizerem respeito a processos de arquitetura, urbanismo e obras (IGT e EUC), outros respeitarem apenas a coleções fotográficas (os álbuns fotográficos e as fotografias
64 ODA, v.3, pg. 26: "Na prática, verifica‐se que uma maior granularidade de informação descritiva
contribui para a uma maior precisão, consistência, coerência e normalização da descrição. (…) Uma maior granularidade permite igualmente taxas mais efetivas de recuperação de informação pertinente, sobretudo tendo em conta a possibilidade de combinação, na pesquisa, de diferentes campos, bem como a possibilidade de ordenação das ocorrências recuperadas."
aéreas) e ainda os fundos bibliográficos. É também de salientar que nem todos os fundos documentais se encontravam descritos, e naqueles que já detinham registos de descrição, estes não cumpriam o estipulado nas normas de descrição já referidas, havendo até casos de falta de campos de descrição ditos fundamentais (ex. a indicação dos autores). Neste sentido, e visando a conciliação destes universos informativos diferentes e a seguir o modelo de dados EDM, foi necessária a criação de tabelas e ficheiros RDF auxiliares (ex. Autores_OTDU), feitos manualmente, uma vez que não era possível o alinhamento da sua informação com os datasets Linked Data já referidos.
Outra recomendação a sugerir é a adoção de soluções tecnológicas menos dadas à obsolescência a curto e médio prazo e conducentes a uma maior interoperabilidade. Isto prende‐se com o facto de o SNIT/AH‐OTDU recorrer à tecnologia Silverlight, tecnologia esta que já não é suportada por algumas versões de web browsers mais recentes, e para a qual já existe um fim anunciado para o seu suporte65. Uma vez que o campo de descrição "LinkZoom" é de grande importância, dado que é por este link que se tem acesso à visualização da representação digital da peça documental pretendida, julga‐se necessário envidar esforços ou determinar outros formatos de visualização mais duradouros antes da submissão destes dados à Europeana. Tomando em consideração o facto de esse fim anunciado implicar alterações na estruturação dos RDFs e na definição dos URIs, o facto de aqui se estar a lidar com formatos de conteúdos complexos e dependentes de aplicativos para a sua visualização, e a fim de evitar enormes custos ‐ quer financeiros, quer humanos, e também em termos de preservação digital destes ‐ e mesmo considerando que não seja fácil de todo determinar qual a melhor solução dada a rapidez da evolução tecnológica, as opções possíveis poderiam passar pela adoção de tecnologias Open Source e formatos de visualização normalizados e estáveis, menos dependentes de fabricantes de software. Para este último, e mesmo considerando as leis de copyright, a Europeana aqui teria a sua palavra ‐ mesmo recebendo apenas os metadados, é esta
65 Como já referido anteriormente, o seu fim de vida foi anunciado em 2012, a possibilidade do seu uso
em novas versões de web browsers terminou na primeira metade de 2015 e o fim oficial do suporte da tecnologia por parte da Microsoft está previsto para outubro de 2021 (fonte:
instituição que acolhe os datasets e disponibiliza o link para visualização das representações digitais provenientes das instituições aderentes.
Em termos da apresentação dos resultados, constatou‐se que o SPARQL Endpoint utilizado não os apresenta de uma forma amigável para o utilizador. Não sendo esse o intuito do presente estudo de caso, julgou‐se conveniente não envidar pelo desenvolvimento de uma interface de apresentação de resultados de pesquisa, uma vez que esta é considerada uma etapa de um processo complexo, para o qual são necessários outros meios informáticos e de programação, deixando essa tarefa a cargo da Europeana, instituição que detém estes meios.
Conclusão
Como nota final, com este estudo de caso comprovou‐se a complexidade do procedimento destinado ao tratamento, adaptação para o modelo de dados EDM e reconciliação dos dados do AH‐OTDU com os datasets Linked Data internacionais existentes.
No entanto, cumpre aqui referir a importância de uma eventual participação da Direção‐Geral do Território, através do SNIT/AH‐OTDU, no projeto do Portal Europeana, podendo o presente trabalho constituir‐se como um ponto de partida para um posterior desenvolvimento mais aprofundado. Mesmo tendo em consideração o esforço financeiro, tecnológico e humano que esta adesão possa implicar, a mesma trará benefícios, quer para a instituição, quer para o utilizador, e também como contributo para as Humanidades Digitais (Digital Humanities).
Para além de a sua documentação ficar descrita conforme uma norma ou orientação internacionalmente aceite, a instituição ganha visibilidade além‐fronteiras, na medida em que a divulgação dos seus fundos é feita através de um portal agregador europeu.
Para os utilizadores, principais beneficiários deste projeto, a pesquisa e acesso digital a estes fundos documentais tornam‐se assim mais fácil e imediato. A partir do momento em que a informação contida nos dados do AH‐OTDU esteja conciliada e ligada com registos informativos de datasets de Linked Open Data, tal será outro benefício para os utilizadores, na medida em que estes já não terão que saltar de motor de pesquisa para outro motor de pesquisa, na senda da informação pretendida. Por fim, e a fim de ser possível compreender o percurso histórico do ordenamento do território e do desenvolvimento urbano português, salvaguardado pela Direção‐Geral do Território e suas antecessoras, cumpre referir a importância e a necessidade de os fundos documentais do AH‐OTDU serem digitalizados e divulgados online. Assim, e tentando evitar ao máximo a existência de "coleções escondidas" (hidden colections), através de todos estes meios e recursos, será possível preservar a memória ‐ institucional, comunitária e até mesmo dos direitos e deveres dos cidadãos.