PARTLY CONCURRING, PARTLY DISSENTING OPINION OF JUDGE PINTO DE ALBUQUERQUE
B. A Convention-oriented constitutional theory of fundamental rights (§§ 81-86)
VI. Conclusion (§§ 91-95)
A representação de vocabulário controlado pode ser realizada por meio de tecnolo- gias como Resource Description Framework (RDF), dados ligados (linked data), Simple
Knowledge Organization System (SKOS) e Web Ontology Language (OWL) 2. Em Gödert, Hubrich e Nagelschmidt(2014), essas tecnologias são denominadas “tecnologias semânticas
para representação de conhecimento” (semantic technologies for knowledge representation).
5.9.1
Resource Description Framework
O Resource Description Framework (RDF) é um arcabouço proposto pelo World
Web Consortium (W3C) para codificação e processamento de metadados. Por meio do
RDF, é possível publicar e interligar informação sobre recursos na World Wide Web. O RDF pode ser usado para descrever recursos em qualquer domínio. Nesse contexto, o termo recurso designa “coisa de interesse”. O RDF pode contribuir na melhoria das capacidades de motores de busca, na descrição e classificação da informação, na descrição de páginas, na descrição de direitos de propriedade intelectual e na interoperabilidade entre aplicações (CAPLAN,2003; LASSILA, 1997; POMERANTZ,2015; YU,2011). Em RDF, informação é representada por enunciados. Um enunciado RDF é denominado tripla. Cada tripla é composta por sujeito, predicado e objeto. Na figura 23, são apresentados elementos em tripla RDF.
Figura 23 – Elementos em tripla RDF
SUJEITO OBJETO
PREDICADO
Fonte: Elaborado pelo autor
Cada tripla representa um fato e define uma relação entre recursos. Em cada tripla, sujeito e objeto são recursos, enquanto o predicado nomeia a relação entre recursos. Triplas podem ser armazenadas em arquivos ou em bases de dados. Bases de dados especialmente desenvolvidas para armazenar triplas são denominadas triple stores. Múltiplas triplas podem formar grafo onde sujeitos e objetos são nós, e predicados são arcos. Por meio desses grafos, é possível estabelecer relações entre metadados. Esses grafos podem ser escritos em vários formatos. Por exemplo, RDF/XML e RDFa. O formato RDF/XML define sintaxe por meio da qual é possível representar grafos RDF como documentos XML, enquanto o RDFa possibilita inserir triplas RDF em documentos HTML. A figura 24 apresenta triplas RDF em um grafo.
Em tripla RDF, nome de recurso pode ser globalmente identificado por meio de
International Resource Identifier (IRI). Um IRI pode ocorrer em qualquer posição de uma
tripla (sujeito, predicado ou objeto). O RDF é neutro quanto a aspectos semânticos e pode ser usado para descrever recursos em qualquer domínio. Para prover informação semântica, podem ser usados vocabulários com o RDF, sendo a definição de vocabulários suportada
Figura 24 – Exemplo de grafo RDF NÓ 2 NÓ 3 NÓ 4 NÓ 6 NÓ 5 NÓ 7 NÓ 1
PREDICADO B PREDICADO C PREDICADO D
PREDICADO E PREDICADO F PREDICADO A TRIPLA RDF
Fonte: Elaborado pelo autor
por RDF Schema. O RDF não define termos para descrever classes de coisas e relações em domínios específicos. Esses termos se originam em vocabulários representados por meio de Simple Knowledge Organization System (SKOS) ou de linguagens como Web Ontology
Language (OWL). Novos vocabulários podem ser definidos ou vocabulários podem ser
reusados. DCMI Metadata Terms, Friend-of-a-Friend (FOAF), Semantically-Interlinked
Online Communities (SIOC), Description of a Project (DOAP), Good Relations Ontology, Creative Commons (CC), Bibliographic Ontology, OAI Object Reuse and Exchange e Review Vocabulary, são alguns vocabulários. Finalmente, nível de popularidade (adoção),
manutenção ativa, cobertura e expressividade são atributos relevantes na seleção de um vocabulário (CHU, 2010; HEATH; BIZER, 2011; HOOLAND; VERBORG, 2014;
SCHREIBER; RAIMOND, 2014;YU, 2011). A título de ilustração, a figura 25 apresenta trecho de código RDF com termos do vocabulário FOAF.
5.9.2
Dados ligados
Dados ligados (linked data) é um modelo composto por práticas para publicar e interligar informação estruturada na World Wide Web. Esse modelo tem o objetivo de facilitar a descoberta e a integração de informação em fontes diversas. A seguir, são listados benefícios desse modelo: possibilidade de formulação de consultas mais expressivas do que comparações entre palavras-chave; uniformização e facilidade de integração devido ao compartilhamento de modelo de representação da informação; possibilidade de recuperar descrições de recursos identificados por Uniform Resource Identifier (URI) via Hypertext
Figura 25 – Exemplo de código RDF com termos do FOAF <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xmlns:foaf="http://xmlns.com/foaf/0.1/"> <foaf:Person> <foaf:name>Fernando Albuquerque</foaf:name> <foaf:title>Mr</foaf:title> <foaf:givenname>Fernando</foaf:givenname> <foaf:family_name>Albuquerque</foaf:family_name> <foaf:mbox rdf:resource="mailto:[email protected]"/> <foaf:homepage rdf:resource="http://cic.unb.br/~fernando/"/> <foaf:workplaceHomepage rdf:resource="http://cic.unb.br"/> </foaf:Person> </rdf:RDF>
Fonte: Elaborado pelo autor
Transfer Protocol (HTTP); promoção de coerência por meio de ligações entre entidades em
diferentes conjuntos de dados; facilidade de publicação e atualização pode reduzir o tempo para disponibilizar informação; flexibilidade, adaptabilidade e eficiência na gestão da informação; eficiência na recuperação e integração da informação; e facilidade de integração de dados em diversas fontes por meio de vocabulários compartilhados. O modelo dados ligados (linked data) adota RDF e mecanismo de acesso padronizado em HTTP, e resulta em espaço de dados estruturado como grafo composto por enunciados RDF (AUER, 2014;
BAUER; KALTENBÖCK, 2012;HEATH; BIZER, 2011).
Berners-Lee (2006) relaciona as seguintes práticas no modelo dados ligados (linked
data): uso de URI como nomes de “coisas”; uso de URI HTTP de modo que as pessoas
possam consultar esses nomes; prover informação usando padrões quando alguém consultar um URI; inclusão de ligações para outros URI de modo a ser possível descobrir mais coisas.
Berners-Lee (2006) também sugere as seguintes fases na transição para o modelo dados ligados (linked data): disponibilização de dados na World Wide Web em qualquer formato, mas com licença aberta; disponibilização de dados estruturados legíveis por máquina; disponibilização de dados estruturados legíveis por máquina em formatos não proprietários; disponibilização de dados segundo o anteriormente exposto, mais uso de padrões W3C para identificar coisas, com o objetivo de possibilitar que as pessoas possam apontar coisas; e disponibilização de dados segundo o anteriormente exposto, mais ligação a dados de outras pessoas para prover contexto.
5.9.3
Simple Knowledge Organization System
A recomendação do World Wide Web Consortium (W3C) denominada Simple
Knowledge Organization System (SKOS) é baseada no RDF e provê modelo para representar
vocabulários controlados estruturados como taxonomias ou tesauros. A recomendação SKOS possibilita a publicação e o uso de vocabulários como dados ligados (linked data). Com ela é possível desenvolver novos vocabulários ou portar vocabulários existentes. Os vocabulários controlados são expressos de modo a torná-los legíveis por máquina e são compostos por conceitos identificados por URI. Também é possível estabelecer relações hierárquicas ou relações associativas entre conceitos. Os vocabulários controlados podem ser representados por agrupamentos de conceitos em esquemas de conceitos, isto é, meios para publicar vocabulário. A interligação de conceitos em diferentes esquemas de conceitos possibilita a construção de uma rede de esquemas de conceitos, assim como o estabelecimento de relações entre conceitos com significados comparáveis (ALLEMANG; HENDLER, 2007; CORCHO; POVEDA-VILLALÓN; GÓMEZ-PÉREZ, 2015; ISAAC; SUMMERS,2009;MILES; BECHHOFER,2009). Finalmente, no quadro7, são listados elementos integrantes do vocabulário SKOS.
Quadro 7 – Elementos do vocabulário SKOS
DESCRIÇÃO URI DESCRIÇÃO URI
Classe Concept skos:Concept Relações semânticas skos:broader Esquemas de conceitos skos:ConceptScheme skos:broaderTransitive
skos:inScheme skos:narrower
skos:hasTopConcept skos:narrowerTransitive skos:topConceptOf skos:related
Rótulos (labels) léxicos skos:altLabel skos:semanticRelation skos:hiddenLabel Coleções de conceitos skos:Collection skos:prefLabel skos:OrderedCollection
Notações skos:notation skos:member
Propriedades de documentação skos:changeNote skos:memberList skos:definition Propriedades de mapeamento skos:broadMatch skos:editorialNote skos:closeMatch skos:example skos:exactMatch skos:historyNote skos:mappingRelation
skos:note skos:narrowMatch
skos:scopeNote skos:relatedMatch
Fonte: Adaptado de Miles e Bechhofer (2009)
Taxonomias e tesauros podem ser implementados como vocabulários Simple Kno-
wledge Organization System (SKOS) com o objetivo de possibilitar sua publicação como
usados em diversas situações e atender necessidades semânticas de diversas organizações e sistemas de recuperação da informação. Por exemplo, a implementação de um tesauro como SKOS possibilita que ele reuse conjuntos de dados (data set) disponíveis na nuvem
Linked Open Data (LOD) e que seja publicado e ligado a essa nuvem como triplas RDF,
promovendo uso, validação e expansão. A estrutura de um tesauro SKOS é composta pelos seguintes níveis: nível conceitual, nível em que são identificados conceitos e são estabelecidas relações; nível de correspondência terminológica, nível em que termos são associados a conceitos; nível léxico, nível em que relações são definidas com o objetivo de interconectar termos (AMERI; URBANOVSKY; MCARTHUR, 2012; CARACCIOLO et al., 2012).
5.9.4
Web Ontology Language
Entre as linguagens para representar ontologias, se encontra Web Ontology Language (OWL) 2. Nesse contexto, uma ontologia é um conjunto de enunciados sobre um domínio de interesse, é composta por classes, propriedades e relações. A partir dos enunciados, podem ser realizadas inferências. Os objetos são denominados instâncias, as categorias são denominadas classes e as relações são denominadas propriedades. As classes podem ser organizadas em hierarquias e classes complexas podem ser descritas a partir de outras classes. Também é possível descrever uma classe por meio da enumeração dos indivíduos dessa classe (HITZLER et al.,2012;YU, 2011). Sobre o uso de linguagens para representar ontologias, Oren et al. (2006) destaca que apenas o uso delas não resulta em termos ontológicos, que uma ontologia denota um entendimento compartilhado, que uma linguagem para representar ontologias pode ser usada para capturar esse entendimento, mas antes é necessário alcançar esse entendimento.