• No results found

PARTLY CONCURRING, PARTLY DISSENTING OPINION OF JUDGE PINTO DE ALBUQUERQUE

B. A Convention-oriented constitutional theory of fundamental rights (§§ 81-86)

VI. Conclusion (§§ 91-95)

A representação de vocabulário controlado pode ser realizada por meio de tecnolo- gias como Resource Description Framework (RDF), dados ligados (linked data), Simple

Knowledge Organization System (SKOS) e Web Ontology Language (OWL) 2. Em Gödert, Hubrich e Nagelschmidt(2014), essas tecnologias são denominadas “tecnologias semânticas

para representação de conhecimento” (semantic technologies for knowledge representation).

5.9.1

Resource Description Framework

O Resource Description Framework (RDF) é um arcabouço proposto pelo World

Web Consortium (W3C) para codificação e processamento de metadados. Por meio do

RDF, é possível publicar e interligar informação sobre recursos na World Wide Web. O RDF pode ser usado para descrever recursos em qualquer domínio. Nesse contexto, o termo recurso designa “coisa de interesse”. O RDF pode contribuir na melhoria das capacidades de motores de busca, na descrição e classificação da informação, na descrição de páginas, na descrição de direitos de propriedade intelectual e na interoperabilidade entre aplicações (CAPLAN,2003; LASSILA, 1997; POMERANTZ,2015; YU,2011). Em RDF, informação é representada por enunciados. Um enunciado RDF é denominado tripla. Cada tripla é composta por sujeito, predicado e objeto. Na figura 23, são apresentados elementos em tripla RDF.

Figura 23 – Elementos em tripla RDF

SUJEITO OBJETO

PREDICADO

Fonte: Elaborado pelo autor

Cada tripla representa um fato e define uma relação entre recursos. Em cada tripla, sujeito e objeto são recursos, enquanto o predicado nomeia a relação entre recursos. Triplas podem ser armazenadas em arquivos ou em bases de dados. Bases de dados especialmente desenvolvidas para armazenar triplas são denominadas triple stores. Múltiplas triplas podem formar grafo onde sujeitos e objetos são nós, e predicados são arcos. Por meio desses grafos, é possível estabelecer relações entre metadados. Esses grafos podem ser escritos em vários formatos. Por exemplo, RDF/XML e RDFa. O formato RDF/XML define sintaxe por meio da qual é possível representar grafos RDF como documentos XML, enquanto o RDFa possibilita inserir triplas RDF em documentos HTML. A figura 24 apresenta triplas RDF em um grafo.

Em tripla RDF, nome de recurso pode ser globalmente identificado por meio de

International Resource Identifier (IRI). Um IRI pode ocorrer em qualquer posição de uma

tripla (sujeito, predicado ou objeto). O RDF é neutro quanto a aspectos semânticos e pode ser usado para descrever recursos em qualquer domínio. Para prover informação semântica, podem ser usados vocabulários com o RDF, sendo a definição de vocabulários suportada

Figura 24 – Exemplo de grafo RDF NÓ 2 NÓ 3 NÓ 4 NÓ 6 NÓ 5 NÓ 7 NÓ 1

PREDICADO B PREDICADO C PREDICADO D

PREDICADO E PREDICADO F PREDICADO A TRIPLA RDF

Fonte: Elaborado pelo autor

por RDF Schema. O RDF não define termos para descrever classes de coisas e relações em domínios específicos. Esses termos se originam em vocabulários representados por meio de Simple Knowledge Organization System (SKOS) ou de linguagens como Web Ontology

Language (OWL). Novos vocabulários podem ser definidos ou vocabulários podem ser

reusados. DCMI Metadata Terms, Friend-of-a-Friend (FOAF), Semantically-Interlinked

Online Communities (SIOC), Description of a Project (DOAP), Good Relations Ontology, Creative Commons (CC), Bibliographic Ontology, OAI Object Reuse and Exchange e Review Vocabulary, são alguns vocabulários. Finalmente, nível de popularidade (adoção),

manutenção ativa, cobertura e expressividade são atributos relevantes na seleção de um vocabulário (CHU, 2010; HEATH; BIZER, 2011; HOOLAND; VERBORG, 2014;

SCHREIBER; RAIMOND, 2014;YU, 2011). A título de ilustração, a figura 25 apresenta trecho de código RDF com termos do vocabulário FOAF.

5.9.2

Dados ligados

Dados ligados (linked data) é um modelo composto por práticas para publicar e interligar informação estruturada na World Wide Web. Esse modelo tem o objetivo de facilitar a descoberta e a integração de informação em fontes diversas. A seguir, são listados benefícios desse modelo: possibilidade de formulação de consultas mais expressivas do que comparações entre palavras-chave; uniformização e facilidade de integração devido ao compartilhamento de modelo de representação da informação; possibilidade de recuperar descrições de recursos identificados por Uniform Resource Identifier (URI) via Hypertext

Figura 25 – Exemplo de código RDF com termos do FOAF <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xmlns:foaf="http://xmlns.com/foaf/0.1/"> <foaf:Person> <foaf:name>Fernando Albuquerque</foaf:name> <foaf:title>Mr</foaf:title> <foaf:givenname>Fernando</foaf:givenname> <foaf:family_name>Albuquerque</foaf:family_name> <foaf:mbox rdf:resource="mailto:[email protected]"/> <foaf:homepage rdf:resource="http://cic.unb.br/~fernando/"/> <foaf:workplaceHomepage rdf:resource="http://cic.unb.br"/> </foaf:Person> </rdf:RDF>

Fonte: Elaborado pelo autor

Transfer Protocol (HTTP); promoção de coerência por meio de ligações entre entidades em

diferentes conjuntos de dados; facilidade de publicação e atualização pode reduzir o tempo para disponibilizar informação; flexibilidade, adaptabilidade e eficiência na gestão da informação; eficiência na recuperação e integração da informação; e facilidade de integração de dados em diversas fontes por meio de vocabulários compartilhados. O modelo dados ligados (linked data) adota RDF e mecanismo de acesso padronizado em HTTP, e resulta em espaço de dados estruturado como grafo composto por enunciados RDF (AUER, 2014;

BAUER; KALTENBÖCK, 2012;HEATH; BIZER, 2011).

Berners-Lee (2006) relaciona as seguintes práticas no modelo dados ligados (linked

data): uso de URI como nomes de “coisas”; uso de URI HTTP de modo que as pessoas

possam consultar esses nomes; prover informação usando padrões quando alguém consultar um URI; inclusão de ligações para outros URI de modo a ser possível descobrir mais coisas.

Berners-Lee (2006) também sugere as seguintes fases na transição para o modelo dados ligados (linked data): disponibilização de dados na World Wide Web em qualquer formato, mas com licença aberta; disponibilização de dados estruturados legíveis por máquina; disponibilização de dados estruturados legíveis por máquina em formatos não proprietários; disponibilização de dados segundo o anteriormente exposto, mais uso de padrões W3C para identificar coisas, com o objetivo de possibilitar que as pessoas possam apontar coisas; e disponibilização de dados segundo o anteriormente exposto, mais ligação a dados de outras pessoas para prover contexto.

5.9.3

Simple Knowledge Organization System

A recomendação do World Wide Web Consortium (W3C) denominada Simple

Knowledge Organization System (SKOS) é baseada no RDF e provê modelo para representar

vocabulários controlados estruturados como taxonomias ou tesauros. A recomendação SKOS possibilita a publicação e o uso de vocabulários como dados ligados (linked data). Com ela é possível desenvolver novos vocabulários ou portar vocabulários existentes. Os vocabulários controlados são expressos de modo a torná-los legíveis por máquina e são compostos por conceitos identificados por URI. Também é possível estabelecer relações hierárquicas ou relações associativas entre conceitos. Os vocabulários controlados podem ser representados por agrupamentos de conceitos em esquemas de conceitos, isto é, meios para publicar vocabulário. A interligação de conceitos em diferentes esquemas de conceitos possibilita a construção de uma rede de esquemas de conceitos, assim como o estabelecimento de relações entre conceitos com significados comparáveis (ALLEMANG; HENDLER, 2007; CORCHO; POVEDA-VILLALÓN; GÓMEZ-PÉREZ, 2015; ISAAC; SUMMERS,2009;MILES; BECHHOFER,2009). Finalmente, no quadro7, são listados elementos integrantes do vocabulário SKOS.

Quadro 7 – Elementos do vocabulário SKOS

DESCRIÇÃO URI DESCRIÇÃO URI

Classe Concept skos:Concept Relações semânticas skos:broader Esquemas de conceitos skos:ConceptScheme skos:broaderTransitive

skos:inScheme skos:narrower

skos:hasTopConcept skos:narrowerTransitive skos:topConceptOf skos:related

Rótulos (labels) léxicos skos:altLabel skos:semanticRelation skos:hiddenLabel Coleções de conceitos skos:Collection skos:prefLabel skos:OrderedCollection

Notações skos:notation skos:member

Propriedades de documentação skos:changeNote skos:memberList skos:definition Propriedades de mapeamento skos:broadMatch skos:editorialNote skos:closeMatch skos:example skos:exactMatch skos:historyNote skos:mappingRelation

skos:note skos:narrowMatch

skos:scopeNote skos:relatedMatch

Fonte: Adaptado de Miles e Bechhofer (2009)

Taxonomias e tesauros podem ser implementados como vocabulários Simple Kno-

wledge Organization System (SKOS) com o objetivo de possibilitar sua publicação como

usados em diversas situações e atender necessidades semânticas de diversas organizações e sistemas de recuperação da informação. Por exemplo, a implementação de um tesauro como SKOS possibilita que ele reuse conjuntos de dados (data set) disponíveis na nuvem

Linked Open Data (LOD) e que seja publicado e ligado a essa nuvem como triplas RDF,

promovendo uso, validação e expansão. A estrutura de um tesauro SKOS é composta pelos seguintes níveis: nível conceitual, nível em que são identificados conceitos e são estabelecidas relações; nível de correspondência terminológica, nível em que termos são associados a conceitos; nível léxico, nível em que relações são definidas com o objetivo de interconectar termos (AMERI; URBANOVSKY; MCARTHUR, 2012; CARACCIOLO et al., 2012).

5.9.4

Web Ontology Language

Entre as linguagens para representar ontologias, se encontra Web Ontology Language (OWL) 2. Nesse contexto, uma ontologia é um conjunto de enunciados sobre um domínio de interesse, é composta por classes, propriedades e relações. A partir dos enunciados, podem ser realizadas inferências. Os objetos são denominados instâncias, as categorias são denominadas classes e as relações são denominadas propriedades. As classes podem ser organizadas em hierarquias e classes complexas podem ser descritas a partir de outras classes. Também é possível descrever uma classe por meio da enumeração dos indivíduos dessa classe (HITZLER et al.,2012;YU, 2011). Sobre o uso de linguagens para representar ontologias, Oren et al. (2006) destaca que apenas o uso delas não resulta em termos ontológicos, que uma ontologia denota um entendimento compartilhado, que uma linguagem para representar ontologias pode ser usada para capturar esse entendimento, mas antes é necessário alcançar esse entendimento.