• No results found

5. Empiri - funn og diskusjon

5.2 Kvalitativt forskningsintervju

5.2.1 Endring som evolusjon

5.2.1.3 Beslutninger

Atualmente a grande dificuldade encontrada com as ferramentas de busca é a recuperação eficiente e precisa da informação, pois as ferramentas de busca não conseguem interpretar palavras em um determinado contexto, não sendo possível o entendimento do significado do conteúdo de um recurso informacional. Na Web Semântica a arquitetura proposta visa promover uma estruturação do conteúdo dos recursos, viabilizando uma maior definição semântica dos dados representados. Desta forma é possível criar um ambiente que utilize linguagens computacionais, agentes de software e instrumentos de metadados que possam realizar tarefas mais refinadas para recuperação de informações mais precisas a partir de processamentos semânticos.

A arquitetura da Web Semântica do ponto de vista da área da Ciência da Informação é representada no “espectro funcional” de forma que detalhes técnicos são omitidos para facilitar a compreensão desta arquitetura, conforme Figura 4.

Figura 4: Espectro Funcional da Arquitetura da Web Semântica

Fonte: figura elaborada pela autora.

A camada estrutural permite identificar cada recurso de forma padronizada e única possibilitando meios seguros de transmissão e armazenamento das informações.

Na camada sintática devemos fazer a descrição desses recursos, ou seja, deve-se definir e validar as regras sintáticas formalmente a fim de propor uma estruturação dos recursos informacionais. Um exemplo clássico aplicado à área da Ciência da Informação se refere às práticas de catalogação e indexação, que são de grande valia para o projeto da Web Semântica.

Na camada semântica são desenvolvidos vocabulários e sistemas de conceitos que definem as relações para que na camada lógica as regras possam ser interpretadas por agentes computacionais, possibilitando realizar inferências automaticamente e verificar o nível de coerência lógica dos recursos informacionais.

Na área da Ciência da Informação a representação do conhecimento através de tesauros, listas de cabeçalhos, taxonomias, dentre outros, permite o desenvolvimento de ontologias promovendo a representação formal dos relacionamentos existentes entre termos e conceitos (vocabulários) de forma mais sofisticada, (SOUZA e ALVARENGA, 2004). Desta forma para que a Web Semântica se concretize é necessária a utilização intensiva de lógicas computacionais, para que na camada de confiança possamos comprovar que os aspectos semânticos dos recursos informacionais estão corretamente descritos a fim de termos um grau de confiança das informações apresentadas, além de atender todos os requisitos das camadas anteriores.

Segundo W3C (2004) o “link desses dados é possível com tecnologias como RDF (Resource Description Framework), SPARQL (SPARQL Protocol And RDF Query Language), OWL (Web Ontology Language), dentre outras”, conforme Figura 5.

Figura 5: tecnologias que compõem a estrutura Web Semântica

Fonte: elaborada pela autora.

Uma descrição mais detalhada dos componentes da Web Semântica compreendem as normas e ferramentas para XML, Esquema XML, RDF e OWL que estão organizados numa arquitetura própria denominada Semantic Web Cake (Torta da Web Semântica) representada, na sua forma já clássica, na Figura 6.

Figura 6: Arquitetura da Web Semântica proposta em 2005 – W3C

Fonte: figura adaptada de Berners-Lee, 2005, p. 17.

As funções e relações entre os componentes apresentados na figura 6 encontram-se em World Wide Web Consortium (W3C, 2004), conforme segue:

 URI (Uniform Resource Identifier) pode ser utilizado para identificar pessoas, lugares, instituições, dentre outros na web. Trata-se do Identificador Único de Recursos que possibilita a definição de nomes aos recursos e seus respectivos endereços na Internet.  UNICODE é o esquema padrão de codificação dos caracteres, que diminui

consideravelmente a possibilidade de redundâncias dos dados, pois funciona independentemente da plataforma utilizada. Trata-se de um esquema padronizado de codificação de caracteres acessível a qualquer sistema computacional (utiliza formato texto).

 XML (Extensible Markup Language) permite uma descrição de regras sintáticas (relações entre palavras) para análise e validação de recursos. Trata-se de uma linguagem computacional que possibilita estruturar dados por meio da definição de elementos e atributos; é uma linguagem de marcação que permite flexibilidade na estruturação de dados. Os namespaces são uma coleção de nomes identificados por um URI (Uniform Resource Identifier) utilizados para validar elementos e atributos em um documento

XML. Ao contrário da linguagem HTML, XML não apresenta uma estrutura de tags (etiquetas) pré-definidas possibilitando, portanto, ao desenvolvedor rotular dados da maneira que for conveniente. Em resumo, trata-se de uma linguagem universal que permite a troca de informações entre diferentes sistemas computacionais, porém não se apresenta como meio eficiente de empregar significados semânticos aos dados. Para delimitar a estrutura e o conteúdo dos elementos contidos nos documentos XML utiliza- se a linguagem XML Schema.

 RDF (Resource Description Framework - Estrutura de Descrição de Recursos) é uma linguagem simples para expressar modelos de dados que se referem a objetos e a suas relações, permitindo a representação de classes. Um modelo baseado em RDF pode ser representado em uma sintaxe XML. Um vocabulário para propriedades e classes de recursos baseados em RDF pode ser descrito com RDF Schema.

 OWL (Web Ontology Language) é a linguagem computacional para o desenvolvimento de ontologias recomendada pelo W3C. Esta linguagem permite descrever formalmente aspectos semânticos dos termos utilizados e suas relações.

 SPARQL (SPARQL Protocol And RDF Query Language) é um protocolo e linguagem de busca para fontes de dados da Web Semântica. Trata-se de uma linguagem para realizar consultas a partir de estruturas RDF com o objetivo de facilitar a recuperação das informações.

 RIF (Rule Interchange Format) - Regra do Formato de Intercâmbio – recomendado pelo W3C é parte da estrutura da Web Semântica juntamente com SPARQL, RDF e OWL. Trata-se do intercâmbio de um conjunto de regras na camada semântica da web. A intenção é reforçar a usabilidade e a utilidade da web e de seus recursos interconectados.  Criptografia consiste de um processo em que as informações são cifradas de modo que

não possam ser interpretadas por qualquer pessoa ou sistema computacional, garantindo assim a confidencialidade das informações.

A Web Semântica está em constante desenvolvimento, de forma que muitas das tecnologias apresentadas são passíveis de modificações devendo atender a padronização a fim de contemplar todas as camadas propostas em sua arquitetura. Apesar de modificações que possam ocorrer, devido inclusive a evolução das tecnologias, é importante manter os

conceitos básicos que norteiam a proposta da Web Semântica (GÓMEZ-PÉREZ e MANZANO-MACHO, 2003).

Soergel (2002) propõem um modelo que se utiliza de linguagens e padrões compatíveis com a web semântica, tais como a Resource Description Framework Schema (RDFS) ou a Extensible Markup Language (XML). Furgeri (2006, p. 237) complementa afirmando que com a RDFS é possível definir os termos (as triplas) que serão usados nas declarações dos documentos RDFS, ou seja, é uma forma de criar o vocabulário controlado estabelecendo relações e restrições entre os recursos (regras e restrições que devem ser seguidas pelos documentos RDF).

Segundo os autores o RDFS possui um modelo de representação simples e flexível, que utiliza conectivos lógicos, de negação, disjunção e conjunção, permitindo a interpretação semântica do conhecimento. Já a linguagem XML é autodescritiva, flexível e normalmente é utilizada para representar dados e troca de informações em várias áreas do conhecimento.

Conforme modelo proposto por Soergel (1999) o uso destas linguagens permite que os relacionamentos sejam armazenados em uma base de dados em todos os níveis de entidades (conceitos, termos, strings e notas). Dessa forma, é possível formalizar as características de cada entidade, de maneira explícita, permitindo que as restrições de integridade sejam mantidas.

Com esta formalização cada entidade pode ser identificada por um Unique Resource Identifier (URI), ou seja, trata-se de um conjunto de caracteres que permite a identificação ou denominação de um recurso informacional na web viabilizando a interação através de recursos específicos. Desta forma o uso de identificadores codifica cada entidade, evitando-se falsos relacionamentos entre eles.