A solução da Web Semântica consiste em aplicar tecnologias avançadas de conhecimento para preencher a lacunas de saber entre o homem e máquina.Vamos dar alguns exemplos do porquê as pesquisas nem sempre retornarem o resultado desejado. - Suponha que você queira achar uma descrição resumida da vida do Apóstolo São Paulo na Bíblia. Provavelmente, você entrará com o argumento => “São Paulo”, e normalmente você receberá como resposta, por exemplo, do Google prontamente em 0,05 segundos, com119.000.000 documentos, na primeira página:
São Paulo => Cidade de São Paulo
São Paulo Futebol Clube
Prefeitura da Cidade de São Paulo etc ...
Figura 19. Pesquisa pela palavra-chave São Paulo
Bem, essa não era a pergunta que eu queria fazer. Um outro exemplo seria recuperar a imagem de Paris Hilton, a herdeira da fortuna Hilton que não apenas é famosa pelo seu patrimônio como também pela sua excentricidade. Podemos ir para pesquisa de imagem da Google e o mais lógico seria teclar: “Paris foto”, novamente o que nós vamos achar depois de 0,10 seg, com 11milhões e 600 mil documentos e fotos como resposta, na primeira página, com seguinte formato:
Argumento de
Pesquisa
Figura 20. Pesquisa pela palavra-chave paris foto
Vamos apreciar muitas imagens da Cidade Luz, a eterna cidade de Paris. Novamente, o Google não conseguiu entender o que quis dizer.
Um terceiro exemplo seria achar um notebook com pelo menos 4GB de memória (que eventualmente poderia ser um netbook). Podemos começar com o argumento de pesquisa “notebook”, “4GB”. O problema que o buscador tem é saber se exatamente 4GB serve, ou se mais de 4GB também serve, ou, ainda, se o notebook tem mais que 4GB de HD (já que praticamente todos os notebooks hoje satisfazem essa condição). Essa pesquisa normalmente retorna os notebooks de 4GB, pois o algoritmo de busca tem muita dificuldade de interpretar as informações como maior, menor, meia-idade etc. Os algoritmos são muito bons para um dado exato, no entanto, quando precisamos que haja interpretação do contexto implícito, o buscador não dispõe de recursos para essa tarefa. Podemos concluir nesse momento que há um hiato entre o conhecimento humano e o conhecimento do computador e chamamos esse hiato de Lacuna do Conhecimento (Knowledge Gap em inglês).
Há outro componente que designamos de Conhecimento do Contexto (Backgroud Knowledge em Inglês) que, em geral, está totalmente ausente nas páginas Web. No caso, se o computador tentar inferir (há programas que tentam fazê-lo), por exemplo, ele poderá usar as pesquisas anteriores para chegar ao resultado, e o resultado poderá ser positivo ou não. Na pesquisa da imagem, com Paris – cidade, a pesquisa foi considerada errada, pois deveríamos ter fornecido também a palavra chave Hilton, e, dependendo do algoritmo, a resposta mais adequada (na opinião da máquina) poderia ter sido os Hotéis Hilton de Paris. Responder a esse tipo de questão, exige da máquina uma outra forma de solucionar esse tipo de ambigüidade. A Web Semântica é uma iniciativa para tratar esse tipo de problema.
A idéia principal do uso da Web Semântica é aplicar as tecnologias avançadas do conhecimento para preencher as lacunas de conhecimento que existem entre homem e máquina. Em outras palavras, é fornecer ao computador “conhecimento” que que possa fazê-lo entender e processar as informações que o ser humano está tentando passar para a máquina. A resposta esperada provavelmente está no conteúdo das páginas Web, mas a dificuldade reside no fato de que a recuperação dessas informações depende do contexto que cerca o ser humano. Dados adicionais têm que ser fornecidos para que a respostas possam ser retornadas dentro da expectativa do usuário.
De acordo com Pollock (2009) loc 384 of 8804, nós podemos olhar para a Web
Semântica sob quatro perspectivas diferentes: - Como um avanço da Web / Internet de hoje (2.0)
- Como uma tecnologia de metadados para software de negócios - Como um movimento social pró dados open-source
- Como uma nova geração de Inteligência Artificial
Talvez haja verdades em cada uma das visões, mas cada uma delas tem foco em audiências diferentes e facetas diferentes do que seja a Web Semântica.
O projeto Amigo-De-Um-Amigo (Friend-of-a-Friend) (FOAF, 2000) é uma revisão do projeto original de Tim Berners-Lee, criador do World Wide Web. (BERNERS-LEE,1989). A idéia básica do projeto é entender o contexto da pesquisa por
meio do entendimento do perfil do usuário. Procura-se mapear o lugar de cada um na Web, compartilhando as informações da pessoa e suas atividades (suas fotos, agenda,
weblogs.), transferindo as informações entre sites e possibilitando estender
automaticamente as conexões e, então, reusá-las online. Esse projeto é uma das iniciativas para poder conectar as ligações de cada internauta com suas coisas, informações, pessoas etc., ou seja, entender-se o contexto individual dos participantes da rede.
Aliás, esse é o método normal que utilizamos ao adicionarmos um amigo na nossa rede social, pois pesquisamos sobre os seus amigos, os seus hobbies, os grupos em que participa etc. Nós conhecemos a pessoa pelo seu perfil (e, por razões de segurança e privacidade a maioria omite seus perfis nas redes sociais), e, como na maioria das vezes as informações do perfil não estão presentes, recorremos ao perfil de seus amigos (vale o ditado “diga-me com quem andas e te direi quem és”). Essa tarefa parece ser trivial, mas ela é relativamente complexa, pois, na prática, temos diversos perfis. Podemos exemplificar com o mapa das conexões do Lawrence abaixo. O conjunto dos pontos azuis representa os amigos do Lawrence na IBM, o conjunto dos pontos vermelhos representa os amigos do Lawrence na PUC/SP, e assim por diante. Figura 21.
Desenvolvemos contextos diferentes em cada um dos círculos em que vivemos, com linguagem própria, culturas diferenciadas, portanto um amigo que nos conhece nesses contextos vai entender as nossas colocações. Em outro tipo de círculo, isso seria impossível de ser compreendido somente com o mapeamento das nossas conexões de amigos.
Figura 21. Perfis do Lawrence – seus papéis (role)
Uma das características da Web é a sua aplicabilidade para seres humanos. Entendemos que os usuários da Web são pessoas, no entanto, existem programas e máquinas que também a usam, provavelmente mais intensivamente do que os homens. A concepção da Web Semântica leva isso em conta, a sua arquitetura leva em conta esse fato, é bastante interessante relermos o desenho da primeira proposta do Berners- Lee(1989) em que ele já previa esse fato quando escreveu um artigo para convencer a gestão da CERN (Organização Européia para Pesquisa Nuclear), onde ele é pesquisador, da importância da proposta de www (aliás o fato curioso no artigo é que ele não sabia qual seria o melhor nome para a Web). Podemos verificar que, ao longo do tempo, muitas tarefas anteriormente executadas pelos seres humanos passaram a ser realizadas pelas máquinas programadas para isso. Esses “robots” têm que interpretar ordens, comandos e compreender contexto, portanto a linguagem e a forma de registro dos fatos do mundo real.
Vamos exemplificar: suponhamos que eu queira comprar um presente de Natal para meu amigo secreto. Para tanto, devo descrever as características desse amigo, tais como, sua faixa etária, seu nível de educação, seu sexo e o valor que estou disposto a gastar etc. e o serviço da Web me retornará mostrando quais são os presentes que estão
encaixados nesses critérios e fornecendo o melhor custo/benefício sem interferência humana. Atualmente, alguns sites de compra já realizam algo semelhante a isso, mas não levam em conta quem eu (o comprador) sou, o meu contexto (o país em que vivo), portanto, a minha cultura, etc. O conceito da Web semântica inclui também todo o contexto. Sem dúvida, ela é uma versão que utiliza todo o conhecimento adquirido da Web 2.0 e levará um certo tempo para que os usuários da Web atual entendam isso.