• No results found

PLMP. A taxa de erro foi computada tal como descrito no par´agrafo anterior, usando o mesmo conjunto de dados: Caltech-5classes. Embora algumas t´ecnicas de proje¸c˜ao tenham se mostrado bastante competitivas, a CSMP continuou apresentando as menores taxas de erro em todas as consultas. Se a CSMP ´e melhor do que t´ecnicas precisas como a LAMP e a pr´opria LSP na qual ela est´a baseada, fica evidente mais uma vez que, a sua efic´acia ao recuperar imagens por conte´udo est´a associada `a fam´ılia de m´etricas classes- espec´ıficas empregada, caracter´ıstica que a diferencia das demais t´ecnicas de proje¸c˜ao.

6.4

Caso de Uso: Resultados Qualitativos

Uma compara¸c˜ao qualitativa entre a CSMP e outros sistemas de CBIR pode ser ob- servada na Figura 6.8, utilizando o conjunto de imagens Caltech-5classes. As imagens com moldura vermelha (esquerda-topo) s˜ao as imagens de consulta. A lista de imagens retornada ´e exibida em ordem decrescente de similaridade e as imagens n˜ao relevantes foram marcadas com o s´ımbolo ⊘, em vermelho, para facilitar a identifica¸c˜ao. Observe

(a) CSMP: todas as imagens s˜ao relevantes (b) GA-CBIR: 6 imagens n˜ao relevantes

(c) CSMP: todas as imagens s˜ao relevantes (d) FIRE: 3 imagens n˜ao relevantes

Figura 6.8: Recupera¸c˜ao de imagens pela CSMP, GA-CBIR e FIRE mostrando as 15 primeiras imagens recuperadas. Na moldura em vermelho as imagens usadas para consulta. Note que todas as imagens recuperadas pela CSMP s˜ao relevantes, enquanto que GA-CBIR e FIRE recuperaram 6 e 3 imagens n˜ao relevantes, respectivamente (indicadas pelo s´ımbolo ⊘, em vermelho).

que a CSMP supera o GA-CBIR consideravelmente, j´a que todas as suas imagens s˜ao relevantes e pertencentes `a classe Dalmatian (Figura 6.8(a)), enquanto que o GA-CBIR recuperou 6 imagens n˜ao relevantes nesta categoria (Figura 6.8(b)). O mesmo efeito pode ser verificado entre CSMP e FIRE, ou seja, todas as imagens recuperadas pela CSMP s˜ao relevantes (Figura 6.8(c)), contra 3 imagens n˜ao relevantes do FIRE (Figura 6.8(d)).

Depois que os dados s˜ao projetados com a CSMP, qualquer imagem ´e, potencialmente, uma imagem de consulta, ou seja, ´e poss´ıvel realizar m´ultiplas consultas sem a necessidade de reconstruir o mapeamento m´ultiplas vezes. Assim sendo, considere o experimento apresentado na Figura 6.9, o qual emprega diferentes imagens de consulta para recuperar imagens similares a partir da cole¸c˜ao Caltech-5classes, tal que as imagens `a esquerda, com moldura vermelha, s˜ao as imagens de consulta. A lista de imagens retornada est´a disposta em ordem decrescente de similaridade, da esquerda para a direita, e as imagens n˜ao relevantes foram marcadas com o s´ımbolo⊘, em vermelho. Note que a CSMP obteve cem por cento de efic´acia nas consultas (Figura 6.9(a)), ao passo que GA-CBIR recuperou 2 imagens n˜ao relevantes na classe Cellphone (Figura 6.9(b)), e o FIRE recuperou 3 imagens n˜ao relevantes: 2 na classe Pizza e 1 na classe Cellphone (Figura 6.9(c)).

Estes experimentos evidenciam a efic´acia da CSMP como t´ecnica de proje¸c˜ao espe- cializada em busca por similaridade.

(a) CSMP: todas as imagens s˜ao relevantes

(b) GA-CBIR: 2 imagens n˜ao relevantes na classe Cellphone

(c) FIRE: 3 imagens n˜ao relevantes, sendo 2 na classe Pizza e 1 na classe Cellphone

Figura 6.9: Recupera¸c˜ao de imagens pela CSMP, GA-CBIR e FIRE usando diferentes ima- gens de consulta. Cada sequˆencia corresponde `as 15 primeiras imagens recuperadas, a partir da imagem de consulta mais `a esquerda, com moldura vermelha. Note que todas as imagens recu- peradas pela CSMP s˜ao relevantes, enquanto que GA-CBIR e FIRE recuperaram 2 e 3 imagens n˜ao relevantes, respectivamente (indicadas pelo s´ımbolo ⊘, em vermelho).

6.5 Considera¸c˜oes Finais 127

6.5

Considera¸c˜oes Finais

Os resultados apresentados nas se¸c˜oes anteriores mostram claramente a efetividade da CSMP, superando tanto em acur´acia quanto em flexibilidade os m´etodos testados. A nova t´ecnica, especializada em busca por similaridade, apoia-se em um conjunto de medidas que dependem das classes das imagens (classe-espec´ıfica), a qual revelou ser muito eficaz nas compara¸c˜oes de dados.

A CSMP fundamenta-se em uma t´ecnica de proje¸c˜ao bem consolidada, a LSP (Paulovich et al., 2008) que, al´em de uma s´olida formula¸c˜ao matem´atica ao projetar dados, permite o uso de recursos visuais e interativos. A formula¸c˜ao da LSP facilita in- serir informa¸c˜oes de classe no sistema atrav´es da fam´ılia de m´etricas classes-espec´ıficas constru´ıda e, o m´etodo da penalidade faz com que as diferentes classes fiquem mais afas- tadas durante a proje¸c˜ao. Ou melhor, a proje¸c˜ao permite distinguir diferentes classes de imagem e, por conseguinte, m´ultiplas consultas podem ser realizadas sem a necessidade de refazer o mapeamento, tornando o processo de consulta muito r´apido e pr´atico.

Depois que os dados s˜ao projetados, o usu´ario seleciona uma ou mais imagens de consulta. Em seguida, o sistema devolve a lista ordenada das imagens mais pr´oximas, computadas a partir do espa¸co visual, por ordem de relevˆancia. No entanto, quando a ordem n˜ao ´e fator primordial, ´e poss´ıvel encontrar as imagens mais similares de forma interativa, selecionando-as diretamente a partir do layout da proje¸c˜ao, realizada com o uso de imagens miniaturizadas para facilitar a identifica¸c˜ao (ver Figura 6.4 como exemplo).

Novas entradas de dados s˜ao previstas na CSMP, ou seja, ´e poss´ıvel inserir uma nova imagem na cole¸c˜ao, mas, neste caso, ´e necess´ario extrair as caracter´ısticas da imagem, adequar a entrada na matriz do sistema e refazer o mapeamento. Este procedimento pode ter custo alto, dependendo da cole¸c˜ao de imagens. Portanto, a CSMP n˜ao ´e indicada para problemas onde novas imagens devem ser inseridas e consultadas em tempo real.

Em todos os experimentos realizados, os melhores layouts foram produzidos com o fator de penalidade fixado em 108. Os outros parˆametros tamb´em s˜ao determinados auto- maticamente, por´em, a escolha do n´umero de pontos de controle ´e um aspecto que merece aten¸c˜ao. Sabe-se que a qualidade na recupera¸c˜ao de imagens da CSMP depende funda- mentalmente da fam´ılia de m´etricas classes-espec´ıficas empregada, no entanto, o emprego de um n´umero muito reduzido de pontos de controle pode comprometer a qualidade da proje¸c˜ao e, consequentemente, afetar o resultado final das consultas.

A limita¸c˜ao dos pontos de controle foi contornada com o emprego de recursos visuais: uma interface gr´afica adequada onde o usu´ario ´e orientado a escolher uma quantidade razo´avel de imagens, preferencialmente a partir de categorias distintas, obtendo, assim, um n´umero suficiente de pontos de controle para guiar o restante da proje¸c˜ao.

Finalmente, vale lembrar que a etapa de constru¸c˜ao da fam´ılia de m´etricas classes- espec´ıficas est´a sujeita `a resposta de um seletor de caracter´ısticas para identificar os

atributos mais relevantes de cada classe de imagem e, mesmo o melhor seletor de ca- racter´ısticas ainda pode falhar nesta etapa. O fato de eliminar atributos possivelmente relevantes para uma determinada classe, pode comprometer a constru¸c˜ao da fam´ılia de m´etricas classes-espec´ıficas, principalmente em cole¸c˜oes de imagens com grande diversi- dade (muitas categorias ou classes). Esta incerteza motivou a investiga¸c˜ao e implemen- ta¸c˜ao de uma nova t´ecnica, discutida no pr´oximo cap´ıtulo, que entre outras melhorias, introduz um fator de incerteza nas compara¸c˜oes de dados multidimensionais, ampliando ainda mais a acur´acia da CSMP, ideal para cole¸c˜oes de imagens com grande diversidade.

Cap´ıtulo

7

M´etricas Espec´ıficas Associadas `a

Informa¸c˜ao

de Incerteza

A

pesarlaridade, muitas t´ecnicas consideram uma ´da grande variedade de t´ecnicas e estrat´egias empregadas em buscas por simi-unica m´etrica para medir a similaridade entre os objetos e, raramente, consideram a incerteza inerente a este processo. A proposta da CSMP, apresentada no cap´ıtulo anterior, introduz uma fam´ılia de m´etricas baseada em classes para aumentar a precis˜ao das respostas, contudo, tamb´em n˜ao leva em conta informa¸c˜oes de incerteza.

Este cap´ıtulo discute uma nova t´ecnica denominada Class-Specific with Weight Image Retrieval (CSWIRe), inicialmente desenvolvida com o intuito de aperfei¸coar as respostas da CSMP para cole¸c˜oes de imagens complexas, com maior diversidade de classes, todavia, mantendo os mesmos recursos da sua antecessora: interatividade, tempo de resposta vi´avel e efic´acia.

Dentre as categorias de t´ecnicas existentes, as supervisionadas normalmente s˜ao as mais precisas, entretanto, como requerem dados rotulados, acabam impondo restri¸c˜oes ao dom´ınio de aplica¸c˜ao. As n˜ao supervisionadas, por outro lado, s˜ao mais abrangentes, por´em n˜ao t˜ao precisas. A CSWIRe, assim como sua antecessora, ´e semissupervisionada, capaz de recuperar imagens com a mesma precis˜ao das t´ecnicas supervisionadas, sem impor restri¸c˜oes ao dom´ınio de aplica¸c˜ao, al´em de ser muito mais precisa ao lidar com grandes cole¸c˜oes de imagens e permitir m´ultiplas imagens de consulta como entrada.

A etapa supervisionada corresponde `a cria¸c˜ao de um modelo de classes, definido a partir de um pequeno subconjunto de imagens, interativamente escolhido pelo usu´ario. `A medida que o usu´ario escolhe as imagens, elas s˜ao rotuladas e em seguida submetidas a um classificador, com o objetivo de encontrar os atributos e pesos que melhor discriminam

cada classe, gerando uma fam´ılia de m´etricas classes-espec´ıficas com pesos. A combina¸c˜ao de tais m´etricas com informa¸c˜ao de incerteza resulta em um mecanismo eficaz na recupe- ra¸c˜ao de imagens por conte´udo, em condi¸c˜oes de operar tanto no espa¸co de caracter´ısticas das imagens como no espa¸co visual atrav´es da proje¸c˜ao multidimensional com o m´etodo da penalidade, conforme o esquema proposto pela CSMP no cap´ıtulo anterior (Se¸c˜ao 6.2). Os resultados mostram que esta abordagem supera os m´etodos existentes, tornando-se uma solu¸c˜ao atrativa na recupera¸c˜ao de imagens por conte´udo (Se¸c˜ao 7.3).