• No results found

Etiske refleksjoner

O primeiro grupo de experimentos realizados incluiu sistemas baseados em dois des- critores. Foram selecionados 2 descritores do padrão MPEG-7. O descritor CLD e o EHD foram escolhidos devido a que a cor é uma das características mais relacionadas com a semântica e o histograma de bordas foi muito usado em diversos trabalhos para a classificação automática de imagens.

Nesta tese conjeturou-se que na indexação sequencial deve existir uma ordem nos des- critores usados em cada nível para poder garantir uma melhor recuperação. Então, para efeitos de avaliação e verificação da nossa proposta, considerou-se nos experimentos as duas combinações destes dois descritores. Assim, inicialmente foi implantada a indexa- ção usando como primeiro filtro do espaço ao descritor CLD e seguidamente ao descritor EHD, logo foram feitos os testes invertendo a ordem dos descritores: EHD no primeiro ní- vel e o CLD no segundo. Ainda, foram testadas versões dos modelos tradicionais usando estes dois descritores.

Dado que a estrutura de indexação escolhida para a realização dos testes foi a rede SOM de Kohonen, a primeira análise a ser feita será sobre os mapas SOM rotulados: TS- SL-SOM no caso da nossa proposta e SOM no caso dos métodos tradicionais. A figura 6.1 mostra a rede TS-SL-SOM em dois níveis treinada e rotulada. Como foi explicado no capítulo de implementações, nesta rede foram usados mapas 10x10 em ambos os níveis. Nesta estrutura, o primeiro mapa é treinado usando os descritores CLD das 5000 imagens de treinamento e cada neurônio é rotulado pela imagem mais próxima que o ativou. Após o treinamento e segmentação do primeiro mapa, foram encontradas 4 regiões que por sua vez, geraram 4 mapas filhos no segundo nível. Cada mapa deste segundo nível é treinado com os vetores característicos EHD das imagens de treinamento que ativaram os neurônios do segmento que os gerou.

Neste mapa é possível observar visualmente que, após 4800 iterações de treinamento, no primeiro nível se agruparam as imagens pela cor e logo no segundo nível se agruparam pela forma.

Foram treinadas redes SOM para os modelos tradicionais, duas SOM 10x10 no caso da indexação paralela e uma rede SOM 10x10 no caso da indexação composta. Estas redes também foram treinadas um total de 4800 iterações. As figuras 6.2 e 6.3 mostram os mapas treinados e rotulados para estes dois modelos.

No caso dos mapas rotulados para a indexação paralela, é possível observar que no mapa de esquerda, o qual usa o descritor CLD, as imagens se agruparam pela cor, do mesmo jeito que aconteceu com o mapa do primeiro nível da nossa proposta. Ainda, é possível observar no segundo mapa (treinado usando o descritor EHD) como as imagens se agruparam pela forma, o que realmente mostra que os mapas tiveram um treinamento bem sucedido e o método não foi prejudicado por um mal treinamento durante os testes.

Já no caso do mapa rotulado para a indexação composta, o agrupamento dos dados foi diferente e pode-se observar como as imagens se agruparam considerando ambos os critérios: A forma e a cor. Por exemplo, na esquina superior direita se agruparam objetos orientados verticalmente e com coloração azul, e a medida em que nos aproximamos da parte esquerda do mapa as imagens vão tomando uma orientação horizontal e mudando sua coloração.

(a) ColorLayout (b) EdgeHistogram

Figura 6.2: SOM Rotulado da Indexação Paralela (2 descritores)

Figura 6.3: SOM Rotulado da Indexação Composta (2 descritores)

Ainda, foram realizados testes usando mapas de tamanho variável, onde o tamanho dos mesmos foi definido pelo próprio Toolbox das redes SOM do Matlab como explica- dos no capítulo anterior. Para efeitos de identificação durante a comparação, as imple- mentações usando tamanhos variáveis serão chamadas de automáticas. Então, no caso da rede TS-SL-SOM da indexação sequencial automática, o primeiro mapa foi de tama- nho 21 × 17 e os 4 mapas filhos criados após a segmentação do primeiro mapa foram de 13 × 10, 17 × 11, 17 × 11 e 19 × 11. Os mapas rotulados para estas implementações não serão mostrados na tese por serem similares aos mapas já mostrados.

No caso das redes SOM, para a indexação paralela automática, o Matlab definiu as mesmas de tamanhos 21 × 17 para o descritor CLD e 23 × 16 para o descritor EHD. Já para a indexação composta automática o tamanho da rede SOM foi calculado como sendo 23 × 16.

Como dito anteriormente, além de fazer uma avaliação numérica do rendimento de cada proposta, foi feita também uma análise visual dos resultados obtidos por cada pro- posta. A figura 6.4 mostra exemplos da recuperação realizada pelos três métodos avali- ados implementados com mapas de tamanho fixo 10x10. Estas figuras foram escolhidas por mostrarem claramente um problema encontrado na recuperação realizada pela pro- posta com indexação composta.

(a) Sequencial CL-EH (b) Paralela

(c) Composta

Figura 6.4: Exemplo de Recuperação em Sistemas com 2 descritores

É importante observar que após analise visual dos resultados obtidos, observou-se que a nossa proposta (especificamente a que usa a sequência CLD-EHD chamada de "se- quencial CL-EH") teve melhores resultados. Ainda, quando a proposta recupera imagens relevantes (da mesma classe da imagem de consulta), é consequente na hora de mostrar os resultados, quer dizer que nas primeiras posições são recuperadas as imagens pertencentes à classe da imagem de consulta. Já o mesmo não acontece com as outras propostas, es- pecialmente com a proposta com indexação composta que mostrou, nestes experimentos, um rendimento aceitável e melhor que a proposta com indexação paralela. o que acontece na figura 6.4(c) se repete em várias imagens. Significa que mesmo recuperando algumas imagens relevantes, não consegue reconhecê-las como as mais relevantes do grupo.

Em relação à análise numérica dos resultados, após observar os mesmos, foi com- provado o comportamento observado na análise visual. Inicialmente foi feita a análise comparativa de todas as implementações usando mapas de tamanho fixo 10x10. A fi- gura 6.5(a) mostra a porcentagem de precisão (p) para 20 classes de exemplos do nosso banco de dados. Nesta figura pode-se observar que os dois métodos que tiveram maior regularidade na recuperação por classe são o Seqüencial CL-EH e o Composto. Ainda, é importante observar que embora numa grande quantidade de classes o Sequencial EH- CLnão consiga recuperar imagens relevantes, quando ele consegue fazer a recuperação a porcentagem de precisão é alta (> 50%).

Em relação à média da porcentagem de precisão de cada método é possível observar que o método proposto nesta tese, especificamente na sequência CLD - EHD, teve melhor

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 0 10 20 30 40 50 60 70 80 90 100 Classes de Exemplo Porcentagem de Precisão Seqüencial (CL−EH) Sequencial (EH−CL) Paralela Composta

(a) 20 Classes Exemplo

0 5 10 15 20 25 30 35 40 Porcentagem de Precisão Seqüencial (CL−EH) Seqüencial (EH−CL) Paralela Composta (b) Média Geral

rendimento (figura 6.5(b)). Neste sentido, o método Sequencial CL-EH teve uma porcen- tagem de precisão de 33.91% o que significa que de cada 50 imagens recuperadas pelo sistema, em média 16 eram da mesma classe da imagem de consulta. Já o método Com- postoteve uma porcentagem de precisão de 28.18% e finalmente os métodos Paralelo e Sequencial EH-CLtiveram 8.39% e 5.43% de precisão respectivamente.

0 2 4 6 8 10 12 14 16 18 20 Precisão Ponderada Seqüencial (CL−EH) Seqüencial (EH−CL) Paralela Composta

Figura 6.6: Precisão Ponderada da Recuperação (2 Descritores)

Conforme já exposto, se faz importante também avaliar o valor da precisão ponderada para conhecer a robustez dos métodos avaliados. Assim, ao considerarmos esta medida (figura 6.6), é possível observar que a vantagem da nossa proposta para este caso especí- fico fica maior, já que pp= 18.23 para o método Seqüencial CL-EH, pp= 10.25 para o

método Composto, pp= 3.71 para o método Paralelo e pp= 3.43 para o método Seqüen-

cial EH-CL. Sendo que nossa proposta teve quase o dobro de precisão ponderada que o método Composto o que confirma as observações feitas na análise visual dos resultados.

Já para o caso das implementações dos métodos onde o tamanho do mapa SOM é calculado automaticamente usando a informação do conjunto de treinamento, vemos que a porcentagem de recuperação favorece o método composto com p = 44.79% em cima do método Seqüencial CL-EH com p = 24.56% e dos métodos Paralelo e Seqüencial EH-CLcom p = 13.11% e p = 2.70% respectivamente. Outro fato interessante é que os métodos tradicionais foram favorecidos com a mudança de estratégia na hora de definir o tamanho dos mapas SOM e as duas versões da nossa proposta foram prejudicadas. Isto se deve ao fato de que quanto maior o mapa mais espalhados estarão os dados, então a segmentação e posterior sub-divisão do conjunto de treinamento para os seguintes níveis acarretará maior perda de dados relevantes.

Já em relação à precisão ponderada para estes métodos, observou-se que a superiori- dade mostrada pelo método composto diminuiu consideravelmente. pp= 17.94 para este

método contra pp= 13.21 para o Seqüencial CL-EH e pp= 6.08 e pp= 1.68 pra os outros

dois métodos. O que mostra realmente que a recuperação deste método é muito sensível às mudanças nos parâmetros como quantidade de imagens a recuperar e a estrutura de indexação. O que não acontece com nossa proposta.

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 0 10 20 30 40 50 60 70 80 90 100 Clases de Exemplo Porcentagem de Precisão Seqüencial (CL−EH) Seqüencial (EH−CL) Paralela Composta

(a) 20 Classes Exemplo

0 5 10 15 20 25 30 35 40 45 Porcentagem de Precisão Seqüencial (CL−EH) Seqüencial (EH−CL) Paralela Composta (b) Média Geral

0 2 4 6 8 10 12 14 16 18 Precisão Ponderada Seqüencial (CL−EH) Seqüencial (EH−CL) Paralela Composta

Figura 6.8: Precisão Ponderada para SOM automático (2 Descritores)

6.1.2 Comparações com dois descritores usando Segmentação Sobre-