Oppsummering og konklusjon - Næring og spel

Næring og spel

3.0. Oppsummering og konklusjon

tracking perdido?

Sistema de visão Modelo de foveamento

Atualizar fóvea

Recuperar tracking

baseado nos últimos n quadros último quadro

desabilitar fóvea aumentar fator de crescimento

atenção bottom-up altera fóvea consulta não sim usar estratégia

Figura 4.8: Diagrama para realização de tracking.

4.4 Extensão para 3D

Tecnologias recentes têm permitido também a aquisição de informações tridimensio- nais do mundo real como, por exemplo, o dispositivo Microsoft Kinect [Microsoft 2013]: um sensor RGB-D a custos acessíveis originalmente desenvolvido para entretenimento que também é utilizado em várias aplicações em pesquisa em robótica e em aplicações comerciais. Em oposição aos dispositivos de captura de imagem bidimensionais, tais dis- positivos capturam a cena do mundo real e a transforma em uma nuvem de pontos. Assim como uma imagem bidimensional, essas informações podem ser trabalhadas por algorit- mos em visão computacional para extração de informações do mundo como, por exemplo, para detecção e localização de um objeto.

A mesma arquitetura também é aplicada no espaço tridimensional [Gomes, da Silva, Rocha, Aroca, Velho & Gonçalves 2013]. Nessa extensão, uma nuvem de pontos é adqui- rida via um dispositivo de captura tridimensional. Em seguida, o sistema de visão aplica o foveamento tridimensional nessa nuvem (vide Figura 4.10). O foveamento na nuvem de pontos não é suficiente para reduzir a densidade de features na nuvem, dessa forma as

features também são extraídas de forma foveada.

No caso do espaçoR

3_{, ao invés de reamostrar regiões concêntricas da imagem, a nu-} vem de pontos foveada é obtida através da subamostragem da nuvem de pontos usando paralelepípedos concêntricos, cada qual representando um nível (vide Figura 4.11). Cada paralelepípedo especifica um recorte na nuvem de pontos com uma densidade de pontos diferente. O paralelepípedo mais externo tem um dos seus cantos posicionado em uma coordenada emR

56CAPÍTULO 4. SELEÇÃO FOVEADA DEFEATURESGUIADA POR ATENÇÃO VISUAL

Figura 4.9: Exemplos de detecções bem-sucedidas (marcadas com um ’O’) e detecções mal-sucedidas (marcadas com um ’X’).

4.4. EXTENSÃO PARA 3D 57

(a) Nuvem de pontos original. (b) Nuvem de pontos foveada com objeto de- tectado em vermelho.

Figura 4.10: (a) Exemplo de uma nuvem de pontos e (b) a detecção de uma bola (em vermelho) nessa nuvem de pontos.

em destaque na Figura 4.11). Todos os pontos fora desse paralelepípedo são descartados. Dentro desse paralelepípedo, outros menores são posicionados linearmente. O menor pa- ralelepípedo é centralizado em um parâmetro chamado centro da fóvea: uma coordenada 3D onde a densidade da nuvem de pontos é máxima. Um algoritmo de subamostragem é então aplicada em cada nível de forma que a densidade de pontos do paralelepípedo maior é a menor dos níveis.

A nuvem de pontos foveada é formalizada a seguir. Define-se m+1 paralelepípedos

de tamanho Sk 2R

3_{, com k}

=0;1;:::;m representando cada nível. Cada nível da nuvem

de pontos foveada modifica a densidade dos pontos. O primeiro nível (nível 0) tem uma redução de densidade dada por d0e o último nível (nível m) tem uma redução de densidade dada por dm. A redução de densidade dos demais níveis são obtidos por interpolação

linear entre d0e dm.

O nível 0 (maior paralelepípedo) possui três parâmetros: tamanho (S0), orientação e posição (denotada por∆). Os últimos dois parâmetros definem o sistema de coordenadas do modelo. De forma prática, se toda a nuvem de pontos deve ser coberta, é possível atribuir automaticamente valores a esses três parâmetros como a bounding box de toda a nuvem. Entretanto, em algumas aplicações, pode ser interessante posicionar o nível 0 em uma pequena parte de uma nuvem de pontos relativamente maior.

O nível m (menor paralelepípedo) é guiado em seu centro por um vetor F que repre- senta o centro da fóvea. Por conveniência, a origem do sistema de coordenadas da fóvea está no centro do nível 0. Dessa forma, F=F

S0=2, onde F

0 é o centro da fóvea no

sistema de coordenadas do modelo. Sejaδk2R

3_{o deslocamento do nível k, então}_δ

0=(0;0;0)eδm+Sm=2=F 0

. O deslocamento do k-ésimo nível usando interpolação linear é dada por:

δk=

k(S0 Sm+2F)

58CAPÍTULO 4. SELEÇÃO FOVEADA DEFEATURESGUIADA POR ATENÇÃO VISUAL x y z S 0 x S 0 z S 0 y Æx 1 Æx2 (a) Exemplo 1. x y z S 0 x S 0z S 0 y Æx 1 Æx 2 (b) Exemplo 2.

Figura 4.11: Exemplos do modelo de foveamento tridimensional usando 3 níveis com duas posições diferentes para o centro da fóvea.

4.4. EXTENSÃO PARA 3D 59 Observe queδk é definido somente para m>0; em outras palavras, o modelo de fovea-

mente deve conter pelo menos 2 níveis.

O tamanho do k-ésimo nível utilizando interpolação linear é dado por:

Sk=

kSm kS0+mS0

m (4.10)

Da mesma forma que no caso bidimensional, o fator de crescimento também é defi- nido e é representado por G=(sx;sy;sz)2R

3_{, onde s}

x;sy;sz são fatores de escala apli-

cados nas direções x, y and z, respectivamente (vide Figura 4.12). Esse fator aumenta a quantidade de pontos na nuvem foveada através do aumento do volume dos paralelepípe- dos. O raciocínio para obter a delimitação de cada nível é similar ao caso bidimensional e os limites de cada nível são dados pelas Equações 4.11 e 4.12.

(max(0;δxk gx);max(0;δyk gy);max(0;δzk gz)) (4.11)

(min(S0 x;δxk+Sk x+gx);min(S0 y;δyk+Sk y+gy);min(S0 z;δzk+Sk z+gz)) (4.12)

Após o cálculo da delimitação dos níveis, a nuvem de pontos é subamostrada para alterar a densidade da nuvem de pontos. Há duas possibilidades nessa etapa em relação ao armazenamento da nuvem de pontos: criar um única nuvem de pontos unindo todos os pontos subamostrados de cada nível ou armazenar os pontos subamostrados de cada nível independentemente. Observe que ambas as maneiras podem ser adotadas simulta- neamente.

Ao juntar todos os pontos em uma única nuvem de pontos, entretanto, podem ocorrer distorções geométricas, provavelmente imperceptíveis em uma inspeção visual, caso o algoritmo de subamostragem modifique as coordenadas dos pontos. Uma possível solução para esse problema é juntar todos os pontos de um nível que não pertencem a um nível de índice maior, ou seja, todos os pontos no paralelepípedo de um nível que não estão nos paralelepípedos internos. Dessa forma, pontos de um nível não se misturam a pontos de outro nível. Para garantir essa disjunção entre os níveis, basta testar se cada ponto do nível k a ser inserido na nuvem de pontos foveada está ou não dentro do paralelepípedo

k+1 (k6=m) como é realizado no Algoritmo 6. Um exemplo de uma nuvem de pontos

60CAPÍTULO 4. SELEÇÃO FOVEADA DEFEATURESGUIADA POR ATENÇÃO VISUAL

(a) G = (0, 0, 0) (b) G = (20, 20, 20)

Figura 4.12: Diferentes valores para o fator de crescimento no modelo de foveamento 3D.

(a) (b) (c)

Figura 4.13: Exemplo de aplicação do modelo de foveamento: (a) nuvem de pontos fo- veada com informações de cor, (b) nuvem foveada com m=4, Sm=(0:4;0:4;0:4), S0= (1;1;1)e F=( 0:06;0:11; 0:75)e (c) nuvem foveada com m=4, Sm=(0:2;0:2;0:2),

4.4. EXTENSÃO PARA 3D 61

Algoritmo 6: Algoritmo para foveamento de uma nuvem de pontos.

Entrada: nuvem de pontosfPgin

Entrada: densidade mínima d₀

Entrada: densidade máxima dm

Saída: nuvem de pontosfPgout

Saída: vetor de nuvem de pontosfLgde tamanho m+1

parak 0 até m faça

dk=d0+k(dm d0)=m;

subamostrarfPginemfLgkusando dk como parâmetro;

para cadaponto p defLgkfaça

se p está dentro do paralelepípedo k e não está dentro do paralelepípedo

k+1 então

adicionar p à nuvem de pontosfPgout;

6 fim 7 fim 8 fim 9

Capítulo 5

Experimentos

O objetivo dos experimentos propostos neste capítulo é fornecer dados para a análise do uso de seleção de features utilizando o modelo de foveamento. Com esses experimen- tos é possível analisar o impacto da seleção de features com foveamento em duas tarefas específicas bastante comuns em aplicações de visão robótica: detecção de objetos utili- zando casamento de features e tracking. Além disso os experimentos mostram contextos teóricos em aplicações práticas, conforme discute-se na Seção 4.2.

Para realizar os experimentos, a arquitetura proposta no Capítulo 4 é implementada em software. Dois experimentos são realizados:

distância do centro da fóvea para o centro do objeto (vide Seção 5.3): esse expe-

rimento avalia a taxa de acerto na detecção de um objeto em função da distância entre o centro do objeto e o centro da fóvea;

e tracking (vide Seção 5.4): um experimento onde avalia-se a taxa de acerto na

detecção de um objeto onde a posição do centro da fóvea não está determinada. Várias estratégias são aplicadas para manter o centro da fóvea próximo ao objeto e, assim, manter a taxa de acerto, conforme discute-se na Subseção 4.3.1.

5.1 Metodologia

Para o experimento de tracking, o material utilizado é um Laptop Intel Core i5 2,3GHz com 4 GB de memória RAM e sistema operacional Linux Ubuntu 12.04. Já para o expe- rimento de distância do centro da fóvea para o centro do objeto, uma vez que a demanda de processamento é alta, várias máquinas são utilizadas. Cada máquina calcula de forma independente das outras máquinas um conjunto específico de distâncias. O algoritmo é implementado na linguagem C++ utilizando a biblioteca OpenCV na versão 2.3.1. As funções icvFindMaximaInLayer e icvCalcLayerDetAndTrace presentes nessa biblioteca são adaptadas para incluir o modelo de foveamento. O tempo de processamento dos al- goritmos é medido utilizando a função cvGetTickCount dessa mesma biblioteca. Para analisar os resultados dos experimentos, utiliza-se o ground truth descrito na Seção 5.2.

64 CAPÍTULO 5. EXPERIMENTOS

In document Utviklinga av historiske spel i Noreg (sider 90-105)