• No results found

O banco de dados FERET foi desenvolvido como parte do programa de Tecnologia de Reconhecimento Facial (FERET) que surgiu de um programa patrocinado pelo Departamento de Defesa americano através do Programa de Tecnologias Anti Drogas. Ele contém um total

de 14.051 faces em tons de cinza de 1.199 indivíduos com resolução 256x384 pixels. Essas imagens foram adquiridas com câmeras de 35 mm. As amostras para cada indivíduo são dis- tribuídas em variações de expressão facial, iluminação, pose e idade com 2, 2, 9-20 e 2 condi- ções, respectivamente. Alguns subconjuntos do FERET são geralmente utilizados. Fa e Fb correspondem a duas visões frontais, mas para Fb existe variação na expressão facial. Fc con- tém imagens tomadas com uma câmera e condições de iluminação diferentes. Duplicate I e Duplicate II foram adquiridas em tempos diferentes, onde passaram em média 251 e 627 dias, respectivamente. Há ainda alguma sobreposição entre os subconjuntos Duplicate. O restante das categorias englobam variações na pose que variam de +60º a -60º (GROSS, 2005). Esse banco de dados pode ser encontrado publicamente em http://face.nist.gov/colorferet/. Algu- mas amostras são apresentadas na Figura 3.5.

Fa Fb Fc Duplicate I Duplicate II

Figura 3.5. Algumas amostras de faces frontais do banco de dados FERET: Fa, Fb, Fc, Duplicate I e Duplicate II são nomes de algumas das principais categorias de divisão do FERET. Retirado de (GROSS, 2005).

3.2.2 AR

O banco de dados AR contém pouco mais de 3.000 imagens faciais coloridas (RGB) de tamanho 768 x 576 pixels de 126 indivíduos (70 homens e 56 mulheres), sendo 26 amos- tras por classe distribuídas em variações de expressão facial (neutro, sorrindo, zangado, gri- tando), iluminação, oclusão e idade com 4, 4, 2 e 2 condições, respectivamente (MARTÍNEZ e BENAVENTE, 1998; GROSS, 2005; ABATE, NAPPI et al., 2007). Foram realizadas duas seções com intervalos de duas semanas. Algumas amostras do banco de dados são mostradas na Figura 3.6. Esse banco de dados pode ser encontrado publicamente em http://cobweb.ecn.purdue.edu/~aleix/aleix_face_DB.html.

Figura 3.6. Algumas amostras de um sujeito do banco de dados AR. As duas primeiras linhas representam a primeira seção e as restantes a segunda seção. Retirado de (MARTÍNEZ e BENAVENTE, 1998).

3.2.3 ORL

O banco de dados ORL (Laboratório de Pesquisa da Olivetti) foi coletado entre 1992 e 1994. Ele contém um total de 400 imagens faciais em tons de cinza de tamanho 92 x 112 pi- xels de 40 indivíduos (4 mulheres e 36 homens), sendo 10 amostras por classe variando sua- vemente em expressão facial (olhos abertos/fechados, sorrindo/não sorrindo), iluminação e detalhes faciais (óculos ou não) (GROSS, 2005). Algumas amostras do banco de dados são mostradas na Figura 3.7. Esse banco de dados pode ser encontrado publicamente em http://www.cl.cam.ac.uk/Research/DTG/attarchive/facedatabase.html.

3.2.4 CMU PIE

O banco de dados CMU PIE (Pose, Illumination and Expression) contém 41.368 ima- gens faciais coloridas (RGB) de tamanho 640 x 486 pixels de 68 indivíduos, sendo aproxima- damente 608 amostras por classe distribuídas em variações de expressão facial, iluminação e pose com 4, 43, 13 condições, respectivamente (GROSS, 2005; ABATE, NAPPI et al., 2007). Algumas amostras do banco de dados são mostradas na Figura 3.8. Esse banco de dados pode ser encontrado publicamente em http://www.ri.cmu.edu/projects/project_418.html.

Figura 3.8. Algumas amostras de um sujeito do banco de dados CMU PIE. Essas amostras foram recortadas a fim de eliminar o fundo e conter somente a face do indivíduo. Retirado de (HUANG, YUEN et al., 2006).

3.2.5 XM2VTS

O banco de dados XM2VTS é um banco de dados multimodal muito utilizado para sis- temas de verificação/autenticação de identidade. Ele contém imagens faciais coloridas (RGB) de tamanho 720 x 576 pixels de 295 indivíduos variando somente em pose e idade (foram tomadas em 4 sessões) (GROSS, 2005; ABATE, NAPPI et al., 2007). Algumas amostras do banco de dados são ilustradas na Figura 3.9. Esse banco de dados não é gratuito. Informações podem ser encontradas em http://www.ee.surrey.ac.uk/CVSSP/xm2vtsdb/.

Figura 3.9. Algumas amostras de um sujeito do banco de dados XM2VTS. Retirado de (MESSER, MATAS et

al., 1999).

3.2.6 Yale

O banco de dados Yale contém um total de 165 imagens faciais em tons de cinza de tamanho 320 x 243 pixels de 15 indivíduos, sendo 11 amostras por classe distribuídas em va- riações de e sem óculos, iluminação e expressão facial com 3 e 6 amostras para as últimas duas variações. A iluminação varia em luz central, direita e esquerda. As expressões encon- tradas são normal, feliz, triste, sonolento, surpreso e piscando. Algumas amostras do banco de dados são mostradas na Figura 3.10. Esse banco de dados pode ser encontrado publicamente em http://cvc.yale.edu/projects/yalefaces/yalefaces.html.

Figura 3.10. Algumas amostras de um sujeito do banco de dados Yale. Retirado de <http://cvc.yale.edu/projects/yalefaces/yalefaces.html>.

3.2.7 YaleB

O banco de dados YaleB contém um total de 5.760 imagens faciais em tons de cinza de tamanho 640 x 480 pixels de 10 indivíduos, sendo 576 amostras por classe distribuídas em variações de expressão facial e iluminação com 9 poses × 64 condições de iluminação. As poses e fontes de iluminação variam em até 24º e 77º, respectivamente (GROSS, 2005). Al- gumas amostras do banco de dados são mostradas na Figura 3.11. Esse banco de dados pode ser encontrado publicamente em http://cvc.yale.edu/projects/yalefacesB/yalefacesB.html.

Figura 3.11. Algumas amostras de um indivíduo do banco de dados YaleB. Retirado de (GEORGHIADES, BELHUMEUR et al., 2001).

3.2.8 MIT

O banco de dados MIT contém 2.500 imagens faciais em tons de cinza de tamanho 512 x 512 pixels de 16 indivíduos (todos homens), variando entre pose, escala e iluminação com 3 condições para cada variação (TURK e PENTLAND, 1991; MARCIALIS e ROLI, 2004). Além disso, as imagens apresentam fundo complexo. Algumas amostras do banco de dados são mostradas na Figura 3.12.

Figura 3.12. Algumas amostras de um sujeito do banco de dados do MIT. Retirado de (MARCIALIS e ROLI, 2004).