Uma observa¸c˜ao cuidadosa do resultado da decomposi¸c˜ao wavelet (Figura 3.5) indica que existe uma rela¸c˜ao hier´arquica entre os distintos subespa¸cos gerados. ´E formada uma estru- tura piramidal de sub-imagens com v´arias resolu¸c˜oes correspondentes `as diferentes etapas da decomposi¸c˜ao. Por exemplo, o subespa¸co Hx1 tem informa¸c˜ao similar ao subespa¸co Hx2,
porque ambos os subespa¸cos expressam elementos de alta freq¨uˆencia na dire¸c˜ao horizontal, mas em escalas distintas da imagem.
T´ecnicas de extra¸c˜ao de caracter´ısticas de imagens 35 O c´alculo dos vetores de caracter´ısticas est´a baseado em medidas dos subespa¸cos da decomposi¸c˜ao wavelet. Diversas medidas podem ser obtidas desses espa¸cos. Na maioria dos estudos que utilizam a transformada de wavelet para extra¸c˜ao de caracter´ısticas da imagem, calcula-se o valor de energia para cada subespa¸co da transformada, obtendo-se um vetor de caracter´ısticas com N medidas correspondentes a cada subespa¸co [84, 85, 3]. Tamb´em ´e poss´ıvel considerar outras medidas, tamb´em para cada subespa¸co, tais como os primeiros momentos estat´ısticos (m´edia, variˆancia, inclina¸c˜ao, curtose), e entropia.
Assim como as medidas da transformada bi-dimensional de Fourier, as medidas da trans- formada de wavelet podem ser consideradas caracter´ısticas de textura da imagem. Por exemplo, valores altos de energia nos subespa¸cos de altas freq¨uˆencias nas dire¸c˜oes horizontal e vertical, separadamente, exprimem caracter´ısticas de direcionalidade da textura enquanto as medidas dos subespa¸cos de altas freq¨uˆencias em ambas as dire¸c˜oes representam a no¸c˜ao de espessura.
3.7
Considera¸c˜oes finais
Neste Cap´ıtulo foi apresentada uma revis˜ao de alguns dos principais m´etodos de extra¸c˜ao de caracter´ısticas de imagens baseados em textura e forma, que est˜ao mais relacionados ao trabalho desenvolvido e apresentado nesta tese.
Em especial, as propriedades de ortogonalidade e invariˆancia `as transforma¸c˜oes geom´etricas dos momentos de Zernike fazem deles uma t´ecnica robusta de caracteriza¸c˜ao da imagem, que ´e empregada em muitos trabalhos de CBIR [86, 87, 88, 89]. Por esse motivo essa t´ecnica foi escolhida para fazer parte de um estudo comparativo envolvendo a nova t´ecnica de extra¸c˜ao de caracter´ısticas de imagens m´edicas desenvolvida e apresentada no Cap´ıtulo 5.
Cap´ıtulo
4
Segmenta¸c˜ao de imagens
A segmenta¸c˜ao ´e um processo que consiste na subdivis˜ao de uma imagem em regi˜oes distin- tas, levando-se em considera¸c˜ao duas propriedades b´asicas das imagens: descontinuidade e homogeneidade. A segmenta¸c˜ao ´e a principal etapa para a an´alise autom´atica de imagens. A partir dela s˜ao delimitados objetos que podem ser utilizados em processos subseq¨uentes, tal como classifica¸c˜ao, descri¸c˜ao, contagem, reconhecimento, entre outros.
O princ´ıpio da segmenta¸c˜ao foi introduzido no in´ıcio do s´eculo XX por alguns psic´ologos alem˜aes (Khler, Wertheimer e Kofftka) [90]. Eles mostraram que o sistema de vis˜ao hu- mana realiza agrupamentos baseados na proximidade, similaridade e continuidade das ima- gens captadas. Tais agrupamentos s˜ao utilizados na classifica¸c˜ao e an´alise semˆantica dos objetos percebidos. Esta id´eia foi estendida para o contexto computacional e deu origem aos primeiros algoritmos de segmenta¸c˜ao de imagens.
O ideal da segmenta¸c˜ao ´e que cada regi˜ao obtida no resultado esteja diretamente rela- cionada com um objeto real contido na imagem, como por exemplo um autom´ovel ou uma pessoa; e que tamb´em se possa fazer distin¸c˜ao do plano de fundo (background) da mesma.
Existem na literatura diversas taxonomias para classifica¸c˜ao dos m´etodos de segmenta¸c˜ao de imagem. Neste Cap´ıtulo ser´a considerada a mesma taxonomia adotada por Gonzales [77] que classifica os m´etodos de segmenta¸c˜ao em trˆes categorias b´asicas: limiariza¸c˜ao (threshol-
ding); segmenta¸c˜ao baseada em bordas; e segmenta¸c˜ao baseada em regi˜oes. Recentemente
v´arias outras categorias s˜ao levadas em considera¸c˜ao.
Dentre elas est˜ao os m´etodos baseados em cores [91, 92, 93], os que utilizam t´ecnica de classifica¸c˜ao e de agrupamento de dados [94, 95, 96] e algoritmos gen´eticos [97, 98, 99, 100, 101].
Neste Cap´ıtulo s˜ao apresentados alguns dos principais m´etodos de segmenta¸c˜ao de ima- gens encontrados na literatura, incluindo os m´etodos cujos conceitos s˜ao utilizados direta- mente na realiza¸c˜ao deste trabalho, em especial a segmenta¸c˜ao pela transformada de wa-
tershed e o m´etodo EM/MPM baseado nos modelos de Markov.
38 Cap´ıtulo 4
4.1
Limiariza¸c˜ao (Thresholding)
A limiariza¸c˜ao ´e o m´etodo mais simples e intuitivo de segmenta¸c˜ao de imagens. Basica- mente, todos os pixels que est˜ao dentro de uma faixa de intensidade s˜ao classificados como pertencentes a uma mesma regi˜ao. Em sua forma mais geral a limiariza¸c˜ao pode ser descrita matematicamente como:
S(i, j) = k se Tk−1 ≤ f(i, j) < Tk para k = 1, 2, ..., m
onde S(i, j) ´e a fun¸c˜ao resultante, f (i, j) ´e a fun¸c˜ao original (imagem), T0, ..., Tm s˜ao os
valores de limiariza¸c˜ao (thresholding) e m ´e o n´umero de classes distintas a serem aplicadas `a imagem.
Se m = 2, o m´etodo de limiariza¸c˜ao ´e denominado limiariza¸c˜ao bin´aria. Para m > 2 o m´etodo ´e descrito como limiariza¸c˜ao multi-modal.
A limiariza¸c˜ao ´e geralmente aplicada a imagens que possuem ´areas homogˆeneas sobre um plano de fundo uniforme. Uma aplica¸c˜ao comum para a limiariza¸c˜ao bin´aria ´e a extra¸c˜ao de texto da imagem digitalizada de uma p´agina.
Existem v´arias t´ecnicas para se determinar os valores de corte T0, ..., Tm. Uma delas ´e a
pr´opria sele¸c˜ao manual, baseada no melhor resultado obtido ap´os o teste com v´arios valores por parte do usu´ario. Dentre as t´ecnicas autom´aticas, a mais tradicional, e tamb´em a mais intuitiva, baseia-se na detec¸c˜ao dos pontos de m´ınimo do histograma da imagem (vales) [102]. O histograma ´e uma fun¸c˜ao que indica o n´ıvel de ocorrˆencia de um determinado n´ıvel de cinza dentro da imagem ou, para imagens coloridas, o n´ıvel de ocorrˆencia de cada cor. ´E coerente pensar que nas regi˜oes de m´ınimo local do histograma, h´a uma barreira que separa objetos. Sendo assim, os valores e limiar T0, ..., Tmser˜ao os pontos de m´ınimo do histograma.
Um problema desta t´ecnica est´a no fato de que muitas vezes os vales s˜ao longos e planos, tornando a escolha do limiar uma busca arbitr´aria. Tamb´em, ´e poss´ıvel que os vales assumam valores muito baixos, o que proporciona ao m´etodo uma sensibilidade maior aos ru´ıdos.
A Figura 4.1 ilustra um t´ıpico histograma bimodal (histograma que possui apenas um ponto de m´ınimo local e dois picos). O limiar T1 foi selecionado a partir do ´unico ponto de
m´ınimo da fun¸c˜ao. T0 e T2 correspondem, respectivamente, `a m´ınima e `a m´axima intensidade
do histograma.
A maioria das t´ecnicas autom´aticas para escolha dos n´ıveis de corte se baseiam no histo- grama. A tradicional t´ecnica de Otsu [77], por exemplo, ´e reconhecida por ser bem eficiente. Ela se baseia na escolha do valor de corte que maximiza a medida de variˆancia entre duas partes do histograma, ou seja, o objetivo ´e encontrar T que minimize a fun¸c˜ao:
u(T ) = q1(T )σ12(T ) + q2(T )σ22(T )
onde:
Segmenta¸c˜ao de imagens 39 • q2(T ) o n´umero de pixels com intensidade superior a T ;
• σ2
1(T ) variˆancia dos pixels cuja intensidade ´e menor que T ;
• σ2
2(T ) variˆancia dos pixels cuja intensidade ´e maior que T .
intensidade qua nt ida de limiar T1
Figura 4.1: Sele¸c˜ao do limiar (threshold) ´otimo para um histograma bimodal.