Chapter 7: Conclusions and summary
7.2 Final reflections and further research
Nesta seção, será estudado um dos mais populares algoritmos na categoria de apren- dizado não-supervisionado, as redes neurais conhecidas como Mapas Auto-Organizados de Kohonen (Self-Organizing Map - SOM), ou simplesmente Redes Kohonen-SOM [37], [36], [38].
As redes Kohonen-SOM foram inicialmente desenvolvidas pelo Prof. Teuvo Kohonen [35], [34] e constituem um dos principais paradigmas na área de redes neurais artificiais. Tais redes foram inspiradas no modo pelo qual informações sensoriais são mapeadas no córtex cerebral.
O desenvolvimento de uma rede Kohonen-SOM, como modelo neural, foi motivado por uma característica do cérebro humano. Assim descrever-se-á, na próxima subseção a motivação biológica para sua criação e, na sequência, será apresentado sua arquitetura. Estas seções restringir-se-ão a aspectos fundamentais de uma rede Kohonen-SOM.
Figura 2.6: Função Chapéu Mexicano descrevendo a ativação lateral do cérebro humano Motivação biológica
O córtex cerebral humano é uma fina camada de células de, aproximadamente, um metro quadrado, contendo seis camadas de neurônios redobradas para caber no crânio [21]. Apesar de a mecânica e os processos do córtex não serem ainda completamente entendidos, evidências anatômicas e fisiológicas sugerem a existência de iteração lateral entre os neurônios. No caso do cérebro dos mamíferos, ao redor de um centro de excitação existe uma região (50 a 100 µm) de excitação lateral. Ao redor dessa região, existe uma área de ativação inibitória, aproximadamente, de 200 a 500 µm [36]. Novamente, ao redor dessa ultima área, segue-se uma região de excitação fraca (alguns centímetros). O fenômeno de iteração lateral pode ser modelado pela função chapéu-mexicano (Mexican hat), mostrado na figura 2.6.
Atualmente sabe-se que o cérebro possui áreas especializadas para processar diferen- tes modalidades de sinais. Nessas áreas, principalmente, nas áreas dedicadas ao proces- samento primário de sinais sensoriais, os neurônios respondem às muitas qualidades dos estímulos de uma forma ordenada. Por exemplo, na área auditiva, existe uma "escala"para frequências acústicas diferentes. Na área visual, existem mapas para processar a orien- tação de segmentos de reta, mapas de cores [5] etc. Mapas ordenados topograficamente, geralmente, bidimensionais e o conceito de formação de imagens abstratas das dimen- sões das características sensoriais aparentam ser um dos mais importantes princípios na formação das representações internas no cérebro [36].
Talvez o trabalho experimental mais influente nessa área, tenham sido os estudos de Hubel e Wiesel [27] usando micro-eletrodos no córtex visual de gatos. Estímulos semelhantes, como segmentos de reta com orientação variando poucos graus, excitaram neurônios próximos. Registrando as respostas mais intensas com um eletrodo, inserido paralelamente à superfície do córtex e gradualmente movido ao longo do tecido nervoso, obtém-se uma série de orientações que, em geral, variam suavemente ao longo do córtex. A figura 2.7 mostra dados experimentais de Hubel e Wiesel, nos quais veem-se também
Figura 2.7: Sensibilidade à orientação versus distância - Adaptado de Hubel e Wiesel (1962)
descontinuidades ocasionais.
Percebe-se, na figura 2.7, uma espécie de mapeamento, onde orientações similares excitam regiões do tecido nervoso próximo. No caso do córtex auditivo, experimentos indicam uma escala logarítmica de frequências. Neurônios em posições diferentes são excitados por sons diferentes e as posições relativas refletem, de uma certa forma, o relacionamento entre o conjunto de sons [36].
Apesar de as ideias de auto-organização em sistemas neurais terem sido iniciadas no final dos anos 50 e início dos anos 60 [87], C. von der Malsburg demonstrou, pela primeira vez, em 1973, a possibilidade de treinar uma rede neural usando métodos competitivos de forma a criar um mapeamento semelhante ao apresentado na figura 2.7. Modelos de auto-organização biologicamente inspirados foram desenvolvidos [85] baseados no estudo de neurônios que respondem seletivamente a estímulos, como os sensíveis à intensidade de luz e orientação de segmentos de retas, no córtex visual.
Kohonen [35], [34] generalizou tal modelo na rede Kohonen-SOM. Previamente, Ko- honen havia se dedicado a estudos sobre memória associativa e modelos para atividade neuro-biológica. A popularização da rede Kohonen-SOM deve-se a muitos fatores como, por exemplo, o seu esforço de manter uma fonte de referências sempre atualizada.
Estrutura básica de uma Kohonen-SOM
Apesar de ter sido desenvolvido inicialmente para tentar modelar áreas sensoriais do córtex e das iterações laterais entre os neurônios em tais estruturas, uma rede do tipo Kohonen-SOM tem um algoritmo extremamente simplificado e, apenas superficialmente, podemos compará-lo a uma estrutura biológica real do cérebro.
As redes Kohonen-SOM são compostas por duas camadas, sendo a primeira de entrada e a segunda de saída. A camada de entrada é por onde os dados a serem clusterizados são introduzidos na rede. Os nodos dessa camada são completamente conectados com os
Figura 2.8: Modelo arquitetura de uma rede Kohonen-SOM
neurônios da segunda camada (camada de saída), sendo a segunda camada da rede com- petitiva. Em uma camada competitiva, os neurônios disputam entre si quem representará o dado apresentado na entrada de rede. A cada conexão entre um nodo da camada de entrada e um neurônio da camada de saída é associado um peso. A figura 2.8, mostra a arquitetura de uma rede Kohonen-SOM.
A arquitetura de uma rede Kohonen-SOM, mostrada na figura 2.8, inclui n nodos na camada de entrada e m neurônios na camada de saída, onde todos os nodos Xi da
camada de entrada (1 ≤ i ≤ n) estão conectados a todos os neurônios Yj da camada de
saída (1 ≤ i ≤ m). O wij indica o peso da ligação entre o i-ésimo neurônio da camada
de entrada e o j-ésimo neurônio da camada de saída. Adicionalmente o vetor peso que representa cada neurônio Yj da camada de saída é composto de todos os n pesos wij,
lembrando que (1 ≤ i ≤ n).
O algoritmo de clusterização da rede Kohonen-SOM será detalhado na seção 5.4.2.