Os mapas auto-organizáveis de Kohonen ou self organization maps (SOM) são um tipo de rede neural artificial com arquitetura reticulada, aprendizado não supervisionado competitivo e que permite a identificação de padrões em vetores de dados multivariados. Tal rede é comumente construída em torno de uma grade unidimensional ou bidimensional de neurônios para capturar similaridades, regularidades e correlações importantes no espaço n- dimensional das n variáveis de entrada; agrupando-as em classes ou em clusters. Trata-se de uma ferramenta largamente utilizada para reconhecimento de padrões nas mais diversas áreas do conhecimento, para realizar agrupamentos e outros usos como para facilitar a visualização de relações entre as variáveis de entrada (KOHONEN, 2001; SILVA; SPATTI; FLAUZINO, 2010).
O SOM é um mapeamento que fornece a representação estrutural dos dados de entrada através dos vetores de pesos dos neurônios. Caracteriza-se pela formação de um mapa topográfico dos padrões de entrada onde as localizações dos neurônios mapeiam as caracterís- ticas estatísticas (em geral não-lineares e dinâmicas) intrínsecas dos padrões de entrada, con- forme disposto na Figura 31 (HAYKIN, 1999). No exemplo, o padrão de entrada ∈ ℝ é representado (ou mapeado) no espaço de saída bidimensional pelo vetor de pesos do neurônio vencedor cuja localização é função de x.
A.1 APRENDIZADO COMPETITIVO
O aprendizado de uma rede neural consiste basicamente da calibração gradativa dos vetores de pesos dos neurônios durante a fase de treinamento à medida que as amostras de entrada são apresentadas sequencialmente à rede. O aprendizado competitivo baseia-se na concorrência entre os neurônios que competem entre si e há um único neurônio vencedor para cada amostra apresentada à rede neural.
A estratégia para determinar qual será o neurônio vencedor – nv – consiste em determinar a proximidade entre o vetor de pesos de cada neurônio com respeito ao vetor de entrada da k-ésima amostra, conforme equação (47):
= √∑ −
=
Apêndice A – Mapas Auto-Organizáveis de Kohonen 154
sendo a norma Euclidiana da diferença entre a k-ésima amostra de entrada e o vetor de pesos do j-ésimo neurônio da rede neural. Em (47) há n amostras de entrada e neurônios na grade neural.
Figura 31 – Mapeamento das amostras de entrada do espaço n-dimensional para o espaço bidimensional da
grade neural – ℝn⇒ ℝ .
Fonte: (HAYKIN, 1999, p. 477).
O neurônio j cujo vetor de peso apresenta a menor distância Euclidiana é nomeado “neurônio vencedor” da competição sendo considerado o neurônio mais ativo em relação à amostra k. O vetor de pesos do neurônio vencedor é ajustado via equação (48) de modo a aproximá-lo ainda mais da amostra previamente apresentada. � é a taxa de aprendizagem e decresce à medida que o número de épocas (ou iterações) aumenta.
= + � − (48)
Na Figura 32 apresenta-se, no espaço bidimensional das variáveis de entrada e , a disposição dos quatro vetores de pesos da rede neural associados aos quatro neurônios
Apêndice A – Mapas Auto-Organizáveis de Kohonen 155
do SOM após convergência do algoritmo de treinamento competitivo. Ressalta-se que cada um dos vetores de pesos aponta para o centro de cada um dos quatro aglomerados ou clusters. Nesse exemplo, o número de classes é vinculado ao número de neurônios da estrutura neural.
Figura 32 – Disposição geométrica dos vetores de pesos dos neurônios do SOM no espaço bidimensional após
treinamento da rede neural.
Fonte: (SILVA; SPATTI; FLAUZINO, 2010, p. 226).
Após a fase de treinamento do SOM, quando uma nova amostra for apresentada à rede, basta verificar qual o neurônio vencedor correspondente que estará associado a uma classe de amostras semelhantes entre si.
A.2 VIZINHANÇA INTERNEURÔNIOS
Os mapas topológicos bidimensionais podem ter um arranjo retangular (como na Figura 33), hexagonal, etc. Dentre os inúmeros critérios de vizinhança interneurônios, um dos mais comuns consiste em adotar um raio R em torno do neurônio cuja vizinhança deseja-se definir. Seja a distância entre os neurônios da grade neural da Figura 33 unitária – = . De- fine-se Ω � como sendo o conjunto dos neurônios vizinhos do neurônio j inscritos em um círculo de raio R em torno de j. Em (49) são apresentados alguns exemplos de vizinhanças interneurônios para a grade neural da Figura 33.
Apêndice A – Mapas Auto-Organizáveis de Kohonen 156
Um neurônio j que venceu a competição após a apresentação da amostra tem seu vetor de pesos ajustado bem como de seus vizinhos através das expressões (48) e (50), respectivamente. Na equação (50), corresponde aos pesos dos “neurônios vizinhos” (viz) do neurônio vencedor (nv). Ω = { , } Ω = { , , } ⋯ Ω 6 = { , } (49)
Visando maior eficiência no treinamento da rede, a taxa de aprendizagem � re- duz gradativamente no transcorrer no processo iterativo de treinamento. Em Haykin (1999), apresenta-se a equação (51) onde a taxa de treinamento é função exponencial decrescente do número de épocas . Segundo Haykin (1999), o treinamento subdivide-se em duas fases: a fase de ordenação e de refinamento com � e épocas, respectivamente. Tal referência adota 1.000 épocas ou iterações para a fase de ordenação, portanto, � = .
= + � Ω − (50)
� = � −� (51)
≅ � + (52)
O lado direito da equação (50) – para ajuste do vetor de pesos dos neurônios vizi- nhos – é multiplicado pela função Gaussiana Ω definida em (53). Quanto maior a norma Euclidiana da diferença entre os vetores de pesos de j e de seus vizinhos Ω , menores serão os ajustes dos neurônios vizinhos. A função Ω em (53) é função de � , definido em (54), o qual é função exponencial decrescente do número de épocas. Em (55) define-se o parâmetro � , que aparece em (54), e que depende do valor de outras duas constantes: � e � . Segundo Haykin (1999, p. 475), � é o raio da grade neural.
Ω = − ‖
� � − Ω‖
Apêndice A – Mapas Auto-Organizáveis de Kohonen 157
� = � − � (54)
� =lo� �� (55)
A.3 MAPAS DE CONTEXTO
Após treinamento do SOM, agrupam-se os neurônios em classes maiores e mais representativas do problema para construção do mapa de contexto. Existem inúmeras estraté- gias para construção desses mapas como técnicas estatísticas e conhecimento especialista.
Neste estudo adota-se o seguinte procedimento para obtenção do mapa de contex- to: sejam os neurônios vizinhos do neurônio 1; Ω = { , } na Figura 33. Seleciona-se aquele que possui a menor norma Euclidiana da diferença entre os vetores de pesos do neurônio 1 e de seus respetivos vizinhos. Supõe-se que o neurônio 2 foi selecionado. Neste momento, a � � = { , }. O processo repete-se para o último neurônio ingressante na classe. Encer- ra-se o processo quando o neurônio selecionado já está contido na classe em formação. Na Figura 33 apresenta-se o mapa de contexto completo após treinamento do SOM e posterior análise. O mapa foi particionado em três classes A, B e C cujos neurônios estão indicados na Figura 33 por polígonos tracejados.
Figura 33 – Mapa de contexto × para uma topologia bidimensional após treinamento do SOM.
Apêndice A – Mapas Auto-Organizáveis de Kohonen 158
Uma abordagem com mais detalhes a respeito do SOM foge ao escopo do presen- te trabalho. Ao leitor interessado recomenda-se Haykin (1999); Silva, Spatti e Flauzino (2010) e Simpson (1989).