6 O PPSUMMERING OG KONKLUSJONER
6.2 Nye observasjoner i våre funn
As redes neuronais (NNs) de Kohonen, também designadas de mapas de Kohonen, foram desenvolvidas por Tuevo Kohonen e baseiam o seu modelo de aprendizagem num processo de treino não supervisionado, onde os objetos a classificar são mapeados de acordo com as suas semelhanças. As redes de Kohonen projetam os objetos multidimensionais numa superfície bidimensional de neurónios – denominada mapa – e o algoritmo foi desenvolvido para evidenciar a semelhança entre os objetos do conjunto de dados mapeando objetos semelhantes no mesmo neurónio ou em neurónios adjacentes. Cada neurónio do mapa é constituído por tantos pesos quantas as variáveis de entrada (input) (ver Figura 3.4).
Figura 3.4. Representação esquemática da arquitetura e do processo de treino de uma rede de Kohonen (adaptado de Latino, 2008).
Antes do início do treino os pesos de cada neurónio assumem valores aleatórios. Durante o treino, cada objeto apresentado é mapeado no neurónio que apresenta a menor distância Euclidiana ao vetor de entrada (input). Este neurónio, denominado de neurónio vencedor, ajusta os seus pesos de forma a tornar-se ainda mais semelhante ao objeto de entrada (input) (ver Figura 3.5).
Figura 3.5. Representação esquemática do neurónio vencedor e da sua vizinhança numa rede de Kohonen (adaptado de Latino, 2008).
Apesar da representação bidimensional da rede de Kohonen, na realidade ela apresenta uma forma toroidal, onde todos os neurónios têm o mesmo número de neurónios vizinhos (ver Figura 3.6).
Figura 3.6. Transformação do plano bidimensional de uma rede de Kohonen numa representação toroidal (adaptado de Zupan e Gasteiger, 1999).
Neurónio vencedor nvariáveis de entrada que descrevem o objeto Vetor de entrada (input) Pesos dos neurónios Neurónio vencedor Neurónios vizinhos
Como já referido a rede de Kohonen aprende através de um processo competitivo e não supervisionado, ou seja, todos os neurónios do plano bidimensional vão competir pela sua ativação quando é fornecido um estímulo (um objeto) ao modelo mas, apenas um será o selecionado. O neurónio selecionado é aquele em que o vetor dos pesos é mais semelhante aos descritores do objeto e essa semelhança é avaliada através da distância Euclidiana, calculada a partir da Equação 3.16.
Onde o índice indica um determinado neurónio, é o número de neurónios, representa o número de pesos de cada neurónio e o índice indica uma determinada variável de entrada (input). Neste caso particular, utilizando esta regra e com uma representação bidimensional, o índice indica a posição de um dado neurónio nesse plano. Em geral, a posição de um neurónio é descrita por dois índices que correspondem às duas coordenadas do neurónio no plano.
Uma vez encontrado o neurónio vencedor , os seus pesos são ajustados com o intuito de os tornar ainda mais semelhantes ao objeto de entrada. Contudo, não é apenas o neurónio vencedor a sofrer um processo de ajuste dos seus pesos, também os pesos dos neurónios vizinhos são ajustados. A extensão do ajuste depende da distância topológica do neurónio vencedor – quanto mais perto do vencedor se encontrar um neurónio – maior será o ajuste dos seus pesos, . A função escalar aplicada é dependente da topologia (ver Equação 3.17).
Onde o termo representa a distância topológica entre o neurónio vencedor e o neurónio enquanto o nível de estímulo depende da função .
Uma das funções utilizada nas redes de Kohonen é denominada de "chapéu mexicano" e é ilustrada na Figura 3.7.
Figura 3.7. Perfil da função mais utilizada na correção dos pesos dos neurónios vizinhos, denominada "chapéu mexicano" (adaptado de Zupan e Gasteiger, 1999).
No processo de aprendizagem de Kohonen é assumido que a rede aprende através da alteração dos pesos de cada neurónio. Assim, a Equação 3.17 é multiplicada por outra função
que será decrescente à medida que o treino decorre (ver Equação 3.18).
Onde representa o número de objetos pertencentes ao subconjunto de treino. Este parâmetro pode ser associado ao tempo de treino e é proporcional ao número de objetos do subconjunto de treino. A função pode ser expressa através da Equação 3.19.
Onde representa o número de objetos do subconjunto de treino que serão apresentados durante o treino. As duas constantes e são os limites superior e inferior entre os quais o ajuste varia (diminuindo do início para o fim do treino).
Os ajustes dos pesos do neurónio na região definida pela função são dados pela Equação 3.20.
Onde representa uma variável de entrada (input) do subconjunto , representa o neurónio vencedor com índice e representa um peso específico do neurónio .
Os resultados de saída (output) da rede de Kohonen consistem na localização do neurónio que apresenta os pesos mais semelhantes às características do objeto, ou seja, a localização do neurónio vencedor.
O algoritmo de aprendizagem da rede de Kohonen pode ser resumido através das seguintes etapas (ver Figura 3.4):
Antes do início do treino, os pesos dos neurónios assumem valores aleatórios; Um objeto ou vetor de entrada (input) de dimensão é apresentado à rede; O vetor de entrada é mapeado no neurónio que possui os pesos mais
semelhantes aos seus. Este é o neurónio vencedor que foi ativado pelo vetor de entrada;
Os pesos de cada neurónio são ajustados de forma a torná-lo ainda mais semelhante às propriedades do objeto apresentado;
Os neurónios vizinhos do neurónio vencedor também sofrem ajustes nos seus pesos. O grau de ajuste de cada neurónio vizinho depende da sua distância topológica ao neurónio vencedor;
O objeto seguinte do subconjunto de treino é apresentado à rede e é iniciado um novo processo de treino (repetindo os passos anteriores);
Os objetos do subconjunto de treino são iterativamente apresentados à rede e os pesos ajustados, até ser atingido o número de ciclos pré-definido.