• No results found

C Prediksjonsmodellering av kulturmarkseng i Østfold

3 Del III – Undersøkelser i Østfold fylke

3.2 C Prediksjonsmodellering av kulturmarkseng i Østfold

3.4.1 Estrutura e características das redes Perceptron

A rede Perceptron apresenta uma única camada de neurônios (camada de saída) constituída por m elementos, além de uma camada de entrada constituída por n elementos de conexão, os quais são responsáveis apenas por realizar a distribuição de todos os sinais de entrada para todos os neurônios da camada de saída. Ou seja, a camada de entrada não apresenta neurônio algum, de maneira que nenhuma computação é processada nesta camada. De forma que, muitas vezes ela é ignorada, onde os sinais de entrada são conectados diretamente aos neurônios da camada de saída, porém a sua utilização possibilita uma configuração mais didática. O número de neurônios da camada de saída é igual ao número de sinais de saída da rede, da mesma forma, o número de elementos da camada de entrada é igual

ao número de sinais de entrada que a rede apresenta. A Figura 3.4 ilustra a estrutura de uma rede Perceptron. (BEALE; HAGAN; DEMUTH, 2009; LABORATÓRIO NACIONAL DE COMPUTAÇÃO CIENTÍFICA, 2011)

Desta maneira, o índice i se refere aos elementos da camada de entrada e o índice j se refere aos neurônios da camada de saída. Sendo assim, tem-se que xi indica o sinal de entrada

associado ao elemento i da camada de entrada, wij representa o peso sináptico localizado entre

o elemento i da camada de entrada e o neurônio j da camada de saída e yj indica o sinal de

saída associado ao neurônio j da camada de saída. Além disso, bj se refere ao bias

correspondente ao neurônio j da camada de saída, como era esperado.

Figura 3.4: Arquitetura da rede Perceptron.

Fonte: Adaptado do Laboratório Nacional de Computação Científica, 2011.

A limitação deste tipo de RNA se encontra na reduzida gama de problemas que consegue tratar: classificação de conjuntos linearmente separáveis. Ou seja, as redes Perceptron não conseguem resolver problemas cujas classes envolvidas não sejam linearmente separáveis. A Figura 3.5 exibe um exemplo de duas classes linearmente separáveis e de duas classes não linearmente separáveis. Observa-se que as classes não linearmente separáveis são impossíveis de serem separadas por um hiperplano. Devido a essa limitação, as redes Perceptron não podem ser utilizadas em aplicações mais avançadas, mas apenas em problemas mais simples. (BRAGA, 2010; LABORATÓRIO NACIONAL DE COMPUTAÇÃO CIENTÍFICA, 2011)

(a) (b)

Figura 3.5: (a) Exemplo de duas classes linearmente separáveis. (b) Exemplo de duas classes não linearmente separáveis.

Fonte: Laboratório Nacional de Computação Científica, 2011.

As redes Perceptron normalmente utilizam funções de transferência do tipo funções de limite ríspido, como a função degrau, onde f(v) (função de transferência) pode assumir dois valores, conforme pode ser observado na equação (3.3):

( ) = 1 ∀ ≥0 ( ) = 0 ∀ < 0.

Onde, v é a função de ativação, como se esperava. (LUDWIG; MONTGOMERY, 2007)

3.4.2 Algoritmo de aprendizagem da rede Perceptron

Uma RNA é composta por um conjunto de elementos (neurônios) com capacidade de processamento local, uma topologia de conexão que define a forma como estes neurônios estão conectados e uma regra de aprendizado. Nesta seção, será descrita a regra de aprendizado da rede Perceptron, denominada de regra delta, a qual permite a adaptação dos pesos de forma que a rede execute uma determinada tarefa ou aplicação. (BRAGA; CARVALHO; LUDERMIR, 2007)

De maneira objetiva, o processo de aprendizado das redes Perceptron consiste nos seguintes passos: Inicialmente, atribui-se aos pesos valores aleatórios e, com eles, apresenta- se um conjunto de sinais de entrada e calcula-se a resposta fornecida pela RNA. Então, comparam-se os valores calculados com os valores desejados (processo de treinamento supervisionado). Caso o erro não seja aceitável, faz-se o ajuste dos pesos proporcionalmente (3.3)

ao erro e ao valor do sinal de entrada correspondente. Intuitivamente, sabe-se que quanto maior é o erro, maior deve ser a correção para os pesos considerados. Por outro lado, quanto maior é o valor do sinal de entrada correspondente a um peso, maior é a participação deste peso na composição dos valores de saída e, consequentemente, no erro global apresentado. De forma que, aquele peso deve receber uma correção maior. (LUDWIG; MONTGOMERY, 2007)

Desta maneira, a equação (3.4) representa a regra de atualização dos pesos para uma rede Perceptron:

( + 1) = ( ) + . ( ) . .

Onde, wij(T+1) representa o valor do peso corrigido entre o elemento i da camada de entrada e o neurônio j da camada de saída, wij(T) representa o valor do peso entre o elemento i da

camada de entrada e o neurônio j da camada de saída na iteração anterior, de forma que T indica o número da iteração considerada. Além disso, a taxa de aprendizagem é representada por η, ej(T) indica o valor do erro associado ao neurônio j da camada de saída na iteração T e

xi representa o sinal de entrada correspondente ao elemento i da camada de entrada

(LABORATÓRIO NACIONAL DE COMPUTAÇÃO CIENTÍFICA, 2011). De acordo com o Teorema da Convergência, a atualização dos pesos pela equação (3.4) leva sempre a uma solução, caso as classes envolvidas sejam linearmente separáveis. (ROSENBLATT, 1958)

Outro aspecto a ser considerado, é que o erro ej(T) é dado pela diferença entre o sinal

de saída desejado para o neurônio j, representado por dj(T), e o sinal de saída calculado pela

RNA para aquele neurônio, indicado por yj(T). Como pode ser observado pela equação (3.5):

( ) = ( )− ( ) .

Além disso, o Erro Quadrático Médio para todos os neurônios da camada de saída na iteração T será dado pela equação (3.6):

( ) = 1 ² ( ) .

(3.4)

(3.5)

Onde, J é o número de neurônios da camada de saída. Já o erro médio para todo o conjunto de treinamento é indicado pela equação (3.7):

= 1 ( ) .

De forma que, N representa o número de iterações necessárias para apresentar todo um ciclo de treinamento (uma época) em cada exemplo utilizado. O erro médio para todo o conjunto de treinamento pode ser utilizado como referência para o encerramento da seção de treinamento pela avaliação do nível de precisão da rede. (LUDWIG; MONTGOMERY, 2007; BEALE; HAGAN; DEMUTH, 2009)