Rovdyr - Resultater fra Trender i norsk landbruk 2020

3. Resultater fra Trender i norsk landbruk 2020

3.6 Rovdyr

wo: bias;

s: saída intermediária; e o: saída ativada.

Através das entradas xi são apresentados os valores que se desejam processar. Os pesos das sinapses wi (que representam o aprendizado da rede) assumirão valores que, aplicados aos valores de entrada, resultarão numa saída intermediária s. Tais pesos são atualizados por meio de um processo de treinamento prévio. A variável wo, denominada por bias, não multiplica nenhuma entrada, possui valor fixo e funciona como uma espécie de ajuste fino (Medeiros, 2006).

Para obter o valor da saída intermediária s, realiza-se o somatório da multiplicação entre as entradas e seus respectivos pesos numa função denominada soma, ou seja:

s = å(xjwij) + wo å -1 Saída x1 x2 x3 x4 xn w1 w2 w3 w4 wn w0 s o Função de ativação E N T R A D A S Pesos Função soma (2.25)

A função denominada função de ativação ou de transferência limita a amplitude do intervalo do sinal de saída do neurônio para algum valor finito, normalmente no intervalo [-1, 1] ou [0, 1].

Os principais tipos de funções de ativação são apresentados na Figura 2.11.

Figura 2.11 - Principais funções de ativação utilizadas no perceptron. Fonte: Paula (2006, p. 49)

Das funções de ativação apresentadas, a de uso mais comum é a logística, por apresentar algumas características vantajosas tais como: continuidade, monotonicidade, não linearidade e diferenciabilidade em qualquer ponto.

2.4.1.3 Treinamento das RNA Logística

De acordo com Mendes Filho e Carvalho (1997) e Warsseman (1989) (apud Lopes, 2005), uma característica muito importante das RNA é sua capacidade de aprender por meio de treinamento e, com isso, melhorar seu desempenho de reproduzir a saída desejada com referência a determinado conjunto de entrada. A aprendizagem se completa quando a RNA chega a uma solução generalizada para uma classe de problemas.

Segundo Medeiros (2004), o ajustamento dos pesos das sinapses deve ocasionar a convergência de erro para um valor mínimo. Esse processo pode ser visualizado na forma de um gráfico (Fig. 2.12) no qual o erro global E (diferença média quadrática entre as saídas desejadas e saídas calculadas) é representado no eixo vertical e, no eixo horizontal, estão representados os valores que um peso w pode assumir.

Figura 2.12 – Representação gráfica da convergência do peso de uma sinapse para um valor correspondente a um erro mínimo.

Fonte: Adaptado de Medeiros (2004, p. 15)

Os principais modelos de aprendizagem são:

a) Aprendizagem supervisionada ou associativa

Esse modelo de aprendizagem se caracteriza por possuir um agente externo (tutor ou professor) que indica à rede a saída desejada para o padrão de entrada, onde o ajustamento dos pesos é realizado por comparação da saída da rede com a saída desejada. Para executar esse tipo de treinamento é preciso que se tenha um conjunto de entrada pré-classificado (conjunto

w

inicial

E

min

de treinamento). O ajustamento dos pesos será realizado até que as respostas geradas pela rede possam classificar os dados de forma suficientemente correta.

Deve-se ter cuidado durante a fase de treinamento para que não ocorra treinamento excessivo da rede, processo conhecido como overfitting, situação que ocasiona a memorização dos dados pela rede e a conseqüente perda de capacidade para reconhecer padrões diferentes do conjunto de entrada.

b) Aprendizagem não supervisionada

Consiste no treinamento autônomo da rede utilizando-se apenas do vetor de valores de entrada. Parte-se do princípio que a rede seja capaz de obter, pelo seu próprio esforço, características importantes dos dados de entrada estatisticamente. São exemplos de rede que possuem esse tipo de treinamento as redes de Hopfield, Kohonen e ART (convencional e nebulosa) (Krose e Smagt, 1996; Wassermann, 1989 apud Lopes, 2005).

c) Treinamento híbrido

Neste modelo de treinamento adotam-se ambos os tipos de treinamento supervisionado e não supervisionado, de modo alternado.

2.4.1.4 Arquitetura das RNA

Segundo Menezes (2004) (apud Rocha, 2006) a sistematização dos neurônios numa RNA está diretamente relacionada ao problema que se deseja resolver, sendo esse um aspecto muito importante também para a definição do algoritmo de aprendizagem a ser utilizado.

De acordo com Lopes (2005), as RNA são compostas basicamente por três camadas: camada de entrada, camada intermediária (ou camada oculta) e camada de saída, como ilustrado pela Figura 2.13.

Figura 2.13 – Representação de uma RNA típica. Fonte: Lopes (2005, p. 32)

Existem diversos tipos de RNA para os mais diversos tipos de aplicações. Alguns tipos são apresentados:

a) Perceptron de camada única

O perceptron é a forma mais simplificada de uma RNA usada para classificação de padrões ditos linearmente separáveis, citando como exemplo padrões que se encontram em lados opostos de um hiperplano (Haykin, 2001 apud Rocha, 2006).

b) Perceptron multicamada (PMC)

Segundo Lima (2006), quando muitos neurônios se ligam, forma-se uma rede e, o efeito combinado da mesma se traduz na capacidade de tomar decisões complexas.

O denominado perceptron multicamadas consiste numa generalização do perceptron de camada única. Segundo Cybenko (1989) (apud Rocha, 2006), uma RNA com uma camada oculta é capaz de implementar qualquer função contínua. Com duas camadas ocultas a rede é capaz de aproximar de qualquer função.

Segundo Rossomando (2006), a capacidade que as RNA possuem de aproximar funções com grau arbitrário de precisão provavelmente justifica sua ampla aplicabilidade no campo da identificação e controle de processos.

c) Rede neural ADALINE

Desenvolvida por Widrow e Hoff em 1959, é utilizada para o reconhecimento de padrões, porém apenas reconhece os padrões nos quais foi treinada. Após ser generalizada para uma RNA multicamada, passa a ser denominada MADALINE, apresentando grande tolerância a falhas (Widrow e Hoff, 1960 apud Lopes, 2005)

d) Rede neural feedforward

Consiste de uma RNA multicamada utilizada normalmente para classificação e controle de robôs (Minsky e Papert, 1969 apud Lopes, 2005).

e) SOM de Kohonen

A rede SOM (Self Organizing Map) de Kohonen, consiste numa rede competitiva com habilidade de realizar mapeamento entre dados de entrada e de saída (Kohonen, 1972 apud Lopes, 2005).

f) Rede neural retropropagação

Werbos apresentou a primeira concepção do algoritmo de retroprogação (backpropagation), em 1974. Em 1986, Rumelhart, Hinton e Williams tiveram a idéia de utilizar o algoritmo de Werbos para ajustar os pesos de uma RNA das unidades de entrada para as unidades de saída

e propagar o erro no sentido inverso. Essa rede é utilizada em operações lógicas complexas e classificação de padrões (Rumelhart et alli, 1986 apud Lopes, 2005).

2.4.1.5 RNA com retropropagação

A rede neural do tipo retropropagação consiste numa rede neural tipo feedforward treinada com o algoritmo retropropagação. Motivada pela grande popularidade desse método para o treinamento de RNAs, as redes treinadas por meio desse método são denominadas de redes retropropagação.

De acordo com Paula (2007), a grande vantagem da utilização do método retropropagação reside no fato de existirem uma quantidade de equações bem definidas e explícitas voltadas para a correção dos pesos na rede. A correção do erro nos pesos das sinapses é realizada por meio da retropropagação do erro obtido na comparação entre a saída gerada pela rede e a desejada, objetivando diminuir o erro total da saída gerada pela rede.

Segundo Fausset (1994) (apud Paula, 2007), o método retropropagação consiste de três etapas: a propagação dos dados da camada de entrada para a camada de saída da rede, o cálculo e a retropropagação relativa ao erro gerado na rede, e a correção dos pesos sinápticos.

Na primeira etapa, os dados de entrada são apresentados à rede e as ativações são conduzidas até alcançarem a camada de saída, obtendo o resultado. Nas segunda e terceira etapas, o resultado obtido na camada de saída é comparado com a resposta desejada e o erro gerado é calculado para as unidades de saída. A partir disso, os pesos das unidades de saída são corrigidos para diminuir o erro. Na seqüência, o erro da camada de saída é utilizado para derivar estimativas de erro para as unidades das camadas ocultas e, assim, o erro é propagado para trás até atingir a conexão da camada de entrada.

O método retropropagação corrige os pesos sinápticos incrementalmente, tendo como critério a análise entrada-saída. Após concluir a análise de todos os pares de entrada-saída, é dito que se concluiu uma corrida. No entanto, esse processo requer diversas corridas.

O processo de atualização de pesos efetuado pelo método retropropagação é ilustrado por meio da Figura 2.14.

Figura 2.14 – Atualização de pesos efetuada no processo de retropropagação. Fonte: Adaptado de Paula (2007, p. 60)

Camada 1 (Camada de Entrada) Pesos

w

1j Camada 2 (Camada Oculta) Pesos

W

2j Camada n (Camada Oculta) Pesos

W

nj Camada m (Camada de Saída) Saída Saída desejada Erro Novos pesos Novos pesos Novos pesos Corrigir

w

nj Corrigir

w

2j Corrigir

w

Segundo Paula (2007), a correção dos pesos realizada no método de retropropagação é embasada na regra Delta de Widrow-Hoff, que foi desenvolvida para ajustar os pesos sinápticos na entrada de cada neurônio, tendo por referência o erro calculado entre a saída real produzida pela rede e a saída desejada para algum vetor de entrada. A correção dos pesos é realizada pelo método de otimização LMS (Least Mean Square), ou mínimos quadrados, cujo objetivo é determinar um valor para o peso que minimize o erro de saída da rede.

Considerando uma rede com retropropagação, o ajuste do erro é feito pela retropropagação do erro, realizando uma distribuição do erro referente aos neurônios de saída para os demais neurônios da rede. Porém, apesar de ser possível conhecer o erro global, não há meio de se determinar os pesos, com exatidão, para corrigi-los. Entretanto, com base no erro global, é possível determinar as direções nas quais os pesos precisam ser ajustados no sentido de minimizar o erro quadrático total na saída da rede. De posse dessas direções, torna-se portanto possível regular os pesos no sentido de atingir o menor erro global.

A soma do erro quadrático instantâneo de cada neurônio disposta na última camada (camada de saída da rede) é dada por (Villalba e Bel, 2000 apud Lopes, 2005, p. 41):

å

= = ns i i 1 2 2 _e e Onde:

ei

= di - yi;

di: saída desejada para o i-ésimo elemento da última camada da rede;

yi: saída do i-ésimo elemento da última camada da rede;

ns: número de neurônios da última camada da rede.

Tomando o neurônio de índice i da rede e utilizando o método do gradiente descendente (Simpson, 1989; Villalba e Bel, 2000 apud Lopes, 2005), o ajuste dos pesos pode se dar como: ) ( ) ( ) 1 (h V h h Vi + = i -qi Onde:

[

( )

]

) (h i h i =g Ñ q (2.26) (2.27) (2.28)

g: parâmetro de controle da estabilidade ou taxa de aprendizagem;

In document Trender i norsk landbruk 2020 (sider 51-57)