• No results found

2. Teoretisk begreper og perspektiver

2.5 Institusjonelt perspektiv

A redes neurais artificiais nada mais são do que pequenos módulos que simulam o funcionamento de um neurônio. Estes módulos devem funcionar de acordo como os elementos em que foram inspirados, recebendo e retransmitindo informações. As redes neurais artificiais são uma descrição genérica para uma ampla classe de modelos computacionais inspirados na estrutura e comportamento de neurônios reais. Como o cérebro, elas podem reconhecer modelos, reorganizar dados e, mais interessante, aprender comportamentos dinâmicos complexos de sistemas físicos (Lau, 1990).

Os modelos artificiais desenvolvidos podem ser arranjados ordenadamente para construir as chamadas redes neurais artificiais, ou simplesmente redes neurais. Várias arquiteturas podem ser obtidas, destacando-se três tipos como sendo as mais comumente empregadas, que são as redes de múltiplas camadas, onde a informação segue uma única direção, a rede recursiva e a rede com conexões laterais (Baughman e Liu, 1995). O tipo de rede neural mais utilizada no campo da engenharia química é a rede neural múltiplas camadas e uma revisão sobre o assunto é encontrada nos trabalhos de Lau (1990), Werbos (1990) e Hussain (1999).

A Figura 3.1 mostra o esquema de uma rede neural de múltiplas camadas. A rede contém uma camada de entrada, por onde as informações como concentrações e variáveis operacionais importantes do processo são alimentadas, uma camada oculta e uma camada de saída onde se obtém as respostas do sistema. Após os sinais entrarem nos neurônios, ocorre um somatório dos sinais de entrada ponderados pelos pesos associados a cada um, seguido de aplicação de uma função de ativação ao resultado obtido da somatória. As funções de ativação, sigmóide e tangente hiperbólica são comumente usadas em processos bioquímicos (Thibault et al.,1990;).

A maioria dos modelos de redes neurais possuem alguma regra de treinamento, onde os pesos de suas conexões são ajustados de acordo com os padrões apresentados. Em outras palavras, elas aprendem através de exemplos. Arquiteturas neurais são tipicamente organizadas em camadas, com unidades que podem estar conectadas às unidades da camada posterior. A rede neural passa por um processo de treinamento a partir dos casos reais conhecidos, adquirindo, a partir daí, a sistemática necessária par executar adequadamente o processo desejado dos dados fornecidos. Sendo assim, a rede neural é capaz de extrair regras básicas a partir de dados reais, diferindo da computação

programada, onde é necessário um conjunto de regras rígidas pré-fixadas e algoritmos (Haykin, 1999).

a

1

a

2

a

k

b

1

b

2

b

k

c

1

c

k

y

1

y

k

x

1

x

2

x

k

.

.

.

.

.

.

.

.

.

Entrada

Dados Normalizados CamadaOculta Saída

f(xi) f(Σvijai)

f(Σwijbi)

Figura 3.1: Rede Neural de múltiplas camadas ("Feedforward"), com uma camada oculta, onde xi são as variáveis de entrada, f(.) é a função de ativação, vij e wij pesos das conexões dos neurônios entre as camadas e yi a resposta desejada.

O primeiro passo no treinamento da rede neural consiste em se definir as variáveis a serem utilizadas como entrada(s) e saída(s) para rede. Essa escolha é um dos itens de grande importância para se alcançar sucesso na utilização da técnica. O segundo passo reside na definição do número de camadas ocultas e do número de neurônios (elementos processantes) de cada camada, além da definição da função de ativação a ser utilizada em cada elemento. A próxima etapa consiste na elaboração da base de dados, que será utilizada durante a etapa de treinamento ou aprendizado da rede, e da escolha de um algoritmo de treinamento (Cruz, 1996).

O algoritmo da retropropagação (Rumelhart e McClelland, 1986) é bastante utilizado em redes neurais múltiplas camadas e ele é baseado na técnica do gradiente descendente e a função mais comumente empregada para realizar o ajuste dos pesos da rede é a soma dos quadrados dos erros (SQE). A adaptação dos pesos da rede inicia-se com um valor arbitrário e vai sendo alterado à medida que a funcão SQE é minimizada. No algoritmo da retropropagação o parâmetro η (taxa de aprendizado), que controla a estabilidade e a taxa de convergência, pode ser reduzido durante o treinamento para

diminuir os efeitos de ruídos sobre a correção dos pesos, ou pode ter seu valor aumentado para acelerar o processo de treinamento. Outro parâmetro é o termo do momento (α), que é um peso extra adicionado quando estes são ajustados, melhorando a taxa de treinamento (Widrow & Lehr, 1990).

A fase de aprendizado da rede neural é de grande importância. Devido à necessidade de sucessivas repetições dos padrões de entrada-saída para a rede, grande quantidade de tempo pode ser requerida nesta etapa. É nesta fase também que podem surgir problemas como o sobretreinamento "overfitting", mínimo local da rede, além de dificuldades de convergência. A fase mais onerosa no emprego da técnica encontra-se na etapa de treinamento da rede. Existem na literatura propostas de algoritmos para superar e/ou evitar estes problemas (Baughman e Liu, 1995).

O modelo da rede neural a ser empregada aqui é um do tipo "feedforward", com uma camada de entrada, uma oculta e uma de saída. As variáveis escolhidas como entrada da rede neural foram as concentrações de glicose, acetato de amônio, fósforo, DL- metionina, ácido oléico e solução de sais e a variável de saída a velocidade específica máxima de crescimento. Desta forma, a topologia da rede incluia 6 entradas e uma saída.

O algoritmo da retropropagação (Rumelhart et al., 1986) foi empregado para o treinamento da rede. A função objetivo empregada durante a fase de treinamento foi a soma dos quadrados dos desvios entre a velocidade específica máxima de crescimento na saída da rede e os valores experimentais, sobre todo o conjunto de dados.

A primeira etapa para a utilização desta técnica consiste na definição do número de neurônios (φ) na camada oculta e na elaboração da base de dados que será empregada para o treinamento da rede. Numa segunda etapa, determina-se o parâmetro η (taxa de aprendizado) e o parâmetro termo do momento, α. Para a etapa de treinamento da rede empregou-se taxa de aprendizado e termo de momento, 0,7 e 0,9, respectivamente, valores estes comumente citados na literatura (Rumelhart et al., 1986; Widrow e Lehr, 1990; Hoskins e Himmelblau, 1988). A função de ativação utilizada nos neurônios foi a sigmoidal (Bhat e Mc Avoy, 1990). Dados experimentais obtidos a partir dos vários planejamentos experimentais realizado serão selecionados para compor a base de dados para o treinamento da rede e validação do modelo.