• No results found

A seguir apresentam-se vários comentários sobre o ADEANN focando nos conceitos mais importantes sobre o quais essa tese foi direcionada.

a) Dependência mínima do especialista: esta tese propõe um sistema automatizado de reconhecimento de padrões e previsão de séries temporais, exigindo apenas um conhecimento mínimo do usuário. O sistema GP (RIVERO et al., 2010) tem vários parâmetros, três dos quais (o coeficiente de penalidade, a altura das árvores, e o número máximo de entradas para cada neurônio) que devem ser definidos por um especialista. No entanto, o ADEANN tem apenas cinco parâmetros (listados na Tabela 21), que podem ser definidos pelo usuário;

b) Esquema de codificação dos genótipos compacto: no ADEANN o ECI inspirado na codificação genética do ADN, um único gene é utilizado várias vezes em diferentes fases do desenvolvimento neuronal. Os genes reutilizados (regras de produção codificadas) permitem representações compactas de fenótipos complexos e redução dimensional do espaço de busca. Para elucidar a compressão fornecida por ECI do ADEANN, consideramos a redução de escalabilidade em relação a outros métodos. Nos métodos de Kitano (1990) e Boozarjomehry e Svrcek (2001), os tamanhos das redes geradas são funções quadráticas do comprimento dos cromossomos, dados por N2 e (N (N + 1) / 2), respectivamente. Por exemplo, para os comprimentos de cromossomos listados na Tabela 17, que variam entre 180-516, as redes neurais que seriam geradas pelos métodos de Kitano (1990) e Boozarjomehry e Svrcek (2001) conteriam (no máximo) 13 a 22 neurónios e 18 a 31 neurônios, respectivamente. Em contraste, dependendo do valor de NR gerado aleatoriamente, nas Equações 41 e 42, o ADEANN pode gerar RNAs muito maiores, pois os tamanhos das redes neurais geradas (fenótipos) são independentes do comprimento do cromossomo, o que é uma vantagem. O método proposto no ADEANN pode manipular cromossomas, que são 30% menores (redução de 256 bits para 180) do que aqueles usados no Graph Rewriting Grammar (GRG) (CANTU-PAZ; KAMATH, 2005). No ECI proposto por Hornby e Pollack (2002), os genótipos codificam vinte regras de reescrita de um Sistema-L. O ECI do ADEANN codifica um Sistema L paramétrico com apenas dez regras de produção, demonstrando que o mesmo é mais compacto do que a versão proposta por Hornby e Pollack (2002). O método de codificação baseado no ADN, utilizado pelo ADEANN pode representar arbitrariamente regras de desenvolvimento de qualquer número e comprimento (LEE; SEO; SIM, 2007). Além disso, o mecanismo de memória utilizado em nossa abordagem permite gerar vias de

desenvolvimento separadas. Rivero et al. (2010) utiliza uma lista para armazenar neurônios existentes, e referencia-los por operadores especiais. Em contraste, o método utilizado pelo ADEANN gera grafos codificados por uma gramática no AG. Portanto, múltiplos neurónios estão implicitamente referenciados dentro dos cromossomos do AG, ao invés de armazenar topologias neurais prontas. Por conseguinte, as arquiteturas de redes neurais geradas pelo ADEANN podem crescer indefinidamente, independentemente da estrutura de dados;

c) Implementa o paralelismo implícito: para tornar o AG, utilizado pelo ADEANN, mais próximo do processo evolutivo biológico, o mesmo evolui uma representação generativa (um ADN hipotético). Os genótipos do mesmo, codificam um conjunto de dez regras de reescrita de um Sistema L. Com objetivo de modelar a abordagem construtiva dos processos evolutivos reais, no método utilizado pelo ADEANN, as regras do Sistema L são automaticamente extraídas pelo AG. Desta forma, pode-se controlar o número e o tempo de disparos das mesmas, isto é, o número de vezes de que cada regra é aplicada e em que contexto. O processo de extração de regras pelo AG no ADEANN é inspirado na síntese de proteínas, que é um processo paralelo que consiste na obtenção de nucleotídeos que constituem as proteínas. Como uma metáfora desse processo, a função extração de regras com o AG (secção 6.3.2), implementa esse mecanismo similar de paralelismo, lendo cada cromossomo a partir de diversas posições simultaneamente, proporcionando um maior paralelismo implícito no processo de extração de regras pelo AG. O que torna o ADEANN mais rápido do que os demais.

d) Otimização de redes neurais: o ADEANN também permite a otimização de redes neurais. Como discutido na subseção 6.3.3, a função de aptidão dada pela Equação 29 automaticamente implementa uma abordagem de penalização que recompensa redes neurais econômicas e com melhores capacidades de generalização e facilidade de implementação (ver os últimos quinze linhas e segunda coluna da Tabela 18). Esta função seleciona redes neurais baseadas em dois critérios: o número de neurônios da camada escondida e o MSE. Portanto, redes neurais menores obterão valores de aptidão maiores do que redes neurais maiores que possuam o mesmo desempenho na generalização. ANEs que evoluem redes recorrentes são raramente reportados na literatura (HORNBY; POLLACK, 2002). O ADEANN preenche parcialmente essa lacuna, possibilitando a evolução desse

tipo de arquitetura neural para simulação de problemas de reconhecimento de padrões e sistemas dinâmicos;

e) Performance: o desempenho e a robustez do ADEANN, em problemas de classificação, foram avaliados pelo método de validação cruzada. Conforme mostrado na secção 7.7.4, o ADEANN obteve um melhor desempenho global dentre todos os métodos pertencentes a categoria (II) (Tabela 34) e (III) de algoritmos (Tabela 35) e teve um desempenho comparável à de outros métodos pertencentes a categoria (I) (Tabela 33). O ADEANN requer menor esforço computacional do que todos os outros métodos pertencentes a todas as demais categorias, (Tabelas 29, 30 e 32). O ADEANN alcança a melhor precisão média de classificação em 55,5% dos casos. O desempenho do ADEANN em tarefas de predição de séries temporais também foi comparado com os métodos ARIMA (BOX; JENKINKS, 1976), UCM, ADANN (DONATE; SANCHEZ; DE MIGUEL, 2012) e o software de previsão Forecat Pro®. A Tabela 46 resume os resultados obtidos na simulação da predição de três séries temporais. O ADEANN superou os outros métodos na predição de todas as três séries temporais (Passageiros, temperatura e Dow-Jones), mas produziu maior MSE do que método UCM na predição da série temporal Passageiros. Conforme ilustrado na Tabela 47, o ADEANN obteve os melhores resultados em quase todos os conjuntos de dados e o melhor desempenho global dentre todos os métodos. Além disso, dentre os métodos de evolução gramatical, ou seja, GEGA (AHMADIZAR et al., 2015), GE (TSOULOS; GAVRILIS; GLAVAS, 2008) e GE-GP (SOLTANIAN et al., 2013), o ADEANN é o único bioinspirado, o que contribui para a sua originalidade.

f) No entanto, a abordagem proposta nessa tese também possui pontos fracos. A mesma é muito mais sensível às condições iniciais e constantes do que outros métodos existentes que não utilizam Sistemas-L como modelos de desenvolvimento. À medida que a população inicial é inicializada aleatoriamente com zeros e uns, os genótipos gerados são difíceis de serem controlados. Portanto, serão necessários testar outros métodos para configuração da população inicial, tais como métodos estocásticos, baseados, por exemplo em uma distribuição Normal (Gaussiana). Além disso, como a NR variável nas Equações 41 e 42 é gerada de forma aleatória, o algoritmo pode não gerar todas as topologias possíveis neurônios no intervalo [X, Y] numa geração específica.