9.8 Metodedrøfting
9.8.2 Personlig intervju og instrument
O problema de otimização abordado neste trabalho pode ser descrito da forma (Bonilla-Petriciolet, Rangaiah e Segovia-Hernández, 2010):
Maximizar/Minimizar:
Sujeito a ∈ (30)
sendo um vetor de variáveis de decisão contínuas de domínio Ω de dimensão igual ao número de variáveis de otimização ( ) que são os parâmetros do modelo, e : Ω → uma função objetivo de valor real. Isto é, é o vetor de parâmetros a ser otimizado por uma estratégia de treinamento que maximiza ou minimiza a função objetivo através de um algoritmo de busca. Como ilustrada pela Figura 37, a estratégia de treinamento depende de um banco de dados de treinamento, de um algoritmo de busca e de uma função objetivo.
Figura 37. Elementos de um problema de otimização.
Esses elementos são apresentados ao longo deste tópico 5.1. 5.1.1 Dados de treinamento
Dados de treinamento são dados de entrada/saída do processo ou fenômeno estudado que são utilizados na construção da função objetivo. Para a estimação de parâmetros de modelos de coeficiente de atividade, muitos tipos de dados têm sido utilizados: dados de equilíbrio líquido-vapor e líquido-líquido, coeficiente de atividade a diluição infinita, entalpia de excesso (Abrams e Prausnitz 1975; Gmehling, 2009; Soares e Gerber, 2013; Soares et al., 2013). Os dados de treinamento podem ser divididos em dados de estimação dos parâmetros e em dados de validação que servem para avaliar o resultado da estimação (Nelles, 2001, p.13).
5.1.2 Função objetivo
A função objetivo é uma formulação matemática que representa a aderência do modelo matemático ao problema físico. O objetivo é maximizá-la ou minimizá-la variando os parâmetros a serem estimados. A função objetivo pode ter várias formulações e seu cálculo depende das hipóteses consideradas a respeito do modelo e dos dados de treinamento (Schwaab e Pinto, 2007, p.234-287).
5.1.3 Algoritmo de busca
Um algoritmo de busca é um conjunto de operações passo-a-passo construído de forma a retornar uma informação a partir de alguma estrutura de dados. Na estimação de parâmetros, o algoritmo de busca procura os valores dos parâmetros através dos dados de treinamento avaliando o máximo ou mínimo de uma função objetivo. Os diferentes algoritmos de busca são construídos de maneira que suas características permitam diferentes formas de exploração do espaço de busca, que pode ter topologia não trivial, e mesmo não suave.
Os algoritmos de busca podem ser classificados como: local ou global; estocásticos ou determinísticos; de busca direta ou baseados no gradiente; populacional ou não (Nelles, 2001, p.26; Schwaab e Pinto, 2007, p.307-338). O Quadro 3 mostra alguns algoritmos de busca e suas principais características.
Quadro 3. Algoritmos de busca e suas características. Algoritmo de busca Características e método
Steepest descent, gradiente descendente (Cauchy, 182913, apud
Petrova and Solov’ev, 1997)
Algoritmo local, baseado no gradiente e com único ponto inicial. Usa somente a primeira derivada na atualização dos parâmetros (variáveis de otimização).
Newton
(Newton, 1669, apud Yamamoto, 1999)
Algoritmo local, baseado no gradiente e com único ponto inicial. Utiliza a hessiana para rotacionar e pesar o gradiente na atualização dos parâmetros.
Quasi-Newton
(Nelles, 2001, p.98) Algoritmo local, baseado no gradiente e com único ponto inicial. Método de Newton aproximado que usa somente a primeira derivada na atualização dos parâmetros.
Gauss-Newton
(Nelles, 2001, p.104) Algoritmo local, baseado no gradiente e com único ponto inicial. Versão não linear dos mínimos quadrados do método de Newton. Levenberg-Marquadt
(Levenberg, 194414,
apud Marquadt, 1963)
Algoritmo local, baseado no gradiente e com único ponto inicial. Método de Newton com regularização.
Simplex
(Spendley, Hext e Himsworth, 196215 apud
Nelder and Mead, 1965)
Algoritmo local, com busca direta e com único ponto inicial. Compara os valores da função objetivo de um poliedro, composto do número de parâmetros +1 vértices, criado a partir do ponto inicial.
Simulated annealing (Kirkpatrick, 198316,
apud Ingber, 1993)
Algoritmo global, estocástico, com busca direta e com único ponto inicial. Analogia com o processo de arrefecimento térmico. Existe uma variável de temperatura que representa o grau de aleatoriedade na atualização dos parâmetros dentro do processo iterativo. Essa temperatura começa alta e vai diminuindo conforme o algoritmo vai convergindo, diminuindo assim a possibilidade de iterações em sentindo contrário ao de busca natural.
Evolutionary strategy (Rechenber e Schwefel, 1960s, apud Nelles, 2001, p.123)
Algoritmo global, estocástico, com busca direta e multi-start. Analogia da teoria da evolução natural e da genética (mutação, recombinação e seleção). O único passo estocástico é a mutação, os outros dois são determinísticos e baseados na ideia da média ser o melhor ponto e na de seleção natural.
Genetic algorithm (Holland, 197517, apud
Nelles, 2001, p.126)
Algoritmo global, estocástico, com busca direta e multi-start. Analogia da teoria da evolução natural e da genética (mutação, recombinação e seleção). O algoritmo acontece em nível da memória binária do computador e os três passos possuem características estocásticas.
Particle swarm (Kennedy e Eberhart, 1995)
Algoritmo global, estocástico, com busca direta e multi-start, com inicialização a partir de uma população de chutes iniciais do vetor de parâmetros. Analogia ao comportamento de um bando de pássaros. A atualização da posição de cada partícula leva em conta sua inércia, sua melhor posição e a melhor posição de todo o enxame.
Fonte: baseado em Nelles (2001).
13 Cauchy, A.L. Me´moire sur divers points d’analyse. Me´moires de l’Acade´mie de France, v.8, p.130–
138, 1829.
14 Levenberg, K. A method for the solution of certain non-linear problems in least squares. Quarterly of
Applied Mathematics, v.2, p.164-168, 1944.
15 Spendley, W; Hext, G.R.; Himsworth, F.R. Sequential application of simplex designs in optimization
and evolutionary operation. Technometrics, v.4, p.441, 1962.
16 Kirkpatrick, A.S.; Gelatt Jr, C.D.; Vecchi, M.P. Optimization by simulated annealing. Science,
v.220(4598), p.671-680, 1983.
5.1.4 Vetor de parâmetros estimados
No problema de otimização, o conjunto de parâmetros estimados formam um vetor de elementos que muda durante a otimização.
5.1.5 Estimação de parâmetros de modelos de coeficiente de atividade
O Quadro 4 apresenta vários tipos de abordagens do problema por diversos autores.
Quadro 4. O problema de estimação de parâmetros de modelos de coeficiente de atividade abordado por diversos autores.
Trabalho Características
Dados de treinamento; Função objetivo; Algoritmo de busca; Vetor de parâmetros e modelo de coeficiente de atividade
Anderson, Abrams e Grens II (1978)
Dados de ELV de sistemas binários; Máxima verossimilhança; Gauss- Newton; Parâmetros de interação da equação de van Laar.
Gmehling et al, (1993); Gmehling (2009)
Dados de equilíbrio de sistemas binários; Mínimos quadrados; Simplex Nelder-Mead seguido de Marquadt; Parâmetros geométricos e de interação do modelo UNIDMD.
Dominguez, Tojo,
Castier (2002) Dados de ELV de sistemas binários; Mínimos quadrados relativos; Análise de intervalos; Parâmetros de interação dos modelos Wilson e UNIQUAC. Bonilla-Petriciolet
et al. (2007) Dados de ELV de sistemas binários; Mínimos quadrados relativos e máxima verossimilhança; Simulated annealing; Parâmetros de interação da equação de van Laar.
Bonilla-Petriciolet, Rangaiah e Segovia-
Hernandez (2010)
Dados de ELV de sistemas binários; Mínimos quadrados relativos e máxima verossimilhança; Simulated annealing, algoritmo genético, evolução diferencial e enxame de partículas; Parâmetros de interação dos modelos Wilson, NRTL e UNIQUAC.
Lazzús, 2010 Dados de ELV do sistema etanol-água; Somatório dos desvios de temperatura e fração molar da fase vapor; Enxame de partículas; Parâmetros de interação dos modelos NRTL e UNIQUAC.
Zhang et al.
(2011) Dados de ELV de sistemas binários; Mínimos quadrados relativos e máxima verossimilhança; Bare-bones e enxame de partículas; Parâmetros de interação dos modelos Wilson, NRTL e UNIQUAC.
Bonilla-Petriciolet
(2012) Dados de ELV de sistemas binários; Mínimos quadrados relativos e máxima verossimilhança; Harmony search; Parâmetros de interação dos modelos Wilson, NRTL e UNIQUAC.
Soares e Gerber (2013); Soares et al.(2013)
Coeficiente de atividade à diluição infinita; Desvio médio do logaritmo da variável; Divisão de retângulos; Parâmetros geométricos e de interação do modelo F-SAC.
Fonte: elaborado pela autora.
A estimação de parâmetros de modelos de coeficiente de atividade baseados em composição local como NRTL (Non Random Two Liquids) de Chen et al. (1980) ou UNIQUAC (Universal QUAsi-Chemical) de Abrams e Prausnitz (1975) tem sido extensivamente estudada (Quadro 4). Contudo, menor atenção tem sido dada à estimação de parâmetros de métodos baseados em contribuição de grupos, que
apresentam dificuldades de otimização adicionais, uma vez que um único parâmetro pode depender de dados experimentais de muitas misturas e substâncias puras.