4.1. The interpretation of solutions journalism at Amhara Mass Media Agency
4.1.3. Uneven levels of engagement
A otimização dos parâmetros listados nos Algoritmos 6 e 7 pode ser realizada por qualquer metaheurística aplicável a funções com variáveis contínuas. Este tra- balho utiliza o algoritmo Differencial Evolution; o Anexo C discorre sobre o mesmo.
A figura de mérito utilizada de forma extensiva na modelagem dos processos 𝒳𝑡 é a função do MAPE. O MAPE do modelo de uma série temporal é definido na
forma da Equação 5.7. MAPE = 1 𝑁 𝑁 ∑︁ 𝑘=1 ⃒ ⃒ ⃒ ⃒ 𝑥𝑘− 𝑥𝑒𝑠𝑡.𝑘 𝑥𝑘 ⃒ ⃒ ⃒ ⃒ (5.7)
Capítulo 5. Metodologia proposta 71
Algoritmo 7: Etapa II: MA-FTS
Data: Erros 𝜖 gerados ao fim da Etapa I - SARFI-FTS
1 Por análise da FAC sobre 𝜖, especificar 𝑞, 𝑄 ; 2 Defina o universo de discurso;
3 Otimize os parâmetros ; // 𝜆, 𝜃1, 𝜃2, 𝜃3,· · · , 𝜃𝑞,Θ1,Θ2,Θ3,· · · , Θ𝑄 4 while¬ Critério de parada do
5 Calcule 𝜉𝑡−𝑖; where 𝑖 = 1, 2, 3, · · · , 𝑠𝑒𝑙𝑒𝑐𝑡𝑒𝑑𝑂𝑟𝑑𝑒𝑟; 6 Estabeleça as FRLGs;
7 foreach 𝑡 do
8 Sejam 𝐵𝑖1, 𝐵𝑖2, 𝐵𝑖3,· · · , 𝐵𝑖selectedOrder o lado esquerdo da FLRG no tempo 𝑡;
9 if Lado direito contém um ou mais números fuzzy na forma
𝐵𝑖1, 𝐵𝑖2, 𝐵𝑖3,· · · , 𝐵𝑖selectedOrder → 𝐴𝑖1, 𝐴𝑖2, 𝐴𝑖3,· · · , 𝐴𝑖k then 10 Predito(t+1) = −𝜉𝑡−1𝜖𝑡−1− 𝜉𝑡−2𝜖𝑡−2− 𝜉𝑡−3𝜖𝑡−3− · · · −𝜉𝑡−𝑠𝑒𝑙𝑒𝑐𝑡𝑒𝑑𝑂𝑟𝑑𝑒𝑟𝑀𝑡−𝑠𝑒𝑙𝑒𝑐𝑡𝑒𝑑𝑂𝑟𝑑𝑒𝑟+ 𝜆( 𝑀𝑖1 + 𝑀𝑖2 + 𝑀𝑖3 + · · · , 𝑀𝑖k 𝑘 ) 11 end if
12 if Lado direito não contém nenhum número fuzzy na
forma𝐵𝑖1, 𝐵𝑖2, 𝐵𝑖3,· · · , 𝐵𝑖selectedOrder → ∅ then
13
Predito(t+1) = −𝜉𝑡−1𝜖𝑡−1− 𝜉𝑡−2𝜖𝑡−2− 𝜉𝑡−3,𝑠𝜖𝑡−3− · · ·
−𝜉𝑡−𝑠𝑒𝑙𝑒𝑐𝑡𝑒𝑑𝑂𝑟𝑑𝑒𝑟,𝑠𝜖𝑡−𝑠𝑒𝑙𝑒𝑐𝑡𝑒𝑑𝑂𝑟𝑑𝑒𝑟 14 end if
15 end foreach
16 Calcule o MAPE e ajuste os parâmetros de acordo com o algoritmo DE; 17 end while
(RMSE), na forma da Equação 5.8.
RMSE = ⎯ ⎸ ⎸ ⎷ 1 𝑁 𝑁 ∑︁ 𝑘=1 (𝑥𝑘− 𝑥𝑒𝑠𝑡.𝑘 ) 2 (5.8)
A principal diferença entre essas funções é a dimensionalidade de cada uma. O MAPE é uma quantidade adimensional, útil em uma comparação de desempenho qualitativa entre modelos diferentes. O RMSE possui a unidade da grandeza física sob estudo e com isso pode fornecer maior conhecimento sobre os impactos (econômicos, e.g.) trazidos pela modelagem.
As restrições aos parâmetros 𝑑, 𝐷, 𝜑1,··· ,𝑝,Φ1,··· ,𝑃, 𝜑1,··· ,𝑞,Φ1,··· ,𝑄, 𝜆, 𝛾 são:
∙ −0, 5 ≤ 𝑑 ≤ 0, 5; ∙ 0 ≤ 𝐷 ≤ 0, 5;
∙ 0 ≤ 𝑑 + 𝐷 ≤ 0, 5; ∙ 0 ≤ |𝜑1,··· ,𝑝| ≤ 1; ∙ 0 ≤ |Φ1,··· ,𝑃| ≤ 1; ∙ 0 ≤ |𝜃1,··· ,𝑞| ≤ 1; ∙ 0 ≤ |Θ1,··· ,𝑄| ≤ 1; ∙ 0 ≤ 𝜆 ≤ 1; ∙ 0 ≤ 𝛾 ≤ 1.
73
6 Resultados
Serão exploradas quatro bases de dados para validação da metodologia pro- posta. A primeira base de dados consiste em demandas de energia elétrica de quatro perfis de clientes de uma grande distribuidora brasileira. Os dados foram coletados entre 01/01/2003 e 01/12/2011. Busca-se modelar com assertividade os comporta- mentos desses clientes diversos. A segunda base de dados se refere a dados de demandas coletados em quatro países europeus com demandas horárias (TAYLOR; MCSHARRY, 2007). Outra base consiste em dados hemi-horários dos sistemas na- cionais da França e Inglaterra coletados no ano de 2005 (SADAEI et al., 2014) e a última base consiste em informações de demanda de quatro MR (LIU et al., 2014b; COELHO et al., 2016b).
Para avaliar o desempenho do método SARFIMA-FTS implementado, foi reali- zado o cálculo do MAPE sobre os dados de treinamento e de validação para apenas um passo à frente. Essa será considerada a condição básica de aplicação de métodos e sistemas de predição às redes inteligentes.
Para cada base de dados, foram realizadas 21 replicações do experimento de otimização dos parâmetros 𝑑, 𝐷, 𝜑1,··· ,𝑝,Φ1,··· ,𝑃, 𝜃1,··· ,𝑞,Θ1,··· ,𝑄, 𝜆, 𝛾 para modelagem dos
processos, gerando-se as estatísticas sobre o desempenho da metodologia proposta. O otimizador utilizado foi o algoritmo de evolução diferencial (STORN; PRICE, 1997; PRADO et al., 2010a) (v. Capítulo 4 e Anexo C).
A estruturação do modelo para cada problema analisado foi feita a partir da seleção da quantidade 𝑀 de parâmetros SARFI Ω𝑛,𝑠, 𝑛 ∈ 1, · · · , 𝑀 , da seleção da
quantidade 𝑁 de parâmetros 𝜉𝑛,𝑠, 𝑛∈ 1, · · · , 𝑁 e do período de sazonalidade 𝑠. 𝑀, 𝑁, 𝑠
foram selecionados a partir das análises de FAC e FACpar. 𝑀 será o último lag no gráfico de FACpar com valor significativo e positivo; 𝑁 será o último lag no gráfico de FACpar com valor significativo e negativo e 𝑠 será o maior período observado no gráfico de FAC.
Antes de proceder com a execução do algorimo, é necessário estabelecer os parâmetros básicos ARFIMA 𝑝, 𝑃, 𝑞, 𝑄. Os parâmetros 𝑝, 𝑃 foram fixados em 𝑝 = 𝑃 = 3 e os parâmetros 𝑞, 𝑄 foram vinculados como 𝑞 = 𝑄 = 𝑁. A seleção de 𝑝, 𝑃 levou em consideração Equação 3.29: Ω𝑡−𝑛,𝑠 = 𝑀D ∑︁ 𝑗=0 𝑀D→∞ 𝑀d ∑︁ 𝑘=0 𝑀d→∞ 𝑃 ∑︁ 𝑙=0 𝑝 ∑︁ 𝑖=0 (−1)𝑗+𝑘𝑓𝑛(𝑖, 𝑙, 𝑘, 𝑗, 𝑠)𝛽(𝑗)𝛼(𝑘)Φ𝑙𝜑𝑖
Era necessário selecionar 𝑝, 𝑃 balanceando a precisão do cálculo de Ω𝑛,𝑠 e o
tempo desse cálculo - a complexidade do cálculo de Ω𝑛,𝑠 é de 𝒪(𝑚4). A precisão está
relacionada às 𝑙 ·𝑖 combinações de cálculo da parcela Φ𝑙𝜑𝑖 na Equação 3.29 - algumas
dessas combinações serão anuladas pelo fator 𝑓𝑛(𝑖, 𝑙, 𝑘, 𝑗, 𝑠). Visto que 𝑀𝑑, 𝑀𝐷 → ∞
(de fato, 𝑀 = max(𝑀𝐷, 𝑀𝑑)), as quantidades dos parâmetros 𝜑1,··· ,𝑝 e Φ1,··· ,𝑃 aumen-
tariam a resolução no cálculo de Ω𝑡−𝑛,𝑠. Sendo que esses parâmetros estão restritos
a 0 ≤ 𝜑, Φ ≤ 1, em uma implementação computacional com resolução de 16 casas decimais1será possível alcançar resoluções da ordem de 10−32(precisão mais que su-
ficiente para qualquer aplicação industrial) e, portanto, valores baixos de 𝑝, 𝑃 seriam suficientes; com isso, convencionou-se 𝑝 = 𝑃 = 3.
Para estabelecer 𝑞, 𝑄, levou-se em consideração a Equação 3.34:
𝜉𝑡−𝑛,𝑠 = 𝑄 ∑︁ 𝑗=0 𝑞 ∑︁ 𝑖=0 𝑔𝑛(𝑖, 𝑗, 𝑠)Θ𝑗𝜃𝑖
Sendo a quantidade de parâmetros 𝜉1,··· ,𝑁, fixou-se 𝑞 = 𝑄 = 𝑁.
6.1
Análise com dados de sistema de distribuição -
Empresa de distribuição brasileira (EDB)
A Figura 24 ilustra o perfil de quatro clientes (ou subsistemas) da empresa de distribuição codificados como A,E,C,D. As bases de dados consistem em medições de demanda de energia elétrica durante 108 meses. Observa-se que dois desses clientes (A e C) possuem uma forte tendência ascendente os outros dois a presença de ciclos de demanda (D e E). Possivelmente, A e C exibem o comportamento de setores in- dustriais em período de expansão econômica: há um contínuo aumento da demanda de energia elétrica à medida em que a taxa de ocupação da indústria aumenta. Os clientes D e E representariam setores residenciais e/ou comerciais.
É pertinente observar a presença das características de memória longa e sa- zonalidade, combinadas ou não, em todas as séries listadas. Observando-se a Figura 25, conclui-se que as curvas de demanda dos clientes A e C aprensentam caracterís- ticas de dependência de memória longa. O decaimento da FAC satisfaz as condições das Definições 5 e 6. Os clientes D e E apresentam ciclos ou quase-ciclos sazonais de período de 12 meses.
A partir da análise das funções de autocorrelação e autocorrelação parcial (v. Figuras 25 e 26), foram selecionados os parâmetros listados na Tabela 3. A análise da FACpar mostrou, em todas as quatro instâncias de problema, para 𝑀 > 12 não haviam
Capítulo 6. Resultados 75
Figura 24 – Perfil dos dados de treinamento (EDB)
Figura 25 – Funções de Autocorrelação (EDB) - dados de treinamento
valores significativos positivos de autocorrelação parcial. Já os valores de autocorre- lação parcial negativa, os quais indicam a ordem da parcela MA do modelo, não eram mais significativos para 𝑁 > 13 (EDB-CONS-E), 𝑁 > 15 (EDB-CONS-D), 𝑁 > 16
Figura 26 – Funções de Autocorrelação Parcial (EDB) - dados de treinamento
Tabela 3 – Parametrização dos modelos SARFIMA-FTS para a EDB Instância Parâmetros Valor
EDB-CONS-A M,N,s 12,16,0 EDB-CONS-E M,N,s 12,13,12 EDB-CONS-C M,N,s 12,0,0 EDB-CONS-D M,N,s 12,15,12
(EDB-CONS-A). Houve até mesmo um caso especial em quenão havia necessidade da parcela MA, levando a 𝑁 = 0 (EDB-CONS-C). A análise de FAC mostrou que para as instâncias EDB-CONS-E e EDB-CONS-D há ciclos de sazonalidade 𝑠 = 12 e para as outras instâncias não se identifica nenhum ciclo sazonal.
A Figura 27 resume os desempenhos durante as replicações do experimentos da modelagem sobre os dados de treinamento. Em todos as instâncias foram obti- das MAPE< 5%. Para sistemas de medição de demanda e de faturamento de energia têm-se acurácia dessa ordem e, portanto, os desempenhos dos modelos encontra- dos são compatíveis com processos de medição e predição de demanda atualmente existentes.
Pode-se avaliar o desempenho dos modelos obtidos não apenas pelo MAPE, mas também por análise de resíduos. A Figura 28 agrega os gráficos de avaliação de normalidade de resíduos através de um gráfico quantil-quantil (“qqnorm plot”) dos 11 modelos obtidos ao fim da otimização para cada uma das quatro instâncias de proble-
Capítulo 6. Resultados 77
Figura 27 – Valores de MAPE sobre as séries temporais da EDB.
mas apresentadas. Um gráfico quantil-quantil compara a distribuição dos valores dos resíduos (valores na abscissa e quantis na ordenada) com os quantis esperados de uma distribuição normal (a linha diagonal). Quanto mais alinhados os pontos estiverem da linha diagonal, mais confiança de que a distribuição é uma normal.
Através da análise dos gráficos da Figura 28 e da realização de testes estatís- ticos (aqui, de Jarque-Bera (JARQUE, 1987)), observou-se que a hipótese nula de normalidade de resíduos se confirmou em todas as instâncias de problema. Conclui- se daí que os modelos obtidos são estatisticamente significantes.