Chapter 5 Analysis
5.3 Operational Issues
5.3.3 Are the rules of the BFP followed?
Nos modelos multivariados para as séries do IRPJ_DOLR e da COFINS_DE, além da série do próprio tributo, foram utilizadas as séries do PIB ou as proxys do PIB, IPI ou IVV, individualmente para cada especificação. Para a série do II, além destas, também utilizadas individualmente, foi utilizada conjuntamente a série da TCR, em cada especificação.
Para estimação dos modelos foram utilizados os seguintes softwares e métodos de estimação:
• ARIMA: E-views (versão 5.0) – OLS – Ordinary Least Square;
• Modelos univariados dinâmicos: PcGive (versão 10.0b) - OLS – Ordinary Least Square;
• Modelos multivariados dinâmicos – VAR/VEC/SEM: PcGive (versão 10.0b) – URF VAR: OLS – Ordinary Least Square; VEC: Reduced Rank Regression; SEM: FIML – Full Information Maximum Likelihood;
• Modelos de Função de Transferência - TFM: PcGive (versão 10.0b) - OLS – Ordinary Least Square;
• Modelos Estruturais – EM e EMX: Stamp (Structural Time Series Analyser, Modeller and Predictor – versão 6.20) – Maximum Likelihood.
PcGive e Stamp são módulos do software GiveWin (versão 2.02).
Na especificação ARIMA, para permitir a comparação entre os diversos modelos por meio dos critérios de ajustamento AIC e BIC, as estimações foram efetuadas sobre o mesmo intervalo de dados. Ocorre que, quando o modelo estimado inclui variáveis em diferença, especialmente diferença sazonal, isso leva à perda de muitas observações no início da série (para série mensal a primeira diferença sazonal leva à perda de 12 observações). Assim, o intervalo de estimação da série é determinado em função do modelo com maior número de parâmetros a serem estimados. Na especificação dos demais modelos (DR, TFM, VAR/VEC/SEM, EM) também foi mantido o mesmo intervalo de dados, porém, diferente do intervalo de estimação da especificação ARIMA, já que não há perda de informação devido à diferença sazonal presente neste último.
A modelagem dinâmica multivariada é usada, também, para se testar a exogeneidade das variáveis explicativas. O roteiro básico, tanto para estimação e previsão, quanto para identificação das variáveis exógenas, envolve os seguintes passos no PcGive:
1º- O procedimento tem início com um modelo bem geral – VAR irrestrito (URF VAR) com pelo menos 6 defasagens das variáveis dependentes, constante
(irrestrita), tendência (restrita), sazonalidade centrada (CSEAS - média zero, irrestrita), outliers das variáveis dependentes, geralmente conhecidas das outras modelagens (principalmente modelos estruturais), ou identificadas por meio dos resíduos do próprio modelo. As variáveis dummies que representam os outliers são tratadas também como irrestritas.
2º- A partir da especificação acima, reduz-se o modelo gradativamente, retirando-se as variáveis não significativas no teste F (retained regressors), até se chegar a um modelo mais parcimonioso. No caso das variáveis dependentes mantém-se sempre o mesmo número de lags para todas elas. A redução do modelo é testada por meio do comando “Progress” (teste-F – baseado em Rao’s F- approximation). São verificados, também, os testes de constância de parâmetros, autocorrelação, normalidade e heteroscedasticidade, com ênfase no sistema como um todo, sem deixar de considerar, quando possível, estes mesmos testes em relação às variáveis dependentes isoladamente.
3º- A etapa anterior finaliza o VAR irrestrito. Procede-se, então, ao teste de cointegração para descobrir se há cointegração entre as variáveis, por meio do posto (r) da matriz Π. Também é feita análise de cointegração I(2).
4º- A partir do posto de Π, estima-se novamente o modelo, agora VAR cointegrado, com imposição do posto de Π, sem restrições impostas sobre a velocidade de ajustamento (αααα) e/ou o vetor de cointegração (ββββ).
5º- Impõem-se restrições sobre os parâmetros αααα e/ou ββββ, para verificar a exogeneidade fraca das variáveis que supostamente foram utilizadas no modelo para ajudar a prever a arrecadação.
6º- A etapa anterior finaliza o VAR cointegrado. Para se obter um modelo mais parcimonioso, após o passo 4 ou 5, o modelo é reduzido para I(0), formando um modelo de equações simultâneas, em diferenças e com as relações de cointegração (identidades), a partir do qual restrições podem ser impostas em cada equação individualmente, bem como sobre as identidades, e os testes de adequação do modelo são efetuados. A redução do modelo é testada por meio do comando “Progress” (neste caso um teste χ² – over-identifying restrictions). Caso o parâmetro estimado para as identidades de determinada equação (variável dependente y2, por exemplo) seja igual zero, a respectiva variável é considerada fracamente exógena. Se, adicionalmente, valores passados das outras variáveis (y1,y3...) podem ser retirados da equação de y2, sem perda de informação, ou seja,
y1 , y3 etc. não causam y2 no sentido de Granger, então y2 é fortemente exógena. Neste caso, pode-se estimar um modelo de Função de Transferência ou Estrutural em que y2 é inserida como variável exógena, tornando os modelos mais simples de serem estimados, devido à diminuição do número de parâmetros, e previsões dinâmicas podem ser efetuadas.
7º- Quando o posto de Π (3º passo) é zero, estima-se ao VAR em 1ª diferença, já que as variáveis são I(1) e não há relação de cointegração entre elas. No caso de posto completo, o VAR irrestrito já é o modelo a ser utilizado, o que indica que as variáveis são I(0).
As modelagens dinâmica univariada e de Função de Transferência seguem basicamente os dois primeiros passos da modelagem multivariada. Quanto aos modelos Estruturais, inicia-se com o modelo básico estrutural (BSM – modelo F – Tabela 35), a partir do qual, em função dos resultados obtidos em cada etapa, são feitas alterações nos componentes do modelo, sempre verificando os testes de autocorrelação, normalidade e heteroscedasticidade dos resíduos, até se chegar ao modelo mais adequado.
5.1 Métodos de comparação da previsão
Os modelos estimados utilizam dados até dezembro de 2006. Os valores de 2007 são deixados de fora da amostra para permitir a comparação com os valores previstos pelos modelos. Segundo Melo (2001), os métodos mais utilizados para se medir a acurácia da previsão são o desvio absoluto médio (MAD), o erro quadrático médio (MSE) e o erro percentual absoluto médio (MAPE). Todos utilizam os resíduos em seus cálculos, definido como a diferença entre o valor previsto pelo modelo e o valor real, ou seja: et = Pt – Rt. Assim, os erros de previsão são definidos pelas seguintes fórmulas, atentando-se para o fato de que no presente trabalho utiliza-se a raiz do erro quadrático médio (RMSE), ao invés do MSE: , 100 * n R e MAPE , n e RMSE , n e MAD t t 2 t t
∑
∑
∑
= = =em que n é o número de valores previstos obtidos dos dados passados30. O MAD é definido como a média dos valores absolutos de cada resíduo; o RMSE é a raiz quadrada da média dos
valores quadráticos de cada resíduo; o MAPE considera o erro relativo de cada previsão. Nas tabelas de resultados dos modelos estimados também é apresentado o erro de previsão anual, que pretende mensurar qual o erro percentual anual da previsão, bem como se o valor previsto foi superior ou inferior ao valor real. Esta medida é importante pois, quando se trata de estimar a receita para fins de orçamento, e mesmo para a avaliação do desempenho anual da Secretaria da Receita Federal do Brasil, o que realmente importa é uma previsão anual bem feita. Esta medida é definida por:
100 * R R P E 12 1 t 12 1 t 12 1 t anual
∑
∑
∑
− =Melo (2001) destaca que se erros elevados de previsão são inaceitáveis, então o uso do RMSE faz-se necessário, enquanto que se é possível ignorar alguns erros elevados, o MAD funciona melhor. O MAPE, por se tratar de uma medida percentual é utilizado para comparar a acurácia de duas séries temporais diferentes. Neste trabalho, embora constem nos quadros comparativos as quatro medidas descritas, o RMSE será utilizado como critério de acurácia para as comparações dos métodos de previsão apresentados. Para que os erros de previsão dos modelos em nível pudessem ser comparados com os erros dos modelos em diferenças, no caso destes últimos, foi efetuada a transformação da previsão da variável em diferença para previsão em nível.