• No results found

DEL II Skoleeier som styringsnivå

3 Kommunesektoren som skoleeier

3.1.1 Kommunen som skoleeier

Dada uma série temporal {yt}, o objetivo da metodologia de Box-Jenkins (1976)

26

é encontrar um modelo estocástico linear da classe ARIMA que possa ter gerado {yt} e que esse modelo possa ser utilizado para fornecer previsões de valores

futuros da série. Caso a série temporal {yt} apresente sazonalidade, {yt} pode ser representada por um modelo da classe SARIMA(p,d,q)(P,D,Q). (Box et ali, 1994).

Segundo Maddala (2003, p. 281), “a abordagem Box-Jenkins é uma das metodologias mais usadas para a análise de dados em séries temporais. Ela é popular em conseqüência de sua generalidade; ela pode lidar com qualquer série, estacionária ou não, com ou sem elementos sazonais, e tem programas de computador bem documentados.”

26

BOX, G. E. P., JENKINS, G. M. Time series analysis: forecasting and control. Holden Day, San

De acordo com Gujarati (2000, p. 745), “uma das razões para a popularidade da modelagem ARIMA é seu sucesso em fazer previsão. Em muitos casos, as previsões obtidas com esse método são mais confiáveis do que as obtidas com a modelagem econométrica tradicional, especialmente para previsões a curto prazo.”.

A estratégia de modelagem de Box-Jenkins, tanto para modelos sazonais quanto para não-sazonais, envolve as três etapas abaixo, após as quais o modelo resultante é utilizado para se fazer previsões:

(i) Identificação: descobrir os valores apropriados de p, d, q e P, D, Q (no caso de modelos sazonais);

(ii) Estimativa: estimar os parâmetros dos termos auto-regressivos e de média móvel incluídos no modelo;

(iii) Checagem de diagnóstico: verificar se o modelo escolhido se ajusta aos dados razoavelmente bem, pois é possível que um outro modelo ARIMA possa desempenhar o mesmo papel.

3.4.6.1 Identificação

De acordo com Gujarati (2000, p. 745), as principais ferramentas dessa etapa “são a função de autocorrelação (FAC), a função de autocorrelação parcial (FACP) e os correlogramas resultantes, que são simplesmente as representações gráficas das FACs e FACPs contra o tamanho da defasagem.”

A fase de identificação, segundo Fava (2000, p. 219), “é a mais difícil das etapas da metodologia de Box-Jenkins, conforme o leitor terá oportunidade de verificar na prática. Não são raros os casos em que não se consegue identificar um único modelo e sim vários modelos candidatos a gerador da série em estudo. Isso porque, trabalhando com FAC e FACP amostrais, fica difícil, muitas vezes, decidir se elas estão decrescendo ou se são truncadas.”.

Em vista disso, não se recomenda a aplicação de modelos ARIMA em séries temporais curtas, razão porque Granger e Newbold (1986, p. 81) apud Fava (2000, p. 219) “sugerem que a série tenha, no mínimo, 40 ou 50 observações”.

Para identificar as características da FAC e FACP em cada caso, que indiquem o possível processo gerador da série, Fava (2000, p. 218) apresenta, de forma resumida e simplificada, o comportamento teórico da FAC e da FACP característicos dos processos AR, MA e ARMA a seguir:

- AR(p): FAC declinante e FACP truncada (cortada) em k = p; - MA(q): truncada em k = q e FACP declinante;

- ARMA(p,q): FAC e FACP declinantes.

Segundo Box et ali (1994, p. 187), Mills (1990)27 apud Melo (2001, p. 26), Morettin e Toloi (1987, p. 225), as propriedades da FAC e da FACP para alguns padrões de modelos ARIMA, podem ser resumidas como:

- Modelo (1,d,0) = FAC com decaimento exponencial ou oscilatório e FACP (φkk=0 para k > 1);

- Modelo (2,d,0) = FAC com decaimento exponencial ou senoidal e FACP (φkk =0 para k > 2);

- Modelo (p,d,0) = FAC com decaimento exponencial e/ou senoidal e FACP (φkk =0 para k > p);

- Modelo (0,d,1) = FAC (ρk = 0 para k > 1) e FACP dominado por decaimento

Exponencial;

- Modelo (0,d,2) = FAC (ρk = 0 para k > 2) e FACP dominado por decaimento

exponencial ou senoidal;

- Modelo (0,d,q) = FAC (ρk = 0 para k > q) e FACP dominado pela combinação

linear de decaimento exponencial e/ou senoidal;

- Modelo (1,d,1) = FAC com decaimento exponencial a partir da defasagem 1 e FACP com dominado por decaimento exponencial a partir da defasagem 1; - Modelo (p,d,q) = FAC com decaimento exponencial e/ou senoidal depois da

defasagem q − p e FACP dominado por decaimento exponencial ou senoidal depois da defasagem q − p.

Para os modelos que contêm filtros sazonais e não sazonais, segundo Fava (2000: p. 228), “a FAC e FACP são mais complicadas. Para facilitar o entendimento,

27

pode-se dizer que elas são uma mistura das funções dos modelos puramente sazonais e dos não sazonais. O comportamento dos coeficientes de autocorrelação de ordens baixas fornece subsídios para a determinação de p e q, e o dos coeficientes de ordens múltiplas de s ajuda a definir P e Q.”.

Bowerman e O’Connell (1987)28 apud Melo (2001, p. 27) resumem as propriedades da FAC e da FACP para os seguintes padrões de modelos SARIMA:

- Modelo (P,D,0) = FAC com decaimento e FACP com picos nas defasagens s, 2s, ...Ps; e corte após Ps;

- Modelo (0,D,Q) = FAC com picos nas defasagens s, 2s, ...Qs e corte após Qs. FACP com decaimento;

- Modelo (P,D,0) ou (0,D,Q) = FAC com picos nas defasagens s, 2s, ...Qs e corte após Qs. FACP com picos nas defasagens s, 2s, ...Ps e corte após Ps; - Modelo (P,D,0) e (0,D,Q) = FAC com decaimento rápido na defasagem

sazonal e FACP com decaimento rápido na defasagem sazonal;

- Modelo sem operador sazonal = FAC com valores pequenos em todas as defasagens sazonais (não há picos) e FACP com valores pequenos em todas as defasagens sazonais (não há picos).

Para os modelos SARIMA, além da identificação dos termos P e Q, pode ser necessário uma diferenciação sazonal (termo D) além da diferenciação regular (termo d). Para tanto, utiliza-se também a inspeção da FAC e da FACP amostrais. Para um modelo não-sazonal, um comportamento suave persistente nas autocorrelações amostrais em defasagens altas indica não-estacionariedade, indicando a necessidade de diferenciação sazonal.

Adicionalmente ao exame das FACs e FACPs amostrais para identificação dos valores de p, d, q (ou P, D, e Q para modelos sazonais), costuma-se utilizar um “outro procedimento de identificação que depende menos do julgamento de quem está analisando a série de tempo. Esse procedimento faz uso de critérios de seleção de modelos construídos com base na variância estimada de εt, no tamanho da

28

BOWERMAN, B. L, O’CONELL, R. T. Time Series Forescasting. Unified Concepts and Computer

amostra e nos valores de p e q.”, os quais mais utilizados são os critérios de Akaike e de Scharz.

Soares e Castelar (2003, p. 103) afirmam que “não nenhuma vantagem evidente de um ou outro critério. Ambos são amplamente aceitos e seus resultados exibidos em relatórios padrões de diversos softwares econométricos, inclusive o EViews.” O cálculo dos critérios de Akaike (AIC) e Scharz (SC) no EViews resulta das fórmulas a seguir: - AIC = n q p n ) ( 2 2 + + − l (eq. 3.29) - SC = n n q p n ln ) ( 2 + + − l (eq. 3.30) onde l = − [1 ln(2 ) ln( ' / )] 2 ee n n +

+ π é o log natural da função de máxima

verossimilhança.29

Estes critérios penalizam os modelos sobreparametrizados, privilegiando os mais parcimoniosos, tendo em vista que o aumento do número de parâmetros a ser estimado num modelo reduz o número de graus de liberdade do mesmo e, consequentemente, diminui sua capacidade de previsão.

Na prática, segundo Fava (2000, p. 219), “em vez de estabelecer p e q precisamente, estimam-se os modelos correspondentes a vários pares (p,q) e escolhe-se aquela estimação que apresentar o menor valor” para os critérios de Akaike ou Sharz. Deste modo, a etapa de estimação acaba sendo executada, concomitantemente, à de identificação.

Para a modelagem SARIMA, a quantidade de modelos investigados é maior, pois além dos valores de p, d e q, deve-se incluir ainda os valores para P,Q = 0,1,2 e D = 0,1. Porém, os modelos são selecionados pelos mesmos critérios que os utilizados para os modelos ARIMA.

29

3.4.6.2 Estimação

Uma vez determinados os valores de p, d, q, P, D e Q passa-se para a estimação dos parâmetros e da variância do modelo identificado. A estimação pode ser feita por mínimos quadrados e por máxima verossimilhança. As estimativas obtidas por mínimos quadrados dependem de valores passados de yt e εt da série analisada,

razão porque o método é chamado de mínimos quadrados condicionados. Caso o componente MA(q) ou SMA (Q) esteja presente, o modelo será não linear, o que exigirá a utilização do método de mínimos quadrados não-lineares. Para a estimação por máxima verossimilhança, é necessário admitir inicialmente que os ruídos brancos εt têm distribuição normal.

Qualquer que seja o método adotado, o processo de estimação é extremamente trabalhoso e requer o uso de computador. No presente trabalho, os modelos identificados serão estimados no software econométrico EViews, o qual aplica um processo iterativo para minimização dos erros da previsão, por meio do Método dos Mínimos Quadrados Não Lineares (MQNL) ou, em inglês, Nonlinear Least Squares

(NLS).

3.4.6.3 Checagem de Diagnóstico

Segundo Fava (2000, p. 221) “essa etapa da metodologia de Box-Jenkins consiste em verificar se o modelo identificado e estimado é adequado. Em caso positivo, pode adotá-lo para fazer previsão; em caso negativo, outra especificação deve ser escolhida para modelar a série, o que implica refazer as etapas de identificação e estimação”. As formas de checagem mais comumente utilizadas são: a análise dos resíduos e a avaliação da ordem do modelo.

Se o modelo estiver apropriadamente especificado, os resíduos estimados (εt)

devem comportar-se aproximadamente como um ruído branco, com distribuição normal de média zero e variância 1/n. Assim, seus coeficientes de autocorrelação devem ser estatisticamente iguais a zero. A verificação é efetuada nas

autocorrelações amostrais dos erros (εt), por meio do exame do correlograma dos

resíduos, se a autocorrelação amostral estiver contida dentro do limite aproximado de dois desvios-padrão, representado no correlograma pelo intervalo de linhas pontilhadas, computados como ± 2 T (onde T indica o número de observações da série), não será significativamente diferente de zero, considerando um nível de significância de 5%. (Soares e Castelar, 2003: p. 216).

Dessa forma, se o modelo estiver corretamente especificado, os resíduos não devem apresentar correlações fora do intervalo das bandas de confiança (limitado por ± 2 vezes os desvios-padrão), pois toda a dinâmica dos dados já foi capturada pelo modelo.

Em adição ao exame das autocorrelações individuais dos resíduos um teste conjunto das primeiras m autocorrelações pode ser utilizado, o qual utiliza a estatística Q de Ljung-Box. Segundo Soares e Castelar (2003, p. 218) “a estatística Q na defasagem k é um teste estatístico da hipótese nula de ausência de autocorrelação até a ordem k.” No EViews, o correlograma demonstra os coeficientes de autocorrelação amostral simples e parcial, seguidos da estatística Q (Q-Stat) e de sua probabilidade (Prob), que é o menor nível de significância para o qual a hipótese nula é rejeitada.

Quanto à avaliação da ordem do modelo, objetiva-se verificar se o modelo está superestimado (p e/ou q maiores do que o devido) ou subespecificado (p e/ou q menores do que o devido). Segundo o princípio da parcimônia, o modelo não deve conter parâmetros em excesso. Essa verificação é feita com base na estatística t de Student dos parâmetros do modelo e na correlação entre eles. Se o coeficiente for estatisticamente não significativo, é provável que haja superespecificação, indicando a necessidade de redução da ordem do modelo. Para verificar se está ocorrendo subespecificação, deve-se introduzir parâmetros adicionais e analisar sua significância estatística.

multivariada, não tem a mesma utilidade para os modelos ARIMA. Harvey30 apud Maddala (2003, p. 286) sugere algumas mensurações de R2‘s relativos para julgar a escolha da ordem “p” em modelos auto-regressivos – AR(p) de séries temporais, uma vez que o R2 usual é aplicado sob o pressuposto de regressores não- estocásticos, julgando um modelo comparado a outro oriundo de uma alternativa ingênua, em que apenas a média é estimada. “Em modelos de séries temporais essa alternativa não faz sentido. A alternativa adequada é um passeio aleatório com deslocamentos, ou com dados sazonais, um passeio aleatório com tendência e com

dummies sazonais adicionadas. (Maddala, 2003: p. 286).