• No results found

5.2 Findings From the Observation

5.2.1 The Lesson

Vários outros autores (MAKRIDAKIS; WHEELWRIGHT, 1989; MYERS; MONTGOMERY; VINING, 2002) discorrem sobre alguns pressupostos básicos utilizados para verificar se um modelo é adequado. Embora esses autores usem nomes diferentes para os pressupostos e os apresentem em seqüência diferente, neste trabalho serão apresentados e nomeados da forma em que foram encontrados com mais freqüência na literatura revisada. Se estes pressupostos são desobedecidos, o modelo pode levar a estimativas errôneas e imprecisas. São eles: a) Linearidade: levando em consideração que a classe dos modelos em pauta é linear, a resposta deve ser uma função linear das variáveis envolvidas. Embora o pressuposto da linearidade dificilmente seja confirmado nas questões práticas, a regressão linear múltipla não é grandemente afetada por pequenos desvios da linearidade. Mas é prudente relacionar a variável resposta com cada variável independente, separando e identificando, graficamente, o comportamento de cada um desses pares.

b) normalidade ou distribuição normal dos resíduos (erros): se os resíduos se aproximam de uma linha reta, como se observa na figura 6, o pressuposto é atendido. (MCKENZIE; GOLDMAN, 1999; MYERS; MONTGOMERY; VINING, 2002). Quando o gráfico de resíduos é padronizado, o eixo horizontal deixa de representar escala numérica e passa a representar os desvios-padrão. O gráfico padronizado do modelo normal é útil na medida em que os pontos suspeitos (fora da faixa -2 desvios a +2) são facilmente detectados. Esses pontos, chamados outliers, podem ser oriundos de erro de coleta, má calibragem de equipamento, etc.

Se existem mais de 30 observações, este pressuposto é considerado como atendido. Aumentar o número de observações é sempre uma boa abordagem. Se

houver menos de 50 observações coletadas, o gráfico pode apresentar curvatura nas caudas, mesmo que os resíduos sejam distribuídos normalmente.

Figura 6 – Gráfico de probabilidade normal dos resíduos, resultante do exercício da tabela 4. Adaptado deMyers; Montgomery e Vining (2002).

Usando testes de ajuste, como por exemplo, a estatística de Anderson-Darling, é possível verificar a normalidade da distribuição dos resíduos. Se o p-value desse teste for maior do que o nível de significância α, os dados seguem uma distribuição normal. A normalidade está também validada se, para um intervalo de confiança de 95%, o valor AD (Anderson-Darling) for menor que 0,787000. (MCKENZIE; GOLDMAN, 1999; STEPHENS, 1974).

c) variância constante dos erros ou homocedasticidade: se os pontos do gráfico de valores previstos versus residuais formarem uma “nuvem aleatória” (sem padrão definido), como se observa na figura 7, o pressuposto é atendido, pois os resíduos não dependem do valor do ganho de transitor (hFE) previsto pelo exercício da tabela 4.

Um exemplo visual da falta da variância constante (ou heterocedasticidade) é um gráfico com pontos que seguem um padrão de “funil aberto à direita”. Quando há heterocedasticidade, os testes de significância perdem sentido. Na tentativa de corrigir o problema, variáveis adicionais podem ser incluídas, e as variáveis

existentes podem sofrer transformações. As medidas corretivas não são tão fáceis de serem implementadas e não serão abordadas neste trabalho.

Figura 7 – Gráfico de probabilidade normal dos resíduos, resultante do exercício da tabela 4. Adaptado deMyers; Montgomery e Vining (2002).

Algumas situações que levam a heterocedasticidade são: equipamento que descalibra quanto mais se colhe observações; experimentos desbalanceados (números de observações diferentes para cada período de tempo), entre outras. d) autocorrelação ou independência dos resíduos: cada valor residual deve ser independente do valor anterior e posterior. Do contrário, existe correlação serial – autocorrelação – entre valores residuais sucessivos. A existência de autocorrelação ocorre quando alguma variável independente importante é omitida ou quando uma variável do modelo apresenta forma funcional autoregressiva. Nesses casos, as variâncias são estimadas erroneamente, invalidando os testes de significância e trazendo valor errôneo para R². (ARMSTRONG, 2001; MAKRIDAKIS; WHEELWRIGHT, 1989).

O teste estatístico Durbin-Watson (ou Dwa) é considerado conveniente por vários autores. É um teste que determina se o resíduo entre duas observações adjacentes é zero. É necessária a comparação entre os valores críticos do teste estatístico, ou

seja, das bordas superior e inferior, com os valores teóricos tabelados. Estes valores críticos variam de acordo com o nível de significância, o número de observações do fenômeno e o número de variáveis independentes do modelo.

Figura 8 – Gráfico de interpretação para valores do teste de Durbin-Watson

Como os valores de DWa estão obrigatoriamente entre zero e quatro, a figura 8 ilustra todas as possibilidades de interpretação dos valores obtido neste teste. Se DWa (Durbin-Watson) for maior que o valor da borda superior (dU – upper) e ao mesmo tempo menor do que quatro subtraído deste mesmo valor (4 – dU), não existe autocorrelação. Se DWa for menor que o valor da borda inferior (dL – lower), existe correlação positiva. Se DWa for maior do que quatro subtraído da borda inferior (4 – dL), existe correlação negativa. Valores entre as duas bordas (dL~dU ou 4 – dU~4 – dL) representam que o teste é inconclusivo.

Embora os valores do teste devam ser analisados fazendo uso de uma tabela apropriada, como regra geral, valores do teste de Durbin-Watson entre 1,5 e 2,5 representam ausência de autocorrelação. (FEMENIAS, 2004; MAKRIDAKIS; WHEELWRIGHT, 1989; UYAK; OZDEMIR; TOROZ, 2007).

Soluções possíveis numa situação de autocorrelação podem ser:

ƒ uso de modelos autoregressivos – não considerados neste trabalho; ƒ inclusão de variável importante que tenha sido esquecida;

ƒ método das primeiras diferenças, onde a série temporal da variável com problema passa a ser as diferenças entre termos adjacentes.

e) multicolinearidade: significa alta correlação entre duas ou mais variáveis independentes. Multicolinearidade é um problema freqüente em economia e administração de negócios por causa da alta correlação entre os fatores comumente analisados nestes tipos de fenômenos: população, produto interno bruto, renda pessoal, estoques, vendas e custos. Devem ser escolhidas variáveis independentes que estejam altamente correlacionadas com a variável dependente, mas não correlacionadas entre si. Nesse caso, pequenas flutuações nos dados podem levar a grandes flutuações no tamanho dos parâmetros β e até mesmo mudar seus sinais (LEWIS-BECK, 1980). Na presença de multicolinearidade, os erros-padrão são inflacionados e por isso, os testes de significância perdem sua importância. As variáveis independentes podem aparentar não ser significantes no modelo, quando na verdade, são significantes. O diagnóstico deste problema pode ser feito ao obter R² alto sem aparentemente ter variáveis significativas no modelo.

O variance inflation factor ou fator de inflação da variância (VIF) ajuda a identificar multicolinearidade. Quanto maior o fator, maior a evidência do problema. Como regra geral usada por muitos práticos e pesquisadores, um fator VIF acima de 5 é motivo de atenção e um fator VIF acima de 10 é motivo de preocupação. Algumas soluções paliativas podem ser adotadas, como a combinação linear das variáveis que apresentam correlação (gerando uma única variável), a simples retirada de uma das variáveis que motivam a correlação, ou ainda, aumentar o número de observações. Tal questão merece um estudo aprofundado. (MAKRIDAKIS; WHEELWRIGHT, 1989; MCKENZIE; GOLDMAN, 1999). A matriz de correlação é uma ferramenta também útil na avaliação da multicolinearidade. Se o coeficiente de correlação for de 0,75 entre um ou mais pares de variáveis, pode haver multicolinearidade.

f) uma questão e não um pressuposto é: “quais variáveis são as mais importantes na explicação do fenômeno?” Uma das respostas seria: basta analisar a magnitude dos parâmetros desconhecidos β.

Alguns trabalhos comentam a tarefa de saber a importância de cada parâmetro da regressão, estando as variáveis em escalas diferentes (como dezena, centena e milhar) e em unidades de medida diferentes (como graus centígrados, anos, metros quadrados). As variáveis são chamadas padronizadas quando se subtrai de cada valor a média da série histórica e divide-se pelo desvio-padrão da mesma. De

acordo com os defensores de tal prática, torna-se possível saber qual variável é mais importante para o fenômeno e quanto que a variável resposta muda ao acrescentar um desvio-padrão em determinada variável, por exemplo. (BOBKO; SCHEMMER, 1980; LUSKIN, 1991).

A equação composta de coeficientes padronizados não retornará, como previsão, valores de resposta na escala de valores original esperada. Para tal, é utilizada a equação original.

2.3 EXEMPLO DE MODELO NÃO CAUSAL: SUAVIZAÇÃO EXPONENCIAL