2. Teoretisk rammeverk
2.1. Teorier om konkurransefortrinn
A técnica de análise multivariada requer que sejam testadas premissas para as variáveis separadas ou conjuntamente, sendo que cada técnica apresenta seu conjunto de pressupostos, bem como a “aplicação apropriada de um procedimento estatístico depende do cumprimento desse conjunto de pressupostos” (CORRAR et al., 2009, p. 151).
a) Normalidade dos resíduos
A suposição mais fundamental em análise multivariada é a normalidade da distribuição (HAIR et al., 2005).
Segundo Corrar et al. (2009, p. 154), “o conjunto de resíduos produzidos em todo o intervalo das observações deve apresentar distribuição normal, indicando, assim, que os casos amostrados se dispõem normalmente em toda a extensão da população”.
A validação do pressuposto da normalidade é realizada através de testes estatísticos, os quais, dependendo das prerrogativas assumidas acerca da distribuição dos incrementos, podem ser classificados em paramétricos e não-paramétricos.
De acordo com Bruni (2002, p. 77), os testes paramétricos são caracterizados pela exigência de suposições sobre a natureza ou forma da população envolvida, como os testes de assimetria e curtose. Já os testes não- paramétricos não assumem qualquer condição quanto à distribuição da variável sob análise, sendo, muitas vezes, denominados como testes livres de distribuição.
Na presente pesquisa, verificou-se a distribuição dos resíduos por meio do teste não-paramétrico de Kolmogorov-Smirnov, conforme Nadal et al. (2003) ao avaliar imóveis urbanos e Pena et al. (2004) ao estudar a influência dos índices Dow Jones sobre o Ibovespa.
O Teste de Kolmogorov-Smirnov (KS) “busca analisar se a função de distribuição cumulativa, observada de uma variável com uma função teórica específica, pode ser a distribuição normal” (BRUNI, 2009, p. 167), sendo recomendado quando o conjunto de observações é grande (N ≥ 50).
Para avaliar se os resíduos das equações estimadas possuem distribuição normal, admitiu-se o nível de significância a 0,05, tendo-se como hipóteses do teste, conforme proposto por Bruni (2009), Hair (2005) e Triola (2008):
H0 = a distribuição é normal quando p-valor > nível de significância (0,05);
H1 = a distribuição não é normal, quando p-valor < nível de significância (0,05).
b) Homocedasticidade
Segundo Corrar et al. (2009, p. 152) “... o conjunto de resíduos referentes a cada observação de x deve ter variância constante ou homogênea em toda a extensão das variáveis independentes. [...] Tal característica se define como homoscedasticidade”.
Quando as variáveis de erro deixam de apresentar variância constante, ocorre a heterocedasticidade, ou seja, as variâncias dos distúrbios estocásticos das observações são diferentes entre si.
Para verificar a ausência de heterocedasticidade, é usado o teste de White, “que permite verificar se há heterocedasticidade no modelo sem o conhecimento das possíveis causas”, razão pela qual este teste é bastante utilizado (GREENE, 1997).
O Teste White consiste em regredir os resíduos ao quadrado da regressão original sobre as variáveis explicativas ao quadrado e o produto cruzado dessas variáveis, sob a hipótese nula de que os coeficientes que multiplicam as variáveis explicativas são, simultaneamente, iguais a zero. “Se o valor p (probabilidade), obtido como resultado do teste, for superior ao nível de significância adotado, não se pode rejeitar a hipótese nula. Dessa forma, o modelo somente será homocedástico se o p-valor for superior ao nível de significância estabelecido; caso contrário, haverá heterocedasticidade no modelo” (FARIA et al., 2005).
c) Ausência de autocorrelação
A ausência de correlação é um dos mais aspectos importantes para que os parâmetros estimados não sejam enviesados.
O modelo pressupõe que a correlação entre os resíduos, ao longo do espectro das variáveis independentes, é zero; isto implica que o efeito de uma observação de dada variável x é nulo sobre as observações seguintes; portanto, não há causalidade entre os resíduos e a variável x e, por consequência, a variável y somente sofre influências da própria variável x considerada e não dos efeitos defasados de x1 sobre x2 e desta sobre y. Dito
de outro modo, os resíduos são independentes entre si e só se observa o efeito de x sobre y, ou seja, não existe autocorrelação residual (CORRAR et al., 2009, p. 154).
Não existe independência serial dos resíduos, quando os erros são correlacionados com os valores anteriores ou posteriores na série, e surge por causa de erros na forma do modelo ou por exclusão de variáveis independentes importantes para a análise, sendo que tal fenômeno ocorre principalmente em aplicações envolvendo séries temporais.
A ausência de autocorrelação foi verificada através do teste de Durbin- Watson, que consiste em computar uma soma ponderada dos resíduos, de tal forma que seja possível detectar algum padrão no seu comportamento ao medir a correlação entre cada resíduo e o resíduo da observação imediatamente anterior.
Na interpretação do resultado do teste, para valores próximos de 2, não existe autocorrelação dos resíduos; para valores próximos de 0, significa uma autocorrelação positiva; e para valores próximos de 4, existe uma autocorrelação negativa (PESTANA; GAGEIRO, 2000).
d) Multicolinearidade
A multicolinearidade consiste na existência de forte relação entre as variáveis explicativas, o que torna a separação dos efeitos individuais de cada variável mais difícil, pois a determinação da contribuição de cada uma delas torna-se mais complicada, uma vez que os resultados se apresentam misturados ou duas ou mais variáveis altamente correlacionadas levam a dificuldades na separação dos efeitos de cada uma delas isoladamente sobre a variável dependente, fornecendo informações similares para explicá-la e prevê- la, fazendo com que uma delas perca significância na explanação do comportamento do fenômeno. Dessa forma, diminui-se o poder preditivo de uma ou mais variáveis selecionadas em função de outra (CORRAR et al., 2007, p. 156).
Para medir a multicolinearidade, foi utilizado o Fator de Inflação da Variância (VIF), conforme sugerido por Gujarati (2000, p. 377) e pelo indicador de Tolerância, que trata-se de uma medida frequentemente usada para a multicolinearidade, definida como 1 – R2
i , em que R2i é o coeficiente de determinação para previsão de uma variável independente “i” pelas outras variáveis preditoras (HAIR et al., 2005).