As análises de autocorrelação espacial levam em conta medidas estatísticas para o grau de dependência entre observações no espaço, são exemplos o I de Moran, definido por Moran (1950) e o C de Geary, definido por Geary (1954). Índices dessa natureza têm o intuito de sintetizar, em uma única medida, como um determinado fenômeno é afetado
85
pela geografia e se esse efeito envolve proximidade de unidades similares ou não similares.
Nesse tipo de análise, tem especial importância a forma como os dados são constituídos. Em concreto, para esses trabalhos, são muito relevantes as matrizes de peso espacial (em geral denotadas pela letra ). Estas matrizes, como já apontado, definem os pesos de proximidade relacionados à geografia ou às relações entre as regiões.
Normalmente, as medidas de autocorrelação espacial comparam os pesos espaciais com a covariância entre os pares de localização. Quando a medida de autocorrelação espacial é maior que o esperado pela matriz de pesos, indica-se que há um processo de aglomeração de valores similares no espaço. Em sentido contrário, quando menor que o esperado, indica que os vizinhos não são similares.
Estatísticas de autocorrelação espacial como o I de Moran e o C de Geary são globais, ou seja, dizem respeito ao universo das regiões estudadas. Isso significa que estimam o grau médio de autocorrelação de um conjunto de dados. No entanto, em cenários reais em que ocorre heterogeneidade espacial, é normal que a autocorrelação varie entre as regiões. Por isso, medidas locais das estatísticas de autocorrelação espacial permitem estimar localmente as relações de dependência no espaço.
Entre as ferramentas de análise de autocorrelação espacial, uma das mais tradicionais é proposta por Anselin (1988). O autor apresenta uma metodologia para lidar com a heterogeneidade espacial de certos fenômenos que se tratados de forma por métodos econométricos padronizados poderiam levar a resultados equivocados. Essa ferramenta é a Análise Exploratória de Dados Espaciais (AEDE) que auxilia a modelagem econométrica espacial. Isto ocorre porque essa ferramenta permite verificar concentração de localidades de um mesmo tipo (clusters) e localidade atípicas, ou
outliers espaciais. Por isso, Montenegro (2008) afirma que:
Os métodos convencionais, como regressões múltiplas, não são formas apropriadas de lidar com dados georeferenciados, visto que não são confiáveis para detectar agrupamentos e padrões espaciais significativos. Dessa forma, a AEDE será a primeira etapa para revelar padrões espaciais, que deverão anteceder quaisquer modelos econométricos espaciais. (MONTENEGRO, 2008, p. 52).
Nesse contexto, as ferramentas de AEDE permitem avaliar as diferentes características espaciais do fenômeno estudado e indicar o padrão espacial de ocorrência de um determinado fenômeno. No caso de estudos de inovação, por exemplo, podem ser
86
regiões com número expressivamente alto ou baixo de patentes per capita ou o dispêndio em Pesquisa e Desenvolvimento (P&D) das empresas locais.
A partir de uma grandeza analisada e da matriz de pesos escolhida, é possível calcular as medidas de autocorrelação espacial globais (um valor único para todo o conjunto) ou locais (único para cada localidade). No primeiro caso, duas medidas são as mais utilizadas, I de Moran e C de Geary. Ambos indicadores medem, de forma diferente, se a variável analisada está autocorrelacionada espacialmente. Nesse trabalho, será utilizado fundamentalmente o I de Moran24, que é calculado por:
(4.8)
Em que é o vetor de observações para o ano na forma de desvio em relação à média. é a matriz de pesos espaciais. É importante lembrar que os valores da diagonal principal dessa matriz são iguais a zero, pois nenhuma região é, por definição, sua vizinha. O termo é um escalar igual à soma de todos os elementos de .
Para simplificar essa equação, costuma-se utilizar de forma normalizada, reduzindo a equação anterior a:
(4.9)
O I de Moran tem por propósito avaliar se a distribuição espacial das variáveis analisadas se deve a um processo aleatório ou a algum processo espacial subjacente. Para confirmar essa hipótese, o I de Moran tem valor esperado
. Dessa forma, os valores de I que excederem
apresentam autocorrelação espacial positiva. Ao contrário, valores abaixo do esperado sinalizam uma autocorrelação negativa.
A ocorrência de autocorrelação espacial positiva ou negativa implica em padrões distintos de distribuição no espaço. A positiva implica na concentração de regiões similares. Isto é, regiões com valores altos de uma determinada variável, como patentes per capita, são vizinhas de regiões de alto valor e de forma similar uma região de baixo número de patentes é vizinha de regiões com baixo número de patentes.
24
Diversos trabalhos fazem uma revisão mais detalhada sobre o I de Moran e análise LISA, entre eles é possível citar Montenegro (2008).
87
No caso da autocorrelação negativa ocorre ao contrário, regiões dissimilares estão concentradas, sendo uma região com alto número de patentes per capita cercada por outras de baixa e vice-versa.
No entanto, as variáveis globais apontam para a tendência geral de toda amostra. Dessa forma, o I de Moran não aponta padrões locais de associação espacial. Para esse propósito é possível utilizar indicadores que medem a associação entre uma região específica e seus vizinhos, chamadas de indicadores de autocorrelação locais. Nesse caso, trata-se do I de Moran local, também conhecido pelo acrônimo de LISA (Local
Indicator of Spatial Association).
A análise da estatística LISA serve de modo especial para apontar padrões locais de autocorrelação estatisticamente significativos que indicariam clusters espaciais (aglomerações de valores altos ou baixos da unidade analisada). O I de Moran local de uma dada variável é medido por:
(4.10)
em que é a variável analisada na região e a seqüência de todos os seus vizinhos ( .
é a matriz de pesos espaciais adotada em que indica o peso atribuído na matriz à ligação espacial entre a região e a região .
Com as medidas de I de Moran local é possível determinar algumas observações que são de especial interesse para a análise, entre eles os clusters. Os clusters são pontos cercados por vizinhos de valor similar.
Figura 4.1 – Exemplo do gráfico de dispersão de Moran.
Baixo Alto Baixo Baixo Alto Alto Alto Baixo
88
Esses pontos podem ser observados no gráfico de dispersão de Moran (figura 4.1). Como visto, o gráfico é composto por dois eixos que representam no eixo vertical a defasagem espacial da variável analisada e no eixo horizontal a variável estudada. Sob esses eixos são plotadas as observações de cada região e uma linha de tendência que indica a média global do I de Moran. Além disso, o diagrama delimita quatro quadrantes que identificam quatro tipos de associações entre as regiões: que permite identificar quatro tipos de associações: alto-alto, baixo-baixo, alto-baixo e baixo-alto. Pode-se afirmar, portanto, que o diagrama de dispersão de Moran, nada mais é do que assinalar num gráfico com dois eixos a variável analisada e sua respectiva observação defasada espacialmente como na ilustração. Os quatro quadrantes definem comportamentos especiais. O primeiro e o terceiro quadrantes referem-se respectivamente aos espaços em que são plotados os pontos de alto-alto e baixo-baixo. Esses dois quadrantes apontam as regiões cercadas por vizinhos de valores de similares. Ou seja, uma região identificada no diagrama na área alto-alto terá um valor de e superior à média de e , respectivamente, e, analogamente, em baixo- baixo, valores inferiores à média.
De modo contrário, o segundo e o quarto quadrante do diagrama, representam as áreas de alto-baixo e baixo-alto. Ou seja, regiões de valor de superior à média, rodeada por vizinhos ( ) com valor mais baixo que a média (alto-baixo). No caso de baixo-alto, ocorre precisamente o contrário.
Além disso, a linha de tendência plotada no diagrama apresentará inclinação positiva quando os pontos de alto-alto e baixo-baixo forem abundantes, indicando uma autocorrelação espacial positiva. Dessa forma, os outliers espaciais serão as observações encontradas nos quadrantes contrários à linha de tendência e os pontos de alavancagem alinhados com a linha de tendência. Portanto, num caso de autocorrelação positiva seriam outliers as observações alto-baixo e baixo-alto; e de alavancagem as observações alto-alto e baixo-baixo.
Como é possível observar, as ferramentas de Análise de Autocorrelação Espacial como o I de Moran e a análise LISA oferecem uma evidência estatística do comportamento especial de um dado fenômeno. No entanto, essas ferramentas possuem duas limitações. A primeira é que estas ferramentas traçam apenas um cenário estático do fenômeno estudado. E a segunda, é que e a análise é realizada apenas para uma ou duas variáveis
89
por vez. Assim, para análises mais complexas é necessário utilizar modelos de regressão espacial.