A ênfase da análise espacial é mensurar propriedades e relacionamentos dos dados espaciais que, por sua vez, são definidos como quaisquer dados que possam ser caracterizados no espaço, em função de algum sistema de coordenadas (CÂMARA et
al., 2000a). Esta análise subdivide-se segundo a sua forma geométrica em: análise de
superfícies (geoestatística), análise de redes, análise de padrões pontuais, e análise de dados em áreas.
A geoestatística objetiva inferir uma superfície contínua a partir de uma amostra de um atributo coletado em alguns pontos da área de estudo. Neste intuito, a krigeagem é o procedimento de interpolação mais indicado por usar estimadores pontuais ótimos e não tendenciosos (CÂMARA et al., 2000a). A análise de redes é aplicada a entidades lineares conectadas, estando já bastante disseminada na solução de problemas de transporte, tais como as aplicações de roteamento (CHOU, 1996).
Denomina-se padrão pontual qualquer conjunto de dados consistindo de uma série de localizações pontuais que estão associadas a eventos dentro da área de estudo. Suas principais características são: as áreas dos eventos não são uma medida válida; suas localizações não estão associadas a valores, mas apenas a ocorrência dos eventos; e entidades geográficas representadas como pontos no mapa são consideradas de mesma qualidade (CÂMARA e CARVALHO, 2000). Dentre os objetivos da análise de padrões pontuais, destacam-se o estudo de padrões de distribuição no espaço para identificar os fatores que determinam a concentração ou a dispersão espacial e a identificar também os fatores de risco associados a este evento.
Os objetivos da análise de dados em áreas são identificar a existência de padrões de distribuição espacial, de áreas críticas e de tendências espaciais de crescimento, auxiliando o entendimento da ocorrência de determinado fenômeno. Para isto torna-se necessário agregar os objetos espaciais e seus atributos contidos no espaço total em sub- áreas, tais como setores censitários ou distritos; agregação esta que nem sempre é feita de forma criteriosa (CÂMARA et al, 2000a).
A agregação de dados pontuais em áreas ocasiona vários problemas destacando- se o Problema da Unidade de Área Modificável (PUAM) que é composto dos efeitos de escala e de zoneamento (CAMARA et al., 2000a). O efeito de escala é a tendência, dentro de um sistema de unidades de áreas modificáveis, de se obter diferentes resultados estatísticos para um mesmo conjunto de dados quando a informação é agrupada em diferentes níveis de resolução espacial, como setores censitários e distritos. O efeito de zoneamento é a variabilidade dos resultados estatísticos obtida dentro de um conjunto de unidades de áreas modificáveis em função das várias possibilidades de agrupamentos em uma dada escala, e não em função da variação do tamanho dessas áreas; isto é, a diferença nos resultados é gerada devido a simples alteração das fronteiras. Vale ressaltar que este problema nunca poderá ser removido, pois está associado a divisões territoriais, e o que se pode fazer ao usar estas ferramentas é minimizar o seu efeito. Como exemplo, MARTIN (2001), apud RAMOS (2002), cita que o Censo do ano 2000 do Reino Unido já permite o acesso a dados em suportes territoriais gerados interativamente de acordo com a finalidade do estudo, processo denominado Output Areas (OAs), que são subdivisões territoriais elaboradas segundo critérios de forma, homogeneidade e tamanho da população.
RAMOS (2002) exemplifica o efeito de escala ao elaborar mapas temáticos de três variáveis usando as 270 zonas de análise de tráfego, definidas para a pesquisa de origem/destino de 1997, e os 96 distritos municipais de São Paulo. As variáveis usadas foram: população > 60 anos / população total (variável A); total de habitantes não alfabetizados / população total (variável B) e renda individual per capita (variável C). Uma significativa perda de informação pode ser notada na Figura 3.1 quando se agregam as zonas em unidades de área maiores (distritos), considerando o mesmo intervalo de classes para os dois formatos de áreas. As zonas pertencentes ao maior intervalo de classe, quando subdividida em distritos, passam a pertencer a intervalos de classes menores.
Para exemplificar o outro efeito, este mesmo autor elaborou um novo zoneamento, usando critério de homogeneidade intra-zonal, para igualar a quantidade de distritos. Pode-se visualizar este efeito ao analisar a matriz de correlação na Tabela 3.1, na qual percebe-se que houve uma redução nas correlações entre todas as variáveis no nível de zonas, quando comparadas com as correlações medidas em nível de distritos.
Figura 3.1: Visualização do efeito de escala na cidade de São Paulo (RAMOS, 2002). Tabela 3.1: Matrizes de correlação p/ as variáveis agrupadas em distritos e em zonas.
Distritos Zonas A B C A B C A 1,00 -0,81 0,65 A 1,00 -0,52 0,57 B -0,81 1,00 -0,78 B -0,52 1,00 -0,72 C 0,65 -0,78 1,00 C 0,57 -0,72 1,00 Fonte: RAMOS (2002).
96 distritos do município de São Paulo
Variável B Variável C
ASSUNÇÃO (2001) também cita alguns casos de pequenas áreas em que se calculam taxas sobre um universo populacional reduzido, o qual pode ser solucionado com o uso de estimadores bayesianos. CÂMARA et al. (2000b) citam também o problema da falácia ecológica que envolve a inferência inadequada de relações em nível de indivíduo, a partir de resultados obtidos em nível de áreas. Devido aos efeitos oriundos do PUAM, as relações medidas em nível de unidades de áreas a partir de coeficientes de correlação tendem, em geral, a apresentar valores absolutos maiores que as correlações desconhecidas em nível de indivíduos. Estes mesmos autores ressaltam que nenhuma das medidas está certa ou errada, elas apenas representam diferentes formas de análise.
CÂMARA et al. (2000b) citam também o problema das áreas sem homogeneidade, que ocorre em países com diferenças sociais significativas, em que a agregação de grupos sociais distintos, como favelas e áreas nobres, numa mesma região é bastante comum. Neste caso, usar um atributo com valor médio não representa verdadeiramente os valores nela contidos.
Algumas análises podem ser realizadas usando dados contínuos ou discretos. A decisão sobre qual deles usar dependerá do tipo de problema vinculado aos dados. A análise de superfícies se mostra superior à análise por áreas nos casos em que o problema da descontinuidade nas fronteiras se mostre significativo. Entretanto, para regiões com características homogêneas, a análise agregada em áreas é mais simples e requer menor esforço computacional e capacitação técnica de recursos humanos (CÂMARA et al., 2000b). Em outras palavras, esta decisão está relacionada ao grau de homogeneidade da variável sobre a região de estudo.