NEA Mackerel - ACOM1308.pdf (18.31Mb)

Dentre os modelos geoponderados que se adequam ao fenômeno acidentes de trânsito, têm-se os Modelos Lineares Generalizados Geograficamente Ponderados (MLGGP), que conforme Chen e Yang (2012) expandem o conceito da Regressão Geograficamente Ponderada (RGP) no contexto dos Modelos Lineares Generalizados (MLG). Com os MLGGP é possível a aplicação de modelos de regressão locais, onde a variável dependente não necessita ser uma medida contínua e os termos do erro não seguem necessariamente uma distribuição normal.

Um exemplo de MLGGP é a Regressão de Poisson Geograficamente Ponderada (RPGP), desenvolvida por Nakaya et al. (2005), que propuseram essa técnica para relacionar o número de mortes em zonas com variáveis socioeconômicas. Especificamente para a área de segurança viária, alguns estudos já utilizaram a RPGP para investigar as variações espaciais locais em relação ao número de acidentes em áreas (

2010 LI et al., 2013 PIRDAVANI et al., 2014). O modelo RPGP proposto é definido pela Equação 7:

E y*X₁, X$, … , X. = exp [β₀ 4 + β₁ 4 X₁ + β$ 4 X$ + … + β. 4 X.] (7)

em que E(y|X1, X2, ..., Xk) é o valor esperado da variável resposta, dado que um conjunto de k

valores das variáveis explicativas é observado. Os β´s são os parâmetros que se deseja estimar em função da localização ui = (uix, uiy) que caracteriza as coordenadas do ponto i no espaço e

representa um vetor de duas coordenadas dimensionais que descrevem a localização do elemento i com coordenadas x e y.

A ideia básica da regressão geoponderada é que os dados observados próximos ao ponto i tenham mais influência sobre a estimativa dos βj(ui)’s do que dados localizados mais

longe de i. Esta influência em torno do ponto i é descrita por uma função de ponderação. O método tenta capturar a variação espacial ajustando um modelo de regressão em cada ponto individualmente, ponderando todas as observações vizinhas por uma função da distância, denominada função de ponderação kernel. A Figura 1 mostra uma função kernel típica.

Embora a especificação da função de ponderação kernel possa assumir muitas formas, existem duas grandes categorias: fixa ou adaptativa. Um exemplo de uma função de ponderação fixa é a kernel gaussiana e tem sua formulação de acordo com a Equação 8.

Gaussiana: 6₇ = 89: ;−0.5 >?@

AB $

C (8)

em que wij é o valor do peso de uma observação em j para a estimação do coeficiente em i e

dij é a distância euclidiana entre os pontos i e j. O parâmetro b (chamado de largura de banda)

regula o tamanho do kernel e controla a taxa na qual o peso de um dado ponto i diminui à medida que a distância do local do ponto de regressão em análise (j) aumenta. É importante perceber que nessa função de ponderação, os pesos são não nulos para todas as observações, apesar da ponderação ser praticamente zero quando a distância dij for muito grande.

Figura 1 - Função kernel típica

A função de ponderação kernel da Equação 8 é fixa na forma e magnitude sobre o espaço, como mostra a Figura 2. Neste caso, a função de ponderação especificada tem o mesmo parâmetro de suavização, constante em toda a área de estudo, a qual se mostra eficiente se os pontos amostrados forem igualmente espaçados. Entretanto, para uma área de estudo com pontos muito irregulares, o uso de um kernel fixo pode gerar dois problemas

(FOTHERIN 0 . &. > $&. ):

i) em regiões que têm muitas observações próximas, o kernel fixo poderia ser menor para melhor examinar mudanças nos relacionamentos, mas essas mudanças podem ser perdidas quando é adotado um kernel fixo maior. Nesse caso, a adoção de um kernel fixo maior pode gerar subamostras redundantes, podendo implicar em viés na estimação dos coeficientes locais.

ii) em regiões de baixa densidade de pontos amostrados ou próximas da fronteira da área de estudo, um uso do kernel fixo menor do que o necessário faz com que a estimação dos coeficientes locais seja feita com poucas observações efetivas, aumentando os erros padrão e causando ineficiência dos coeficientes.

Figura 2 - Função kernel fixa

Fonte: Fotheringham (2009)

Ambos os problemas podem ser reduzidos pela utilização de um kernel variando espacialmente. Uma função kernel adaptativa é aquela onde a extensão da banda é ditada pela densidade dos pontos da área de estudo. Assim, em regiões onde os dados são abundantes, a banda é menor em torno do ponto de regressão e em regiões onde os dados são relativamente escassos, a banda se estende a fim de capturar mais dados. A Figura 3 ilustra a operação da banda adaptativa (FOTHERINGHAM, 2009).

Figura 3 - Função kernel adaptativa

Fonte: Fotheringham (2009)

Um exemplo típico de função de ponderação kernel adaptativa é a função biquadrática, dada pela Equação 9.

Biquadrática: 6₇ = D E1 − >?_G@B

H$se J7 < L

0 caso contrário

(9)

em que wij é o valor do peso de uma observação em j para a estimação do coeficiente em i e

dij é a distância euclidiana entre os pontos i e j. O parâmetro Gi é a distância do i até o N-

ésimo vizinho, obtido a partir do tamanho da largura de banda otimizada (medidas em vizinhos). A função kernel biquadrática adaptativa proporciona uma função de ponderação contínua semelhante à Gaussiana até a uma distância menor que Gi do ponto de regressão e

depois disso, o peso considerado para os coeficientes será zero em qualquer ponto com distância maior ou igual a Gi.

Os resultados da regressão geoponderada são relativamente indiferentes à forma da função kernel escolhida, sendo a largura de banda o aspecto mais importante na calibração do modelo. A largura de banda pode ser considerada como um parâmetro de suavização:

G, 59 * 3 5) * 3 , 3H I ) J3 3 59 7 3 4 , H G, 59 * 5

a banda, maior será a heterogeneidade nas respostas, pois menos observações serão usadas ao redor do ponto de observação. A largura de banda envolve um equilíbrio entre viés e variância, sendo que a escolha de uma largura de banda muito pequena leva a uma variância grande nas estimativas locais, enquanto que uma banda muito larga traz viés às estimativas locais (/&$ . 0 . &. > $&. ).

Para a seleção da banda ótima é preferível utilizar o Critério de Informação de Akaike Corrigido (AICc) (FOT . 0 . &. > $&. NAKAYA

et al., 2005), pois o mesmo penaliza o número de parâmetros e consequentemente, a

complexidade do modelo. Por conta disso, esse critério também pode ser utilizado para comparar modelos de diferentes variáveis explicativas ou comparar os modelos de regressão geograficamente ponderados com outros modelos candidatos.

Hadayeghi, Shalaby e Persaud (2010) utilizaram a RPGP para investigar as variações espaciais na relação entre o número de acidentes zonais e potenciais variáveis explicativas de planejamento de transporte para a cidade de Toronto. Desenvolveram e compararam os MPA do tipo binomial negativo com a RPGP, tendo esse último modelo apresentado melhores medidas de ajuste que o MLG.

In document ACOM1308.pdf (18.31Mb) (sider 178-200)