Através da pesquisa de campo desenvolvida e dos dados sobre a região onde os PGVs exercem sua atração, ou seja, a sua área de influência, foi possível compor o banco de dados que subsidiou o desenvolvimento dos modelos de geração de viagens e para o número de clientes para supermercados.
O banco de dados foi constituído por diferentes tipos de variáveis, divididas em grupos conforme a Tabela 6.1.
Como já comentado no capítulo 4 desta obra, optou-se por utilizar como variáveis dependentes nas equações de geração de viagens, o número de automóveis no dia pico da semana (Y4) e a média de automóveis por hora (Y5), assim como o número de clientes no dia pico (Y6) e a média horária dos mesmos (Y7), devido à diferença dos horários de funcionamento dos supermercados estudados e ao impacto que isso pode acarretar no total de viagens por dia (ver Tabelas 4.9 e 4.11)
Dentre as variáveis independentes a serem analisadas, temos os grupos de variáveis endógenas e exógenas. No presente estudo, entende-se como variável endógena toda aquela referente aos dados próprios dos PGVs, enquanto as variáveis exógenas são características externas ao empreendimento que podem ter alguma relação com as variáveis dependentes das equações; mais especificamente, são os dados da área de influência do PGV que podem afetar no quantitativo de viagens por automóvel ou clientes do PGV.
Tabela 6.1 – Variáveis levantadas para o estudo da geração de viagens e da geração de clientes
Grupos de variáveis Variável Unidade
Y4 Viagens por automóvel no dia pico Automóveis
Y5 Média de viagens de automóvel por hora Automóveis/hora
Y6 Clientes no dia pico Clientes
Variáveis dependentes
Variáveis quantitativas
Y7 Média de clientes por hora Clientes/hora
D1 Faz parte de uma rede de supermercados? Sim = 1, não = 0 D2 Possui posto de gasolina? Sim = 1, não = 0
D3 Possui caixas de bancos? Sim = 1, não = 0
D4 Possui restaurantes? Sim = 1, não = 0
Variáveis
Dummy
D5 Possui lojas anexas? Sim = 1, não = 0
X1 Área total construída m2
X2 Área de vendas m2
X10 Número de Itens ofertados Nº de itens
Variáveis endógenas
Variáveis quantitativas
X11 Número de seções Nº de seções
X12 População total habitantes
X13 Número de habitantes do sexo masculino habitantes
X14 Número de habitantes do sexo feminino habitantes
X15 Área de Influência primária m2
X16 Densidade populacional hab/m2
X17 Domicílios particulares permanentes domicílios
X18 Domicílios totais domicílios
X19 Renda nominal total na área R$
Variáveis referentes
à área de influência primária
X20 Rendimento nominal médio por pessoa R$/hab
X21 População total habitantes
X22 Número de habitantes do sexo masculino habitantes
X23 Número de habitantes do sexo feminino habitantes
X24 Área de Influência secundária m2
X25 Densidade populacional hab/m2
X26 Domicílios particulares permanentes domicílios
X27 Domicílios totais domicílios
X28 Renda nominal total na área R$
Variáveis referentes
à área de influência secundária
X29 Rendimento nominal médio por pessoa R$/hab
X30 População total habitantes
X31 Número de habitantes do sexo masculino habitantes
X32 Número de habitantes do sexo feminino habitantes
X33 Áreas de Influência primária e secundária m2
X34 Densidade populacional hab/m2
X35 Domicílios particulares permanentes domicílios
X36 Domicílios totais domicílios
X37 Renda nominal total na área R$
Variáveis referentes às áreas de influência primária e secundária
X38 Rendimento nominal médio por pessoa R$/hab
Y1 Isócota limite primária Km
Y2 Isócota limite secundária Km
Y3 Isócota limite terciária Km
Variáveis indepen- dentes Variáveis exógenas (somente quantitativas) Variáveis referentes às
isócotas X4 Número de concorrentes dentro da isócota
de 1 Km
Nº de concorrentes
As variáveis endógenas analisadas nesta seção são as mesmas consideradas nos modelos para delimitação das subdivisões da área de influência, divididas entre variáveis quantitativas (X1, X2, X10, X11) e variáveis Dummy (D1, D2, D3, D4, D5).
O levantamento das variáveis exógenas demandou cuidado nas decisões. O impasse estaria no seguinte questionamento montado: Se as características da área de influência têm relação com a geração de viagens do PGV, até que ponto desta área tais características devem ser levantadas?
Como foi observado no capítulo anterior, as áreas de influência variam de tamanho e forma em relação a alguns fatores (distância da viagem, localização de concorrentes, porte do empreendimento e tipo do uso do solo da região dentre outras). Tais características podem traduzir a atratividade do PGV em pequenas unidades territoriais que concentram populações com semelhantes características (setores censitários, como sugerido neste trabalho). Contudo, verifica-se que a intensidade da atração é maior na área de influência primária, decrescendo nas demais subdivisões até se esvair fora da área de influência. Tal comportamento é inversamente proporcional ao número de habitantes e às áreas totais das respectivas subdivisões, tal como mostra o esquema na Figura 6.1.
Figura 6.1 – Relações entre as subdivisões da área de influência
Logo, as informações referentes à área de influência a serem estudadas na geração de viagens deveriam ser da região que sofre um impacto atrativo mais direto dos PGVs, concentrando a maior parte da população que pode ser atraída ao empreendimento.
secundária, separadamente e em conjunto, para que, após os resultados, seja possível inferir sobre qual a parcela da área de influência que tem maior relação com a quantidade de viagens e clientes dos supermercados. Com este intuito, foram levantados os valores das variáveis exógenas quantitativas de X12 a X38 para cada supermercado, através da delimitação destas regiões em um ambiente SIG e a posterior extração dos dados segundo as informações georeferenciadas do IBGE (2003b) .
Os valores de Y1, Y2 e Y3, referentes às isócotas limites das subdivisões da área de influência, também foram considerados como prováveis fatores com relação direta na geração de viagens e na geração de clientes, assim como a variável X4, referente ao número de concorrentes dentro da isócota de 1 km.
Os valores levantados para todas as variáveis podem ser observados nas tabelas presentes no Apêndice H.
6.1.1 Tratamento do banco de dados
Com o objetivo de reduzir o número de combinações possíveis entre as variáveis no desenvolvimento das equações de regressão e otimizar o tempo despendido para esta tarefa, as variáveis passaram por uma análise detalhada que resultou no descarte ou preferência de escolha de algumas delas.
Pelos motivos já comentados na seção 5.1.2, as variáveis X10 e X11, que representam o número de itens ofertados e o número de seções do supermercado respectivamente, foram descartadas pela baixa precisão dos dados adquiridos para amostra. Como também pode ser recordado na seção supracitada, as variáveis D2, D3, D4 e D5 não apresentaram variações aceitáveis para que sejam consideradas estatisticamente em uma amostra da amplitude trabalhada neste estudo.
Através de uma matriz de correlação entre as variáveis dependentes (Tabela 6.2), verificou-se que a diferença entre os horários de funcionamento dos estabelecimentos não era um fator significante dentro da amostra, pois a correlação entre o número de automóveis por dia pico da semana (Y4) e o número médio por hora de funcionamento (Y5) apresentava praticamente o valor unitário, da mesma forma que a correlação entre o número de clientes no dia pico (Y6) e o número de clientes médio por hora (Y7). Por
este motivo, as variáveis efetivamente estudadas nas equações de regressões foram as que apresentam valores do dia inteiro, coincidindo também com o estado da prática dos estudos de geração de viagens de PGVs.
Tabela 6.2 – Correlação entre as variáveis dependentes
Variáveis Y4 Y5 Y6 Y7
Y4 1,00
Y5 1,00 1,00
Y6 0,99 0,99 1,00
Y7 0,98 0,98 1,00 1,00
Dentre as variáveis exógenas, precisou-se decidir qual unidade territorial deveria ser considerada no desenvolvimento das equações. Para isso, foram verificadas as correlações entre o número de viagens no dia pico e as variáveis da área de influência primária, da área de influência secundária e das áreas primária e secundária unidas.
Como pode ser observado na Tabela 6.3, os valores que apresentaram uma melhor correlação no geral, foram os dados da área de influência primária. Logo, optou-se pela escolha deste grupo de variáveis como sendo as características que tem relação mais provável com a geração de viagens e clientes, a serem verificadas no desenvolvimento das equações.
Tabela 6.3 – Correlações entre Y4 e as variáveis exógenas das áreas de influência primária e secundária Área de influência primária Área de influência secundária Áreas de influência primária e secundária Y4 Y4 Y4 Y4 1,0000 Y4 1,0000 Y4 1,0000 X12 0,9334 X21 0,9157 X30 0,9277 X13 0,9334 X22 0,9137 X31 0,9271 X14 0,9330 X23 0,9173 X32 0,9281 X15 0,8526 X24 0,7444 X33 0,7854 X16 -0,2533 X25 0,0418 X34 -0,1408 X17 0,9236 X26 0,9086 X35 0,9196 X18 0,9240 X27 0,9092 X36 0,9202 X19 0,8874 X28 0,8926 X37 0,8964 X20 -0,1448 X29 0,3776 X38 0,1417
As variáveis referentes à divisão da população da área de influência em relação ao sexo (X13 e X14) também foram desconsideradas, pois não houve significativa variação da proporção homens/mulheres dentro da amostra (Tabela 6.4). Logo, os valores da população de homens e da população de mulheres, se apresentaram praticamente na metade do valor da população total (X12), mostrando intima correlação, o que exclui a necessidade de analisá-las nas mesmas equações de regressão.
Tabela 6.4 – Proporção da população da área de influência primária em relação ao sexo
Masculino Feminino S1 46,37% 53,63% S2 47,45% 52,55% S3 46,89% 53,11% S4 44,92% 55,08% S5 47,79% 52,21% S6 48,75% 51,25% S7 47,47% 52,53%
Foram geradas, então, as matrizes de correlação para as variáveis que passaram pelo filtro de tratamento. As matrizes possibilitaram a análise das possíveis combinações de variáveis que podem pertencer às mesmas equações, como pode ser observado nas tabelas presentes no Apêndice I.
6.2 DESENVOLVIMENTO DOS MODELOS DE GERAÇÃO DE VIAGENS