9 APPENDIX
9.2 Incident List
As diversas características dos candidatos, estudadas uma a uma, trás poucas informações, exigindo uma maneira de se observar conjuntamente essas características e como interagem.
Para atender essa necessidade, foram buscadas as informações dos candidatos junto ao Tribunal Superior Eleitoral (TSE) relacionadas ao gênero, faixa etária e escolaridade.
A partir dessas informações, foi construída a tabela 21, tratando-se de uma tabela de contingência apresentando o número de candidatos em cada conjunto de atribuições, ou seja, para o conjunto Gênero, Idade, Escolaridade e se Eleito ou não.
Tabela 32: Perfil dos candidatos a vereador no Estado de São Paulo. Gênero, idade e escolaridade.
Escolaridade
Fundamental (1) Médio (2) Superior (3)
Gênero Idade
(anos)
Eleito Total Eleito Total Eleito Total
Feminino <30 (1) 3 341 22 1420 26 670 30-44 (2) 28 2061 105 3984 188 2635 45-59 (3) 60 3104 125 3747 177 3046 >60 (4) 18 1007 13 626 29 706 masculino <30 (1) 33 534 174 2098 203 1166 30-44 (2) 501 5106 1087 8660 1001 5021 45-59 (3) 853 8153 933 7788 817 5033 >60 (4) 212 2629 121 1361 175 1367
Fonte: TSE (2012). Elaborado pelo autor.
Os dados referentes à distribuição dos candidatos a vereador nos Municípios do Estado de São Paulo, eleições 2012, apresentados na tabela 21, estão na seguinte ordem: número de candidatos eleitos, número total de candidatos (eleitos e não eleitos), Escolaridade (1: Fundamental, 2: Médio, 3: Superior), Idade em anos (1: menor do que 30, 2: 30 a 44, 3: 45 a 59, 4: mais de 60) e o Gênero (1: Feminino, 2: masculino). Supõe-se que a distribuição do número de candidatos eleitos tenha distribuição binomial. Essa suposição é imprescindível para a validade do modelo estatístico adotado. O modelo estatístico proposto para explicar a proporção de eleitos é o Logístico-Linear, o
qual se passa a descrever. A descrição utilizada busca utilizar uma notação que ajuda compreender o código de programação utilizado, o qual é apresentado nos anexos.
Seja o número total de candidatos que concorrem ao cargo de vereador no nível de A (Gênero), de B (Idade) e de C (Escolaridade).
Considere o número de candidatos eleitos no nível de A, de B e de C então, conforme suposto, onde é a probabilidade dos candidatos no nível de A, de B e de C serem eleitos onde: Gênero (A), 1: Feminino, 2: masculino; Idade (B), 1: <30, 2: 30 a 44, 3: 45 a 59; 4: >60; Escolaridade (C), 1: Fundamental, 2: Médio, 3: Superior.
Assim o modelo Logístico-Linear com interação até 1ª ordem é dado por: {
} onde temos: efeito comum, efeito da variável Gênero, efeito da variável Idade e efeito da variável Escolaridade.
As estimativas dos parâmetros serão obtidas utilizando-se o modelo de caselas de referência onde , e .
Dessa forma pode-se construir o esquema da tabela 22 para os efeitos assumidos no modelo.
Tabela 33: Esquema notacional para o modelo logístico-linear, com interação até primeira ordem, transcrito em uma tabela de contingência.
Fonte: Elaborada pelo autor
Gênero Idade <30 (1) 30-44 (2) 45-59 (3) >60 (4) <30 (1) 30-44 (2) 45-59 (3) >60 (4) Escolaridade FEM(1)
Fundamental (1) Médio (2) Superior (3)
MAS(2) + + + + + + + + + + + + + + + + + + +
A casela de referência é a célula com o efeito comum representada pelo nível 1 de Gênero (Feminino), nível 1 de Idade (<30 anos), nível 1 de Escolaridade (Fundamental). A partir dessa casela os efeitos são somados à medida que se caminha pelas células. É importante comentar que o valor dos parâmetros pode ser positivo ou negativo, ou seja, o efeito tanto pode contribuir para aumentar a probabilidade de o candidato ser eleito como para diminuir essa probabilidade.
O processo de obtenção das estimativas de máxima verossimilhança dos parâmetros exige iteração (algoritmo de convergência), já que não é possível chegar-se numa forma fechada para as estimativas, tal como ocorre no modelo normal linear tradicional.
Dessa forma, utiliza-se o pacote R-Software para o ajuste do modelo. Todos os códigos utilizados para a obtenção dos resultados estão nos anexos.
O resultado do ajuste é mostrado na tabela 23 onde é possível visualizar os parâmetros estimados e as respectivas significâncias estatísticas.
Os ajustes dos efeitos principais (sem interação) foram significativos. Quanto às interações de primeira ordem, alguns efeitos foram significativos, demonstrando a necessidade do ajuste do modelo considerando essas interações. A interação entre Escolaridade e Idade apresentou significância para os efeitos conjugados do nível 3 de Escolaridade (Superior) e Idade 3 (45 a 59 anos), para o nível 3 de Escolaridade (Superior) e Idade 4 (> 60 anos). A interação entre Idade e Gênero apresentou significância estatística para os efeitos conjugados de Idade 3 (45 a 59 anos) e Gênero 2 (Masculino), para Idade 4 (> 60 anos) e Gênero 2 (Masculino). Os efeitos conjugados de Escolaridade e Gênero apresentaram significância para Escolaridade 2 (Médio) e Gênero 2 (Masculino), para Escolaridade 3 (Superior) e Gênero 2 (Masculino).
A existência de interação indica que a ação simultânea de dois efeitos não é simplesmente a soma deles. Na interação ocorre uma potencializarão
dos efeitos, quando o resultado é maior que a soma dos efeitos, ou uma redução, quando o resultado é menor que a soma desses efeitos.
Tabela 34: Coeficientes estimados sob o modelo logístico-linear com interação de primeira ordem.
Fonte: Elaborado pelo autor
Em todos os casos de interação o resultado foi inferior à soma dos efeitos. Tem-se como exemplo a interação do nível Superior com a Idade 45 a 59 anos e nível Superior com a Idade > 60 anos. Nesses dois casos de interação o efeito do candidato possuir nível superior não se soma ao efeito da Idade, resultando num valor inferior. Assim, caso não houvesse a interação, a probabilidade estimada de eleição seria ainda maior. A mesma explicação pode ser estendida às outras interações significativas encontradas.
Por outro lado, algumas mostraram não ser significativas, tais como a interação entre o nível 2 de escolaridade (Médio) e o nível 2 de Idade ( 30 a 44 anos).
Para uma melhor interpretação dos dados, é construída a tabela 24 com os valores calculados para
em cada casela, ou seja, a chance de ser
eleito.
Tabela 35: Chances de ser eleito estratificadas por gênero, idade e escolaridade.
Fonte: Elaborado pelo autor
[ ] para ; ; e
.
A grande vantagem dessa tabela está relacionada ao fato de ser possível comparar os diversos estratos quanto às chances de eleições através do cálculo das razões de chances.
Inicialmente é analisada a situação das candidatas na faixa etária abaixo dos 30 anos. A chance de uma candidata (i=1) com menos de 30 anos (j=1) e do nível fundamental (k=1) é de 0,00734, ou seja, o resultado da razão entre a probabilidade de ser eleita e a probabilidade de não ser eleita. Em termos de chances, uma candidata com idade abaixo de 30 anos e com nível superior apresenta uma chance de ser eleita de 0,04471. Fazendo-se uma comparação com a candidata de nível fundamental, com chance de 0,00734, mostra que a de nível superior tem 6,09 mais chances de ser eleita do que a de nível
Gênero Idade FUND (1) MÉDIO (2) SUP (3) <30 (1) 0,00734 0,01417 0,04471 30-44 (2) 0,01562 0,02908 0,07189 45-59 (3) 0,01978 0,03274 0,06393 >60 (4) 0,01473 0,02255 0,04683 <30 (1) 0,06696 0,09166 0,20745 30-44 (2) 0,10790 0,14239 0,25252 45-59 (3) 0,11682 0,13713 0,19208 >60 (4) 0,08924 0,09687 0,14433 Escolaridade FEM (1) MAS (2)
fundamental. Para obter esse resultado, basta encontrar a razão de chances entre as candidatas, ou seja, calcular 0,04471/0,00734 = 6,09. O grande abismo, entretanto, pode ser encontrado quando se compara as chances de um candidato masculino, idade entre 30 e 44 anos e do nível superior com uma candidata de idade inferior a 30 anos e do nível fundamental. A razão de chances para esse caso é de 0,25252/0,00734 = 34,4, ou seja, as chances do candidato ser eleito é aproximadamente 34 vezes maior do que a candidata.
Para ilustrar o distanciamento existente entre os gêneros, o perfil mais favorável para uma candidata é aquele na qual sua idade está entre 30 e 44 anos com nível superior, apresentando uma chance de 0,07189. Esse resultado é muito próximo do pior perfil do candidato masculino, com idade abaixo dos 30 anos e nível fundamental, apresentando uma chance de 0,06696. Assim, a melhor situação de uma candidata corresponde ao pior desempenho de um candidato.
Tomando-se uma candidata e um candidato com idade inferior a 30 anos e nível fundamental, o candidato tem 9,12 vezes mais chance de ser eleito do que a candidata.
As candidatas nas faixas etárias acima dos 30 anos apresentam um melhor desempenho. De modo geral, candidatas com nível médio têm 50% mais chance de ser eleita do que as de nível fundamental e as de nível superior, 3 vezes mais chance do que a de nível fundamental. A vantagem da candidata de nível superior quando comparada com a de nível médio é de aproximadamente 2 vezes mais chance.
Pode-se converter a chance numa probabilidade isolando-se, no caso de uma candidata (i=1) abaixo dos 30 anos (j=1) e nível fundamental (k=1), (probabilidade de ser eleita) na expressão
fornecendo
. Assim, uma candidata com idade inferior a 30 anos e do
nível fundamental tem uma probabilidade de 0,7% de ser eleita. Fazendo-se o mesmo procedimento para uma candidata com as mesmas características
exceto por ter nível superior, a sua probabilidade de ser eleita sobe para 4,3%. Repetindo-se o procedimento para todas as células, obtém-se a tabela 25, a qual apresenta as probabilidades de ser eleito para as combinações de características.
Essa tabela apresenta um forte apelo ilustrativo, pois destaca visualmente as probabilidades de um candidato ser eleito a partir da combinação de suas características. Quanto menor a probabilidade de ser eleito, mais clara é a célula e quanto maior a probabilidade, mais escura a célula. Nota-se, portanto, que candidatos do sexo masculino, idade entre 30 e 44 anos e nível superior são os que mais se destacam nas eleições, com 20,2% de probabilidade de ser eleito.
Tabela 36: Probabilidade de o candidato ser eleito estratificado por gênero, idade e escolaridade.
Fonte: Elaborado pelo autor
Gênero
Idade
FUND (1) MÉDIO (2) SUP (3)
<30 (1)
0,7%
1,4%
4,3%
30-44 (2)
1,5%
2,8%
6,7%
45-59 (3)
1,9%
3,2%
6,0%
>60 (4)
1,5%
2,2%
4,5%
<30 (1)
6,3%
8,4%
17,2%
30-44 (2)
9,7%
12,5%
20,2%
45-59 (3)
10,5%
12,1%
16,1%
>60 (4)
8,2%
8,8%
12,6%
Escolaridade
FEM (1)
MAS (2)
Considerações Finais
O uso dos métodos quantitativos nas ciências sociais esbarra em um ponto de difícil controle, a ação da flecha do tempo. Segundo a teoria mais aceita atualmente, o universo teve início a partir de uma diminuta região conhecida como singularidade. Por motivos ainda desconhecidos, ou seja, fogem da explicação científica, essa singularidade, surgida a partir do nada onde não existiam tempo e espaço, sofreu uma grande explosão, conhecida como “big-bang”, e a partir dessa explosão a singularidade passou a se expandir de modo inflacionário, criando o universo. Segundo essa mesma teoria, o universo continua em expansão e de forma acelerada, ou seja, cada vez mais rápido.
Essa expansão ocorre segundo um princípio que parte da organização para a desorganização ou, a rigor, aumento constante da desorganização conhecida como entropia nas leis de termodinâmica.
O crescimento da entropia designa, pois, a direção do futuro, quer no nível de um sistema local, quer no nível do universo como um todo (PRIGOGINE, 1996).
Assim, a flecha do tempo está associada à irreversibilidade.
A entropia é o elemento essencial introduzido na termodinâmica, a ciência dos processos irreversíveis, ou seja, orientados no tempo (PRIGOGINE, 1996).
O tempo, nessa interpretação de Prigogine, não é nada mais do que a ação constante de um processo irreversível dado pela constante expansão do universo, criando a sensação de há uma ordem cronológica na natureza, quando na verdade tudo não passa de uma mera ilusão.
O pensamento é sequencial, sucessivo e unidimensional, ao mesmo tempo em que o mundo real se apresenta como um padrão multidimensional, não sucessivo e simultâneo, de riqueza e variedade infinitas; e tentar que um compreenda o
outro é o mesmo que tentar apreciar uma bonita paisagem olhando através de uma estreita fenda numa cerca ou tentar contemplar um quadro de Renoir por um microscópio (WILBER, 2007).
Existem tantas variáveis determinantes do tempo que este se torna único e exclusivo para cada consciência que o interpreta.
Em verdade, toda a noção da sucessão, de uma “coisa” que sucede a outra “coisa” no tempo, depende diretamente dos nossos processos de memória, pois é óbvio que, sem memória, não teríamos nenhuma ideia do tempo, quer do passado quer do futuro. Trata-se, portanto, de saber se a memória nos informa a respeito de um fenômeno real, a que damos o nome de “tempo”, ou se a memória cria uma ilusão de tempo (WILBER, 2007).
É este o divisor das águas. A consciência de alguma forma se destaca do processo de irreversibilidade, a qual a natureza está submetida, devido ao seu poder de criação dos momentos virtuais por meio da memória. Esse mesmo tempo coaduna-se com a memória, agindo no sentido de causar mudanças, mas com uma grande diferença, pelo menos em termos de comportamento e expressão do pensamento, é possível a reversibilidade.
A sondagem dessas consciências por meio de análises quantitativas implica em sérias restrições nas informações e respectivas interpretações. Uma taça de cristal cai sobre o piso e se estilhaça em inúmeros pedaços. É um processo irreversível, pois jamais será possível recompor a taça original, átomo por átomo; o máximo que se poderia obter é uma taça muito parecida com a original. Isso não ocorre na manifestação da consciência.
Nesse contexto pode surgir uma pergunta: se a entropia somente aumenta no universo então por que a natureza permitiu o surgimento de organismos tão organizados como os seres vivos? A resposta está na segunda lei da termodinâmica, a qual afirma que a entropia aumenta o fica constante em
um sistema isolado, ou seja, não ocorre troca de energia com o meio. Esse não é o caso dos organismos vivos, os quais interagem com o meio, buscando energia para se organizar e manterem essa organização até os limites permitidos pela sua natureza, afinal a morte é considerada, por enquanto, a realidade final de qualquer organismo vivo, a menos que possibilidades metafísicas sejam consideradas. Entretanto, possibilidades metafísicas não são passíveis de medições, coleta controlada de dados e comprovação por meios empíricos, afastando-a da pesquisa científica clássica.
A consciência pode escapar da irreversibilidade quando se leva em conta que os processos mentais estão à margem da segunda lei da termodinâmica, ou seja, pode mudar de estado e depois retornar a esse mesmo estado (processo reversível), perfazendo um caminho cíclico (Figura 28). Isso torna ainda mais difícil fazer previsões do estado dessa consciência no tempo.
Figura 28: Ciclo de estados da consciência
Fonte: Elaborado pelo autor.
A principal utilidade dos métodos quantitativos nas ciências sociais está relacionada à identificação de estados sociais tais como cultural, econômico, religioso, etc. e como esses estados se relacionam entre si. Estados
Estado 1 Estado 2 Estado 3 Estado 4 Estado n CONSCIÊNCIA
comportamentais, reflexos de uma consciência coletiva, apresentam uma maior dificuldade de modelagem.
A exploração e a análise de informações de estados sociais estão vinculados, principalmente, a dados demográficos e a indicadores sociais. Estatísticas nessa área tendem a ser mais comportadas no tempo, sendo possível realizar previsões e projeções mais confiáveis. De qualquer maneira também não estão imunes a fraturas bruscas, que alteram repentinamente esses estados. Tais fraturas ocorrem a partir de eventos sociais drásticos e imprevisíveis, tais como crises econômicas, políticas e conflitos armados. É patente a relação dessas fraturas com o estado de consciência coletiva.
Quando o objeto de análise é o comportamento social, ou seja, quantificar o estado da consciência coletiva, as dificuldades aumentam, tornando a modelagem instável devido a sua sensibilidade à ação da flecha do tempo. A manifestação da consciência coletiva é guiada por acontecimentos temporais que modificam, por exemplo, opiniões, as quais, diferentemente dos processos irreversíveis, podem até retornar a um estado anterior.
Se a sondagem diz respeito às opiniões ao longo de um processo eleitoral, os modelos quantitativos precisam ser continuamente revistos, pois o impacto de novos acontecimentos muda drasticamente a consciência coletiva.
Importante destacar que os impactos dos acontecimentos não ocorrem de maneira homogênea nos estratos sociais aos quais os eleitores pertencem. Esses estratos, quando corretamente delineados dentro dos campos respectivos, podem, utilizando-se modelagem adequada, mostrar de que forma o impacto dos acontecimentos é absorvido por cada um deles.
A ação da flecha do tempo pode ser incorporada em modelo estatístico e, como a portadora da constante evolução da entropia do universo, pode apontar tendências ou servir como contraste na identificação de variáveis latentes, as quais passariam despercebidas em uma sondagem estática. Uma única foto de um objeto não permite dizer se está parado ou em movimento.
Quando são obtidas várias fotos (o tempo agindo) e desde que haja informações nas fotos que permitam criar um modelo posicional para o objeto, pode-se inferir se está em movimento e até dizer com que velocidade. Nesse exemplo a velocidade é uma variável latente que não pode ser observada diretamente, mas é possível determina-la a partir de outras informações conhecidas e informadas pelos efeitos carregados pela flecha do tempo.
Figura 29: Ação da flecha do tempo
Fonte: Elaborado pelo autor.
A Figura 29 mostra um exemplo da ação do tempo no processo eleitoral. Nela é possível observar que a proporção de eleitores para os candidatos mudou entre duas datas pesquisadas, indicando uma ligeira vantagem para o
• 80% Religião A
• 20% Religião B
Candidato A
45%
• 60% Religião A
• 40% Religião B
Candidato B
45%
• 60% Religião A
• 40% Religião B
Não Sabe
10%
• 85% Religião A
• 15% Religião B
Candidato A
48%
• 55% Religião A
• 45% Religião B
Candidato B
42%
• 70% Religião A
• 30% Religião B
Não Sabe
10%
DATA 1 DATA 2FLE
CHA D
O T
EM
PO
candidato A. Provavelmente há uma tendência e o candidato A poderá, numa próxima sondagem, ter maior proporção de votos. Entretanto, a proporção de indecisos não mudou, mas a proporção dos estratos religiosos sofreu alteração entre os indecisos e candidatos. A modelagem estatística se faz particularmente importante nessas situações, pois muitos desses indecisos terminarão decidindo seu voto e é possível modelar como esses votos migrarão para cada candidato.
Esse tipo de abordagem específica foi utilizado no capítulo 3, entretanto, ele se repete, usando-se outras formas de modelagem adaptadas aos interesses apresentados nos capítulos 2, 4 e 5.
No capítulo 2 buscou-se delinear o comportamento do eleitor paulistano na eleição para prefeito da cidade em 2008. Para atingir esse delineamento, foram utilizadas técnicas de análise estatística nos principais campos da sociedade, proporcionando uma visualização de como esses campos se relacionam, através dos eleitores neles inseridos, com o processo eleitoral na figura dos candidatos e as preferências dos eleitores.
A análise estatística mostrou que os campos apresentam relação com o processo eleitoral, permitindo avaliar sua influência no resultado do processo eleitoral.
A análise e modelagem dos campos, tais como conceituados por Pierre Bourdieu, é possível quando se leva em consideração a dinâmica desses campos. Tais modelagens, entretanto, são limitadas pelo fluxo temporal, o qual permite a ação de fatores imprevisíveis, não probabilísticos, os quais podem alterar totalmente as previsões traçadas pelo modelo adotado.
A maior contribuição que se pode atribuir a esse capítulo é a possibilidade de se vislumbrar o estudo dos campos de forma qualitativa através da modelagem dos estados e de forma quantitativa no momento em que se avalia o montante do fluxo dos agentes entre os estados na seta do
tempo. Esses modelos trariam previsões que podem funcionar razoavelmente para avaliar a dinâmica dos campos em períodos curtos.
A abordagem feita no capítulo 3 permite modelar o comportamento do eleitor indeciso nas eleições para prefeito da Cidade de São Paulo em 2008. A modelagem mostra que é possível identificar padrões de comportamento de eleitores que não revelaram o seu voto, entretanto foi possível colher algumas informações do perfil desses eleitores indecisos. A partir desse perfil, foram criados modelos estatísticos que incorporam as informações conhecidas e a partir dessas informações inferir qual seria o candidato mais provável do eleitor indeciso. Assim, o perfil do eleitor poderia revelar em qual candidato estaria mais propenso a votar.
Esses modelos estatísticos consideram diversos níveis de conhecimento de informação dos eleitores e, para atender os objetivos propostos no capítulo, optou-se pela utilização do modelo de censura, ou seja, de falta de informações, que considera um padrão de perda de informações que pode ser explicado não só pelas variáveis conhecidas, mas também pela variável desconhecida. Tal modelo considera um mecanismo de censura não-ignorável (NMAR).
A abordagem para o mecanismo de censura não-ignorável mostrou claramente a importância da escolha do mecanismo de censura que inclua as observações incompletas. A adoção de um modelo NMAR para as eleições apresentou resultados mais próximos do valor final (votos válidos divulgados pela Justiça Eleitoral) se comparado com o resultado das pesquisas descartando-se os votos indefinidos ou adotando-se o modelo de censura ignorável.
Uma pergunta importante seria como eleger o modelo de censura adequado. Os modelos ignorável e não-ignorável não são encaixados; cada um deles se apresenta de forma independente para explicar os dados, ou seja, representam, individualmente, o modelo saturado não implicando, portanto, da
simplificação de um o qual gera outro. Provavelmente existem outros fatores que podem levar a uma escolha adequada do modelo de censura. Alguns desses fatores podem ser oferecidos pelo pesquisador, maior conhecedor do provável comportamento do fenômeno, outros por algum método de análise de sensibilidade. O desenvolvimento dessa análise de sensibilidade será tema de um trabalho futuro.
O perfil do candidato à reeleição é o tema do capítulo 4. A partir do resultado das eleições para vereador nas cidades de São Paulo, Rio de Janeiro, Belo Horizonte, Porto Alegre e Recife em 2008 e o levantamento de informações dos vereadores candidatos à reeleição, foi possível modelar quais dessas informações, adotadas como perfil do candidato, são relevantes para a