A estatística descritiva, como o próprio nome indica, descreve fatos a partir de números, simplificando informações muitas vezes complexas, a partir da sua sistematização, organização e resumo. (STEVENSON, 2001, p. 3)
O experimento desenvolvido aqui foi realizado com a manipulação de uma matriz formada por 87 linhas, correspondendo aos filmes exibidos no período 2001-2003 e 15 colunas, correspondendo às variáveis conhecidas antes do lançamento do filme e após o primeiro fim de semana da abertura, o que totalizou 1.305 células de dados.
A matriz completa, com os dados na forma do que foi explicitado, é apresentada no Anexo B, onde os valores de incentivo fiscal e os relativos a público e número de salas, estão na escala decimal. Pelas razões já expostas, no experimento foi utilizado o logaritmo dessas variáveis e a matriz correspondente está apresentada no Anexo C.
Em ambas tabelas não existe a identificação do nome de cada um dos filmes, mas apenas seu número de ordem, cuja correspondência pode ser verificada na tabela 7, constante no item “3.2.2 Tipo de corte” e que, eventualmente, poderá ser consultada.
Uma vez que as variáveis utilizadas no experimento já foram descritas no item “3.1 Definição da categoria analítica”, a tabela a seguir se limita a apresentar seu nome, tipo e descrição dos níveis, com o objetivo de facilitar a compreensão das análises e gráficos que lhe seguem.
Dado o interesse estatístico da discussão e de modo a permitir seu uso nas equações, as variáveis estão representadas a partir daqui, por Vi, onde i é um número de 1 a 15 e corresponde à mesma ordem de apresentação das variáveis, conforme foi feito no início deste Capítulo. Na tabela abaixo, o Vi aparece ao lado do nome da variável.
Tabela 8 – Descrição sintética das 14 variáveis explicativas e da única variável explicada
Variáveis Tipo Descrição dos níveis Gênero (V1) Categórica nominal Ação (1) Animação (2) Aventura (3) Comédia (4) Documentário (5) Drama (6) Ficção Científica (7) Musical (8) Romance (9) Suspense (10) Terror (11) Classificação (V2) Categórica nominal
Especialmente recomendado para crianças/adolescentes (1) Livre para todo o público (2)
Não recomendado para menores de 10 anos (3) Não recomendado para menores de 12 anos (4) Não recomendado para menores de 14 anos (5) Não recomendado para menores de 16 anos (6) Não recomendado para menores de 18 anos (7) Poder dos astros (V3) Quantitativa
Poder do diretor (V4) Quantitativa
Recursos públicos, total (V5) Quantitativa
Recursos públicos, art 3º (V6) Quantitativa
Seqüência (V7) Dummy Não (0)
Sim (1)
Período de férias (V8) Dummy Não (0)
Sim (1)
Feriado (V9) Dummy Não (0)
Sim (1)
Festival internacional (V10) Dummy Não (0)
Sim (1)
Globo Filmes (V11) Dummy Não (0)
Sim (1)
Crítica O Globo (V12) Ordinal Bonequinho indo embora (1)
Bonequinho dormindo na poltrona (2) Bonequinho interessado e sentado (3) Bonequinho aplaudindo sentado (4) Bonequinho aplaudindo de pé (5) Salas de abertura (V13) Quantitativa
Público na abertura (V14) Quantitativa
Público total (V15) Quantitativa
Fonte: Elaboração do autor
A tabela a seguir apresenta a freqüência da variável gênero, onde se observa que mais de 66% dos filmes exibidos no período estudado, correspondem aos gêneros: comédia, documentário e drama.
A oferta maior desses gêneros por parte dos produtores, não significa que seja decorrente de uma maior aceitação de público, afinal, enquanto os gêneros comédia e drama obtiveram, cada um, público superior a 13 milhões, o gênero documentário atingiu pouco mais de 660 mil espectadores.
Um caso interessante analisado no período, foi protagonizado pelo filme “Janela da Alma”, que conseguiu atrair ao longo da sua carreira 132.997 espectadores, um fenômeno raro, visto que poucos documentários ultrapassam a marca dos 20 mil. Distribuído pela Copacabana Filmes, da também diretora Carla Camurati, o filme encontrou seu público junto a “estudantes, professores e intelectuais, mas também atingiu um público maior, que à primeira vista estaria distante de um tema tão específico – o olhar no mundo contemporâneo”. (FILME B, 2005).
Outro caso emblemático é “O grilo feliz”, de Walbercy Ribas, lançado em 28 salas no ano de 2001, tendo feito 216 mil espectadores no Brasil. Única animação brasileira lançada no período 2001-2003, ficou em 23º lugar de público, dentre os 87 filmes estudados e sua carreira continuou anos mais tarde, em janeiro de 2006, quando foi lançado no México com 80 cópias em cinemas, atingindo perto de 200 mil ingressos.
Tabela 9 – Freqüência da variável Gênero
Gênero Freqüência % Ação 2 2,3 Animação 1 1,1 Aventura 6 6,9 Comédia 18 20,7 Documentário 22 25,3 Drama 35 40,2 Ficção Científica 0 0 Musical 0 0 Romance 2 2,3 Suspense 1 1,1 Terror 0 0 Total 87 100,0
Fonte: Elaboração do autor
Perto de 40% dos filmes lançados no período 2001-2003 teve sua classificação indicativa autorizada pelo Ministério da Justiça, como sendo livre para todo o público, e juntos fizeram 17,5 milhões de espectadores. Todos os demais gêneros somados, totalizaram
19,7 milhões de espectadores, distribuídos em faixas com restrições para menores de 12, 14 e 16 anos, sem que tivesse havido qualquer filme com restrição para menores de 18 anos.
A observação é consistente com o que foi identificado – para o caso da renda bruta – no trabalho de Simonoff e Sparrow (2002, p. 5), a partir da seguinte afirmação: à medida em que a platéia para a qual se destina o filme fica mais “madura”, o público cai.
Tabela 10 – Freqüência da variável Classificação indicativa
Classificação indicativa Freqüência % Especialmente recomendado para crianças/adolescentes 0 0 Livre para todo o público 34 39,1 Não recomendado para menores de 10 anos 0 0 Não recomendado para menores de 12 anos 16 18,4 Não recomendado para menores de 14 anos 16 18,4 Não recomendado para menores de 16 anos 18 20,7 Não recomendado para menores de 18 anos 3 3,4
Total 87 100,0
Fonte: Elaboração do autor
A freqüência correspondente à variável poder dos astros foi decrescente à medida em que a quantidade de astros, dentro do conceito formulado anteriormente, na apresentação das variáveis, foi aumentando. A distribuição percentual girou ao redor de 50% para filmes com astros e 50% para filmes sem eles.
Ao incluir essa variável no experimento, o pesquisador pretendia medir o quanto aquela influência poderia ter relação de causalidade com o público total, o que será visto no item destinado à análise multivariada.
Presumindo que astros, com histórico de sucesso de público em filmes anteriores, pudessem influenciar os espectadores de novos filmes, seria de se esperar que houvesse uma maior oferta de filmes com aqueles astros, por parte dos produtores, o que acabou não ocorrendo de forma tão significativa, como sugere a tabela a seguir.
Tabela 11 – Freqüência da variável Poder dos astros
Poder dos astros Freqüência %
Nenhum 43 49,4 Um astro 19 21,8 Dois astros 12 13,8 Três astros 8 9,2 Quatro astros 3 3,4 Cinco astros 1 1,1 Seis astros 1 1,1 Total 87 100,0
Na variável poder do diretor, a freqüência foi significativamente maior no caso de filmes cujo diretor não tenha participado de sucessos de público nos anos anteriores, dentro do critério já comentado. Por outro lado, dos dez filmes de maior público no período 2001-2003, em sete deles o diretor fazia parte da lista dos 25 filmes50 com maior público após 1995, sendo que três deles, tinham 2 filmes naquela lista.
Tabela 12 – Freqüência da variável Poder do diretor
Poder do diretor Freqüência %
Nenhum 71 81,6
Um filme 12 13,8 Dois filmes 4 4,6
Total 87 100,0
Fonte: Elaboração do autor
Para representar as freqüências das variáveis Recurso público total e Recurso público proveniente do artigo 3º, cujos números de ocorrências eram muito altos – relativas a 87 filmes – preferiu-se agrupá-los em classes, técnica em que a eventual perda de informação é considerada útil para a análise. (STEVENSON, 2001, p. 37)
Assim, a tabela a seguir apresenta dez ocorrências na primeira classe, sendo sete documentários, uma comédia, um drama e um suspense. Nenhum deles teve recursos públicos alocados. Os filmes que receberam recursos públicos – 88,5% do total – concentram-se nas três últimas classes.
Tabela 13 – Freqüência da variável Recurso público total
Classe Freqüência % 0,00000 |– 0,76444 10 11,5 0,76445 |– 1,52889 0 0 1,52890 |– 2,29334 0 0 2,29335 |– 3,05779 0 0 3,05780 |– 3,82224 0 0 3,82225 |– 4,58669 0 0 4,58670 |– 5,35114 4 4,6 5,35115 |– 6,11559 32 36,8 6,11560 |– 6,88004 41 47,1 Total 87 100,0
Fonte: Elaboração do autor
Nota: O Recurso público total está dado pelo seu logaritmo
50
Comportamento semelhante ocorre com os filmes que receberam recursos públicos provenientes do artigo 3º, embora a concentração seja diversa do caso anterior. Aqui, 54% dos filmes não receberam o recurso, sinalizando, de certa forma, o desinteresse do distribuidor pela obra – conforme explicado no Capítulo 1, a aplicação desse recurso é uma decisão do distribuidor, normalmente uma major.
Tabela 14 – Freqüência da variável Recurso público art. 3º
Classe Freqüência % 0,00000 |– 0,71968 47 54,0 0,71969 |– 1,43937 0 0 1,43938 |– 2,15906 0 0 2,15907 |– 2,87875 0 0 2,87876 |– 3,59844 0 0 3,59845 |– 4,31813 0 0 4,31814 |– 5,03782 5 5,7 5,03783 |– 5,75751 12 13,8 5,75752 |– 6,47720 23 26,4 Total 87 100,0
Fonte: Elaboração do autor
Nota: O Recurso público art. 3º está dado pelo seu logaritmo
As cinco variáveis a seguir são do tipo dummy e por serem binárias, suas tabelas de freqüência foram substituídas por sua representação gráfica, para melhor visualização do seu comportamento. Sim; 8; 9% Não; 79; 91% Sim; 20; 23% Não; 67; 77%
Figura 11 – Freqüência da variável Seqüência Fonte: Elaboração do autor
Figura 12 – Freqüência da variável Período de férias Fonte: Elaboração do autor
Na figura 11, o que se percebe é que somente 9% dos filmes analisados eram seqüência – ou franquia, conforme já comentado – embora o público total, nesses casos, tenha sido significativo, como mostra o boxplot da variável, constante do Apêndice I. Dos 8 filmes lançados com esta característica, cinco deles tiveram mais do que 1,7 milhão de espectadores.
A variável da figura 12 mostra que apenas 20 dos 87 filmes lançados no período 2001- 2003, ocorreram no período de férias, muito embora, ao verificar seu boxplot no Apêndice I, constate-se que o segundo quartil dos filmes lançados fora do período de férias, também está na mesma faixa de público. A presença de outliers também ficou evidente.
Sim; 43; 49% Não; 44; 51% Sim; 4; 5% Não; 83; 95%
Figura 13 – Freqüência da variável Feriado Fonte: Elaboração do autor
Figura 14 – Freqüência da variável Festival internacional Fonte: Elaboração do autor
No caso da variável 13, a freqüência da presença de feriado dentro da primeira ou segunda cine-semanas, oscilou ao redor dos 50% dos filmes lançados e da mesma forma, o
boxplot também mostrou outliers.
A freqüência de filmes com indicação ou premiação internacional foi muito pequena, apenas quatro, embora todos numa faixa de público total elevada – dois deles acima de 3,3 milhões de espectadores – mas a amostra é pequena para outras considerações.
Sim; 17; 20%
Não; 70; 80%
Figura 15 – Freqüência da variável Globo Filmes Fonte: Elaboração do autor
A freqüência da presença da Globo Filmes, de acordo com a figura 18, foi de 20% dos casos, mas em onze deles, o público total superou a marca dos 1,4 milhões de espectadores.
8
6
25
30
18
A variável relacionada à crítica, mostrada na figura 16, teve uma freqüência concentrada em filmes relativamente bem avaliados pela seção “O bonequinho viu”, do jornal “O Globo”, visto que, em somente 14 filmes, o bonequinho dormiu ou retirou-se.
Figura 16 – Freqüência da variável Crítica O Globo
Fonte: http://oglobo.globo.com/blogs/cinema (adaptada pelo autor)
Em 2001 haviam 1620 salas de exibição no país. Disputá-las exigiu não só esforço, como recursos para investimento em comercialização. A freqüência da variável Salas na abertura permite observar que um bom número de filmes, ocuparam no lançamento um pequeno número de salas – em boa parte, documentários, filmes de arte e filmes sem o suporte de uma distribuidora major. O filme que atingiu o maior número de salas na abertura foi “Acquaria”, com 340 – e atingiu somente 837 mil espectadores. “Carandiru”, por exemplo, foi lançado em 288 salas e atingiu quase 4,7 milhões de espectadores.
Tabela 15 – Freqüência da variável Salas na abertura
Classe Freqüência % 0,00000 |– 0,28128 9 10,3 0,28129 |– 0,56257 13 14,9 0,56258 |– 0,84386 11 12,6 0,84387 |– 1,12515 14 16,1 1,12516 |– 1,40644 8 9,2 1,40645 |– 1,68773 9 10,3 1,68774 |– 1,96902 7 8,0 1,96903 |– 2,25031 15 17,2 2,25032 |– 2,53160 1 1,1 Total 87 100,0
Fonte: Elaboração do autor
Nota: Salas na abertura está dada pelo seu logaritmo
A cada semana os exibidores têm que tomar uma importante decisão a respeito da manutenção ou não de um filme em cartaz e substituí-lo ou não. A variável Público na
abertura foi um importante indicador observado pelos entrevistados em profundidade e cuja tabela de freqüência foi elaborada por classe, para torná-la mais explicativa.
A distribuição da variável pelas 9 classes, possibilita visualizar a ocorrência de público na abertura, ligeiramente concentrada nas classes 3 a 6, o que significou, público na abertura entre 1.461 e 39.503 espectadores. Apenas para comparação, Carandiru obteve na abertura, 468.293 espectadores.
Tabela 16 – Freqüência da variável Público na abertura
Classe Freqüência % 2,44871 |– 2,80669 9 11,8 2,80670 |– 3,16468 6 7,9 3,16469 |– 3,52267 12 15,8 3,52268 |– 3,88066 11 14,5 3,88067 |– 4,23865 9 11,8 4,23866 |– 4,59664 9 11,8 4,59665 |– 4,95463 7 9,2 4,95464 |– 5,31262 8 10,5 5,31263 |– 5,67061 5 6,6 Total 76 100,0
Fonte: Elaboração do autor
Nota 1: O Recurso público total está dado pelo seu logaritmo
Nota 2: No total da freqüência estão desprezados 11 filmes cuja informação quanto ao
Público na abertura não estava disponível
A tabela de freqüência da variável público total, é coerente com a de público na abertura e de certa maneira, sinaliza uma correlação entre as duas variáveis.
Tabela 17 – Freqüência da variável Público total
Classe Freqüência % 2,91540 |– 3,33275 5 5,7 3,33276 |– 3,75011 11 12,6 3,75012 |– 4,16747 13 14,9 4,16748 |– 4,58483 10 11,5 4,58484 |– 5,00219 12 13,8 5,00220 |– 5,41955 16 18,4 5,41956 |– 5,83691 6 6,9 5,83692 |– 6,25427 6 6,9 6,25428 |– 6,67163 8 9,2 Total 87,0 100,0
Fonte: Elaboração do autor
Nota: O Recurso público total está dado pelo seu logaritmo
A tabela 18 a seguir, apresenta estatísticas sobre as 15 variáveis estudadas e constitui- se um elemento a mais para análise, se associada a outras informações a serem vistas adiante, quando estiverem sendo desenvolvidas as análises multivariadas.
Tabela 18 – Tabela de estatísticas
Variáveis Média Desvio Variabilidade (CV)
Gênero 5,08 0,153 3,0118
Classificação 3,92 0,183 4,6684 Poder dos astros 1,03 0,144 13,9806
Poder do diretor 0,23 0,056 24,3478 Recursos públicos, total 5,4159 0,2157 3,9825 Recursos públicos, art 3º 2,6526 0,3126 11,7837
Seqüência 0,09 0,031 34,4444 Período de férias 0,23 0,045 19,5652 Feriado 0,49 0,054 11,0204 Festival internacional 0,05 0,023 46,0000 Globo Filmes 0,2 0,043 21,5000 Crítica O Globo 3,51 0,125 3,5613 Salas de abertura 1,5827 0,0813 5,1355 Público na abertura 3,9833 0,9849 24,7257 Público total 4,7359 0,1037 2,1903
Fonte: Elaboração do autor
3.4.2 Estatística multivariada
A seguir serão apresentadas, passo a passo, as etapas realizadas para rodar a regressão múltipla, com a utilização do software Statistical Package for the Social Science - version
13.0 (SPSS 13.0) for Windows. O método utilizado foi a estimação stepwise e a regressão foi
feita primeiramente, considerando as variáveis disponíveis antes do lançamento do filme e em seguida, adicionando-se as variáveis conhecidas após o primeiro final de semana da abertura.
• Estimação Stepwise (antes do lançamento do filme)
A tabela 19 mostra as correlações existentes entre as 11 variáveis independentes (V1 a V11) e a variável dependente (V15). O exame da matriz de correlação indicou a variável Recursos públicos provenientes do Art. 3º (V6) como a mais bem correlacionada (0,7081) com a variável dependente (V15). Foi observado, também, que a correlação da participação da “Globo Filmes” (V11) com a variável dependente (V15) foi de 0,697. Assim, o 1º passo foi construir uma equação de regressão utilizando a melhor variável independente.
Tabela 19 – Correlação das variáveis e suas significâncias – 11 independentes
** Correlation is significant at the level 0.01 level (2-tailed) * Correlation is significant at the level 0.05 level (2-tailed)
Fonte: Elaboração do autor (saída do SPSS 13.0) • Variáveis na equação (Passo 1)
No passo 1, apresentado na tabela 20, uma única variável independente (V6) é utilizada para calcular a equação de regressão, a fim de prever a variável dependente. Para cada variável candidata a compor a equação, algumas medidas precisam ser definidas, como: o coeficiente de regressão, o erro padrão do coeficiente e o valor parcial t de variáveis na equação.
• Coeficiente de regressão
Na tabela 20, o valor 0,235 é o coeficiente de regressão (B6) da variável independente (V6). Desse modo, o valor previsto para cada observação é dado pelo intercepto (4,113), mais o coeficiente de regressão (0,235), vezes o seu valor para a variável independente:
^
Y
= 4,113 + 0,235 V6 Antes V1 V2 V3 V4 V5 V6 V7 V8 V9 V10 V11 V15 V1 1 V2 ,357(**) 1 Sig. 0 V3 -,269(*) -0,04 1 Sig. 0,01 0,68 V4 -,213(*) -0,04 ,337(**) 1 Sig. 0,05 0,68 0 V5 -0,16 0,18 ,250(*) 0,15 1 Sig. 0,15 0,1 0,02 0,16 V6 -,267(*) 0,09 ,378(**) ,277(**) ,448(**) 1 Sig. 0,01 0,43 0 0,01 0 V7 -,355(**) -0,2 ,379(**) ,396(**) 0,03 ,312(**) 1 Sig. 0 0,07 0 0 0,78 0 V8 -0,09 -,312(**) ,211(*) 0,13 0,03 -0,02 0,2 1 Sig. 0,41 0 0,05 0,24 0,78 0,83 0,06 V9 -0,04 -0,02 0,13 0,09 0,02 0,17 0,16 0,17 1 Sig. 0,71 0,85 0,23 0,39 0,85 0,11 0,13 0,12 V10 0,14 0,2 0,04 0,11 0,14 ,232(*) -0,07 -0,12 ,222(*) 1 Sig. 0,19 0,06 0,74 0,29 0,19 0,03 0,52 0,27 0,04 V11 -,253(*) -0,1 ,574(**) ,396(**) 0,19 ,546(**) ,545(**) 0,14 0,15 0,17 1 Sig. 0,02 0,38 0 0 0,08 0 0 0,18 0,16 0,12 V15 -,287(**) 0 ,476(**) ,425(**) ,353(**) ,708(**) ,433(**) 0,13 0,17 ,286(**) ,697(**) 1 Sig. 0,01 0,97 0 0 0 0 0 0,24 0,11 0,01 0O coeficiente de regressão padronizado, ou valor Beta (0,708) é o valor calculado a partir dos dados padronizados e com apenas uma variável independente, o coeficiente Beta ao quadrado será igual ao coeficiente de determinação.
• Erro padrão do coeficiente
O erro padrão do coeficiente é o erro padrão da estimativa de B6. O valor de B6 dividido pelo erro padrão (0,235 / 0,025 ≅ 9,4) é o valor parcial t calculado para um teste t da hipótese B6 = 0. Erro padrão menor implica numa previsão mais confiável.
• Valor parcial t de variáveis na equação
O valor parcial t de variáveis na equação, como calculado na tabela 20, mede a significância da correlação parcial da variável refletida no coeficiente de regressão e é particularmente útil para determinar se alguma variável deve ser eliminada sempre que uma nova variável for acrescentada.
Também é dado o nível de significância, o qual é comparado ao nível de referência estabelecido para eliminar a variável. Neste experimento, foi estabelecido um nível de 0,05 para eliminação de variáveis da equação. O valor crítico para um nível de significância de 0,05 com 86 graus de liberdade é 1,67. Logo, V6 atende as exigências para inclusão na equação de regressão. Os valores de F podem ser considerados no lugar de valores de t, visto que são diretamente comparáveis, uma vez que o valor de t é aproximadamente a raiz quadrada do valor F.
Tabela 20 – Coeficientes Standardized
Coefficients
B Std. Error Beta L. Bound U. Bound Zero-order Partial Part Tolerance VIF
(Constant) 4,113 0,100 41,162 0 3,914 4,311 V6 0,235 0,025 0,708 9,237 0 0,184 0,285 0,708 0,708 0,708 1,000 1,000 (Constant) 4,116 0,086 48,091 0 3,946 4,286 V6 0,155 0,026 0,466 5,949 0 0,103 0,206 0,708 0,544 0,390 0,702 1,426 V11 1,073 0,190 0,442 5,645 0 0,695 1,451 0,697 0,524 0,370 0,702 1,426 (Constant) 4,089 0,085 48,104 0 3,920 4,258 V6 0,151 0,026 0,454 5,883 0 0,100 0,202 0,708 0,542 0,379 0,697 1,434 V11 0,951 0,196 0,392 4,853 0 0,561 1,340 0,697 0,470 0,313 0,636 1,571 V4 0,267 0,131 0,144 2,049 0,044 0,008 0,527 0,425 0,219 0,132 0,838 1,194 Model Unstandardized Collinearity
Coefficients t Sig. Interval for B Statistics
95% Confidence
Correlations
1
2
3
• Variáveis fora da equação
Após a inclusão de V6 na equação de regressão, restaram outras dez variáveis independentes potenciais para serem incluídas no modelo, de modo a melhorar a capacidade preditiva da variável dependente. Assim, foram necessárias duas medições para avaliar suas eventuais inclusões: correlações parciais e valores t.
• Correlação Parcial
A correlação parcial é uma medida da variação de Y não explicada pelas variáveis na equação (apenas V6 no passo 1) que pode ser explicada por cada variável adicional. O valor 0,524 (ver tabela 21) representa a correlação parcial da “Globo Filmes” (V11), dado que V6 está presente na equação.
A correlação parcial, todavia, pode ser mal interpretada, pois isso não significa que esteja sendo explicado 52,4% da variância previamente inexplicada. Na verdade, significa que 27,5% (0,5242 = 0,275, o coeficiente de determinação) da variância inexplicada e não o total, agora pode ser explicado por V11. Considerando que 50,1% já era explicado por V6, então 13,7%, calculado por [(1 – 0,501) x 0,275] da variância total, seria explicado pelo acréscimo da variável V11.
• Valores de t de variáveis fora da equação
A coluna de valores t mede a significância das correlações parciais para variáveis fora da equação. Se esse valor t não exceder a um nível de significância especificada, a variável não poderá entrar na equação. O valor t tabelado para um nível de significância de 0,05 com 86 graus de liberdade é 1,67. Observando a coluna onde constam os valores de t na tabela 21, verifica-se que quatro variáveis (V3, V4, V7 e V11) apresentam p-valor < 0, 05, sendo candidatas a inclusão.
A tabela 19 mostra que a correlação simples de V11 com a variável dependente é de 0,697 e para as variáveis V3, V4 e V7 são, respectivamente, 0,467, 0,425 e 0,433. Para decidir quais variáveis novas seriam incluídas na equação, primeiramente selecionou-se a variável independente que exibe a correlação parcial mais alta com a variável dependente – não a maior correlação com Y. A correlação parcial de V11 é a maior (0,524) e, portanto, V11 e mesmo V4, foram consideradas para inclusão no modelo antes de V3.
Agora, sabe-se que uma parte significante da variância na variável dependente é explicada por V6. Também é possível observar, que V11 tem maior coeficiente de correlação parcial com a variável dependente e que o valor t é significante no nível de 0,05. Dessa maneira, pode-se examinar o novo modelo utilizando-se as variáveis V6 e V11.
Tabela 21 – Variáveis fora do modelo
Partial
Correlation Tolerance VIF Min. Tolerance V1 -,105(a) -1,332 0,187 -0,144 0,929 1,077 0,929 V2 -,066(a) -0,851 0,397 -0,092 0,993 1,008 0,993 V3 ,243(a) 3,078 0,003 0,318 0,857 1,167 0,857 V4 ,248(a) 3,289 0,001 0,338 0,924 1,083 0,924 V5 ,046(a) 0,53 0,597 0,058 0,799 1,251 0,799 V7 ,235(a) 3,049 0,003 0,316 0,903 1,108 0,903 V8 ,145(a) 1,918 0,058 0,205 0,999 1,001 0,999 V9 ,054(a) 0,688 0,493 0,075 0,97 1,031 0,97 V10 ,129(a) 1,653 0,102 0,178 0,946 1,057 0,946 V11 ,442(a) 5,645 0 0,524 0,702 1,426 0,702 V1 -,055(b) -0,802 0,425 -0,088 0,912 1,096 0,684 V2 -,002(b) -0,025 0,98 -0,003 0,963 1,038 0,681 V3 ,069(b) 0,854 0,396 0,093 0,665 1,504 0,544 V4 ,144(b) 2,049 0,044 0,219 0,838 1,194 0,636 V5 ,076(b) 1,038 0,302 0,113 0,795 1,258 0,579 V7 ,066(b) 0,836 0,405 0,091 0,702 1,424 0,546 V8 ,078(b) 1,169 0,246 0,127 0,964 1,037 0,677 V9 ,028(b) 0,42 0,676 0,046 0,966 1,036 0,693 V10 ,110(b) 1,639 0,105 0,177 0,944 1,06 0,681 V1 -,040(c) -0,582 0,562 -0,064 0,9 1,111 0,631 V2 ,001(c) 0,016 0,988 0,002 0,963 1,039 0,62 V3 ,047(c) 0,588 0,558 0,065 0,652 1,534 0,52 V5 ,068(c) 0,94 0,35 0,103 0,793 1,262 0,577 V7 ,031(c) 0,386 0,701 0,043 0,664 1,505 0,529 V8 ,067(c) 1,014 0,314 0,111 0,957 1,045 0,621 V9 ,024(c) 0,368 0,714 0,041 0,965 1,036 0,634 V10 ,104(c) 1,587 0,116 0,173 0,942 1,061 0,635 Model Beta In t Sig. Collinearity Statistics
1
2
3
a Predictors in the model: (Constant), V6 b Predictors in the model: (Constant), V6, V11 c Predictors in the model: (Constant), V6, V11, V4 d Dependent Variable: Público total
Fonte: Elaboração do autor (saída do SPSS 13.0)
• Variáveis na equação (Passo 2)
Os valores múltiplos R e R2, aumentaram com a adição de V11, conforme pode ser observado na tabela 22. O R2 aumentou em 13,7% a quantidade prevista, quando examinou-se o coeficiente de correlação parcial V11, de 0,524. O aumento de 13,7% em R2 é determinado
multiplicando-se os 49,9% de variação que não eram explicados depois do passo 1, pela correlação parcial ao quadrado, isto é: 49,9 x (0,524)2 = 13,7%, ou seja, dos 49,9% inexplicados com V6, (0,524)2 dessa variância foi explicada pelo acréscimo de V11, levando uma variância total explicada de 0,638 – isto é, 0,501 + [ 0,499 x (0,524)2].
Tabela 22 – Modelo sumário
Change Statistics Model R R Square Adjusted R
Square Std. Error R Square Change F Change df1 df2 Sig. F Change
Durbin Watson 1 ,708(a) 0,501 0,495 0,688 0,501 85,328 1 85 0,000 2 ,799(b) 0,638 0,630 0,589 0,137 31,861 1 84 0,000 3 ,810(c) 0,656 0,643 0,578 0,017 4,199 1 83 0,044 2,196 a Predictors: (Constant), V6 b Predictors: (Constant), V6, V11 c Predictors: (Constant), V6, V11, V4 d Dependent Variable: Público total
Fonte: Elaboração do autor (saída do SPSS 13.0)
O valor de B6 mudou muito pouco, o que é um indicativo de que as variáveis V6 e V11 são relativamente independentes. De fato, isto sugere que V6 e V11 são preditores estatisticamente significantes de Y. O valor de t para V6, agora é de 5,949 e, anteriormente, ainda no passo 1, era de 9,237. O valor t para V11 examina a contribuição dessa variável dado que V6 já está na equação.
Note-se que o valor t para V11 (5,645) é o mesmo valor mostrado para V11 no passo 1, sob o título “Variáveis fora do modelo” (ver tabela 21). Como V6 e V11 têm contribuições significantes, nenhuma foi eliminada no procedimento de estimação stepwise.
As correlações parciais para variáveis fora da equação na tabela 21, mostra que V4 tem maior correlação parcial (0,219). Essa variável explicaria 4,8% da variância (0,2192 = 0,048) até então inexplicada, ou 1,7% da variância total, dada por [(1 – 0,638) x 0,048].
Essa é uma contribuição muito modesta de poder explanatório, ainda que a correlação parcial seja significante no nível de 0,05 (o valor tabelado t para 86 graus de liberdade é 1,67 e o valor t para V4 é 2,049).
• Variáveis na equação (Passo 3)
Com V4 na equação de regressão, os resultados são exibidos na tabela 22 e conforme era previsto, o valor de R2 aumentou em aproximadamente 1,8%. Além disso, o exame das correlações parciais para V1, V2, V3, V5, V7, V8, V9 e V10, indicou que nenhum valor adicional
seria agregado ao modelo, acrescentando-as na equação preditiva. Essas correlações parciais eram muito pequenas e tinham valores de t associados que não seriam estatisticamente significantes no nível de 0,05 escolhido para este estudo.
• Avaliação da variável estatística para suposições de análise de regressão.