Delmål 6 Forbedre kunnskapen om ulike virkemidler
11.3 Å forandre undervisningen
A priori, para a análise efetiva dos dados, foram feitos procedimentos exploratórios e
diagnósticos, com vistas a identificar características dos dados, avaliando a existência de violações de pressupostos e demais problemas das propriedades das variáveis que perpassem os requisitos das técnicas de análise empregadas (TABACHNICK; FIDEL, 2001, p. 56). A partir desse ponto, verificou-se a existência de fatores que poderiam distorcer as análises, e buscaram-se soluções pertinentes a estes casos.
6.5.1.1 Dados ausentes
Constatou-se a existência de 67 perguntas em branco na base de fabricantes e oito na base de fornecedores, representando 0,59% e 0,17% da matriz de dados de cada grupo. Considerando que tais ocorrências foram muito dispersas entre questionários e variáveis, nenhum padrão notável dos dados ausentes se tornou perceptível, o que foi confirmado ainda pelo MCar (missing completely at randon = perdidos completamente ao acaso) de aleatoriedade de dados (fabricantes p=0,016 e fornecedores p =0,430), indicando que com 1% de significância não se pode rejeitar a hipótese de que os dados ausentes estão dispersos totalmente ao acaso (HAIR Jr. et al., 2005, p. 46). Neste estudo, foram poucos os dados ausentes, pois os procedimentos de pesquisa foram seguidos à risca, de modo a evitar que os respondentes dessem respostas ambíguas ou se recusassem a fornecer respostas válidas. Desse modo, não foi necessário dar nenhum tratamento especial aos dados ausentes.
Considerando ainda que a quantidade de dados ausentes foi bastante reduzida e dispersa, e que a mera exclusão poderia trazer um viés notável nos resultados (HAIR Jr. et al., 2005), propôs-se uma reposição dos dados ausentes com base nos valores observados das variáveis presentes no estudo. Utilizando um procedimento Stepwise limitado a até cinco variáveis por grupo, os dados ausentes foram repostos por meio do procedimento de regressão (visando manter a variância e covariância original) e, posteriormente, delimitados aos intervalos originais da escala. Dessa forma, eliminaram-se os problemas de dados ausentes na base de dados.
6.5.1.2 Valores extremos
Usando um limite moderado segundo o intervalo interquartil (IQ) (usado quando as variáveis não seguem uma distribuição normal), considerando valores fora dos limites Q1 - 1,5 x IQ e Q3 + 1,5 x IQ como sendo casos extremos, 129 respostas foram consideradas extremas no grupo de fabricantes, enquanto 82 foram detectadas como extremas no grupo de fornecedores1. Usando as sugestões correntes (KLINE, 1998, p. 78; TABACHNICK; FIDEL, 2001, p. 70), tais respostas foram substituídas por valores menos ofensivos, tendo como limites os valores Q1 - 1,5 x IQ e Q3 + 1,5 x IQ. Assim, não permaneceram casos extremos univariados no estudo. Conforme sugere Kline (1998), para cada variável se encontram os limites que determinam a classificação de valores em extremos (por exemplo, 2 e 9) e todos os indivíduos que para esta variável apresentam respostas fora destes limites (por exemplo, 1 ou 10) são reposicionados dentro dos limites considerados aceitáveis. Assim, modifica-se muito pouco a estrutura de variância e covariância, bem como as estimativas originais de média e desvio padrão, conseguindo mesmo assim dar um tratamento capaz de eliminar os
outliers univariados.
Após a reposição de casos univariados, ainda poderiam existir casos com uma combinação peculiar de respostas, isto é, outliers multivariados. De acordo com o procedimento mencionado para a análise dos outliers multivariados, usando um nível de significância de 0,1%, encontraram-se 3 casos extremos no grupo de fabricantes e 7 no caso de fornecedores. Como nenhum padrão ou diferença no perfil foi detectado para estes casos, procedeu-se à manutenção deles na base, e os resultados do modelo foram avaliados com e sem estes casos, a fim de verificar a estabilidade da solução.
6.5.1.3 Avaliação da normalidade
Pela análise dos histogramas e diagramas Q-Q de normalidade, constatou-se que os dados fogem de um padrão normal, em sua maioria, apesar de não haver uma concentração muito grande dos dados nos extremos das escalas. Avaliando a significância dos parâmetros de assimetria e de curtose, foram detectados desvios da normalidade na maior parte das variáveis, usando um valor alfa de 0,1%, sugerido por Tabachnick e Fidel (2001, p. 74).
1 Por casos extremos se consideram aqueles fora dos limites sugeridos. Notadamente a limitação da escala dentro
de um limite préestabelecido faz com que tais casos sejam menos nocivos que em demais casos de variáveis contínuas.
Pelos resultados, que estão disponíveis no Apêndice E, observou-se que parte considerável das variáveis em cada uma das amostras do estudo violam a premissa básica de normalidade univariada, especialmente a presença de dados assimétricos de maneira negativa (dados muito concentrados acima da média das variáveis), que representam 90 do total de 108 variáveis (83%). Em termos de curtose, os valores foram bastante equilibrados em seus sinais, mas prevaleceram 28 casos com curtose positiva (dados muito concentrados em torno das médias da variável) dignas de cautela (maior que 1).
Em suma, o teste de Jarque-Bera foi significativo para 68% das variáveis (p < 0,01), demonstrando desvios expressivos da normalidade em ambas as amostras. Buscando reduzir tais problemas, tentaram-se várias transformações de variáveis, da forma; 1) X2; 2) X3; 3) LnX; 4) LOG10_X; 5) XY; 6) 1/X (HAIR Jr. et al., 2005; TABACHNICK; FIDEL, 2001, p. 80). Escolhendo a alternativa que implica menor desvio global da normalidade (menor valor de J-B), obteve-se uma matriz cujos vetores ainda discrepavam significativamente da normalidade. Considerando a inaptidão do procedimento, decidiu-se manter as variáveis em seu formato original e proceder a análises aceitando que os dados do estudo não seguem uma distribuição normal.
6.5.1.4 Análise de linearidade
A linearidade dos relacionamentos dos indicadores foi testada por meio do coeficiente de pearson. Considerando o nível de significância de 5%, o valor crítico de r é de 0,115 e 0,210 nas amostras de fabricantes e fornecedores, respectivamente. No total, 745 correlações no grupo de fabricantes e 511 no grupo de fornecedores foram significativas, representando 27% e 19% da matriz R em cada grupo. Buscando verificar se tal ocorrência procede de uma violação da linearidade, foram traçados diagramas de dispersão, buscando-se padrões lineares, quadráticos e cúbicos entre 100 pares de variáveis, mas nenhum desvio preocupante foi identificado. Assim, por consequência, as variáveis podem ser vistas como se comportando dentro do padrão de linearidade.
6.5.1.5 Análise de multicolineariedade
O grau de redundância avaliado pelos procedimentos de multicolinearidade entre as variáveis não indicou correlações maiores que 0,90 em módulo. A única variável que demonstrou um percentual de variância superior a 90% com as demais variáveis foi a
DESEMP_4 (qualidade dos produtos fabricados) no grupo de fornecedores (R2 = 0,92). Mas, por se tratar de um caso isolado, marginalmente acima do limite proposto e que faz parte de um construto endógeno final do modelo (desempenho), não se consideraram tais resultados como preocupantes. Ademais, uma vez que serão usadas medidas de avaliação da validade dessas medidas e os problemas concentram-se em uma questão isolada, preferiu-se manter esse indicador na análise para, mais adiante, verificar a necessidade de sua exclusão. Neste tópico, na prática, avaliou-se a multicolineraridade entre os indicadores de forma geral, enquanto a validade discriminante foi usada para verificar o grau de intercorrelação entre os construtos no modelo estrutural.
Tendo apresentado as análises preliminares dos dados, assim como os pressupostos da análise multivariada, optou-se por demonstrar as análises subsequentes de cada amostra em separado, como será visto a seguir, iniciando-se pela amostra de fabricantes.