Os três indicadores descritos fornecem os insumos básicos para a construção de um indicador mais geral e consistente de concentração empresarial ligado a uma atividade ou setor econômico num município, denominado de Índice de Concentração Produtiva (ICP). Para o cálculo deste indicador, somam-se os três indicadores anteriores em uma combinação linear e cada indicador recebe um peso (θn), que depende do valor de explicação de cada um. Sua forma é dada por:
� =∅1 � +∅2 +∅3
O estudo realizado por Crocco (2003) utilizou o método de análise de componentes principais para estimar os valores dos pesos do índice. A importância de cada um dos indicadores na determinação do ICP do município é medida pelo grau de explicação que cada um dos indicadores fornece para cada setor especificamente.
Para a obtenção dos pesos (θ) de cada um dos índices definidos na Equação 4, utilizar-se-á a técnica de Análise Fatorial com aplicação do método de componentes
principais. Através da matriz de correlação das variáveis, a metodologia permitirá que se conheça qual o percentual da variância da dispersão total de uma nuvem de pontos, representativa dos atributos aglomerativos, que é explicado por cada um dos três indicadores utilizados.
A análise fatorial procura analisar a estrutura das inter-relações (correlações) existentes de um determinado número de variáveis, definindo um conjunto de dados comuns (fatores). Esta ferramenta permite resumir e reduzir os dados (sem grandes perdas), encontrando fatores que, quando interpretados e compreendidos corretamente, são capazes de descrever os dados em um número muito menor de conceitos do que as variáveis originais (HAIR JÚNIOR et al, 2005). Esta redução de fator é o que gerará o ICP da fórmula (4).
Monteiro e Pinheiro (2004) relatam que a aplicação da análise fatorial permite a simplificação de um grande vetor de dados correlacionados a um conjunto menor de variáveis não observáveis, denominadas fatores ortogonais, captando, entretanto, o máximo possível da variância das variáveis que lhes deram origem.
Segundo Malhotra (2006), a análise fatorial pelo método de componentes principais corresponde a uma classe de processos utilizada basicamente para redução e sumarização dos dados. Ela proporciona a diminuição do número de variáveis, a fim de que a sua análise possa ser facilitada. A análise de componentes principais, segundo o autor, leva em consideração a variância total nos dados.
Para este trabalho, o uso da análise fatorial através do método dos componentes principais, objetivou simplificar a interpretação de uma base de dados, sem comprometer informações relevantes, tornando possível gerar o índice necessário para que se pudesse analisar o potencial aglomerativo de determinadas atividades em determinados municípios, este índice é o ICP citado na fórmula (4).
Algumas vezes, a matriz de dados não se compatibiliza à aplicação de uma análise fatorial. Neste trabalho, a constatação da adequabilidade dos dados foi realizada a partir da verificação dos critérios descritos a seguir, conforme as recomendações de Hair et al (2005).
i. Número de correlações
Um dos interesses da análise fatorial é buscar identificar conjuntos de variáveis que sejam inter-relacionadas. Para isto, é necessário que a matriz de dados apresente correlações suficientes. Para Hair et al (2005), a matriz de dados deve apresentar um número substancial de correlações maiores que 0,30. Caso contrário, a análise fatorial torna-se inapropriada. Assim, foram excluídos os índices que apresentaram, em sua formação, os indicadores que se mostraram pouco correlacionados com os demais, conforme o nível de significância dos coeficientes expressos na matriz de correlações.
ii. Teste de esfericidade de Bartlett
O Coeficiente de Bartlett é utilizado para testar a hipótese nula de que a matriz de correlação é uma matriz identidade. Sendo essa hipótese rejeitada, a análise fatorial poderá, então, ser realizada (FERREIRA JÚNIOR et al., 2004). O referido teste verifica a adequabilidade do modelo de análise fatorial estimado para representar a estrutura de dependência dos dados (ARTES, 1998). O coeficiente de Bartlett também permite saber se a correlação entre as variáveis é significativa ou se equivale a uma matriz identidade com determinante igual um, isto é, com a correlação entre as variáveis igual a zero. Caso esta situação seja a ocorrida, deve-se descartar o uso da análise fatorial.
As hipóteses para o teste de Bartlett são:
H0: a matriz de correlação é uma matriz identidade;
H1: a matriz de correlação não é uma matriz identidade, ou seja, há
correlações significativas entre as variáveis.
Se o valor apresentado pelo Sig. (P-value) >0,05, a hipótese nula não deverá ser rejeitada a um nível de significância de 5%, neste caso, a análise fatorial não poderá ser executada.
iii. Estatística de Kaiser-Meyer-Olkin (KMO)
A estatística KMO testa a consistência geral dos dados (MONTEIRO; PINHEIRO, 2004); compara os valores dos coeficientes de correlação linear observados com os valores dos coeficientes de correlação parcial (RODRIGUES; VIANA, 1997); quanto maior essa grandeza, melhor a análise fatorial. Assim, o critério de corte foi KMO < 0,6, dependendo do resultado encontrado na matriz de correlação.
Kaiser e Rice (1977) indicam que um modelo de análise fatorial ajustado deve apresentar valor maior ou igual a 0,8 para o coeficiente KMO. Alguns autores trabalham com valores de KMO por faixas de validade, ou seja, um KMO na faixa de 0,9 é considerado excelente, enquanto que um KMO na faixa de 0,5 seria considerado péssimo e exigiria medidas de correção nos dados amostrais mediante a exclusão de variáveis ou inclusão de novas variáveis (PEREIRA, 1999).
Após o cálculo dos indicadores seguiu-se a escolha do método de extração de fatores. Geralmente, a análise fatorial é feita através do método de componentes principais, que faz com que o primeiro fator tenha a melhor explicação das relações lineares exibidas das variáveis originais, isto é, explicando um maior percentual na variância dos dados que qualquer outra combinação linear de variáveis. Para este trabalho, onde as variáveis utilizadas se condensam em um único fator de explicação, a escolha desse método mais adequado.
A estrutura inicial das estimativas das cargas fatoriais não é definitiva e, para que se possa confirmar ou rejeitar essa estrutura, é necessário fazer uma rotação dos fatores para obter uma maior interpretação significativa (LEMOS, 2000).
Monteiro e Pinheiro (2004) destacam que a rotação possibilita que as variáveis, que compõem um determinado fator, fiquem mais fortemente correlacionadas entre si e com maior grau de dependência em relação às variáveis que compõem os outros fatores e, com isso, consegue-se dar melhor significado interpretativo para os fatores.
Para Hair et al (2005), a rotação é desejável porque simplifica a estrutura fatorial determinando soluções fatoriais mais simples e teoricamente mais significativas além de reduzir algumas ambigüidades que acompanham soluções de fatores não-rotacionados.
Existem três abordagens ortogonais para rotacionar os fatores: Quartimax, Varimax e Equimax. Nesta pesquisa adotou-se o método varimax por ser o mais utilizado e, segundo Ferreira Júnior et al. (2004), procura maximizar o número de variáveis fortemente relacionadas com cada fator permitindo, assim, obter fatores mais facilmente interpretáveis. De acordo com Hair et al. (2005), o método varimax concentra-se na simplificação da matriz fatorial maximizando a soma das variâncias de cargas fatoriais exigidas na matriz e fornecendo uma separação mais clara dos fatores.
3.3.1. Transformação do Indicador de Concentração Produtiva – ICP*
O ICP é um índice cujos resultados se concentram em torno de uma média zero. A amplitude de seus resultados é pequena e sua interpretação se dá entre classificá-lo em abaixo ou acima da média, dado seus valores encontrados como sendo negativo ou positivo, respectivamente.
Em relação as categorias que serão criadas, é preciso fornecer a informação de que cada setor analisado é particular em relação aos demais, isto é, poderão apresentar classificações distintas entre eles. Isso acontecerá devido ao fato de que o próprio ICP* é ajustado de acordo com os ICP de cada setor em particular, o que significa que eles não serão compatíveis para comparações com outros setores. Ou seja, não se poderá comparar o ICP* do setor A com o ICP* do setor B. Este índice é para informar onde está havendo maior concentração de atividades em determinado setor econômico.
Para tornar a informação mais clara, segue o exemplo:
O município A apresentou valores de ICP entre -3 e +3, tendo o zero como média. Então, para este caso, -3 equivaleria ao zero, +3 equivaleria ao 100, e o valor zero (média) corresponderia ao 50, no ICP*;
O município B apresentou valores de ICP entre -3 e +1, tendo o zero como média. Então, para este caso, -3 equivaleria ao zero, +1 equivaleria ao 100, mas o valor zero (média) não seria igual a 50, mas sim, 30 (exemplo) no ICP*;
O município C apresentou valores de ICP entre -4 e -1, tendo o zero como média. Então, para este caso, -4 equivaleria a zero, -1 equivaleria a 100, e o valor zero (média) seria um valor semelhante ao do exemplo anterior.
Os três exemplos devem ficar claros para que não haja confusão em relação aos resultados que serão apresentados. O primeiro exemplo serviu para mostrar a situação da média quando há essa perfeita simetria dos resultados, sendo que isso não ocorreria em nenhum dos resultados encontrados. É apenas para informar que municípios acima de 50 (ICP*) estariam acima da média, e os abaixo de 50 (ICP*), estariam abaixo. O segundo exemplo é o que de fato encontraremos nos resultados; serviu para ilustrar que a média encontrada no ICP* dependerá da amplitude dos resultados apresentados pelo
ICP, e não estará sempre localizada no meio termo entre 0 e 100 do ICP*. Por fim, o terceiro serviu para informar que, mesmo os dois valores encontrados no ICP sendo negativos, isto é, abaixo da média 0, estes apresentarão valores entre 0 e 100 no ICP*. Significa que independente dos valores encontrados para o ICP*, neste caso, todos estarão abaixo da média.
Apresentada estas explicações, concluímos que:
No ICP, a média é sempre 0, e esta atua como um divisor entre os que estão abaixo ou acima dela. Quanto mais distante positivamente estiver da média, maior o valor do ICP* e maior o potencial de aglomeração produtiva. O inverso é dito para valores abaixo da média.
O ICP* limita-se ao intervalo de 0 a 100, sendo que sua média corresponderá a média apresentada pelo ICP, e esta não será constante para todos os setores.
A transformação dos valores do ICP em ICP* para cada setor, foi realizado pela seguinte expressão:
� ∗ = � − �
� �� − � �100
� ∗: Índice de Concentração Produtiva Ajustado; � : Índice de Concentração Produtiva do município;
� : Índice de Concentração Produtiva mínimo de determinado setor; � �� Índice de Concentração Produtiva máximo de determinado setor.
3.3.2. Categorização dos resultados do ICP*
Como dito anteriormente, os valores do ICP* sofrerão uma categorização para que seja mais adequada sua hierarquização.
Esta hierarquização classificará os que estão abaixo dos que estão acima da média. A partir deste ponto, passa a existir faixas de modo a classificar o ICP* entre
seus respectivos potenciais de aglomerações produtivas, sendo classificados como apresentado no Quadro 2.
Quadro 2 - Categorização dos valores do ICP*
Valores do ICP* Classificação
Entre 0 - 19 Não há potencial Entre 20 - 39 Baixo potencial Entre 40 - 59 Razoável Potencial Entre 60 - 79 Bom Potencial Entre 80 - 100 Ótimo Potencial
Fonte: Elaboração Própria, 2012.
Duas observações devem ser feitas em relação à classificação apresentada: Adotou-se o critério de que os valores encontrados para o ICP*, que
estejam situados entre 0 e 20, serão classificados em ―Não há Potencial‖ aglomerativo.
Em todos os casos da classificação, estes devem ser compreendidos como casos potenciais. Tal informação é relevante, pois, o presente trabalho utilizou além de dados secundários fornecidos pela RAIS (restritos a dados formais), dados do IPECE (referentes à produção: subsetores da agricultura e pecuária). Portanto, quando um caso é dito potencial, significa que pode, na melhor das hipóteses, vir a se tornar uma aglomeração produtiva.
O ICP* está situado em uma escala de 0 a 100, onde zero indicaria a pior situação para a existência de potencial de concentração produtiva; e 100, a melhor situação.