8.2 Stability of the scenario tree
8.2.2 Out-of-sample stability
Em outras palavras, este critério toma como base a distância entre os CNAE, representada pela medida de semelhança escolhida (distância euclidiana quadrática). Se a distância entre dois grupos é pequena, os grupos devem ser agregados. Em contrapartida, se a distância entre os dois grupos é grande os grupos devem se manter separados.
Assim, por exemplo, para dois CNAE (CNAEa e CNAEb) com as dimensões padronizadas (0,0345; 0,8755; 0,4871) e (0,3655; 1,1942; 1,0297), respectivamente para freqüência, gravidade e custo. A distância euclidiana será 0,7110:
(
) (
)
2(
)
2 2 2 2 1 1 ) , (CNAEa CNAEb a b a b ap bp d = − + − +K+ −(
0,0345 0,3655) (
0,8755 1,1942) (
0,4871 1,0297)
0,7110 ) , (CNAEa CNAEb = − 2 + − 2 + − 2 = dRepete-se essa operação entre todos os CNAE-Classe, dois-a-dois, de forma que cada par de CNAE possua uma distância euclidiana quadrática que servirá para definir proximidade e, por conseguinte o cluster das alíquotas de 1%, 2% e 3%.
7.5 Análise de Conglomerados (clusterização)
7.5.1 Critérios de Agrupamento dos CNAE
A partir da limpeza dos registros discrepantes com a exclusão dos valores extremos pelo método de Tukey, procede-se à padronização dos coeficientes de freqüência, gravidade e custo e em seguida opera-se a análise de conglomerados
Adota-se neste estudo o critério combinado109 de conglomeração de elementos tridimensionais (CNAE) com uma clusterização, via SPSS, dos 433 CNAE por intermédio do critério de Ward seqüenciado pelo K-means. A combinação desses dois critérios nessa seqüência, funciona como refinamento, pois teoricamente poderia ser feita a clusterização isoladamente com o Ward ou
K-means. A seguir os critérios:
7.5.1.1 Critério Hierárquico de Ward
O critério hierárquico de Ward assume inicialmente um conjunto pulverizado de 433 elementos que correspondem ao número de CNAE. Cada agrupamento (cluster) composto por um único CNAE. Partindo-se aleatoriamente de uma CNAE qualquer, chamada CNAE inicial, uma-a-uma CNAE vai sendo
"anexadas" à CNAE de maior proximidade, pelo critério de parecença no espaço tridimensional.
Essa aglomeração de CNAE próximas gera um cluster. O processo é dinâmico e contínuo de modo a incorporar hierarquicamente novas CNAE a sucessivos novos clusters até todos os 433 elementos inicias formarem um único cluster. Diz-se critério hierárquico pelo fato da conglomeração acontecer do maior número de elementos ao menor, conjunto unitário.
Faz-se esse procedimento computacional, até se encontrar um número ideal de clusters de forma a assegurar menor variabilidade interna ao cluster e maior heterogeneidade entre eles mediante análise multivariada das distancias entre clusters, por batimento computacional 110.
Por imposição legal, dada a determinação do artigo 22 da lei 8.212/91111 que fixou em três graus de risco, interrompe-se a clusterização quando a análise computacional multivariada apresenta três clusters, cujas coordenadas são chamadas de centróide - núcleo de cada agrupamento gerado - que nada mais é que o ponto médio de cada um deles. Os valores dos coeficientes calculados pelo método hierárquico, no programa SPSS, são apresentados na Tabela 7-4, como “Saída Processo Hierárquico (Ward)” (sementes).
7.5.1.2 Critérios de Não-Hierárquico - K-means
Os coeficientes obtidos no passo anterior (Ward) servem como sementes otimizadoras do processamento seguinte, não-hierárquico, pois a análise multivariada em busca das distâncias relativas entre CNAE para fins de
clusterização deixa de partir aleatoriamente de um CNAE qualquer, para iniciar
desses pontos sementes, fixados a priori, k=3, daí o critério ser chamado de não- hierárquico ou k-médias.
O resultado do processamento do método hierárquico (Ward) fornece as sementes (centróides iniciais) como entrada para o algoritmo K-means, bem como os resultados com os centróides finais.
Registre-se que as distâncias entre os centróides inicial e final, neste conjunto especifico de dados, são muito pequenas, que significam o quão homogênea está a distribuição dos 433 CNAE-Classe, pois o refinamento do K-
means pouco agregou, a ponto de se prescindir, inclusive, dessa segunda etapa
(K-means).
Todavia, optou-se por manter essa combinação para salvaguardar o refinamento para qualquer outra distribuição que venha a ser tratada, pois tal método será replicado para novos períodos, novas cargas de dados. Os resultados são apresentados na Tabela 7-4.
Tabela 7-4: Coeficientes padronizados de freqüência, gravidade e custos – centróides iniciais e finais - a partir dos critérios combinados Hierárquico (Ward) com Não-Hierárquico (K-means).
leve - 1% Médio - 2% Grave - 3%
CFp -0,1834 -0,1461 -0,0981 CGp -0,1484 -0,1220 -0,0964 CCp -0,1864 -0,1701 -0,1370 CFp -0,1797 -0,1446 -0,0903 CGp -0,1449 -0,1212 -0,0925 CCp -0,1853 -0,1624 -0,1464
Saída - Processo Hierarquico (método - Ward) Entrada - Processo Não Hierarquico (k-means)
Grau de Risco e Alíquota do SAT
Saída - Processo Não Hierarquico (k-means)
7.5.2 Resultados da Clusterização e Atribuição das Alíquotas por CNAE
Os três clusters são então determinados - com a menor variabilidade interna e maior heterogeneidade entre eles - a partir do batimento computacional das distâncias euclidianas quadráticas das coordenadas padronizadas de freqüência, gravidade e custos, no módulo analyze do SPSS, tomando-se como centróides aqueles finais do critério de K-means.
Após sucessivas iterações de batimentos computacionais das distâncias relativas entre os 433 CNAE-Classe, verifica-se a imutabilidade de alocação dos CNAE-Classe, convergência do sistema, na seguinte configuração: 176 CNAE-Classe no cluster de grau leve (1%); 173 de grau médio (2%) e 84 de grau grave (3%), conforme se visualiza na Figura 7-8 que apresenta a distribuição do tipo Box-Plot para o conjunto de 433 CNAE-Classe, na qual se verifica a
3,00 2,00 1,00
G
Ri
4 3 2 1 0 -1 -2 7990 7719 155 8513 9609 5112 6391 910 1064 2093 114 2814 1531 Zscore(INDCUS Zscore(INDGRA Zscore(INDFREexistência de diferenças significativas entre os grupos de risco por coeficientes padronizados de freqüência, gravidade e custo.
Figura 7-8: Box-Plot dos coeficientes de freqüência, gravidade e custo (Zscore) e respectivos graus de riscos e alíquotas do SAT pós-clusterização pelo método combinado Ward-Kmeans para 433 CNAE-Classe
Acrescentando-se agora os 73 CNAE-Classe discrepantes, alocados em risco grave, aos 433 oriundos da clusterização, é possível verificar na Figura 7-9 as nuvens (clusters) por grau de risco e alíquota SAT com os 506 CNAE- Classe. Lista-se no Anexo 9-5 a descrição, códigos e alíquotas SAT dos 506 CNAE-Classe.
Figura7-9: Dispersão espacial dos 506 CNAE-Classe segundo coeficientes tridimensionais de freqüência, gravidade e custo e respectivos graus de riscos do SAT.
7.6 Testes Estatísticos e Validação
As distâncias entre os centros dos clusters (centróide) são apresentadas na Tabela 7-5 e demonstram em termos numéricos a posição relativa entre os graus de risco.
Tabela 7-5: Distância entre os centros de cada cluster (centróide)
Grau de Risco (cluster)
Leve Médio Grave
Leve * 0,048 0,111
Médio 0,048 * 0,063
Grave 0,111 0,063 *
Os coeficientes padronizados de freqüência, gravidade e custo apresentam baixos valores de correlação entre si, conforme se verifica na Matriz de Correlação da Tabela 7-6 que evidencia um baixo coeficiente de correlação entre as variáveis escolhidas revelando ausência de multicolinearidade entre as variáveis independentes112.
Tabela 7-6: Matriz de Correlação entre os coeficientes padronizados de freqüência, gravidade e custo. Pooled Within-Groups Matrices
CFp CGp CCp CFp 1,0000 0,5320 -0,0770 CGp 0,5320 1,0000 0,1020 CCp -0,0770 0,1020 1,0000 Correlação (R2)
Os graus de risco (cluster) por CNAE-Classe apresentam médias significativamente diferentes, segundo o teste de Wilks Lambda113, conforme a Tabela 7-7 o que assegura, conjuntamente à baixa correlação, a obtenção de um
ponto ótimo que balanceia a homogeneidade dentro dos grupos e heterogeneidade entre eles.
Tabela 7-7: Teste de Igualdade de médias entre os grupos de risco (cluster)
Wilks' Lambda F df1 df2 Sig.
CFp 0,206 830,826 2 430 0,000
CGp 0,298 506,888 2 430 0,000
CCp 0,58 155,378 2 430 0,000
Finalmente, o processo de conglomeração (clusterização) dos graus de risco (cluster) aqui desenvolvido apresenta níveis distintos para os três coeficientes, sendo sólida a interpretação dos resultados, ao tempo que indica, apesar de existir uma correlação significativa entre os coeficientes de freqüência e gravidade (0,5), que as três variáveis, decisivamente, contribuíram para a definição desses grupos.
7.7 Considerações Finais
A despeito de questionamentos e objeções relacionados à escolha da medida de parecença (distância euclidiana quadrática); à pertinência dos critérios de conglomeração (Ward e K-means) e até mesmo à própria técnica de discriminação dos graus de riscos mediante análise de cluster (clusterização) utilizadas neste trabalho, entende-se que tais vicissitudes não invalidam este método.
Tal assertiva se deve ao fato de que quaisquer que sejam os vieses presentes, têm-se por contornados devido à concepção de projeto, uma vez que
essa metodologia vale para a primeira geração dos coeficientes e clusterização, mas igualmente, às demais, o que naturalmente os neutraliza, pois compara-se relativamente, em sucessivas atribuições de graus de riscos, os CNAE-Classe em relação à mesma metodologia.
Ademais, tal gradação tributária dos riscos por CNAE se faz periodicamente – ao menos uma vez a cada três anos – de modo contínuo aglomerativo, pois essa primeira geração decorre dos dados SUB-CNIS de maio/2004 a dez/2006, porém as próximas terão novos anos na base, a partir de 2006.
Registre-se a consagração da figura do risco consumado ao invés do risco potencial, dado que o desempenho é aferido quantitativamente dentro de um arcabouço epistemológico e metodológico capaz de contribuir no equacionamento das três dimensões fundamentais - Saúde x Desenvolvimento (Livre-iniciativa) x Meio Ambiente do Trabalho como visto no capítulo 2, fortemente distorcido pelo vértice da iniciativa privada.
Finalmente, este método além de contribuir no alcance do objetivo geral – pois, introduz atratividade à iniciativa privada quanto à melhoria ambiental - permite objetivamente distinguir as CNAE-Classe em três grupos e responde cabalmente à problematização posta no item 7.2.
8 Fator Acidentário de Prevenção – FAP
8.1 Introdução
No âmbito tributário da Saúde do Trabalhador se faz necessário, até por força do artigo 10 da lei 10.666/2003110, estimular a concorrência de livre mercado quanto às práticas prevencionistas, notadamente aquelas relacionadas à redução dos afastamentos por incapacidade laborais. Nesse sentido estabelecer uma metodologia de bônus x malus que privilegie e penalize as empresas de modo isonômico se faz premente.
A medida não é novidade. A lei nº. 7.787114, de 30 de junho de 1989, em seu art. 4º, dispunha que a empresa cujo índice de acidente de trabalho fosse superior à média do respectivo setor sujeitar-se-ia a uma contribuição adicional de 0,9% a 1,8% para financiamento do respectivo seguro. A Lei nº. 8.212115, de 24 de julho de 1991 (§ 3º do art. 22), possibilita ao Ministério da Previdência Social alterar o enquadramento da empresa, para fins de contribuição, a fim de estimular investimentos em prevenção de acidentes.
Em 16 de julho 1998, O Conselho Nacional de Previdência Social – CNPS116, mediante a Resolução nº. 1.101, aprovou uma sistemática para elaboração de indicadores de acidente de Trabalho, consubstanciada no documento Metodologia para Avaliação e Controle dos Acidentes de Trabalho, com o objetivo de identificar as atividades econômicas de elevados riscos laborais.
Essas disposições nunca foram implementadas, face, sobretudo, à ausência de bases sólidas que pudessem aferir, com fidedignidade, a realidade ambiental da empresa, sobretudo por se basear nos acidentes notificados, o que penalizaria as empresas cumpridoras da obrigação de notificar e beneficiaria aquelas sonegadoras dessa notificação acidentária.
A Lei 10.666117, de 2003, em seu art. 10, resgata esse temário ao tempo que lança desafio metodológico ao prescrever que as alíquotas do SAT por empresa poderão ser reduzidas à metade ou até dobrar, de acordo com os coeficientes de freqüência, gravidade e custo mediante metodologia a ser desenvolvida. A questão posta é: como?
Esta tese assumiu esse desafio como um dos objetivos específicos
8.2 Problematização
Dado um conjunto de empresas (CNPJ) pertencente a uma CNAE-Classe, cada uma medida segundo três variáveis (coeficientes padronizados de freqüência, gravidade e custo), como proceder para distingui-las de forma que a tributação do SAT flutue de 50,0% a 100,0% da alíquota nominal do CNAE- Classe?
8.3 Método
Designa-se Fator Acidentário de Prevenção – FAP o número, dentro do intervalo contínuo fechado [0,5000; 2,000], que multiplica as alíquotas de 1%, 2% ou 3%, para cada uma das empresas empregadoras brasileiras, de forma a reduzir em até 50% ou majorar em até 100%.
O FAP é determinado por discriminação dos distanciamentos lineares de coordenadas tridimensionais em um mesmo CNAE. O procedimento consiste em padronizar os coeficientes de freqüência, gravidade e custo para cada empresa e em seguida, atribuir o FAP.
O FAP será máximo (2,0000) se o score (soma dos coeficientes padronizados de freqüência, gravidade e custo) for maior que o limite superior da distribuição dos scores de todas as empresas daquele CNAE-Classe; e, receberá o FAP mínimo (0,5000), se esse score for menor que o limite inferior dessa mesma distribuição.
Caso o score da empresa fique compreendido no intervalo entre os limites superior e inferior da distribuição, o FAP será obtido mediante procedimento de interpolação linear simples. O FAP, obrigatoriamente, será igual a um, (FAP=1), quando a empresa tiver o score igual a zero, que equivale rigorosamente ao ponto central (centróide) da distribuição do CNAE-Classe, formado por todas as empresas a ele vinculado. A Figura 8-1 apresenta o fluxo para cálculo do FAP, considerando o acima exposto:
Figura 8-1: Fluxo para geração do FAP
8.3.1 Cálculo dos Coeficientes Padronizados das Empresas
As variáveis – coeficientes de freqüência, gravidade e custo – em relação ao CNAE-Classe, por empresa, são assim definidas:
X Coeficiente Freqüência (CF) como o quociente entre Freqüência (Freq) e a População Exposta (Pop) representada pela média de vínculo-empregatício do período considerado.
Considera-se Freqüência a quantidade de benefícios acidentários, exceto auxílio-acidente (B94) – temporários ou permanentes – complementada por aqueles previdenciários cujos agravos causadores da incapacidade apresentem Nexo Técnico Epidemiológico Previdenciário – NTEP, segundo estabelecido no Capitulo 6, entre a CNAE-Classe e o Agrupamento-CID da entidade mórbida. Conforme visto na Equação 8-1.