• No results found

Para alcançar seus objetivos, o presente estudo lança mão de dois métodos matemáticos, que são: um método não-paramétrico de construção de fronteira eficiente chamado Análise Envoltória de dados e um modelo de Regressão Linear Censurada ou Método Tobit. A determinação dos métodos e dos dados utilizados pode ser dividida em dois passos distintos. O primeiro é a determinação das variáveis que serão utilizadas no modelo de Análise Envoltória e o cálculo da fronteira propriamente dita; o segundo, e último passo, refere-se à regressão Tobit.

Por esses motivos, este capítulo está dividido em três partes. A primeira é dedicada aos dados e ao método utilizados no cálculo da fronteira eficiente; a segunda aborda as variáveis que podem explicar os diferentes níveis de eficiência alcançados pelos municípios; e, a terceira e última seção, apresenta o modelo Tobit e a justificativa do porquê se utilizar tal método.

3.1.Análise Envoltória de Dados (DEA)

O método de Análise Envoltória de Dados (DEA), mais especificamente o BCC1, foi escolhido por permitir a construção de uma fronteira eficiente sem a necessidade de ex-antes se assumir uma função de produção específica, além da possibilidade de se trabalhar com vários insumos e produtos. A abordagem BCC permite a existência de rendimentos variáveis de escala, o que é indispensável para a correta modelagem do setor saúde, principalmente pelos dados escolhidos.

O modelo BCC possui duas abordagens possíveis, conhecidas como: i) orientação para insumo; e, ii) orientação para produto. No primeiro caso, mantém-se fixa a quantidade de insumo e varia-se a quantidade de produto; a unidade mais eficiente é a que utiliza a menor quantidade de insumo na produção. Na orientação para

1 O nome BCC deriva das iniciais dos autores que propuseram o método, são ele: Banker, Charles e

produto, faz-se o contrário, com insumos constantes, é a quantidade de produto que varia. O mais eficiente será aquele que alcançar a maior quantidade de produto.

No presente estudo é utilizada a abordagem orientada para insumos, dado a nature a das ari eis “produto2” escol idas

3.1.1.Dados

Ao se falar em eficiência técnica, é usual pensar em termos monetários. Mais eficiente é a firma que produz com menor custo e, no caso, custo significa recursos monetários. Isso ocorre porque a produção é orientada para o mercado, e tanto o proprietário do capital, como os trabalhadores, utilizarão a moeda para ter acesso aos bens e serviços que desejam. Caso os custos, em termos monetários, sejam diferentes entre regiões, no longo prazo, as firmas ou irão migrar para as regiões de menor custo ou adotarão políticas que aumentem seu nível de eficiência. Essa dinâmica é coerente com a definição de mercado competitivo, mas os serviços de saúde pública não se enquadram nessa definição. O funcionamento de um sistema de saúde municipal não possui, por exemplo, mobilidade geográfica. Se a mão-de-obra é mais cara em determinado lugar, não pode a secretaria municipal de sa de “migrar” para um município cujo preço do médico seja mais baixo; o mesmo vale para o capital. Em decorrência, a secretaria terá maiores custos, mas isso não significa, necessariamente, um menor nível de eficiência.

Rendimentos médicos diferem entre municípios da capital e municípios do interior e entre as regiões do país; conseqüentemente, é melhor que variáveis monetárias sejam evitadas.

2 Em termos de literatura DEA, as variáveis escolhidas, neste trabalho, são na verdade outcomes

Os dados utilizados para a construção da fronteira eficiente compõem a estrutura básica de oferta de serviços médicos e são, provavelmente, os principais fatores de custo para os sistemas municipais de saúde. Foram utilizados como insumos:

i) Médicos por mil habitantes; ii) Enfermeiros por mil habitantes; iii) Leitos por mil habitantes; e, iv) Consultórios por mil habitantes.

Para a determinação dos produtos, partiu-se das seguintes questões: qual a função de um sistema de saúde e onde ocorre o impacto do bom cumprimento dessa função?

Um sistema de saúde não tem por finalidade ofertar internações e consultas que, na verdade, são meios que o sistema lança mão para melhorar a qualidade de vida da população, em todas as faixas etárias. Essa melhora ocorre através da redução de doenças e das mortes por causas evitáveis. Logo, o importante não é o número de internações e consultas realizadas, mas sim o impacto disso em alguns indicadores de qualidade de saúde.

Como visto na revisão de literatura, a curva de probabilidade de morte em função da idade, assim como os custos com saúde, possui um formato em “J”. Pode-se inferir da curva que as faixas-etárias localizadas nos extremos das curvas são mais dependentes dos sistemas de saúde. Logo, a mortalidade infantil surge como uma primeira variável de resultado.

A expectativa de vida é uma opção pouco controversa como variável de resultado dos sistemas de saúde. Dois fatores fizeram com que ela fosse adotada neste estudo. Primeiro, por ser o somatório da probabilidade média de se sobreviver entre duas idades exatas, ela capta o impacto do sistema em todas as idades; segundo, também por ser um

somatório, os efeitos dos erros de estimativa das população das faixas etárias mais elevadas são reduzidos, dado que esses efeitos são menores nas idades intermediárias.

Portanto, as variáveis de resultado utilizadas são: i) Taxa de mortalidade infantil; e,

ii) Expectativa de vida ao nascer.

Uma última transformação foi realizada antes do cálculo da fronteira. A taxa de mortalidade infantil é melhor quanto menor for. Isso contradiz a relação básica insumo- produto dentro de um modelo de eficiência – produzir mais com menos. Por isso, a taxa de mortalidade infantil foi transformada em taxa de sobrevivência infantil, através da equação (1). i i i TMI TMI TSI 1000 , (1) onde:

TMIi = taxa de mortalidade infantil do município i;

TSIi = taxa de sobrevivência infantil do município i.

Por fim, a fonte dos dados utilizados como insumo foi a Pesquisa de Assistência Médico-Sanitária de 1999 e dos dados utilizados como resultados, o Censo Demográfico de 2000. Ao todo 3.365 observações foram utilizadas para as estimativas.

3.1.1.1 Outliers

A Análise Envoltória de Dados é bastante sensível à presença de observações atípicas, tecnicamente conhecidas como outliers. Vários estudos utilizam bootstrap para eliminação dessas inconsistências. Simar (1998) defende que modelos muito sensíveis a pequenas variações em suas bases de dados não devem ser válidos.

No presente estudo, a eliminação de variáveis atípicas seguiu os seguintes passos: a) A partir do banco de dados original estimaram-se as efici ncias das s b) Calculou-se a média e o desvio-padrão dos escores de eficiência;

c) Todas as observações não contidas no intervalo média mais dois desvios foram excluídas;

d) Com o novo banco de dados, novos escores de eficiência foram estimados. Com o objetivo de testar a estabilidade dos escores, novas críticas foram realizadas nos dados e mais dois modelos foram calculados. Os novos exames, que analisaram as variáveis de insumo e produto, buscaram relações de produção aparentemente inconsistentes – como exemplo, um municípios que possuía leitos, mas não tinha médicos. Os resultados dos modelos adicionais, assim como questões relativas ao viés dos escores de eficiência e das críticas de Simar e Wilson (2007), estão disponíveis no apêndice deste trabalho.

3.1.2.M odelos DEA

A Análise Envoltória de Dados é um método não-paramétrico de programação linear que se baseia na mensuração da performance relativa de unidades organizacionais que demandam múltiplos insumos e tenham como resultado vários produtos O termo eficiência está usualmente associado à melhor maneira pela qual os insumos podem ser utilizados para produção.

A forma mais simples e comum de se medir eficiência é dada pela equação (2): eficiência = produto / insumos. (2)

Porém, em muitos casos, o interesse está cunhado em processos que envolvem diversos insumos e produtos. Nesses casos, a análise baseada na equação (2) deixa de ser adequada e duas alternativas são amplamente utilizadas: Econometria de Fronteira Estocástica e Análise Envoltória de Dados.

Charnes, Cooper e Rhodes (1978) partiram do trabalho de Farrell (1957) e criaram o modelo original de DEA, conhecido como CCR. Posteriormente, Banker, Charnes e Cooper (1984) apresentaram um novo modelo conhecido como BCC. A

57 diferença básica entre CCR e BCC está no fato do primeiro trabalhar com retornos constantes de escala e o segundo permitir retornos variáveis. O presente trabalho adotou o modelo BCC, mas, para fins didáticos, ambos os modelos serão apresentados.

3.1.2.1.M odelo CCR – Retornos Constantes de Escala

O problema resolvido pela Análise Envoltória é constituído pela maneira como unidades de decisão s3) combinam insumos, de forma a obter uma determinada

quantidade de produtos.

Supon a insumos utili ados por cada uma das s para produ ir produtos, com I e P respectivamente representados pelos vetores xi e yi para a enésima

DMU. Tem-se, então, duas matrizes que representam o total produzido e consumido por todas as s, ue são a matri de insumos, , e uma matri de produtos, , x N.

A Análise Envoltória busca mensurar a relação entre cada DMU e todos os insumos e produtos existentes. A programação matemática utilizada parte da equação (3):

(3)

O problema consiste em encontrar pesos para u e v de forma a maximizar a eficiência da enésima DMU, sujeita à restrição de que todas as eficiências devem ser menores ou iguais a 1.

A equação (3) apresenta infinitas soluções possíveis, o que pode ser resolvido pela adição da restrição i om isso, u e passam a ser, respecti amente, e e

3 Decision Making Unit – termo em inglês adotado na literatura DEA. 0 , , ,..., 2 , 1 , 0 ' ' v u N j x v y u j j : . ' ' max , a s x v y u i i v u

0 , , ,..., 2 , 1 , 0 ' ' 1 ' N j x y x v j i i

a equação (3) pode ser reescrita conforme a equação (4), conhecida como multiplicador da programação linear: : . ) ' ( max , a s yi (4)

Adotando-se como escalar e como um etor de constantes , o modelo envoltório pode ser derivado de (4) e resultará na equação (5):

(5)

Coelli (1996) afirma ser a equação (5) a melhor maneira para se resolver o problema de análise envoltória. O valor obtido ser o escore de efici ncia para a enésima DMU e irá satisfazer a condição 0 , onde representa a fronteira de eficiência.

or fim, o problema resol ido para cada uma das s com um calculado para cada uma delas. O escore de ineficiência, ou relação de recursos desperdiçados pela DMU que não opera na fronteira, pode ser obtido pela equação (6):

1- inefici ncia 6)

3.1.2.2.M odelo BCC – Retornos Variáveis de Escala

Assumir retornos constantes de escala é uma hipótese muito forte para grande parte dos modelos econômicos. De forma estrita, tal hipótese só é apropriada caso a DMU opere com um nível de produção que a coloque na escala ótima. Banker, Charnes e Cooper (1984) apresentaram uma variação do modelo CCR que pode operar com rendimentos variáveis de escala.

. . , min , a s . 0 , 0 , 0 X x Y y i i

A alteração básica consiste na adição da restrição de convexidade, composta pelo etor , , de “uns” e o etor de constantes. O formato da restrição é portanto o acrescentar a no a restrição à equação (5), tem-se a equação (7):

(7)

Que representa a forma funcional do modelo BCC.

3.2.Variáveis Explicativas - Tobit

O segundo estágio de um modelo DEA em dois estágios é composto por uma regressão Tobit, com o escore de eficiência calculado na Análise Envoltória utilizado como variável dependente.

Utilizou-se a estratégia de modelagem geral para específica. Ou seja, em um primeiro momento, são listadas várias variáveis que devem ter impacto na eficiência4; em seguida, a relação entre essas variáveis é analisada e o modelo ajustado para a correção de eventuais problemas.

Como ponto de partida, as seguintes variáveis foram adotadas:

i) Anos de existência: busca captar o efeito da maturidade administrativa do município, além de permitir a análise do impacto do fenômeno de criação de municípios;

ii) Distância da capital: capta os impactos gerados pela distância do principal centro metropolitano do estado e, conseqüentemente, dos spillovers gerados por eles;

4 Com a exceção da variável PSF, todas as demais foram incluídas no modelo por serem comumente

adotadas na literatura. A variável PSF é utilizada por se tratar de uma ação estratégica do Ministério da Saúde e que, ao menos em teoria, deve ter um impacto significativo sobre a eficiência.

. . , min , a s . 1 ' 1 , 0 , 0 , 0 N X x Y y i i

iii) Média de anos de estudo dos maiores de 25 anos: a relação anos de estudo e produtividade da mão-de-obra é comumente aceita. Uma maior média de anos de estudo da população local deve viabilizar uma administração pública melhor qualificada, logo mais eficiente;

iv) Porcentagem da população com mais de 25 anos analfabeta: argumento semelhante ao de média de anos de estudo, mas com efeito contrário;

v) Renda per capita: a renda é ator central na explicação dos fluxos migratórios e pode, até certo grau, refletir o nível de produtividade marginal do fator trabalho;

vi) Índice de Gini: conforme Piola (2004), o Índice de Gini evidencia a divisão de interesses entre a população municipal. Quanto mais desiguais, mais heterogêneos serão os interesses da população local;

vii) Dias de internação: supõe-se altamente correlacionada com a complexidade das intervenções médicas demandadas.

viii) População total: tem por função captar os efeitos de escala; ix) População urbana: capta o efeito da urbanização;

x) Programa de Saúde da Família (PSF): pode captar dois efeitos distintos. O primeiro seria o impacto do PSF no resultado alcançado pelo município. O segundo, como os dados são de 2000 e esse programa é relativamente novo, pode captar um viés de seleção, onde os menos eficientes aderiram de forma mais forte ao programa;

xi) Porcentagem dos municípios atendidos por coleta de lixo: trata da infra- estrutura urbana;

xii) Porcentagem dos municípios atendidos com água encanada: efeito do fornecimento de água de melhor qualidade; e,

xiii) Porcentagem dos municípios com energia elétrica: infra-estrutura urbana. Todas as variáveis, com exceção do PSF, têm como fonte o Censo Demográfico de 2000. A informação relativa ao PSF foi obtida junto ao DATASUS5 e refere-se à dezembro de 2000.

A Tabela 1 apresenta o valor das correlações para as variáveis listadas e para o escore de eficiência calculado. Observar as correlações é útil para evitar problemas de multicolinearidade na regressão.

Como já esperado, analfabetismo tem uma forte correlação negativa com anos de estudo e com renda. Optou-se pela exclusão das variáveis média de anos de estudo e analfabetismo e pela manutenção da variável renda, principal fator explicativo para o comportamento da mão-de-obra6 e, assim como as outras duas variáveis, altamente correlacionado com a produtividade do fator trabalho.

Luz, água e lixo também são muito correlacionadas. Adotou-se a porcentagem dos domicílios com luz elétrica como a proxy para a infra-estrutura urbana.

5 Departamento de Informática do Sistema Único de Saúde. <www.datasus.gov.br>. 6 Segundo a literatura sobre fluxos migratórios.

Eficiência Existência Anos de da Capital Distância Estudos Analfabetas Renda Gini Água Lixo Luz População Urbana Pop. Eficiência 1,000 Anos de Existência -0,049 1,000 Distância da Capital 0,020 -0,203 1,000 Estudos 0,056 0,242 -0,151 1,000 Analfabetas -0,127 -0,088 0,079 -0,903 1,000 Renda 0,135 0,159 -0,086 0,885 -0,827 1,000 Gini -0,097 0,107 0,200 -0,247 0,329 -0,192 1,000 Água 0,036 0,089 -0,108 0,785 -0,829 0,766 -0,385 1,000 Lixo 0,009 0,100 -0,135 0,556 -0,567 0,563 -0,275 0,738 1,000 Luz -0,038 0,083 -0,242 0,666 -0,620 0,592 -0,375 0,780 0,643 1,000 População -0,022 0,231 -0,120 0,240 -0,121 0,241 0,054 0,079 0,063 0,079 1,000 Pop. Urbana -0,021 0,213 -0,122 0,677 -0,499 0,572 -0,153 0,544 0,374 0,572 0,173 1,000 Elaboração: Autor Tabela 1: Correlações

A Tabela 2 apresenta as correlações das variáveis que serão utilizadas no modelo

Tobit. Como pode ser observado, não há mais nenhuma variável altamente

correlacionada.

3.3.M odelo Tobit

O modelo Tobit é um método alternativo de regressão que permite o uso de uma variável explicada censurada, ou seja, que siga y = (0;y*). Nesse caso, a variável explicativa y* satisfaz as hipóteses do modelo clássico de regressão linear; em particular as hipóteses de distribuição normal e homocedasticidade. De outra forma, y é igual a y* quando y* é maior ou igual a zero e y é igual a zero quando y*<0.

Grosskopf (1996) aponta que como o coeficiente de eficiência gerado pela metodologia DEA está localizado no intervalo entre zero e 1, o modelo de regressão censurada (Tobit) seria o mais indicado para o cálculo da regressão.

Conforme Greene (2005), uma distribuição normal censurada é aquela na qual o ponto censurado é assumido como igual a zero. O resultado é a mistura de uma distribuição contínua com uma discreta. Definindo-se a seguinte variável aleatória:

Eficiência

Anos de Existência

Distância da

capital Renda Gini

Pop. Total Pop. Urbana PSF Luz Eficiência 1,000 Anos de Existência -0,049 1,000 Distância da capital 0,020 -0,203 1,000 Renda 0,135 0,159 -0,086 1,000 Gini -0,097 0,107 0,200 -0,192 1,000 Pop. Total -0,022 0,231 -0,120 0,241 0,054 1,000 Pop. Urbana -0,021 0,213 -0,122 0,572 -0,153 0,173 1,000 PSF -0,129 -0,086 -0,067 -0,167 0,013 -0,062 -0,062 1,000 Luz -0,038 0,083 -0,242 0,572 -0,153 0,082 0,552 -0,024 1,000 Elaboração: Autor

0 y sey* 0 e * y y sey* 0, a distribuição aplicada *~ [ ; 2] N y tem 1 ) 0 * ( Pr ) 0 ( Prob y ob y (8),

se y* 0, então y tem a densidade de *y . 3.3.1.M odelo Tobit – Revisão Econométrica

Com uma variável explicada censurada, o método de regressão alternativo é o modelo Tobit. Segundo Greene (2005), a fórmula geral é dada por:

i i i x y* ' , 0 y sey* 0, (9) * y y sey* 0.

Conforme Wolldridge (2003), a variável *y satisfaz as hipóteses do modelo

clássico de regressão linear. A densidade de ydado x é fornecida pela equação (10), que nada mais é que uma adaptação da equação (8):

x x x x ob x x ob x y ob x y ob( 0| ) Pr ( * 0| ) Pr ( | ) Pr ( / / | ) 1 Pr (10)

A função log-verossimilhança para cada observação i é dada pela equação (11):

i i i i i i x y y x y l ( , ) 1( 0)log 1 1( 0)log[ 1 (11),

onde é a função de densidade normal padrão. As estimativas por máxima verossimilhança do parâmetro e do desvio-padrão ( ) são obtidas pela maximização da função log-verossimilhança.

Quanto aos testes dos parâmetros, cada estimador possui seu próprio desvio- padrão, o que possibilita a realização de teste de hipótese com o uso de estatísticas t. A fórmula para o cálculo do desvio-padrão, mais complicada do que a de um Modelo Mínimos Quadrados Ordinários convencional, será omitida. Maiores informações sobre esse tema podem ser obtidas na publicação de Wooldridge (2003, capítulo 16).

3.3.2.M odelo Tobit Estimado

O modelo utilizado por este trabalho é multivariado e segue a equação (12):

9 8 7 6 5 4 3 1

0 Luz PSF 2 Renda AE DC Gini Pop PU DI

(12) onde:

: Escore de eficiência;

Luz: Porcentagem dos domicílios com eletricidade;

PSF: Porcentagem da população atendida pelo Programa Saúde da Família; Renda: Renda per capita da população;

AE: Anos de existência do município; .DC: Distância da capital;

Gini: Coeficiente de Gini; Pop.: População total em 2000;

PU: Porcentagem da população urbana na população total; e, DI: Dias de internação.

Serão duas regressões: a primeira contará com todos os municípios e, na segunda, só os ineficientes estarão presentes.