Nesta seção são especificados os métodos estatísticos utilizados para testar hipóteses a respeito de variáveis diferenciadoras dos dois grupos (adotantes e não adotantes), bem como testar hipóteses a respeito de potenciais fatores determinantes da adoção. Foram utilizadas estatísticas descritivas e modelos logit binários, conforme descritos nas duas subseções que se seguem.
4.2.1. Estatísticas descritivas
Os dados do Censo Agropecuário 2006 foram analisados por meio de estatísticas descritivas (freqüências e médias) que permitissem diferenciar os dois grupos de análise. Esta avaliação foi realizada para o estado de São Paulo.
Os dados primários da pesquisa empírica também foram analisados por meio de estatística descritiva (freqüência, média e desvio padrão) e testes de hipóteses que permitissem diferenciar os dois grupos de análise.
O teste qui-quadrado foi utilizado para testar a significância da associação entre duas variáveis qualitativas (X e Y), quando os resultados da variável resposta (X) apresentam-se em categorias (BARBETTA, 2011). O qui-quadrado verifica se as diferenças entre as proporções dos dois grupos amostrais são significativas, neste caso, o grupo dos pecuaristas certificados SISBOV/TRACES e o grupo dos não certificados. Formalmente, as seguintes hipóteses são testadas:
H0: as distribuições de frequências da variável resposta são iguais nos dois grupos amostrais,
ou seja, as duas variáveis (X e Y) são independentes;
H1: as distribuições de frequências da variável resposta não são iguais nos dois grupos
amostrais, ou seja, existe associação entre as duas variáveis (X e Y).
Neste trabalho adotou-se um nível de significância de 5% (α=0,05). Assim, a decisão do teste estatístico é dada da seguinte forma:
p> α → aceita H0
p≤ α → rejeita H0, em favor de H1
A estatística do teste qui-quadrado é um tipo de medida de distância entre as frequências observadas e as frequências esperadas (BARBETTA, 2011). Neste trabalho, seguiu-se a recomendação de aplicar a correção de continuidade Yates no caso de frequências esperadas inferiores a 10. Este método consiste em reduzir 0,5 unidade nas diferenças absolutas entre as frequências observadas e as frequências esperadas (BARBETTA, 2011). No caso de tabela 2x2, com frequência esperada inferior a cinco, aplicou-se o teste exato de Fisher.
O teste t-student para amostras independentes é indicado para variáveis contínuas. Neste caso, a estatística do teste tem por objetivo verificar se a diferença entre as médias da variável resposta dos dois grupos amostrais é significativa ou não. Para isso, leva-se em consideração o tamanho de cada amostra e a variabilidade interna das amostras. Quanto maior a amostra, maior a evidência de uma diferença significativa (BARBETTA, 2011). Supõem-se a distribuição normal e a mesma variância nos dois grupos dados para a aplicação deste teste estatístico.
Assim, as seguintes hipóteses são testadas:
H0: µ1 = µ2
H1: µ1 ≠ µ2
Onde:
µ1: média da variável resposta no grupo de pecuaristas certificados SISBOV/TRACES; e
µ2: média da variável resposta no grupo de pecuaristas não certificados.
Para a aplicação do teste t-student também se adotou o nível de significância de 5% (α=0,05). Assim, o teste rejeita H0 quando p ≤ 0,05. Cabe lembrar que o teste é bilateral (H1:
µ1 ≠ µ2), o que implica que a área da distribuição t-student deve ser dobrada para se obter o
valor (p) correto. Nas tabelas apresentadas neste trabalho o valor (p) está correto com esta condição.
Para a verificação do avanço do nível tecnológico do pecuarista certificado SISBOV/TRACES, foram realizadas questões considerando a condição antes e após a certificação. Para a análise destas variáveis respostas categóricas utilizou-se a teste estatístico de McNemar. Este teste tem por objetivo comparar proporções em amostras pareadas. O teste
McNemar é um teste qui-quadrado de ajustamento, que compara as frequências observadas com as esperadas supondo ausência de associação entre as variáveis. As seguintes hipóteses são testadas:
H0: as distribuições de frequências da variável resposta são iguais nas duas amostras pareadas
(antes e após a certificação);
H1: as distribuições de frequências da variável resposta não são iguais nas duas amostras
pareadas (antes e após a certificação).
Assim como nos demais testes estatísticos, adotou-se um nível de significância de 5% (α=0,05). O teste rejeita H0 quando p ≤ 0,05.
4.2.2. Modelo logit binário
A identificação dos determinantes da adoção da certificação SISBOV/TRACES foi realizada por meio de modelos de regressão com variáveis dependentes binárias, modelo logit binário (GREENE, 1993; GUJARATI, 2006). Neste trabalho atribui-se o valor 1 para a adoção da certificação SISBOV/TRACES e 0 para a não adoção. As variáveis explicativas
são representadas pelo vetor x que explica a decisão entre adotar ou não adotar. A probabilidade de um produtor rural com determinadas características individuais, da propriedade rural e da produção adotar a certificação SISBOV/TRACES é dada por:
Pr (y = 1) = F(β‘xi) (1)
Pr (y = 0) = 1 - F(β‘xi) (2)
Os parâmetros β refletem o impacto das alterações de x na probabilidade de adoção da certificação SISBOV/TRACES no estado de São Paulo, Brasil. O modelo de probabilidade é uma regressão representada por:
E[y|x] = 0[1-F(β‘xi)]+1[F(β‘xi)] = F(β‘xi) (3)
Se o modelo de probabilidade for linear, ou seja, se F(βx) = β‘x, dois problemas afetam a estimação. Um é o erro heteroscedástico e o outro é o fato de não ser possível restringir as estimativas das probabilidades no intervalo [0,1]. Em modelos com variáveis dependentes binárias, não é aconselhável a aplicação dos métodos de estimação dos parâmetros usuais de regressão, pois podem-se obter valores estimados da variável dependente negativos ou maiores do que um. O que é incompatível com a natureza na variável (HOFFMAN, 2002). Existem métodos específicos para evitar este problema, a exemplo dos modelos não lineares de probabilidade. Segundo Greene (1993), para que o modelo (3) forneça previsões consistentes, espera-se que:
lim Pr (y = 1) = 1 β‘x →
lim Pr (y = 1) = 0 (4)
β‘x → -
Essas condições são satisfeitas se F for uma função de distribuição logística, por exemplo, dada por:
E[y|x] = Pr (y = 1) = F(β‘x) = e β‘x (5) 1 + e β‘x
No modelo logístico os parâmetros não são necessariamente os efeitos marginais. Como as estimações envolvem funções não lineares, o efeito marginal de uma variável explicativa sobre a variável dependente não é o coeficiente β, como no modelo linear. Para a inferência sobre a influência das variáveis explicativas na probabilidade de y = 1, ou seja, adoção da certificação SISBOV/TRACES é necessário calcular para cada caso.
Ou seja, a variável dependente no modelo é o logaritmo natural da probabilidade de estar em um grupo (propriedades certificadas) dividido pela probabilidade de estar no outro grupo (propriedades não certificadas). O procedimento para estimar os coeficientes é o método da máxima verossimilhança e o objetivo é o de encontrar a melhor combinação de variáveis independentes que maximizam a verossimilhança de obter as freqüências observadas nos grupos. O modelo comporta o uso conjunto de variáveis quantitativas métricas e variáveis qualitativas (tratadas como dummies).
Os coeficientes estimados (
ˆ
i) do modelo logístico devem ser interpretados como avariação do logaritmo natural da relação das probabilidades de adoção e não adoção. Portanto, se um coeficiente possui um valor
ˆ
i este é o valor da variação no logaritmo natural do oddratio causado pela elevação unitária da variável xi , supondo-se fixos os valores de todas as
outras variáveis. Coeficientes de variáveis com sinais negativos indicam uma redução na probabilidade de adoção com a mudança de ocorrência da situação descrita pela variável.
Com base nesta técnica foram estimados modelos: (i) para testar as variáveis que explicam a adoção da certificação SISBOV e o conjunto de tecnologias a ela associadas, resultantes da literatura sobre a difusão e adoção de tecnologia; (ii) para testar as variáveis que explicam o reconhecimento da oportunidade criada pela certificação SISBOV/TRACES e a sua exploração, resultantes da literatura sobre o empreendedorismo.
5. ANÁLISE DOS FATORES DETERMINANTES DA ADOÇÃO DA