• No results found

Trata-se de uma pesquisa exploratória e descritiva, com abordagem qualitativa e quantitativa. Foi utilizada a metodologia baseada em abordagem sistêmica, mais precisamente

7

Formulário é um instrumento de coleta de dados, cujo sistema consiste em obter informações de modo direto com o entrevistado, por meio de um roteiro de perguntas enunciadas pelo entrevistador e preenchidas por ele com as respostas do pesquisado (MARCONI; LAKATOS, 2012, p.111).

8 Na prática, a amostragem casual ou aleatória simples pode ser realizada numerando-se a população de 1 a n e

sorteando-se, a seguir, por meio de um dispositivo aleatório qualquer, K números dessa sequência, os quais corresponderão aos elementos pertencentes à amostra (CRESPO, 2011. p.11) .

nos preceitos do Diagnóstico de Sistemas Agrários (DSA) desenvolvido por Marcel Mazoyer e Marc Dufumier (seção 3.3.1). Além disso, foi feita uma análise estatística usando inicialmente técnicas de análise descritiva (tabelas, gráficos, medidas descritivas, etc.). Posteriormente, foram utilizadas técnicas de análise multivariada (modelo de regressão linear múltiplo) para uma avaliação da renda agrícola dos produtores rurais a fim de verificar quais estão se capitalizando (ou se descapitalizando) e quais os principais fatores ou variáveis que contribuem para essa condição (seção 3.3.2).

3.3.1 Diagnóstico de Sistemas Agrários

Mediante a complexidade e diversidade encontrada na pesquisa, utilizou-se como base metodológica o Diagnóstico de Sistemas Agrários (DSA) e, após a delimitação da área de estudo, a Figura 3, mostra as etapas da aplicação do método de análise diagnóstico dos sistemas agrários do município de Palmital/SP.

Figura 3: Etapas da aplicação do método de análise diagnóstico do sistema agrário de Palmital/SP Fonte: Próprio autor adaptado de Guia metodológico INCRA/FAO (1999).

A primeira etapa do diagnóstico, a leitura da paisagem e o resgate da história, fornecem as primeiras informações importantes. Realizada por meio da compilação e tratamento de dados já existentes como documentos históricos, estatísticos e até por meio de entrevistas, esta etapa tem como objetivo identificar as diferentes variáveis que com o passar do tempo contribuíram para as transformações dos sistemas agrários em uma determinada região.

A história do sistema agrário permite elaborar uma pré-tipologia dos produtores rurais e de seus respectivos sistemas de produção. Foram realizadas entrevistas a produtores rurais com a finalidade de conhecer a realidade agrária do município e por meio das informações coletadas, construir as tipologias destes produtores e de seus respectivos sistemas de produção.

Na segunda etapa, com as tipologias de produtores e de sistemas de produção já conhecidas, pode-se caracterizar e quantificar os sistemas de produção, além de identificar as diversas formas de geração de renda nos estabelecimentos rurais pesquisados.

Na terceira e última etapa desse diagnóstico realiza-se a avaliação dos fatores e ou variáveis que interferem positiva ou negativamente na rentabilidade dos estabelecimentos rurais do município de Palmital/SP. Assim, chega-se a uma síntese final do diagnóstico e elabora-se possíveis propostas de desenvolvimento rural para o município.

3.3.2 Análise Estatística - Modelo de Regressão Múltiplo

Suponha que uma variável dependente (reposta) Y esteja relacionada com um conjunto de k variáveis independentes (explicativas ou preditoras) X=

(

X1,X2,K,Xk

)

, que podem ser numéricas ou não, e que uma função relacione tais variáveis,

( )

x x kxk

F

Y = X01 12 2+...+β . Desta forma, tem-se um modelo de regressão linear múltiplo dado por:

(

=

)

=EY |X x

Y (1)

onde E

(

Y | X= x

)

= β01x12x2 +...+ βkxk e ε é uma variável aleatória (erro aleatório) com média zero e variância 2

s . Os erros, por hipótese, são não correlacionados e, para fins de inferência, é feita a suposição adicional de normalidade dos mesmos.

Neste trabalho, os valores dos coeficientes β012,K,βk da equação de regressão (1) serão estimados pelo método dos mínimos quadrados ordinários, que busca encontrar os coeficientes (ou estimativas) b0,b1,b2,K,bk que minimizem a soma dos quadrados dos erros (diferenças entre os valores observados de, Y, e os obtidos a partir do modelo ajustado, Yˆ). Assim, os estimadores de mínimos quadrados do vetor de coeficientes de regressão

[

β01,...,βk

]

'

=

B são dados por Bˆ =

( )

X´X−1X´Y=

[

b0,b1,b2,K,bk

]

', e o vetor dos valores ajustados é representado por Yˆ =XBˆ =X

(

X´X

)

−1X´Y onde Y é o vetor de observações de tamanho n e X é a matriz dos preditores (MARTINS, 2006).

Testa-se, então, a significância do modelo por meio do teste de hipótese para a existência de regressão linear múltipla. Sendo α o nível de significância (ou limite do erro) do teste, então, conclui-se que existe regressão linear múltipla, ou seja, que o modelo pode explicar e prever a variável Y se Fcal > Ftab, sendo Ftab obtido de uma tabela da distribuição F

de Snedecor, com (k, n – k – 1) graus de liberdade (k: número de variáveis independentes do modelo e n: número de informações amostrais); e Fcal =

( )

( )

= = = = − − − − = n i i n i i n i i Y Y k n Y Y k Y Y 1 2 1 1 , 1 ˆ ˆ QM_res QM_reg

, obtidos por meio das informações amostrais. O processo de seleção de variáveis preditoras para o modelo de regressão ajustado é realizado por meio de testes de hipóteses da existência dos parâmetros β012,K,βk. Sendo α o nível de significância (ou limite do erro) do teste, então, conclui-se que βi é diferente de zero se tcal >ttab, sendo ttab obtido de uma tabela da distribuição t de Student com nk graus de liberdade; e

i b i cal S b

t = , obtidos por meio das informações amostrais (MARTINS, 2006).

Uma vez definido o modelo e obtidas as estimativas de seus parâmetros, avalia-se a qualidade do ajuste deste aos dados por meio do coeficiente de determinação múltipla, que mede a porcentagem da variação de Y que é explicada pelo modelo. Este coeficiente é dado

por

( )

(

)

2 1 2 1 2 ˆ

= = − − = n i i n i i Y Y Y Y

R , onde 0≤R2 ≤1 ou 0%≤R2≤100%. Quanto mais próximo de um ou de 100% R estiver, melhor será a adequabilidade do modelo de regressão 2 linear múltiplo aos dados (MARTINS, 2006).

Existem três medidas auxiliares que podem ser utilizadas na verificação dos pressupostos (ou restrições) da regressão: diagnóstico de multicolinearidade9, análise da ausência de autocorrelação serial dos resíduos (diferença entre os valores reais e os valores preditos) e da existência de normalidade destes. Para o diagnóstico de multicolinearidade

9 A análise de regressão é uma extensão do conceito de correlação e, dentre as restrições desta análise, uma delas

é de que variáveis independentes não podem estar correlacionadas umas com as outras. A existência da correlação cruzada entre variáveis independentes é chamada de multicolinearidade. Quando existe multicolinearidade, o processo de estimação é insatisfatório e os coeficientes sobre cada uma das variáveis independentes tornam-se difíceis de serem interpretados isoladamente, pois as variáveis colineares não proporcionam informação suficiente para estimar seus efeitos separados. Porém, a regressão ainda tem poder de previsão (HILL, 2003).

utiliza-se a estatística Variance Inflation Factor (VIF), a qual é calculada estimando-se cada variável independente como se esta fosse dependente, regredindo-a em relação às demais e obtendo-se o valor

(

2

)

1−R de tal regressão. Se VIF<1, não existe multicolinearidade; 10

VIF

1≤ ≤ , a multicolinearidade é aceitável; VIF>10, a multicolinearidade é problemática. A análise da autocorrelação serial se faz por meio do teste de Durbin-Watson (D-W). Sendo

α o nível de significância (ou limite do erro) do teste, então, conclui-se que existe ausência de autocorrelação serial dos resíduos se a estatística D-W estiver próxima a 2. E verifica-se ainda a normalidade dos resíduos graficamente e por meio do teste de Kolmogorov-Smirnov (K-S). Sendo α o nível de significância (ou limite do erro) do teste, então, conclui-se que a distribuição dos resíduos é normal se a estatística K-S, calculada a partir da distribuição D (distância euclidiana máxima), for menor do que o valor crítico (tabelado), ou equivalentemente, se o p_valor >α (CORRAR; PAULO; DIAS FILHO, 2009).