Utilizou-se como variável dependente, o logaritmo da razão do rendimento de todos os trabalhos das pessoas ocupadas e das horas trabalhadas. É relevante destacar que foram retirados da amostra os indivíduos que não declararam suas rendas nas análises pertinentes à equação de rendimento, mas mantendo-os na análise descritiva.
Segundo Hoffmann e Simão (2005), informações sobre rendimento obtidas por meio de questionários, como nos Censos ou nas PNADs, produzem valores que subestimam a renda efetiva, já que as pessoas (especialmente as relativamente ricas) subdeclaram seus rendimentos, e vários tipos de renda real são omitidos. As famílias também possuem rendas provenientes de outras fontes como aluguéis e juros, que não foram computadas devido a sua baixa importância relativa e porque o objetivo principal é analisar o rendimento advindo do trabalho.
Isto posto, empregou-se o logaritmo neperiano da renda dividido pelas horas trabalhadas, uma vez que esta variável tem como característica uma distribuição assimétrica.
Variáveis explicativas – características produtivas
Como supramencionado, é esperado que trabalhadores com maiores escolaridade e experiência sejam mais eficientes e recebam maiores remunerações. Nesse caso, as diferenças de remuneração são apenas a tradução das desigualdades preexistentes em produtividade, sendo essa parcela da desigualdade em remuneração apenas revelada pelo mercado de trabalho.
A idade é incluída na regressão como proxy da experiência, ou seja, com o passar dos anos espera-se que os indivíduos se tornem mais especializados e eficientes nas funções que exercem e por isso tenham um retorno financeiro correspondente a tal empenho. Optou-se em medir a idade em dezenas de anos para tornar os coeficientes maiores. Também se utilizou o quadrado dessa variável, uma vez que a renda não varia linearmente com a idade, tendo um comportamento de U invertido. Esta curva revela a depreciação do capital humano, ou seja, a produtividade do indivíduo após atingir um ápice começa a recuar. Se os parâmetros para a idade e idade ao quadrado forem indicados por β1 e β2, respectivamente, deve-se ter β1 > 0 e β2 < 0 e então o valor esperado da renda será máximo quando a idade da pessoa for igual a − β1/(2β2);
Para captar o efeito da educação, que se trata de uma proxy de produtividade, utilizou-se a variável anos de estudo. Nos dicionários da PNAD, ela é dividida em 14 categorias até 1990, quais sejam: (1) sem instrução e menos de um ano; (2) um ano; (3) dois anos; (4) três anos; (5) quatro anos; (6) cinco anos; (7) seis anos; (8) sete anos; (9) oito anos; (10) nove a onze anos; (11) doze ou mais; (12) não determinado; e, (13) não declarado. De 1996 a 2006, mudam-se as categorias a partir da dez: (10) nove anos; (11) dez anos; (12) onze anos; (13) doze anos; (14) treze anos; (15) quatorze anos, (16) quinze anos ou mais; e, (17) não determinados e sem declaração. Optou-se pela exclusão da categoria doze e treze nos anos até 1995, e dezessete de 1996 a 2006 para não causar viés nos resultados por se tratar de uma variável contínua que indica a taxa de retorno, ou seja, o acréscimo percentual no rendimento esperado produzido por cada ano adicional de estudo.
Outra variável utilizada foi o efeito limiar da educação. Segundo Hoffmann e Simão (2005), tem-se um limite a partir do qual os anos de estudo começam a impactar de forma mais expressiva no rendimento. Segundo Ney e Hoffmann (2004) este valor deve se situar em 10 anos de estudo.
S* = Z (S – ) (2.1)
onde:
S* = Efeito Limiar da Educação; S = Anos de Estudo do individuo;
= Limiar da educação;
Z = é uma variável dummy que assume valor zero para S ≤ e valor 1 para S > .
Considerando que S = anosdeestudoe, S* = ELEDU e K as demais variáveis das equações de rendimentos, o valor do logaritmo dos rendimentos de todos trabalhos ficará como:
ln Yi = K + β4 anosdeestudoi + β5 ELEDUi (2.2)
Quando S ≤ , teremos Z = 0 e a equação se reduz a:
lnYi = K + β4 anosdeestudoi (2.3)
Ou seja, desconsiderando o limiar da educação, cada ano adicional de estudo está associado a um aumento de [exp( β4 )-1]100% no rendimento dos indivíduos;
Quando S > , temos Z = 1, e a expressão (2.3) se tornará:
ln Yi = K− β5 + (β4 +β5 )S (2.4)
Sendo assim, após o nível de limiar cada ano a mais de escolaridade provocará retorno nos rendimentos das pessoas em [exp(β4 + β5) - 1]100%.
Para o cálculo do limiar do meio rural e urbano foram construídas dummies para cada ano de estudo e rodada a regressão de rendimento. O limiar é escolhido quando se tem um aumento brusco de retorno para cada ano adicional de estudo seguido de um aumento crescente.
Variáveis explicativas – características não-produtivas
Segundo Barros et al. (2007), nem todas as diferenças em remuneração resultam dessas diferenças intrínsecas de produtividade entre trabalhadores, reveladas apenas pelo mercado de trabalho. Boa parte delas ocorre entre trabalhadores perfeitamente substituíveis no processo de produção, isto é, entre aqueles que, se trocassem entre si os postos que ocupam, não alterariam o nível da produção em nenhum deles. Nesse caso, temos que o mercado de trabalho remunera de forma diferenciada trabalhadores com a mesma produtividade intrínseca e, portanto, gera desigualdades. O mercado gera desigualdade quando remunera de forma diferenciada homens e mulheres, brancos e negros com mesma produtividade. Neste sentido, foram incluídas dummies de gênero e cor ou raça para captar se no rural mineiro existe discriminação.
Outra razão para explicar as disparidades em remuneração do trabalho são as que resultam de segmentação na remuneração de trabalhadores com a mesma produtividade. Como a divisão de setores apresentada no presente artigo abarca agrícolas e não-agrícolas, utilizamos uma dummy para identificar se no rural existe segmentação. A partir do coeficiente estimado de uma variável explanatória binária podemos obter a diferença percentual entre o rendimento esperado na categoria tomada como base e o rendimento da categoria para a qual aquela variável binária assume valor 1. Adicionalmente, foram utilizadas dummies para captar a segmentação regional devido a heterogeneidade brasileira, onde a variável controle será o Nordeste.
Por fim, para a mensuração de uma das mais importantes variáveis responsáveis pela desigualdade de rendimento no rural, a posição na ocupação, utiliza-se duas dummies para identificar se as pessoas eram empregadores ou conta-própria.
De acordo com Corrêa (1998), as variáveis incluídas devem captar o efeito do treinamento e da experiência das pessoas (idade e escolaridade), as discriminações (cor, sexo e setor de atividade) e as diferenças de posse de propriedade e riqueza (posição na ocupação). É importante ressalvar que esses efeitos são captados não de forma perfeita, uma vez que não se dispõe de uma medida da qualidade do ensino e que a posição na ocupação é uma proxy não adequada para a posse de capital.
Segue abaixo, o modelo de equação estimado: Equação de participação: 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 2 i i i i i i i i i i i i i i i
cond_ativid idaded idade anosest efeitolimiar num_comp_fam
rend_fam brancaD amar_pardD sudesteD centro - oesteD
norteD sulD urbanoD masculinoD
β β β β β β β β β β β β β β β = + + + + + + + + + + + + + + (2.5) Em que as variáveis: i
cond_ativid = Variável dummy concernente à condição de atividade do indivíduo i, ou seja, economicamente ativo (1) ou não economicamente ativo (0);
1idadedi
β = Idade do indivíduo i em dezenas de anos (seguindo metodologia proposta em Hoffmann e Simão, 2005);
2idade2i
β = Idade ao quadrado em dezenas de anos;
3anosesti
β = Anos de estudo do indivíduo i;
4efeitolimiari
β = Efeito Limiar dos anos de estudo do indivíduo i15;
5num_comp_fami
β = Número de componentes na família do indivíduo i;
6rend_fami
β = Rendimento familiar mensal do indivíduo i;
i
cor
D = Conjunto de variáveis dummy para descrever cor ou raça dos indivíduos, divididas em Preta e Indígena, Parda e Amarela. A cor preta foi utilizada como controle. O agrupamento da cor ou raça foi realizado devido à baixa representatividade dos amarelos e indígenas na amostra
13urbanoDi
β = Variável dummy para setor censitário, sendo a variável de controle o rural;
14masculinoDi
β = Variável dummy para gênero, em que a categoria de controle é o sexo feminino;
i
região
D = Conjunto de variáveis dummy para descrever as regiões geográficas do Brasil, divididas em Centro-Oeste, Sudeste, Norte e Sul, sendo a região Nordeste o controle;
i = termo de erro aleatório.
15
Equação de rendimento: 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 ln i i 2i i i i i i i i i i i i i i
rendimento idaded idade anosest eledu emprD
cpD brancaD amar_pardD nagricolaD sudesteD centro - oesteD
norteD sulD urbanoD masculinoD
β β β β β β β β β β β β β β β β = + + + + + + + + + + + + + + + (2.6) Em que:
ln_ renda = logaritmo natural dos rendimentos de todos os trabalhos do indivíduo i sobre o total de horas trabalhadas do indivíduo i;
i
λ = a razão inversa de Mills;
i
cond_ativid = Variável dummy concernente à condição de atividade do indivíduo i, ou seja, economicamente ativo (1) ou não economicamente ativo (0);
1idadedi
β = Idade do indivíduo i em dezenas de anos;
2idade2i
β = Idade ao quadrado em dezenas de anos;
3anosesti
β = Anos de estudo do indivíduo i;
4efeitolimiari
β = Efeito Limiar dos anos de estudo do indivíduo i16;
5emprDi
β e β6cpDi= Conjunto de variáveis dummy para identificar a posição na
ocupação, quais sejam: empregado, empregador e conta-própria. Empregado foi utilizada como variável de controle;
i
cor
D = Conjunto de variáveis dummy para descrever cor ou raça dos indivíduos, divididas em Preta e Indígena, Parda e Amarela. A cor preta foi utilizada como controle. O agrupamento da cor ou raça foi realizado devido à baixa representatividade dos amarelos e indígenas na amostra;
9nagricolaDi
β = Variável dummy para indicar o ramo de atividade, agrícola ou não- agrícola. Agrícola é a variável de controle.
13urbanoDi
β = Variável dummy para setor censitário, sendo a variável de controle o rural;
14masculinoDi
β = Variável dummy para gênero, em que a categoria de controle é o sexo feminino;
i
região
D = Conjunto de variáveis dummy para descrever as regiões geográficas do Brasil, divididas em Centro-Oeste, Sudeste, Norte e Sul, sendo a região Nordeste o controle;
i
v = termo de erro aleatório.
Tabela 2.1. Descrição das variáveis utilizadas e seus efeitos esperados sobre as equações, de participação e de rendimentos.
Variável Descrição das variáveis Sinal esperado
Participação Rendimentos
Idade Idade do indivíduo + +
idade2 Idade ao quadrado - -
Anosest Nº de anos de estudos + +
Eledu Efeito Limiar da Educação + +
Empr =1 se a posição na ocupação do indivíduo é empregador
n.a. +
Cp =1 se a posição na ocupação do
indivíduo é conta-propria
n.a +
Branca =1 se o indivíduo é branco + +
amar_pard =1 se o indivíduo é pardo ou amarelo + - nagricola =1 se o ramo de atividade é não-agrícola n.a. - Norte =1 se o indivíduo mora na região Norte + - nordeste =1 se o indivíduo mora na região
Nordeste
+ -
centro-oeste =1 se o indivíduo mora na região Centro- oeste
+ + ou -
Sul =1 se o indivíduo mora na região Sul + + ou - Urbano =1 se o indivíduo mora em cidades ou
vilas
+ +
masculino =1 se o sexo é masculino + +
num_comp_fam N° componentes na família - n.a.
Fonte: Elaborada pela autora.
Sinais positivos das variáveis na tabela 2.1 na coluna de rendimento indicam que o indivíduo que possui a característica em pauta, tem impactos positivos em seu rendimento. Sendo o contrário para sinais negativos. Já os sinais positivos nas equações de participação, indicam que o indivíduo que possui tal característica tem maior probabilidade de estar (participar) no mercado de trabalho.