A técnica de regressões quantílicas foi introduzida através dos trabalhos desenvolvidos pioneiramente por Koenker e Basset (1978), técnica tratada como semiparamétrica, tendo sido utilizada como instrumental para uma série de constatações em trabalhos empíricos envolvendo desigualdades de rendimentos.
As regressões quantílicas possibilitam observar as mudanças na distribuição dos dados e em seu formato. Assim, em diferentes partes da distribuição condicional podem ser observados comportamentos diferenciados. Esse tipo de regressão é caracterizado como uma técnica estatística baseada na estimação de vários quantis da distribuição condicional associada ao modelo, conforme estabelecido por Koenker e Hallock (2001).
A utilização de regressões quantílicas é preterida por alguns fatores, isso porque, quando a distribuição de resíduos não é normal, usualmente há estimadores não- lineares e/ou viesados que são mais eficientes do que os de Mínimos Quadrados Ordinários (MQO). Neste caso, os regressores quantílicos são sugeridos como melhores métodos de estimação; em particular, a regressão mediana, por ser mais resistente aoutliers. Também, o estimador de mínimo desvio absoluto (LAD), utilizado para ajustar as medianas à função linear das covariáveis é bastante usual, dada ser esta uma medida de localização melhor que a própria média.
De acordo com Buchinski (1998), o modelo de regressão quantílica estende a noção dos quantis ordinários em um modelo de alocação para uma classe mais geral de modelos lineares, na qual os quantis condicionais têm uma forma linear.
As regressões quantílicas possuem uma série de vantagens dentre as quais se destacam:
i) modelos de regressões do tipo quantílicas podem ser usados para caracterizar a distribuição condicional inteira de uma variável dependente, dado um conjunto de variáveis explicativas;
ii) o modelo de regressão quantílica tem uma representação de programação linear que facilita a estimação dos parâmetros;
iii) a função da regressão quantílica é uma soma ponderada dos desvios absolutos, o que dá uma medida robusta de alocação, tal que o vetor de coeficientes estimados não é sensível a observações outliers da variável dependente;
iv) se o termo do erro aleatório possuir uma distribuição que esteja fora da normalidade padrão, os estimadores das regressões quantílicas podem ser mais eficientes do que aqueles observados nos modelos de Mínimos Quadrados Ordinários convencionais;
v) soluções diferentes, em distintos percentis, podem ser interpretadas como diferenças na resposta da variável dependente a mudanças nos regressores, em vários pontos na distribuição condicional da variável dependente.
O modelo de regressão quantílica diferencia-se dos métodos usuais de estimações regressivas que, em geral, estimam o valor médio da distribuição condicional da variável dependente. A regressão do tipo quantílica permite a estimação em partes diferenciadas da distribuição, ou seja, em uma família de quantis. Assim, possibilitam uma análise mais precisa da relação entre a variável dependente e suas variáveis explicativas.
Percebe-se, portanto, que a estimação por regressão quantílica é vantajosa por permitir a identificação de variações inter e intra quantis, não possível quando se utiliza o método de regressão por Mínimos Quadrados Ordinários (MQO), o qual é baseado na média da distribuição condicional.
O modelo de regressões quantílicas é baseado na demonstração de quantis no caso padrão homoscedástico em que a reta de regressão (+x) é a esperança de Y condicional em x, e as curvas ilustram esquematicamente as densidades condicionais dos erros dado x.
Neste tipo de regressão, para cada valor de x, marcam-se os percentis da distribuição condicional e conectam-se os mesmos percentis para diferentes valores de x; assim, se a distribuição de erros é simétrica, a média condicional ou função de regressão estaria no 50º.percentil, ou seja, na mediana. Ligando as medianas, reproduz-se a regressão. Portanto, quando a distribuição dos erros é homoscedástica, os percentis estarão sempre à mesma distância da mediana, não importando o valor de x.
Quando a regressão apresenta-se de forma homoscedástica, as retas que conectam os pontos correspondentes aos percentis das distribuições condicionais são paralelas e equidistantes da reta de regressão. Por outro lado, quando as regressões são heteroscedásticas, ou os erros são assimétricos, as observações contidas em cada percentil podem levar a diferentes resultados.
Ao analisar os percentis em diferentes valores de x, não necessariamente obtém-se uma reta; entretanto, é possível ajustar retas aos percentis através da regressão quantílica.
Se há heteroscedasticidade no modelo regredido em relação ao valor de x, a distribuição dos resíduos pode tornar-se mais ou menos dispersa na medida em que x aumenta, neste caso, as regressões quantílicas para percentis que não a mediana não serão paralelas à reta de regressão, mas vão divergir ou convergir para maiores valores de x.
Modelos de regressões quantílicas são úteis não somente para lidar com a heteroscedasticidade, ao calcular regressões para diferentes percentis, como também possibilitam explorações sobre a forma da distribuição condicional.
Deve-se deixar claro que as regressões do tipo quantílicas não informam sobre os processos causais que geram as diferenças, mas apresentam resultados de maneira
interessante que podem sugerir uma investigação mais profunda sobre os dados avaliados.
Como são calculadas as regressões quantílicas:
Ao contrário do modelo de Mínimos Quadrados Ordinários (MQO), em que a soma dos quadrados dos erros são minimizadas, a regressão mediana de uma quantílica pode ser definida pela minimização da soma absoluta dos erros – estimador LAD “Least Absolute Deviations”, assim, os coeficientes da regressão mediana podem ser obtidos minimizando , conforme demonstração formal:
Em que:
sgn: é o sinal de a= 1 se a é positivo e -1 se a é negativo ou igual a 0.
Esta equação satisfaz a condição de 1ª. ordem através da minimização de seus parâmetros, ou seja, para j=1,...,k. Apresenta-se de forma semelhante à condição de 1ª. ordem de mínimos quadrados ordinários, exceto pela função sgn; dado que, na regressão mediana, somente o sinal de cada resíduo é importante, enquanto,na de mínimos quadrados, sua magnitude é mais relevante.
Se há somente uma constante na regressão, esta equação diz que a constante deve ser escolhida tal que haja um número igual de pontos em cada um de seus lados, o que define a mediana.
n 1 i n 1 i ' i i ' i i ' i i x (y x ) sgn( y x ) y
n 1 i ' i i ij sgn( y x ) 0 xQuando tratado o modelo de regressão quantílica fora da mediana, este pode ser definido pela seguinte fórmula de minimização:
Onde 0<q<1 é o quantil de interesse, e o valor da função l(z) sinaliza a verdade (1) ou caso contrário (0) da proposição z; a condição de minimização é:
Neste caso, a regressão é igual à mediana quando q=0.5; se a regressão contém somente um termo constante, a constante é fixada tal que 100q% dos pontos da amostra estão abaixo e 100(1-q)% estão acima dela.
A adoção de regressões do tipo quantílica permite, por exemplo, observarmos os efeitos da distribuição regional das IMFs sobre o crédito concedido pelo setor microfinanceiro em diversas partes da distribuição de crédito, já que esta variável não é constante ao longo da distribuição condicional de créditos.