• No results found

Inicialmente, estimamos regressões simples para destacar a importância de determinadas variáveis sobre o desempenho escolar. Neste sentido, a Tabela 3 apresenta os resultados de estimação de três modelos, do mais simples ao mais completo, estimados a partir do MMQ, onde o desempenho escolar do aluno é medido através das notas dos exames nacionais de Matemática e Português (variável dependente).

Tabela 3: Resultados da estimação por MMQ utilizando as notas de exame de Matemática e de Português como variável dependente

MMQ 1 MMQ 2 MMQ 3 MMQ 3 robusto Matemática 1,555*** 1,555*** 1,299*** 1,299*** (0,087) (0,087) (0,077) (0,078) Mulher 1,225*** 1,231*** 1,097*** 1,097*** (0,084) (0,084) (0,078) (0,069) MulherXMatemática -1,231*** -1,231*** -0,996*** -0,996*** (0,118) (0,118) (0,105) (0,105) Ensino básico -0,343*** -0,299*** -0,202*** -0,202*** (0,080) (0,082) (0,074) (0,073) Ensino superior 1,387*** 1,370*** 0,995*** 0,995*** (0,085) (0,085) (0,076) (0,073) Pai 0,197*** 0,159** 0,078 0,078 (0,073) (0,074) (0,066) (0,065) Outro 0,165 0,201 -0,038 -0,038 (0,155) (0,155) (0,138) (0,141) Não trabalha 0,070 0,091 0,091 (0,081) (0,072) (0,073) Beneficiário SASE -0,322*** -0,209*** -0,209*** (0,081) (0,072) (0,074) Computador -0,431*** -0,210*** -0,210*** (0,075) (0,067) (0,067) % Mulheres na turma -0,006*** -0,006*** (0,002) (0,002)

34 % Bons alunos (p90) na turma 0,070 *** 0,070*** (0,001) (0,001) Até 19 alunos 0,283*** 0,283*** (0,097) (0,096) Entre 20 a 25 alunos 0,338*** 0,338*** (0,058) (0,058) Superior a 31 alunos -0,505*** -0,505*** (0,104) (0,110) 𝑅2 ajustado 0,09 0,09 0,28 0,28 Raiz do Erro Quadrático Médio 3,26 3,25 2,90 2,90

Nota: Entre parêntesis encontram-se reportados os erros-padrão nos modelos estimados pelo MMQ e os erros-padrão robustos no último modelo (MMQ 3 robusto). Níveis de significância: 1% (***), 5% (**) e 10% (*). Todos os modelos incluem a constante e possuem 12224 observações. As variáveis “Ensino básico” e “Ensino superior” referem-se ao nível de escolarização dos pais/encarregado de educação, sendo o ensino secundário a categoria base. As variáveis “Pai” e “Outro” correspondem ao encarregado de educação ser o pai ou outro familiar, respetivamente, considerando a categoria base a mãe como encarregado de educação. A variável “Não trabalha” considera que pelo menos um dos indivíduos do agregado familiar não trabalha, sendo a categoria base trabalhar. As variáveis “Até 19 alunos”, “Entre 20 a 25 alunos” e “Superior a 31 alunos”, referem-se ao tamanho da turma, considerando a categoria base a dimensão entre 26 a 30 alunos. Consideramos a informação desconhecida relativa ao nível de escolarização e para a situação no mercado de trabalho dos pais/encarregado de educação.

Fonte: Construção própria baseada nos dados recolhidos na MISI.

No primeiro modelo MMQ 1, apenas consideramos a identificação da disciplina de exame (ser ou não Matemática), as caraterísticas demográficas do estudante (ser ou não mulher), o nível de escolarização dos pais/encarregado de educação e a identificação do encarregado de educação como variáveis explicativas. No modelo MMQ 2, acrescentamos os aspetos representativos do seu contexto socioeconómico (pelo menos um dos pais/encarregado de educação trabalha ou não trabalha, ter ou não ter computador em casa e ser ou não ser beneficiário do apoio social escolar). No modelo MMQ 3, adicionamos as caraterísticas da escola, nas quais compreendem as variáveis referentes à dimensão e composição da turma(fração de mulheres na turma, fração de bons alunos na turma, tamanho da turma). 10

De notar que ao longo da análise foram realizados testes de significância individual, de forma a aferir a relevância dos diferentes determinantes nos modelos. Neste sentido, pela aplicação da estatística de teste t-student, vamos rejeitar a hipótese nula (supõe que o coeficiente da variável é igual a 0) se |𝑡observado |>|𝑡crítico |. Ao invés de considerarmos o valor do 𝑡crítico, também podemos obter conclusões baseadas no p-valor.

35

Considerando o modelo mais completo, constatamos para o exame de Português as mulheres têm em média mais 1,1 valores (𝛽𝑚𝑢𝑙ℎ𝑒𝑟) face aos homens. Esta diferença é estatisticamente significativa. 11 No caso do exame de Matemática esta diferença é de apenas 0,1 valores

( 𝛽𝑚𝑢𝑙ℎ𝑒𝑟 + 𝛽𝑚𝑢𝑙ℎ𝑒𝑟𝑋𝑚𝑎𝑡𝑒𝑚á𝑡𝑖𝑐𝑎) , não sendo estatisticamente significativa. 12 Ou seja, a

vantagem desvanece entre o exame de Português e o exame de Matemática. Observamos, então, uma quebra de cerca de 1 valor (𝛽𝑚𝑢𝑙ℎ𝑒𝑟𝑋𝑚𝑎𝑡𝑒𝑚á𝑡𝑖𝑐𝑎) da vantagem das raparigas face aos rapazes entre o exame de Português e o exame de Matemática (diferença das diferenças). Esta variação de vantagem é estatisticamente significativa (i.e., como o p-valor é aproximadamente 0, rejeitamos a HO:𝛽𝑚𝑢𝑙ℎ𝑒𝑟𝑋𝑚𝑎𝑡𝑒𝑚á𝑡𝑖𝑐𝑎 = 0). Por outro lado, para os rapazes observamos que em média os exames de Matemática têm uma pontuação superior de 1,3 valores (𝛽𝑚𝑎𝑡𝑒𝑚á𝑡𝑖𝑐𝑎) face

a Português, e é estatisticamente significativo. Esta diferença de nota entre o Português confirma- se também para as raparigas. Contudo neste caso, a diferença é de apenas 0,303 valores(𝛽𝑚𝑎𝑡𝑒𝑚á𝑡𝑖𝑐𝑎+ 𝛽𝑚𝑢𝑙ℎ𝑒𝑟𝑋𝑚𝑎𝑡𝑒𝑚á𝑡𝑖𝑐𝑎), sendo estatisticamente significativo. Por outras

palavras, em média temos melhores notas em Matemática do que em Português para rapazes e raparigas. Além disso, em média as raparigas têm melhores notas nos exames do que os rapazes, embora não sendo estatisticamente significativo no caso da Matemática.

Em todos os modelos, o aumento do nível de escolaridade dos pais/encarregado de educação exerce um efeito positivo e estatisticamente significativo sobre o desempenho do aluno, no entanto, a sua magnitude diminui à medida que se adiciona novas variáveis explicativas no modelo. No modelo mais completo, a diferença média, entre os alunos cujo agregado familiar possui o ensino secundário e os alunos cujo agregado familiar possui o ensino básico é de aproximadamente 0,2

11A estatística do teste de significância individual segue uma estatística de teste t com (n-k) graus de liberdade, onde n representa o número de

observações e k representa o número de coeficientes do modelo. Assim: H0:𝛽𝑚𝑢𝑙ℎ𝑒𝑟 = 0

H1: 𝛽𝑚𝑢𝑙ℎ𝑒𝑟≠ 0

tobservado=

𝛽𝑚𝑢𝑙ℎ𝑒𝑟̂ − 𝛽𝑚𝑢𝑙ℎ𝑒𝑟 𝑠𝑒̂ (𝛽𝑚𝑢𝑙ℎ𝑒𝑟̂ ) ~𝑡(n−k),

onde 𝑠𝑒̂ corresponde ao erro-padrão estimado. Como o p-valor é aproximadamente 0, rejeitamos a hipótese nula. Logo, concluímos que a variável explicativa “mulher” é individualmente estatisticamente significativa, uma vez produz efeito no desempenho escolar do aluno se controlarmos para os restantes regressores.

12A estatística do teste de significância de igualdade de parâmetros segue uma estatística de teste t com (n-k) graus de liberdade, onde n representa

o número de observações e k representa o número de coeficientes do modelo. Assim: H0:𝛽𝑚𝑢𝑙ℎ𝑒𝑟− 𝛽𝑚𝑢𝑙ℎ𝑒𝑟𝑋𝑚𝑎𝑡𝑒𝑚á𝑡𝑖𝑐𝑎= 0

H1: 𝛽𝑚𝑢𝑙ℎ𝑒𝑟− 𝛽𝑚𝑢𝑙ℎ𝑒𝑟𝑋𝑚𝑎𝑡𝑒𝑚á𝑡𝑖𝑐𝑎≠ 0

tobservado=

(𝛽mulher̂ − 𝛽𝑚𝑢𝑙ℎ𝑒𝑟𝑋𝑚𝑎𝑡𝑒𝑚á𝑡𝑖𝑐𝑎̂ )−(𝛽𝑚𝑢𝑙ℎ𝑒𝑟−𝛽𝑚𝑢𝑙ℎ𝑒𝑟𝑋𝑚𝑎𝑡𝑒𝑚á𝑡𝑖𝑐𝑎) 𝑠𝑒̂ (𝛽mulher̂ − 𝛽𝑚𝑢𝑙ℎ𝑒𝑟𝑋𝑚𝑎𝑡𝑒𝑚á𝑡𝑖𝑐𝑎̂ ) ~𝑡(n−k),

onde 𝑠𝑒̂ corresponde ao erro-padrão estimado. Como o p-valor é aproximadamente 0,24, não rejeitamos a hipótese nula. Logo, concluímos que o efeito não é estatisticamente diferente.

36

valores, a favorecendo os alunos cujo agregado familiar possui o ensino secundário. Além disso, a diferença média entre os alunos cujo agregado familiar possui o ensino secundário e os alunos cujo agregado familiar possui o ensino superior é de aproximadamente 1 valor, a favor do agregado familiar mais escolarizado. De forma a constatar os resultados obtidos, realizamos um teste de significância de igualdade de parâmetros para o agregado com o ensino superior e para o agregado com o ensino secundário e outro teste de significância de igualdade de parâmetros para o agregado com o ensino básico e para o agregado com o ensino secundário. Ambos os testes revelaram que o efeito entre os níveis de ensino é estatisticamente diferente (i.e., como o p-valor é aproximadamente 0 para ambos, rejeitamos a Ho:𝛽ensino básico − 𝛽ensino secundário= 0 e a Ho:𝛽ensino superior − 𝛽ensino secundário = 0).

Quanto à diferença média entre o encarregado de educação ser o pai ou a mãe, esta apenas é individualmente estatisticamente significativa no 1º e no 2º modelo, perdendo a sua significância estatística com a inclusão das variáveis explicativas sobre a escola. Contudo, no modelo MMQ 2, podemos averiguar que a diferença média entre o encarregado de educação ser a mãe e ser o pai é de cerca de 0,2 valores. Isto significa que o aluno consegue obter melhores notas nos exames nacionais quando o seu encarregado de educação é o pai. De forma similar, a diferença média entre o encarregado de educação ser a mãe e ser o outro familiar13 é de cerca de 0,2 valores (no

modelo MMQ 2), porém quando incluímos as caraterísticas da composição e dimensão da turma no modelo, observamos o efeito oposto (-0,04 valores). Ou seja, apenas é benéfico para o aluno o seu encarregado de educação ser outro familiar, quando os resultados não são condicionais às variáveis explicativas da escola. Contudo, esta variável não tem efeito estatisticamente significativo nas notas de exame em todos os modelos estimados.

Em todos os modelos, verificamos um efeito consistentemente positivo quando pelo menos um dos indivíduos do agregado familiar do aluno não trabalha, comparativamente a pelo menos um dos indivíduos do agregado familiar do aluno trabalhar, no entanto, este não tem efeito estatisticamente significativo nas notas de exame.

No modelo mais completo, a diferença média das classificações obtidas nos exames nacionais entre os alunos que são beneficiários do Sistema de Ação Social Escolar e os que não são beneficiários é de cerca de 0,21 valores, a favor dos alunos não beneficiários. Ou seja, os alunos

13De notar que quando o encarregado de educação é outro significa que este pode ser o(a) tio(a), o(a) irmão(ã), o tutor, um dos avós ou outro

37

com elegibilidade para Apoio Social Escolar apresentam um desempenho escolar inferior, face aos restantes alunos. Em todos os modelos, o coeficiente associado aos alunos beneficiários do SASE, possui um efeito individualmente estatisticamente significativo.

No que diz respeito à disponibilidade de computador em casa, a diferença média entre os alunos que possuem computador em casa e os que não possuem é de cerca de 0,2 valores (modelo mais completo), a favor dos alunos que não possuem computador em casa. De forma similar, esta é individualmente estatisticamente significativa em todos os modelos estimados.

Com o intuito de apurar se as caraterísticas socioeconómicas do aluno são importantes na explicação do seu desempenho escolar, realizamos um teste de significância conjunta sobre estas variáveis.14

No que concerne às caraterísticas da composição da turma, um aumento de 10 p.p. (ponto percentual) na fração de mulheres na turma, em média, reduz a nota dos exames em 0,6 décimas, condicional aos restantes regressores incluídos no modelo; i.e., existe uma externalidade negativa associada ao aumento de mulheres na turma no desempenho externo. Por outro lado, o aumento de 10 p.p. na fração de bons alunos na turma, em média, aumenta a nota dos exames em 7 décimas, mantendo tudo o resto constante. Relativamente à variável explicativa sobre a dimensão da turma, constatamos que as turmas que possuem menos alunos são benéficas para o desempenho escolar do aluno. Assim quando o tamanho da turma é superior a 31 alunos, observamos um efeito negativo na nota dos exames de cerca de 0,5 valores, face a turmas com uma dimensão entre 26 a 30 alunos.

Também se realizou um teste de significância conjunta sobre as caraterísticas da escola. Como o p-valor é aproximadamente 0, rejeitamos a hipótese nula. Neste sentido, conseguirmos apurar que com a introdução destas novas variáveis ocorre uma melhoria na qualidade do ajustamento do modelo de forma significativa.

14A estatística do teste de significância conjunta segue uma estatística de teste F com (m) e (n-k) graus de liberdade, onde m representa o número

de restrições lineares, n representa o número de observações e k representa o número de coeficientes do modelo não restrito. Assim: H0:𝛽não trabalha= 𝛽sit.desconhecida/outra= 𝛽beneficiário SASE= 𝛽computador= 0

H1: Pelo menos um 𝛽𝑗≠ 0, j= não trabalha, sit.desconhecida/outra, beneficiário SASE, computador

𝐹 = 𝑅𝑁𝑅2 −𝑅𝑅2 𝑚 (1−𝑅𝑁𝑅2 ) (𝑛−𝑘) ~𝐹(m; n−k),

onde 𝑅𝑁𝑅2 diz respeito ao coeficiente de determinação do modelo não restrito (i.e., do modelo MMQ 1), e 𝑅𝑅2 diz respeito ao coeficiente de

determinação do modelo não restrito (i.e., o modelo MMQ2). Como o p-valor é aproximadamente 0, rejeitamos a hipótese nula. Neste sentido, a inclusão de novas variáveis melhora a qualidade do ajustamento.

38

De forma a conseguirmos averiguar a adequabilidade dos modelos, realizamos um teste de significância global.15 A estatística de teste F apresenta um resultado de 145 (MMQ 1); 104 (MMQ

2); 280 (MMQ 3); 385 (MMQ 3 robusto) e em todos os modelos estimados o p-valor é de aproximadamente 0. Neste sentido, como a hipótese nula é rejeitada, concluímos que todos os modelos são globalmente significativos para a explicação da variável dependente.

O coeficiente de determinação 𝑅2 ajustado é uma medida de ajustamento que permite averiguar

o quanto o modelo consegue explicar os valores observados. Assim, observando a Tabela 3 verificamos que o modelo MMQ 3, explica 28% das variações da variável dependente em questão, sendo o modelo com melhor qualidade de ajustamento. Além disso, a Raiz do Erro Quadrático Médio é menor para o modelo MMQ 3 (cerca de 2,9 valores).

Tal como debatido anteriormente, é necessário averiguar se estamos perante um problema de heteroscedasticidade, uma vez que esta afeta negativamente a estimação e inferência estatística. Assim sendo, utilizamos o Teste de White para o modelo MMQ 3. Sob a hipótese nula que assume que a variância dos termos de erro é constante, verificamos que o p-valor é aproximadamente 0 e por esse motivo a hipótese nula de homoscedasticidade é rejeitada. Neste sentido, procedemos à correção deste problema utilizando o comando “robust” incluído no programa estatístico STATA, no qual estima o modelo MMQ 3 considerando os erros-padrão robustos, e assim, obtemos o modelo MMQ 3 robusto.

Como os modelos da Tabela 3 são estimados a partir do MMQ, os resultados obtidos do desempenho dos alunos podem estar enviesados, devido a problemas de endogeneidade. Isto acontece, porque o MMQ ignora as diferentes especificidades dos alunos, e consequentemente, as suas estimativas não captam o verdadeiro efeito causal. Neste sentido, de forma a conseguirmos controlar as características não observáveis ao nível do aluno, utilizamos o Modelo de Efeitos Fixos (EF) e o Modelo de Efeitos Aleatórios (EA).

15A estatística do teste de significância global segue uma estatística de teste F com (k-1) e (n-k) graus de liberdade, onde n representa o número

de observações e k representa o número de coeficientes do modelo. Assim: H0:𝛽1= 𝛽2= ⋯ = 𝛽𝑘= 0 (não se inclui a constante)

H1: Pelo menos um 𝛽𝑗≠ 0, j= 2, …, k 𝐹 = 𝑅2 (𝑘−1) (1−𝑅2) (𝑛−𝑘) ~𝐹(k−1; n−k),

Como o p-valor é aproximadamente 0, rejeitamos a hipótese nula. Logo, concluímos que todos os modelos são globalmente estatisticamente significativos para qualquer nível de significância assumido.

39

No entanto, tal como anteriormente mencionado, o problema da endogeneidade também pode advir da possibilidade da alocação dos alunos não ser aleatória, portanto será fundamental recorrer ao modelo High-Dimensional Fixed Effects (HDFE). O modelo HDFE inclui efeitos fixos do aluno e efeitos fixos da escola, e sendo assim, conseguimos controlar para a heterogeneidade não observado do aluno, bem como as especificidades da escola.

Também é importante testar a presença de heteroscedasticidade nos modelos em dados em painel, dado que esta invisibiliza toda a inferência estatística, tornando-se necessário recorrer à utilização de erros-padrão robustos. Através do teste Wald, observamos um p-valor de aproximadamente 0 para o EF, logo rejeitou-se a hipótese nula de homoscedasticidade. Se existe heteroscedasticidade no EF, também existe no EA e no HDFE, sendo necessário corrigir para heteroscedasticidade, usando a opção do Stata “robust”. Assim, na Tabela 4 são apresentados os resultados de estimação do MMQ 3 robusto (modelo MMQ 3 estimado com erros-padrão robustos), EA robusto (Modelo de Efeitos Aleatórios estimado com erros-padrão robustos), EF robusto (Modelo de Efeitos Fixos estimado com erros-padrão robustos) e HDFE robusto (modelo High- Dimensional Fixed Effects estimado com erros-padrão robustos).

Tabela 4: Modelos em dados em painel utilizando as notas de exame de Matemática e de Português como variável dependente

MMQ 3 robusto EA robusto EF robusto HDFE robusto Matemática 1,299*** 1,318*** 1,342*** 1,367*** (0,078) (0,066) (0,066) (0,064) Mulher 1,097*** 1,083*** (0,069) (0,079) MulherXMatemática -0,996*** -1,013*** -1,036*** -1,059*** (0,105) (0,088) (0,088) (0,086) Ensino básico -0,202*** -0,110 0,649*** 0,604*** (0,073) (0,094) (0,188) (0,194) Ensino superior 0,995*** 0,965*** 0,142 0,157 (0,073) (0,096) (0,231) (0,240) Pai 0,078 0,073 0,003 -0,087 (0,065) (0,082) (0,166) (0,168)

40 Outro -0,038 0,119 0,408* 0,405 (0,141) (0,168) (0,217) (0,298) Não trabalha 0,091 0,043 0,106 -0,042 (0,073) (0,091) (0,164) (0,156) Beneficiário SASE -0,209*** -0,185** 0,080 0,144 (0,074) (0,090) (0,139) (0,134) Computador -0,210*** -0,357*** -0,605*** -0,971*** (0,067) (0,075) (0,097) (0,104) % Mulheres na turma -0,006*** -0,005*** -0,003 -0,002 (0,002) (0,002) (0,002) (0,002) % Bons alunos (p90) na turma 0,070 *** 0,065*** 0,058*** 0,051*** (0,001) (0,001) (0,001) (0,001) Até 19 alunos 0,283*** 0,546*** 0,956*** 0,502*** (0,096) (0,113) (0,146) (0,168) Entre 20 a 25 alunos 0,338*** 0,469*** 0,655*** 0,442*** (0,058) (0,063) (0,074) (0,088) Superior a 31 alunos -0,505*** -0,709*** -0,947*** -0,813*** (0,110) (0,114) (0,122) (0,147) 𝑅2within 0,27 0,28 𝑅2 between 0,29 0,09 𝑅2 overall 0,28 0,19 Raiz do Erro Quadrático Médio 2,90 2,46 2,12 2,36

Nota: Entre parêntesis encontram-se reportados os erros-padrão robustos. Níveis de significância: 1% (***), 5% (**) e 10% (*). Todos os modelos incluem a constante e possuem 12224 observações. As variáveis “Ensino básico” e “Ensino superior” referem-se ao nível de escolarização dos pais/encarregado de educação, sendo o ensino secundário a categoria base. As variáveis “Pai” e “Outro” correspondem ao encarregado de educação ser o pai ou outro familiar, respetivamente, considerando a categoria base a mãe como encarregado de educação. A variável “Não trabalha” considera que pelo menos um dos indivíduos do agregado familiar não trabalha, sendo a categoria base trabalhar. As variáveis “Até 19 alunos”, “Entre 20 a 25 alunos” e “Superior a 31 alunos”, referem- se ao tamanho da turma, considerando a categoria base a dimensão entre 26 a 30 alunos. Consideramos a informação desconhecida relativa ao nível de escolarização e para a situação no mercado de trabalho dos pais/encarregado de educação. O EF robusto compreende efeitos fixos do aluno. O HDFE robusto compreende efeitos fixos do aluno e da escola. No EF robusto e no HDFE robusto não é apresentado o coeficiente associado à variável género, uma vez que não existe variação (i.e., o mesmo aluno não muda de género entre o 9º e o 12º ano).

Fonte: Construção própria baseada nos dados recolhidos na MISI.

Dado que só faz sentido aplicar o EF se existirem efeitos fixos ao nível do aluno e o HDFE se existirem efeitos fixos ao nível do aluno e da escola, aplicamos um teste de significância conjunta. Sob a hipótese nula da ausência de efeitos fixos (i.e., 𝛼1 = ⋯ = 𝛼𝑘 = 0) e sob a hipótese

41

valor aproximadamente de 0 no EF e no HDFE, permitiu-nos rejeitar a hipótese nula, neste sentido, foi possível verificar a presença de efeitos fixos (existe heterogeneidade não observada).

Através do teste de significância global, concluímos que todos os modelos apresentados na Tabela 4 são globalmente estatisticamente significativos, uma vez que o p-valor foi aproximadamente 0 em todos os modelos.

Não existe um padrão geralmente aceite para o cálculo do coeficiente de determinação nos modelos baseados em dados em painel. No entanto, na Tabela 4 são apresentados 3 coeficientes de determinação, nomeadamente 𝑅2 within, 𝑅2 between e 𝑅2 overall. O 𝑅2 within é uma

medida da variação explicada within (variabilidade dentro do próprio aluno), ignorando a variação capturada pelo 𝛼𝑖. Por outro lado, o 𝑅2 between corresponde à variação entre os alunos. Quando

comparamos os valores destes coeficientes é possível saber se o poder explicativo do modelo é maior dentro do próprio aluno ou entre os alunos. Ou seja, se a variabilidade da variável dependente de um determinado aluno (within) é mais relevante que a variação da variável dependente entre alunos (between). Neste sentido, como no EA verificamos que 𝑅2 within é

inferior ao 𝑅2 between (0,27<0,29), o efeito explicativo é mais relevante entre alunos do que

dentro do próprio aluno. Em contrapartida no EF, verificamos o oposto (𝑅2 within de 0,28 valores

é superior ao 𝑅2 between de 0,09 valores). O 𝑅2 overall corresponde ao 𝑅2 da regressão MMQ.

O 𝑅2 overall do EF é menor que o 𝑅2 overall do EA (0,19<0,28), uma vez que o 𝑅2 overall não

considera os efeitos fixos estimado.

De forma a conseguirmos comparar os estimadores EA e EF, realizamos o teste de Hausman. Sob a hipótese nula, os estimadores EA são consistentes, e sob a hipótese alternativa, os estimadores EA não são consistentes, porém os estimadores EF são consistentes. Como o p-valor é de aproximadamente 0, rejeitamos a hipótese nula, e consequentemente, concluímos que o EF é o modelo mais apropriado. De salientar, que se o teste de Hausman rejeita o EA também vai rejeitar o MMQ, dado que a hipótese fundamental é a mesma em ambos.

De salientar que, o HDFE é modelo conceptualmente mais adequado, pois conseguimos interpretar os coeficientes como se os alunos fossem alocados entre as escolas de forma aleatória, e simultaneamente controlamos para a heterogeneidade não observada ao nível do aluno. Todavia, as estimativas obtidas pelo modelo HDFE robusto não diferem muito das estimativas dos restantes modelos apresentados na Tabela 4.

42

Quando observamos a diferença média entre as notas de exame nacional de Matemática e de Português para os alunos do sexo masculino e a diferença média entre as notas de exame nacional de Matemática e de Português para os alunos do sexo feminino, observamos que apesar existir um aumento destas diferenças com a introdução dos dados em painel, os resultados não diferem de forma substancial entre os modelos estimados. No modelo HDFE robusto, para os rapazes observamos que em média os exames de Matemática têm uma pontuação superior de 1,4 valores face a Português, enquanto que para as raparigas esta diferença é de apenas 0,308 valores. Isto significa, que quando controlamos para a heterogeneidade não observada ao nível do aluno e da escola, em média a diferença de notas de exame aumenta ligeiramente (a favor da disciplina de Matemática), principalmente para os rapazes. De notar que estas estimativas são individualmente estatisticamente significativas em todos os modelos apresentados.

Em relação ao coeficiente associado à diferença média entre os alunos cujo agregado familiar possui o ensino secundário e os alunos cujo agregado familiar possui o ensino básico este é individualmente estatisticamente significativo sobre o desempenho do aluno em todos os modelos, com exceção do EA robusto. Contrariamente aos resultados do MMQ robusto e do EA robusto, quando consideramos os efeitos fixos ao nível do aluno e os efeitos fixos ao nível do aluno e da escola, verificamos um efeito positivo (cerca de 0,6 valores) sobre o desempenho do aluno quando o nível de escolaridade dos pais/encarregado de educação é equivalente ao ensino básico comparativamente ao agregado familiar possuir o ensino secundário. Além disso, nestes mesmos modelos, deixa de ser estatisticamente significativo a diferença média entre o aluno cujo agregado familiar possui o ensino superior e o aluno cujo agregado familiar possui o ensino secundário. Relativamente à diferença média entre o encarregado de educação ser o pai ou a mãe, constatamos que quando são incluídos os dois efeitos fixos (aluno e escola) o efeito torna-se negativo; i.e., o aluno consegue obter melhores notas nos exames nacionais quando o seu encarregado de educação é a mãe. Contudo, em todos os modelos, esta diferença não é individualmente estatisticamente significativa nas notas de exame. No que concerne à diferença média entre o encarregado de educação ser a mãe e ser o outro familiar, esta apenas é um fator estatisticamente relevante com a inclusão dos efeitos fixos ao nível do aluno (EF robusto). No EF robusto esta diferença média é cerca de 0,4 valores a favor dos alunos que têm outro indivíduo