A Tabela 5 contém os resultados de estimação de três modelos, do mais simples ao mais completo, estimados a partir do MMQ. De notar que todos os modelos estimados na Subsecção 6.1, são agora estimados nesta subsecção, contudo a variável dependente é a nota interna de Matemática e de Português (medida interna da capacidade do aluno).
Tabela 5: Resultados da estimação por MMQ utilizando a nota interna de Matemática e de Português como variável dependente
MMQ 1 MMQ 2 MMQ 3 MMQ 3 robusto Matemática 0,442*** 0,442*** 0,329*** 0,329*** (0,072) (0,072) (0,070) (0,071) Mulher 1,137*** 1,138*** 1,085*** 1,085*** (0,069) (0,069) (0,070) (0,066) MulherXMatemática -0,818*** -0,818*** -0,714*** -0,714*** (0,097) (0,097) (0,095) (0,095) Ensino básico -0,264*** -0,262*** -0,213*** -0,213*** (0,066) (0,068) (0,066) (0,066) Ensino superior 1,152*** 1,151*** 0,986*** 0,986*** (0,070) (0,070) (0,068) (0,067) Pai 0,068 0,059 0,025 0,025 (0,060) (0,061) (0,059) (0,059)
45 Outro -0,196 -0,191 -0,296** -0,296** (0,128) (0,128) (0,125) (0,124) Não trabalha 0,033 0,045 0,045 (0,067) (0,065) (0,066) Beneficiário SASE -0,065 -0,012 -0,012 (0,067) (0,065) (0,066) Computador -0,160** -0,068 -0,068 (0,062) (0,061) (0,060) % Mulheres na turma -0,003** -0,003** (0,001) (0,001) % Bons alunos (p90) na turma 0,031*** 0,031*** (0,001) (0,001) Até 19 alunos 0,032 0,032 (0,087) (0,086) Entre 20 a 25 alunos 0,084 0,084 (0,052) (0,052) Superior a 31 alunos -0,156* -0,156* (0,094) (0,093) 𝑅2 ajustado 0,07 0,07 0,12 0,12 Raiz do Erro Quadrático Médio 2,69 2,69 2,61 2,61
Nota: Entre parêntesis encontram-se reportados os erros-padrão nos modelos estimados pelo MMQ e os erros-padrão robustos no último modelo (MMQ 3 robusto). Níveis de significância: 1% (***), 5% (**) e 10% (*). Todos os modelos incluem a constante e possuem 12224 observações. As variáveis “Ensino básico” e “Ensino superior” referem-se ao nível de escolarização dos pais/encarregado de educação, sendo o ensino secundário a categoria base. As variáveis “Pai” e “Outro” correspondem ao encarregado de educação ser o pai ou outro familiar, respetivamente, considerando a categoria base a mãe como encarregado de educação. A variável “Não trabalha” considera que pelo menos um dos indivíduos do agregado familiar não trabalha, sendo a categoria base trabalhar. As variáveis “Até 19 alunos”, “Entre 20 a 25 alunos” e “Superior a 31 alunos”, referem-se ao tamanho da turma, considerando a categoria base a dimensão entre 26 a 30 alunos. Consideramos a informação desconhecida relativa ao nível de escolarização e para a situação no mercado de trabalho dos pais/encarregado de educação.
Fonte: Construção própria baseada nos dados recolhidos na MISI.
Considerando o modelo mais completo, constatamos para a nota interna de Português as mulheres têm em média mais 1,1 valores ( 𝛽𝑚𝑢𝑙ℎ𝑒𝑟) face aos rapazes. Esta diferença é estatisticamente significativa. No caso da nota interna de Matemática esta diferença é de apenas 0,4 valores ( 𝛽𝑚𝑢𝑙ℎ𝑒𝑟+ 𝛽𝑚𝑢𝑙ℎ𝑒𝑟𝑋𝑚𝑎𝑡𝑒𝑚á𝑡𝑖𝑐𝑎) , sendo estatisticamente significativa (i.e., ao contrário dos exames nacionais, como o p-valor é aproximadamente 0, rejeitamos a HO:𝛽𝑚𝑢𝑙ℎ𝑒𝑟− 𝛽𝑚𝑢𝑙ℎ𝑒𝑟𝑋𝑚𝑎𝑡𝑒𝑚á𝑡𝑖𝑐𝑎 = 0). Observamos, então, uma quebra de cerca de 0,7 valor (𝛽𝑚𝑢𝑙ℎ𝑒𝑟𝑋𝑚𝑎𝑡𝑒𝑚á𝑡𝑖𝑐𝑎) da vantagem das raparigas face aos rapazes entre a nota interna de
46
Português e a nota interna de Matemática (diferença das diferenças). Esta variação de vantagem é estatisticamente significativa (i.e., como o p-valor é aproximadamente 0, rejeitamos a HO:𝛽𝑚𝑢𝑙ℎ𝑒𝑟𝑋𝑚𝑎𝑡𝑒𝑚á𝑡𝑖𝑐𝑎 = 0).
Para os rapazes observamos que em média a nota interna de Matemática têm uma pontuação superior de 0,3 valores (𝛽𝑚𝑎𝑡𝑒𝑚á𝑡𝑖𝑐𝑎) face a Português, e é estatisticamente significativo. Por
outro lado, contrariamente aos resultados para os exames nacionais, as mulheres conseguem obter um melhor desempenho interno na disciplina de Português, face à disciplina de Matemática (cerca de 0,385 valores ( 𝛽𝑚𝑎𝑡𝑒𝑚á𝑡𝑖𝑐𝑎+ 𝛽𝑚𝑢𝑙ℎ𝑒𝑟𝑋𝑚𝑎𝑡𝑒𝑚á𝑡𝑖𝑐𝑎)), sendo estatisticamente significativo.
Tal como nos exames nacionais, o aumento do nível de escolaridade dos pais/encarregado de educação influencia de forma positiva e estatisticamente significativa o desempenho interno do aluno em todos os modelos. Todavia, a sua magnitude diminui à medida que se acrescenta novas variáveis explicativas no modelo. No modelo mais completo, a diferença média, entre os alunos cujo agregado familiar possui o ensino secundário e os alunos cujo agregado familiar possui o ensino básico é de aproximadamente 0,2 valores, favorecendo os alunos cujo agregado familiar possui o ensino secundário. Relativamente à diferença média entre os alunos cujo agregado familiar possui o ensino secundário e os alunos cujo agregado familiar possui o ensino superior, verificamos que é de aproximadamente 1 valor, a favor do agregado familiar mais escolarizado. Tal como nos exames nacionais, ambos os testes de significância de igualdade de parâmetros revelaram que o efeito entre os níveis de ensino é estatisticamente diferente.
Quando à diferença média entre o encarregado de educação ser o pai ou a mãe, esta não possui um efeito individualmente estatisticamente significativo na nota interna do aluno, em todos os modelos. No modelo mais completo, verificamos que a diferença média entre o encarregado de educação ser a mãe e ser o pai é de cerca de 0,03 valores. Ou seja, é benéfico para o aluno o seu encarregado de educação ser o pai, comparativamente à mãe. Quando o encarregado de educação é outro familiar, este apenas é individualmente estatisticamente significativo no modelo mais completo. Assim sendo, no modelo MMQ 3, a diferença média entre o encarregado de educação ser a mãe e ser outro indivíduo do agregado familiar é de cerca de 0,3 valores, a favor do primeiro.
No que concerne à situação no mercado de trabalho, esta não tem efeito individualmente estatisticamente significativo na nota interna. Como observado nos exames nacionais, em todos
47
os modelos, verificamos um efeito consistentemente positivo quando pelo menos um dos indivíduos do agregado familiar do aluno não trabalha, comparativamente a pelo menos um dos indivíduos do agregado familiar do aluno trabalhar.
No modelo mais completo, a diferença média das classificações obtidas na componente interna entre os alunos que são beneficiários do Sistema de Ação Social Escolar e os que não são beneficiários é de cerca de 0,01 valores, a favor dos segundos. Isto significa que, os alunos com elegibilidade para Apoio Social Escolar apresentam um desempenho escolar inferior, face aos restantes alunos (conclusão semelhante aos exames nacionais). No entanto, esta diferença não possui um efeito estatisticamente significativo.
Relativamente ao coeficiente associado à disponibilidade de computador em casa, este é apenas individualmente estatisticamente significativo no modelo MMQ 2, perdendo a sua significância estatística com a inclusão das variáveis explicativas sobre a escola. Contudo, a diferença média entre os alunos que possuem computador em casa e os que não possuem é de cerca de 0,16 valores (no modelo MMQ 2), a favor dos alunos que não possuem computador em casa.
Aplicamos um teste de significância conjunta, com o propósito de averiguar se as caraterísticas socioeconómicas do aluno são relevantes na explicação do seu desempenho interno. Como o p- valor é aproximadamente 0,77, não rejeitamos a HO:𝛽não trabalha= 𝛽sit.desconhecida/outra=
𝛽beneficiário SASE= 𝛽computador = 0 . Portanto, a inclusão de novas variáveis não melhora a qualidade do ajustamento, no entanto, foram consideradas.
No que diz respeito às caraterísticas da composição da turma, um aumento de 10 p.p. (ponto percentual) na fração de mulheres na turma, em média, reduz a nota interna em 0,3 décimas, ceteris paribus. Por outro lado, o aumento de 10 p.p. na fração de bons alunos na turma, em média, aumenta a nota interna em 3,1 décimas, mantendo tudo o resto constante. No que concerne à variável explicativa sobre a dimensão da turma, verificamos que as turmas que possuem menos alunos são benéficas para o desempenho escolar do aluno. Deste modo, quando o tamanho da turma é superior a 31 alunos, observamos um efeito negativo na componente interna de cerca de 0,16 valores, face a turmas com uma dimensão entre 26 a 30 alunos. De notar que apesar destas conclusões serem semelhantes às observadas para os exames nacionais, a dimensão da turma apenas tem efeito estatisticamente significativo na nota interna quando o tamanho da turma é superior a 31 alunos.
48
A partir do teste de significância conjunta sobre as caraterísticas da escola constatamos que, com a introdução destas novas variáveis ocorre uma melhoria na qualidade do ajustamento (o p-valor é aproximadamente 0).
Realizamos um teste de significância global, com o propósito de apurar a adequabilidade dos modelos. A estatística de teste F apresenta um resultado de 114 (MMQ 1); 77 (MMQ 2); 101 (MMQ 3); 112 (MMQ 3 robusto) e em todos os modelos estimados o p-valor é de aproximadamente 0. Como se rejeitou a hipótese nula, concluímos que todos os modelos são globalmente significativos para qualquer nível de significância assumido.
Observando a Tabela 5 constatamos que o modelo MMQ 3, com um coeficiente de determinação ajustado de 12%, é o modelo com melhor qualidade de ajustamento, i.e., a inclusão de variáveis da escola melhora o poder explicativo do modelo. Além disso, este também possui o menor valor relativamente a Raiz do Erro Quadrático Médio (cerca de 2,6 valores). Assim sendo, o modelo MMQ 3 é o modelo que melhor consegue explicar os valores observados.
Com o intuito de averiguar se estamos perante um problema de heteroscedasticidade, aplicamos o Teste de White no modelo MMQ 3, no qual se verificou a rejeição da hipótese nula de homoscedasticidade (o p-valor obtido foi de aproximadamente 0). Assim sendo, procedeu-se a correção da presença de heteroscedasticidade através do STATA, no qual estima o modelo MMQ 3 considerando os erros-padrão robustos, tal como o modelo MMQ 3 robusto.
Tal como nos exames nacionais, recorremos aos dados em painel. De notar que todos os modelos possuem a mesma variável dependente e as mesmas variáveis explicativas, de forma a ser possível comparar os resultados obtidos.
Dado que se verificou a presença de heteroscedasticidade nos modelos em dados em painel (p- valor de aproximadamente 0), foi necessário corrigir este problema, nomeadamente através da utilização de erros padrão robustos. Neste sentido, na Tabela 6 são apresentados os resultados de estimação do MMQ 3 robusto (modelo MMQ 3 estimado com erros-padrão robustos), EA robusto (Modelo de Efeitos Aleatórios estimado com erros-padrão robustos), EF robusto (Modelo de Efeitos Fixos estimado com erros-padrão robustos) e HDFE robusto (modelo High-Dimensional Fixed Effects estimado com erros-padrão robustos).
49
Tabela 6: Modelos em dados em painel utilizando a nota interna de Matemática e de Português como variável dependente
MMQ 3 robusto EA robusto EF robusto HDFE robusto Matemática 0,329*** 0,369*** 0,392*** 0,391*** (0,071) (0,053) (0,053) (0,052) Mulher 1,085*** 1,102*** (0,066) (0,079) MulherXMatemática -0,714*** -0,750*** -0,771*** -0,770*** (0,095) (0,071) (0,071) (0,069) Ensino básico -0,213*** -0,208** -0,028 -0,004 (0,066) (0,089) (0,157) (0,164) Ensino superior 0,986*** 0,791*** -0,357* -0,182 (0,067) (0,096) (0,189) (0,199) Pai 0,025 -0,050 -0,282** -0,280** (0,059) (0,079) (0,131) (0,137) Outro -0,296** -0,192 -0,111 0,020 (0,124) (0,142) (0,181) (0,211) Não trabalha 0,045 -0,036 -0,060 -0,157 (0,066) (0,087) (0,136) (0,130) Beneficiário SASE -0,012 -0,003 0,143 0,049 (0,066) (0,079) (0,108) (0,106) Computador -0,068 -0,118* -0,168** -0,190** (0,060) (0,064) (0,075) (0,085) % Mulheres na turma -0,003** -0,003** -0,003* -0,002 (0,001) (0,001) (0,001) (0,002) % Bons alunos (p90) na turma 0,031*** 0,020*** 0,014*** 0,014*** (0,001) (0,001) (0,001) (0,001) Até 19 alunos 0,032 0,185** 0,337*** 0,202 (0,086) (0,094) (0,110) (0,127) Entre 20 a 25 alunos 0,084 0,152*** 0,217*** 0,209*** (0,052) (0,054) (0,060) (0,071)
50 Superior a 31 alunos -0,156* -0,285*** -0,381*** -0,244** (0,093) (0,095) (0,102) (0,115) 𝑅2within 0,04 0,05 𝑅2 between 0,18 9,46 𝑅2 overall 0,12 0,01 Raiz do Erro Quadrático Médio 2,61 1,95 1,67 1,88
Nota: Entre parêntesis encontram-se reportados os erros-padrão robustos. Níveis de significância: 1% (***), 5% (**) e 10% (*). Todos os modelos incluem a constante e possuem 12224 observações. As variáveis “Ensino básico” e “Ensino superior” referem-se ao nível de escolarização dos pais/encarregado de educação, sendo o ensino secundário a categoria base. As variáveis “Pai” e “Outro” correspondem ao encarregado de educação ser o pai ou outro familiar, respetivamente, considerando a categoria base a mãe como encarregado de educação. A variável “Não trabalha” considera que pelo menos um dos indivíduos do agregado familiar não trabalha, sendo a categoria base trabalhar. As variáveis “Até 19 alunos”, “Entre 20 a 25 alunos” e “Superior a 31 alunos”, referem- se ao tamanho da turma, considerando a categoria base a dimensão entre 26 a 30 alunos. Consideramos a informação desconhecida relativa ao nível de escolarização e para a situação no mercado de trabalho dos pais/encarregado de educação. O EF robusto compreende efeitos fixos do aluno. O HDFE robusto compreende efeitos fixos do aluno e da escola. No EF robusto e no HDFE robusto não é apresentado o coeficiente associado à variável género, uma vez que não existe variação (i.e., o mesmo aluno não muda de género entre o 9º e o 12º ano).
Fonte: Construção própria baseada nos dados recolhidos na MISI.
Tal como acontece nos exames nacionais, a hipótese de que todos os efeitos fixos são simultaneamente iguais a zero é rejeitada (o p-valor com valor aproximadamente de 0 no EF e no HDFE), verificando-se assim a presença de efeitos fixos.
Concluímos que todos os modelos apresentados na Tabela 6 são globalmente estatisticamente significativos, dado que, o p-valor foi aproximadamente 0 em todos os modelos.
Como anteriormente mencionado, apesar de não existir um padrão geralmente aceite para o cálculo do coeficiente de determinação em dados em painel, utilizamos 𝑅2 within, 𝑅2 between e
𝑅2 overall. Ao contrário do observado nos exames nacionais, tanto o EA (𝑅2 within de 0,04 valores é inferior ao 𝑅2 between de 0,18 valores) como o EF (𝑅2 within de 0,05 valores é inferior ao 𝑅2
between de 9,46 valores) explicam melhor a variação between, i.e., o efeito explicativo é mais relevante dentro do próprio aluno do que entre alunos.
Também se aplicou um teste de Hausman, no qual se observou que o EF é o modelo mais apropriado, comparativamente ao EA. Tal como mencionado anteriormente, como o HDFE controla para a heterogeneidade não observada ao nível do aluno, bem como as especificidades da escola, é o modelo conceptualmente mais adequado. Contudo, as estimativas dos restantes modelos apresentados na Tabela 6 não diferem muito das estimativas obtidas pelo modelo HDFE. Como observado para os exames nacionais, no modelo HDFE robusto, os alunos do sexo masculino conseguem obter um melhor desempenho interno na disciplina de Matemática, face à
51
disciplina de Português (cerca de 0,4 valores). No entanto, ao contrário do obtido nos exames nacionais, no caso das mulheres constatamos que em média a nota interna obtida para a disciplina de Português é superior em 0,379 valores, relativamente à nota obtida interna de Matemática. De notar que condicional aos efeitos fixos do aluno e da escola, apesar de verificarmos que a diferença média da nota interna aumenta ligeiramente (a favor da disciplina de Matemática) para os homens e diminui ligeiramente (a favor da disciplina de Português) para as mulheres, os resultados não diferem de forma substancial entre os modelos estimados. Além disso, estas estimativas são individualmente estatisticamente significativas, em todos os modelos apresentados.
O coeficiente associado à diferença média de nota interna entre os alunos cujo agregado familiar possui o ensino secundário e os alunos cujo agregado familiar possui o ensino básico, deixa de ser um fator estatisticamente relevante com a introdução dos efeitos fixos. Contrariamente às estimativas obtidas anteriormente para os exames nacionais, quando consideramos os efeitos fixos ao nível do aluno e da escola, verificamos um efeito negativo (cerca de 0,4 décimas) sobre a classificação interna do aluno, quando o nível de escolaridade dos pais/encarregado de educação é equivalente ao ensino básico comparativamente ao agregado familiar possuir o ensino secundário, mas não de forma individualmente estatisticamente significativa. Relativamente à diferença média de nota interna entre os alunos cujo agregado familiar possui o ensino secundário e os alunos cujo agregado familiar possui o ensino superior, constatamos que o seu efeito passa de positivo a negativo quando adicionamos os efeitos fixos no modelo; i.e., torna-se prejudicial para o desempenho interno se o aluno possuir pais/encarregado de educação com o ensino superior comparativamente ao aluno que possui um agregado com o ensino secundário, quando as estimativas são condicionais para a heterogeneidade não observada. Todavia, estas estimativas são apenas individualmente estatisticamente significativas no MMQ robusto, EA robusto e no FE robusto.
No que concerne à diferença média entre o encarregado de educação ser o pai ou a mãe, verificamos que o efeito torna-se negativo nos modelos em dados em painel, i.e., o aluno obtém uma melhor classificação na componente interna quando o seu encarregado de educação é a mãe (cerca de 0,3 valores no modelo HDFE robusto). Contudo, esta diferença apenas é individualmente estatisticamente significativa quando são incluídos os efeitos fixos. Quanto à diferença média entre o encarregado de educação ser a mãe e ser o outro familiar, esta apenas é um fator estatisticamente relevante no MMQ robusto. Além disso, quando adicionados simultaneamente os efeitos fixos ao nível do aluno e da escola, verificamos um efeito oposto; i.e., no modelo HDFE
52
robusto a diferença média é cerca de 2 décimas a favor dos alunos que têm outro indivíduo da família como encarregado de educação.
Nos modelos de dados em painel, existe um efeito consistentemente negativo quando pelo menos um dos indivíduos do agregado familiar do aluno não trabalha, comparativamente a pelo menos um dos indivíduos do agregado familiar do aluno trabalhar. Tal como nos exames nacionais, no modelo HDFE robusto, constatamos que é benéfico para o desempenho interno do aluno se pelo menos um dos indivíduos do seu agregado familiar trabalhar. No entanto, esta variável não é individualmente estatisticamente significativa na nota interna em nenhum dos modelos apresentados.
Tal como observado para os exames nacionais a diferença média das classificações obtidas na nota interna entre os alunos que são beneficiários do Sistema de Ação Social Escolar e os que não são beneficiários passa de um efeito negativo para positivo, quando são incluídos os efeitos fixos. Assim sendo, controlando as caraterísticas não observadas do estudante, bem como tudo o que é específico da escola, observamos que esta diferença média é cerca de 0,05 valores, a favor dos alunos beneficiários. Mais uma vez, os resultados do MMQ robusto e do EA robusto levam a considerar que os alunos que têm Apoio Social Escolar obtêm piores notas internas, face aos restantes. No entanto, com o EF robusto e o HDFE robusto verificamos que afinal ter apoio social é positivo. De salientar, esta variável não é individualmente estatisticamente significativa em nenhum dos modelos estimados.
Relativamente à disponibilidade de computador em casa, esta é individualmente estatisticamente significativa em todos os modelos estimados, com exceção do MMQ robusto. Condicional para a heterogeneidade não observada ao nível do aluno e da escola observamos que a diferença média entre os alunos que possuem computador em casa e os que não possuem é de cerca de 0,2 valores, a favor dos alunos que não possuem computador em casa.
No que diz respeito às caraterísticas da composição da turma, como observado nos exames nacionais, um aumento da fração de mulheres na turma em média, reduz o desempenho escolar dos alunos. Contudo, esta deixa de ser um fator estatisticamente significativo com a introdução dos dois efeitos fixos. No modelo HDFE robusto, um aumento de 10 p.p. na fração de mulheres na turma em média, diminui a nota interna em 0,2 décimas, mantendo tudo o resto constante. No que concerne à fração de bons alunos na turma, constatamos um efeito positivo e estatisticamente significativo em todos os modelos, no entanto, a sua magnitude diminui
53
ligeiramente com a inclusão dos efeitos fixos. No HDFE robusto o aumento de 10 p.p. na fração de bons alunos na turma, em média, aumenta a nota interna em 1,4 décimas, condicional aos restantes regressores incluídos no modelo.
Quanto à variável explicativa sobre a dimensão da turma, observamos que quando se controla para a heterogeneidade não observada ao nível do aluno e da escola, o tamanho da turma possui uma maior influencia na componente interna do aluno. No HDFE robusto quando o tamanho da turma compreende os 20 a 25 alunos, constatamos um efeito positivo na nota interna de cerca de 0,2 valores, face a turmas com uma dimensão entre 26 a 30 alunos. Por outro lado, quando o tamanho da turma é superior a 31 alunos, o efeito é negativo (cerca de 0,2 valores), face a turmas com uma dimensão entre 26 a 30 alunos. Ou seja, tal como nos exames nacionais, as turmas com menos alunos são benéficas para o desempenho interno do aluno.