Como foi j´a foi citado anteriormente, n˜ao dar a devida aten¸c˜ao aos dados faltantes de um banco de dados em estudo pode gerar s´erios problemas nos resultados das an´alises. Por esse motivo, al´em dos m´etodos de imputa¸c˜ao apresentados anterior- mente, existem outros m´etodos de tratamento dos dados faltantes, que s˜ao, inclusive, mais frequentemente utilizados na pr´atica. Estes m´etodos s˜ao chamados de M´etodos de Exclus˜ao, os quais podem ser divididos em dois principais tipos: M´etodo de Ex- clus˜ao Listwise e M´etodo de Exclus˜ao Pairwise. Esses m´etodos ser˜ao apresentados a seguir.
3.3.1
M´etodo de Exclus˜ao Listwise
O m´etodo listwise, ou tamb´em conhecido pelo m´etodo de An´alises de Casos Completos, consiste em excluir todos os casos que contenham uma ou mais informa- ¸c˜oes faltantes em qualquer vari´avel, ou seja, qualquer indiv´ıduo ou participante que tenha valores ausentes ´e simplesmente descartado do banco de dados, deixando-se apenas os casos com informa¸c˜oes completas para todas as vari´aveis. V´arios autores, como Acock (2005), Little (1992), Mcknight at al. (2007), Pigott (2001) e Van Buuren (2012), afirmam em seus estudos que o listwise ´e o m´etodo de exclus˜ao mais comum utilizado nas an´alises, sendo este o procedimento padr˜ao ou o “default” da maioria dos softwares estat´ısticos, tais como os softwares R, SPSS, SAS e Stata.
Existem v´arias vantagens oriundas da aplica¸c˜ao deste m´etodo. Dentre elas, podemos citar a conveniˆencia e a simplicidade de como a t´ecnica ´e executada. De acordo com Pigott (2001), a principal vantagem deste m´etodo ´e a facilidade de imple-
menta¸c˜ao, uma vez que o pesquisador pode utilizar m´etodos padr˜oes para calcular as estimativas para o modelo proposto. Na mesma linha de racioc´ınio, Schafer e Graham (2002) afirmam que a principal virtude do m´etodo ´e a simplicidade, pois o problema da falta de dados pode ser resolvido excluindo-se apenas uma pequena parte da amos- tra. Dessa forma, pode-se afirmar que o m´etodo ´e completamente eficaz. Entretanto, os autores ressaltam que, mesmo nesta situa¸c˜ao, devem-se explorar os dados para se certificar de que os casos descartados n˜ao s˜ao excessivamente influentes.
Para dados classificados como MCAR, este m´etodo ´e dito como adequado, pois se houver um n´umero de amostras suficiente e o padr˜ao dos valores faltantes for completamente aleat´orio, ent˜ao a solu¸c˜ao listwise pode ser considerada adequada. Da mesma forma, segundo Pigott (2001), se os dados s˜ao MCAR e h´a poucas in- forma¸c˜oes faltantes, h´a uma maior chance de que os dados completos representem a popula¸c˜ao, produzindo assim resultados coerentes. Para Van Buuren (2012), se os dados s˜ao MCAR, a exclus˜ao listwise produz estimativas n˜ao tendenciosas para as m´edias, variˆancias e pesos da regress˜ao.
No entanto, a rejei¸c˜ao de casos incompletos pode ser um desperd´ıcio desne- cess´ario. Na pr´atica, n˜ao ´e incomum que boa parte da amostra real seja perdida, principalmente se h´a um grande n´umero de vari´aveis no estudo. Ou tamb´em, de acordo com Mcknight at al. (2007), ´e bem poss´ıvel que grande parte da amostra em estudo esteja com muitos dados faltantes em uma mesma vari´avel, e com a elimina¸c˜ao dos casos incompletos, perde-se toda ou grande parte das informa¸c˜oes sobre a vari´avel em quest˜ao.
Ainda sobre a perda de amostra, King et al. (2001) afirmam que, apesar de, em m´edia, um pouco menos de um ter¸co das observa¸c˜oes serem perdidas quando o m´etodo
listwise ´e aplicado, a propor¸c˜ao de observa¸c˜oes perdidas pode ser muito maior. Em
seus estudos apresentados na reuni˜ao anual da Sociedade para Metodologia Pol´ıtica, em 1997, por exemplo, o n´umero de casos perdidos ultrapassou cerca de 50% em m´edia, e, em alguns casos, mais de 90%.
Al´em disso, se os dados n˜ao s˜ao MCAR, os resultados podem ser ainda mais distorcidos ao se aplicar esse m´etodo de exclus˜ao. Conforme Acock (2005), se os dados n˜ao atendem a suposi¸c˜ao de serem MCAR, a exclus˜ao listwise pode gerar estimativas tendenciosas, pois geralmente os casos completos podem n˜ao ser representativos para
a popula¸c˜ao. Litlle e Rubin (2002, apud VAN BUUREN,2012) argumentaram que ´e dif´ıcil formular “regras de ouro” para o uso ou n˜ao deste m´etodo, pois as consequˆencias de seu uso n˜ao dependem somente da propor¸c˜ao de dados faltantes.
3.3.2
M´etodo de Exclus˜ao Pairwise
O m´etodo de exclus˜ao pairwise, tamb´em conhecido como An´alise dos Casos Dispon´ıveis, ao contr´ario do m´etodo listwise, utiliza todos os casos dispon´ıveis nas bases de dados para estimar os parˆametros do modelo. Assim, o m´etodo em quest˜ao tenta corrigir o problema de perda de informa¸c˜oes da t´ecnica listwise, ao eliminar todos os casos com informa¸c˜ao faltante. Van Buuren (2012), descreve como o m´etodo
pairwise funciona da seguinte forma:
O m´etodo calcula as m´edias e as (co) variˆancias em todos os dados observados. Assim, a m´edia da vari´avel X ´e baseada em todos os casos com os dados observados em X, a m´edia da vari´avel Y utiliza todos os casos com os valores de Y observados, e assim por diante. Para as correla¸c˜oes e covariˆancias, todos os dados s˜ao tomados em que X e Y tˆem valores n˜ao faltantes. Posteriormente, a matriz de estat´ısticas sum´arias ´e alimentada em um programa de an´alise de regress˜ao, an´alise fatorial ou outros procedimentos de modelagem. (VAN BUUREN, 2012, p. 9).
De acordo com Acock (2005), neste m´etodo utilizam-se todas as informa¸c˜oes poss´ıveis no sentido de que todos os participantes que responderam a um par de vari´a- veis s˜ao usados para estimar a covariˆancia entre essas vari´aveis, independente de eles responderem outras vari´aveis ou n˜ao. Sendo assim, o m´etodo ´e considerado simples e alguns softwares, tais como SPSS, SAS e Stata, contˆem diversos procedimentos com op¸c˜ao de se usar o m´etodo pairwise.
Se os dados s˜ao MCAR, o m´etodo produz estimativas consistentes das m´edias, variˆancias e covariˆancias. O desempenho deste m´etodo na an´alise de casos comple- tos em rela¸c˜ao `a an´alise de casos dispon´ıveis, com dados MCAR, ir´a depender da rela¸c˜ao existente entre as vari´aveis. No m´etodo de casos dispon´ıveis, por exemplo,
s´o ser˜ao produzidas estimativas consistentes quando as vari´aveis forem fracamente correlacionas.
Um dos motivos que faz com que essa t´ecnica n˜ao seja muito utilizada na pr´atica ´e a possibilidade de ela produzir matrizes de covariˆancias n˜ao plaus´ıveis. Isso se d´a, especificamente, pelo fato de que cada covariˆancia pode se basear em subamos- tras de diferentes participantes. Assim, os erros nas estimativas podem ser causados por causa da diferen¸ca entre os n´umeros de informa¸c˜oes utilizados para calcular os componentes das matrizes de covariˆancias. De acordo Schafer e Graham (2002), uma outra limita¸c˜ao do m´etodo pairwise ´e que, pelo fato de os parˆametros serem estimados a partir de diferentes conjuntos de observa¸c˜oes, ´e dif´ıcil calcular os erros padr˜ao ou outras medidas de incertezas.
Al´em disso, para dados n˜ao MCAR, as estimativas podem ser tendenciosas e nesta situa¸c˜ao podem existir ainda problemas computacionais. Van Buuren (2012) afirma ainda que a matriz de correla¸c˜ao pode n˜ao ser positiva definida, sendo este um requisito da maioria dos procedimentos multivariados. Assim, a grande dificuldade em usar a an´alise de casos dispon´ıveis est´a no fato de que n˜ao se pode prever quando este m´etodo de exclus˜ao fornecer´a resultados adequados ou n˜ao, tornando-o assim, n˜ao muito ´util como um m´etodo geral.