Ausência de Estratificação
Com a análise de sensibilidade apresentada na Seção 8.2.1, observamos para o modelo com estrutura de independência condicional, dois testes sob investigação e ausência de estratificação da população (MODELO I: K = 2, V = 1), comportamento muito próximo entre as três prioris Beta (Uniforme, Jeffreys e Rukhim), com desempenho discretamente melhor das prioris de Rukhim e Uniforme segundo os critérios de informação AIC, BIC e DIC (ver no Apêndice B.2.1 a Tabela 14).
De forma geral, foi possível observar falta de convergência do algoritmo MCMC e intervalos de credibilidade (1 − α), α = 0,05, bastante amplos com elevados erros padrões para todos os parâmetros θθθ = (ξ ,Sk, Ek) quando consideramos dados artificiais simulados a
partir de parâmetros de desempenho dos testes fixos próximos de 1 (Sk = Ek = 0, 99), baixa
(ξ = 0, 01) ou alta taxa de prevalência da doença (ξ = 0, 99) para tamanhos amostrais n = {50, 100}. No entanto, à medida que aumentamos o tamanho da amostra (n = {500, 1.000}), verificamos estacionariedade das marginais a posteriori (R ≈ 1), com formas unimodais e estimativas dos parâmetros do vetor θθθ muito próximas dos valores nominais considerados na simulação dos dados e, com menor erro padrão (maior precisão). Além disso, as estimativas foram mais precisas para as taxas de sensibilidade (Sk) no caso de prevalência próxima a 1
(ξ = 0, 99) e para a especificidade (Ek) quando próxima a 0 (ξ = 0, 01) (ver no Apêndice B.2.1
as Figuras 8 e 9).
À medida que deslocamos a taxa de prevalência dos extremos, por exemplo, ξ = 0, 1 ou ξ = 0, 5, as marginais dos parâmetros do vetor θθθ apresentam estacionariedade com estimativas mais precisas em relação às duas configurações anteriores, mesmo para os menores tamanhos amostrais considerados (n = {50, 100}) (ver no Apêndice B.2.1 as Figuras 10 e 11). Considerando, alta taxa de prevalência (ξ = 0,99) associada à baixa concordância de resultados negativos, por exemplo, dentre 100 sujeitos sob investigação, 99 apresentam resultados positivos nos dois testes sob investigação e um sujeito apresenta resultado negativo para o teste 1 e positivo para o teste 2 (concordância para 50% dos resultados negativos entre os testes), temos que, o modelo de classe latente produz marginais não estacionárias com intervalos de credibilidade variando em todo o intervalo [0,1] com elevados erros padrões para a taxa de especificidade do teste (ver no Apêndice B.2.1 a Figura 12). Comportamento semelhante ocorre na situação inversa para a taxa de sensibilidade (Sk). Este cenário tende a melhorar, ou
seja, estacionaridade das marginais e menor amplitude do intervalo de credibilidade, para as taxas de sensibilidades e especificidades dos testes, à medida que aumentamos a concordância de resultados positivos e negativos, respectivamente.
9.1 Estudos de Sensibilidade dos Modelos 150 Presença de Estratificação
A partir da estratificação da população em três estratos (V = 3), segundo a suposição original proposta por Hui e Walter (1980), temos o MODELO II com vetor de parâmetros θθθ =(ξv, Sk, Ek), v = 1, 2, 3, k = 1, 2, apresentando condição básica para
identificabilidade (gl = 9;Qp = 7). Neste caso, foi possível verificar distribuições marginais estacionárias com estimativas bem mais precisas para todos os parâmetros de interesse, mesmo para os menores tamanhos amostrais considerados (n = {50,100}).
Semelhante ao que ocorreu com o MODELO I, à medida que aumentamos o tamanho amostral, o erro padrão diminui; isso também foi observado quando consideramos maiores diferenças médias absolutas das taxas de prevalências da doença entre os estratos (δq),
com δq = (|ξ1− ξ3| + |ξ2− ξ3|)/2, veja no Apêndice B.2.2 a Figura 13, referente à priori
Uniforme. As prioris de Rukhim e Jeffreys apresentam comportamento muito próximo.
Para a estrutura geral proposta (2.22), ou seja, estratificação da população supondo tanto as taxas de prevalências (ξv) quanto os parâmetros de desempenho dos testes
(Skv, Ekv, k = 1, 2, v = 1, 2, 3) diferentes entre os estratos, temos o MODELO III (gl = 9,
Qp= 15) sem condição básica para identificabilidade. No entanto, análogo ao MODELO II, verificamos estimativas com menor erro padrão à medida que aumentamos o tamanho amostral e/ou a diferença média absoluta das taxas de prevalências da doença entre os estratos (δq), sendo
este discretamente menor para as taxas de sensibilidades (Skv) nos estratos mais prevalentes e
para as taxas de especificidades (Ekv) nos estratos menos prevalentes (ver no Apêndice B.2.2 a
Figura 14).
Apesar de apresentar erro padrão discretamente superior ao MODELO II, o modelo proposto (2.22) resultou em marginais estacionárias e estimativas muito próximas dos valores nominais considerados na simulação dos dados artificiais, enquanto as taxas de sensibilidade Sk e especificidade Ek obtidas a partir do MODELO II, mostraram-se
superestimadas uma vez que ficaram mais próximas das Skv e Ekv obtidas a partir do modelo
geral (2.22), naqueles estratos mais e menos prevalentes, respectivamente, (ver no Apêndice B.2.2 a Figura 15).
Além disso, o modelo proposto exibiu desempenho superior, a partir dos critérios de informação AIC, BIC e DIC, em relação aos modelos sem estratificação (MODELO I) e estratificado segundo a suposição original de Hui e Walter (MODELO II) para todas as situações comparáveis (ver no Apêndice B.2.2 a Tabela 14).
Para todos os modelos considerados neste estudo, as taxas de sensibilidade e especificidade do teste 2 (S2 e E2, respectivamente) mostraram resultados semelhantes aos
obtidos para o teste 1.
Ao analisar os modelos considerando seis testes sob investigação (K = 6), observamos comportamentos semelhantes para todas as situações descritas, ou seja, aumentar a quantidade de testes não trouxe contribuição adicional para obtenção de marginais
estacionárias, menor erro padrão para as médias a posteriori ou convergência de θ para o valor nominal considerado na simulação dos dados. Também, neste caso, verificamos desempenho discretamente melhor das prioris de Rukhim e Uniforme (ver no Apêndice B.2.2 a Tabela 15).
9.1.3 Relaxamento da Independência Condicional, Ausência de
Covariáveis e Presença de Estratificação
Neste estudo de sensibilidade (ver descrição na Seção 8.3), o objetivo principal foi comparar o desempenho da estrutura geral de estratificação proposta (HWE) com a estrutura de estratificação a partir da suposição original de Hui e Walter (HW) e, o desempenho entre as três suposições: independência condicional (IC), dependência condicional de efeito fixo (DCEF) e dependência condicional de efeito aleatório (DCEA), essa última a partir das ligações logitoe VEG, diferentes tamanhos amostrais e cenários para modelar o conhecimento a priori sobre os parâmetros de interesse.
De forma geral, para todas as situações comparáveis, a estrutura geral de estratificação proposta (HWE) demonstrou, a partir dos critérios de informação AIC, BIC e DIC, desempenho superior à estrutura HW. Além disso, independentemente da estrutura de estratificação (HWE ou HW), do tamanho amostral (n) e dos cenários utilizados para modelar o conhecimento a priori, temos que os modelos a partir do relaxamento da suposição de independência condicional (DCEF e DCEA) exibiram desempenho superior à suposição de independência condicional (IC), sendo a estrutura de dependência condicional a partir da formulação de efeito fixo (DCEF) a de melhor desempenho. Isto ocorreu para ambas as configurações (CONFI e CONFII) utilizadas na simulação dos conjuntos de dados artificiais (ver no Apêndice B.3 a Tabela 16).
Independência Condicional
Analisando as estimativas dos parâmetros originais θθθ = (ξv, Skv, Ekv), para
os dados simulados a partir da primeira configuração (CONFI) (ver Tabela 10 no Capítulo 8), verificamos para a suposição de independência condicional a partir da priori Uniforme Beta(1,1) (análise da Seção 8.3.1), resultados semelhantes aos encontrados no primeiro estudo de sensibilidade (Seção 8.2), ou seja, estimativas com erro padrão maior para as taxas de sensibilidade (Skv) e especificidade (Ekv) nos estratos mais e menos prevalentes,
respectivamente.
Além disso, as taxas de sensibilidade e especificidade obtidas a partir da suposição de HW se aproximam das respectivas estimativas de maior valor oriundas da suposição proposta HWE. Diferentemente do que ocorreu no primeiro estudo de sensibilidade, a estrutura geral de estratificação proposta (HWE) produziu, com a suposição de independência condicional, estimativas discretamente superestimadas, em relação aos valores nominais, para as taxas de sensibilidade e especificidade nos estratos menos e mais prevalentes,
9.1 Estudos de Sensibilidade dos Modelos 152 respectivamente (ver no Apêndice B.3.1 a Figura 16).
Dependência Condicional de Efeito Fixo
Para a estrutura de dependência condicional de efeito fixo (DCEF) com estratificação da população a partir da extensão à suposição de Hui e Walter (HWE), observamos bom desempenho do modelo para qualquer um dos três cenários utilizados para modelar o conhecimento a priori (ver cenários I, II e III na Seção 8.3.2), sendo o cenário III, informativo para os parâmetros de desempenho (Skv, Ekv) e taxa de prevalência (ξv) e não informativo
para as covariâncias condicionais (βdvJ): k = 1, 2, 3; v = 1, 2; d = {0,1}, o que apresentou
melhor desempenho com estimativas para Skv, Ekv e ξv, muito próximas aos valores nominais,
independentemente do tamanho amostral (n). Diferentemente do que ocorreu para a estrutura de independência condicional, na estrutura de DCEF, a suposição de HW contribuiu para taxa de sensibilidade superestimada e taxa de especificidade subestimada (ver no Apêndice B.3.2 a Figura 17).
Dependência Condicional de Efeito Aleatório
No caso da estrutura de dependência condicional de efeito aleatório (DCEA), construída a partir da ligação logito, ocorreu desempenho discretamente melhor para o cenário I (informação sobre todos os parâmetros, ver Seção 8.3.3); mesmo assim, diferentemente do que sucedeu na estrutura DCEF, as estimativas para a Skv e Ekv estão discretamente
superestimadas em relação aos valores nominais em ambos os estratos (ver no Apêndice B.3.3 a Figura 18). Quando retiramos a informação sobre as taxas de prevalência (ξv) e sobre os
parâmetros de dependência condicional (βdvJ) (cenário II), o modelo produziu estimativas com
comportamento oposto, ou seja, discretamente subestimadas em relação aos valores nominais e com erros padrões bem mais elevados (ver no Apêndice B.3.3 a Figura 19). Além disso, foi possível verificar em ambas as situações que a estrutura de estratificação a partir da suposição de Hui e Walter (HW) produziu estimativas para Sk e Ek próximas das respectivas estimativas
obtidas a partir da suposição HWE nos estratos menos e mais prevalentes, respectivamente. Considerando agora a estrutura de DCEA a partir da ligação VEG observamos, de forma geral, que os cenários no qual supomos informação sobre os parâmetros de forma (λv),
apresentaram desempenho superior (ver no Apêndice B.3 a Tabela 16) sendo melhor para o caso em que supomos, também, alguma informação sobre os parâmetros de dependência condicional (βdvJ), com estimativas neste caso muito próximas das nominais. Além disso, semelhante ao que
ocorreu na ligação logito, a suposição de HW produziu estimativas subestimadas para as taxas de sensibilidades e superestimadas para as taxas de especificidades (ver no Apêndice B.3.3 a Figura 20).
Comparando os modelos de IC, DCEF e DCEA, a partir da estrutura de estratificação da população e cenário de conhecimento priori com melhor desempenho para configuração CONFI utilizada na simulação dos dados (ver no Apêndice B.3 a Tabela 16),
observamos, de forma geral, estimativas mais próximas das nominais para a estrutura de DCEF quando supomos conhecimento a priori somente sobre os parâmetros de desempenho Skv e Ekv
(cenário II) e para a DCEA a partir da ligação VEG quando consideramos informação sobre todos os parâmetros (cenário Ib) (ver no Apêndice B.3.3 a Figura 21).
Exploramos dados simulados a partir da segunda configuração (CONFII), no sentido de verificar o comportamento dos nossos modelos quando as taxas de sensibilidade e/ou especificidade apresentam maior diferença entre os estratos. De forma geral, foi possível observar comportamentos semelhantes aos descritos para os dados simulados a partir da primeira configuração (CONFI), no que diz respeito aos cenários utilizados para modelar o conhecimento a priori, tamanho da amostra e estrutura de estratificação da população. Nessa última, a suposição de estratificação proposta (HWE) também apresentou melhor desempenho em relação à suposição HW. No entanto, verificamos alguns resultados particulares para esta configuração de dados. Por exemplo, a estrutura de IC a partir da suposição HWE produziu estimativas muito próximas das nominais (o que não ocorreu na CONFI). A partir do cenário II, no qual não consideramos informação sobre a taxa de prevalência, a estrutura de DCEF segundo a suposição HWE apresentou estimativas superestimadas no segundo estrato e, diferentemente do que ocorreu na configuração CONFI, a estrutura de DCEA a partir da ligação logito para ambos os cenários de informação a priori, produziu estimativas bem mais próximas das nominais.
Quanto à ligação VEG, mesmo supondo informação sobre os parâmetros de forma λvainda encontramos taxas subestimadas para Skve Ekv. Veja no Apêndice B.3.3 a Figura
22, referente ao comportamento dos modelos de IC, DCEF e DCEA, a partir da estrutura de estratificação da população e cenário de informação a priori com melhor desempenho para a segunda configuração (CONFII) utilizada na simulação dos dados.
9.1.4 Relaxamento da Independência Condicional, Presença de
Covariáveis e de Estratificação
Estendemos o estudo anterior (Seção 8.3), a partir da inclusão de um vetor de covariáveis W = (w1, w2, . . . , wn, ), considerando na simulação dos dados situações com taxas
de Skv e Ekv diferentes entre os testes e Sk1diferentes entre os níves da covariável.
De forma geral, para todas as suposições, ou seja, IC, DCEF e DCEA a partir da ligação logito, a estrutura geral de estratificação proposta (HWE) (apresentou, a partir dos critérios AIC, BIC e DIC, desempenho superior em relação à estratificação segundo a suposição original de Hui e Walter (HW). Nos modelos com a estratificação HWE observamos desempenho muito próximos entre os cenários utilizados para modelar o conhecimento a priori para as suposições de IC e DCEF, enquanto para a suposição de DCEA o cenário Ic (informação sobre todos os parâmetros) foi o que obteve melhor desempenho. Além disso, a suposição DCEF apresentou melhor desempenho em relação à IC e DCEA para todos os cenários de priori, enquanto a suposição de DCEA foi melhor à IC somente no cenário Ic (ver no Apêndice B.4 a