• No results found

Specification of the Purpose

3.6 Locating the gills

Sejam as seguintes especifica¸c˜oes para as distribui¸c˜oes de probabilidade a pri- ori, para o ajuste do modelo de tempo de promo¸c˜ao Pareto:

1) ϕ ∼ U(0;100), E(ϕ)=50, Var(ϕ)=250/3; p ∼ exp(0.25), E(p)=4, Var(p)=16;

k ∼ exp(0.25), E(k)=4, Var(k)=16, 2) ϕ ∼ exp(0.5), E(ϕ)=2, Var(ϕ)=4; p ∼ exp(0.25), E(p)=4, Var(p)=16; k ∼ exp(0.25), E(k)=4, Var(k)=16, 3) ϕ ∼ exp(3), E(ϕ)=1/3, Var(ϕ)=1/9; p ∼ Gama(1;2), E(p)=1/2, Var(p)=1/4; k ∼ Gama(1;2), E(k)=1/2, Var(k)=1/4.

Para a estima¸c˜ao via Laplace utilizou-se as especifica¸c˜oes 1) e 2). Observe, Tabela 5.9, que as estimativas da fra¸c˜ao de cura divergiram bastante, segundo os m´etodos de estima¸c˜ao. O m´etodo de MV apresentou desvios padr˜oes de p e k elevados em rela¸c˜ao a OpenBugs e Laplace, sendo que, neste ´ultimo houve um ganho no desvio padr˜ao de θ, por´em sobrestimou sua estimativa, quando comparado com os outros m´etodos. Al´em disso o m´etodo de MV forneceu intervalos de confian¸ca inconsistentes.

A especifica¸c˜ao 3), via OpenBugs, mostrou resultados mais aceit´aveis quanto as estimativas (pontuais e intervalares) dos parˆametros. As especifica¸c˜oes 1) e 2) subestimou a fra¸c˜ao de cura, via OpenBugs. As mesmas especifica¸c˜oes mostraram autocorrela¸c˜oes elevadas, e na tentativa de reduzir a influˆencia dos valores iniciais optou-se por utilizar um aquecimento de 20000 simula¸c˜oes e saltos de 50, obtendo uma amostra final de 50000 observa¸c˜oes para a especifica¸c˜ao 1). No entanto ´e poss´ıvel observar (Figura 5.22, coluna 1) que, mesmo com este procedimento, n˜ao foi poss´ıvel reduzir a autocorrela¸c˜ao dos valores simulados. Na especifica¸c˜ao 2) fez-se um aqueci- mento de 50000, com saltos de 50 obtendo uma amostra final de 80000 observa¸c˜oes. J´a na especifica¸c˜ao 3) descartou as 10000 primeiras simula¸c˜oes com saltos de 10 e tamanho amostral final de 50000 observa¸c˜oes. Nas especifica¸c˜oes 2) e 3) ´e poss´ıvel observar a redu¸c˜ao das autocorrela¸c˜oes dos valores simulados.

5.2 Diferentes modelos de fra¸c˜ao de cura 70

na Figura 5.21. As densidades a posteriori mostraram-se assim´etricas (Figura 5.20) para as especifica¸c˜oes 1) e 2), bem como os hist´oricos das cadeias (Figura 5.21) apresentando um platˆo no zero, criando uma barreira n˜ao permitindo a oscila¸c˜ao da cadeia.

Tabela 5.9 Estimativas dos parˆametros para o MTPpar.

Estimativas DP Especif./M´etodo θ p k θ p k BFGS-MV 0,258 10,914 11,296 0,294 53,189 55,842 1) (Laplace) 0,313 10,754 11,846 0,062 4,332 5,861 1) (Gibbs-OB) 0,127 3,212 3,896 0,219 2,664 2,956 2) (Laplace) 0,301 12,387 11,842 0,027 5,036 5,870 2) (Gibbs-OB) 0,199 3,728 4,204 0,588 2,737 2,995 3) (Gibbs-OB) 0,263 2,267 2,186 0,745 1,050 1,046

Tabela 5.10 Intervalos das estimativas dos parˆametros para o MTPpar.

Intervalos Intervalos Intervalos

Especif./M´etodo LI-θ LS-θ LI-p LS-p LI-k LS-k

BFGS-MV 0,145 0,460 0 26,284 0 27,433 1) (Laplace) 0,191 0,435 2,263 19,244 0,360 23,333 1) (Gibbs-OB) 0,001 0,364 0,145 10,03 0,514 11,590 2) (Laplace) 0,248 0,355 2,517 22,257 0,337 23,347 2) (Gibbs-OB) 0,053 0,381 0,446 10,730 0,665 11,89 3) (Gibbs-OB) 0,135 0,422 0,749 4,802 0,704 4,716

A Figura 5.20 apresenta a fun¸c˜ao de verossimilhan¸ca perfilada, onde a mesma indica uma poss´ıvel corre¸c˜ao.

A Figura 5.23 mostra as curvas de sobrevivˆencia dadas as estimativas por Kaplan-Meier, pelo modelo probabil´ıstico Pareto e pelos modelos de mistura padr˜ao Pareto e de tempo de promo¸c˜ao Pareto. Observe que, que o modelo probabil´ıstico Pareto est´a mais pr´oximo da curva de Kaplan-Meier do que o modelo de mistura padr˜ao e de tempo de promo¸c˜ao Pareto. O modelo de mistura padr˜ao Pareto apre- sentou resultado mais satisfat´orio do que o modelo de tempo de promo¸c˜ao.

5.2 Diferentes modelos de fra¸c˜ao de cura 71

Figura 5.20 Densidades a priori, a posteriori e verossimilhan¸ca perfilada dadas as especi- fica¸c˜oes 1), 2) e 3), respectivamente (por linha), para o MTPpar.

5.2 Diferentes modelos de fra¸c˜ao de cura 72

Figura 5.21 Hist´orico das itera¸c˜oes dadas as especifica¸c˜oes 1), 2) (superiores) e 3) (infe- rior), respectivamente, para o MTPpar.

Figura 5.22 Autocorrela¸c˜oes das itera¸c˜oes dadas as especifica¸c˜oes 1), 2) e 3), respectiva- mente (por coluna), para o MTPpar.

5.2 Diferentes modelos de fra¸c˜ao de cura 73

Figura 5.23 Curvas de sobrevivˆencia dos modelos de mistura padr˜ao e tempo de promo¸c˜ao Pareto.

Cap´ıtulo 6

Considera¸c˜oes Finais

6.1 Conclus˜oes

As distribui¸c˜oes exponencial e Weibull merecem destaque quanto ao ajuste, tanto para os modelos de mistura padr˜ao como nos de tempo de promo¸c˜ao, pois quando utilizadas, na referida base de dados, as estimativas via MV, Laplace e Gibbs (OpenBugs) foram bem pr´oximas. Al´em disso, quando utilizado o software OpenBugs obteve-se convergˆencia das cadeias, bem como a r´apida redu¸c˜ao nas au- tocorrela¸c˜oes dos valores simulados. Vale salientar que, apesar de modelar bem os dados atrav´es do modelo probabil´ıstico, a distribui¸c˜ao Pareto n˜ao mostrou estima- tivas pr´oximas para os modelos de mistura padr˜ao e de tempo de promo¸c˜ao. Uma poss´ıvel causa deste comportamento pode ser atribu´ıda a escolha das distribui¸c˜oes de probabilidade a priori. No modelo de tempo de promo¸c˜ao Pareto, n˜ao est´a claro o porque das estimativas discrepantes, no que se refere ao obtido via OpenBugs. Vale destacar que os modelos de tempo de promo¸c˜ao se mostraram mais sens´ıveis `a mudan¸cas nas distribui¸c˜oes a priori.

Por fim, o estudo mostrou a limita¸c˜ao de utilizar apenas uma base de dados e a n˜ao possibilidade de um estudo de simula¸c˜ao controlando a propor¸c˜ao de curados, bem como a quantidade de censuras. As estimativas encontradas pelas duas aborda- gens se mostraram pr´oximas, no entanto o enfoque Bayesiano oferece mais suporte quanto a aplica¸c˜ao de m´etodos computacionais e de simula¸c˜ao, principalmente em casos onde h´a pequenas amostras. Al´em disso, ´e uma boa alternativa na resolu¸c˜ao de m´etodos anal´ıticos de dif´ıcil solu¸c˜ao. Em modelos com covari´aveis pode-se observar dificuldades nos procedimentos num´ericos de otimiza¸c˜ao, quanto a implementa¸c˜ao do m´etodo da m´axima verossimilhan¸ca, o que n˜ao se espera no m´etodo Bayesiano.

Referˆencias Bibliogr´aficas

[1] Aalen, O. O. (1978). Nonparametric Inference for a Family of Counting Processes. Annals of Statistics, 6, 701-726.

[2] Bailey, R.L. e Dell, J.R. (1973). Quantifying diameter distributions with the Weibull function. Forest Science, Bethesda, 19, 2, p. 97-104.

[3] Berkson, J. e Gage, R. (1952). Survival curve for cancer patients following treatment. Journal of the American Statistical Association, 47(259), 501-515. [4] Best, N., Cowles, M., Vines, K. (1997). CODA: Convergence Diagnosis and Output Analysis Software for Gibbs Sampling Output. Cambridge, UK. [5] Boag, J. W. (1949). Maximum likelihood estimates of the proportion of patients cured by cancer therapy. Journal of the Royal Statistical Society. Series B (Methodological),11(1), 15-53.

[6] Bolfarine, H. e Sandoval, M. C. (2010). Introdu¸c˜ao `a inferˆencia estat´ıstica. 2 ed, Rio de Janeiro, SBM.

[7] Collet, D. (1994). Modelling survival data in medical research. 1 ed. London: Chapman & Hall.

[8] Cowles, M. K., Carlin, B. P. (1996). Markov Chain Monte Carlo con- vergence diagnostics: a comparative review. Journal of the American Statistical Association, 91, 883-904.

[9] Cox, D. R. e Hinkley, D. V. (1974). Theoretical Statistics. London: Chapman & Hall.

[10] Cox, D. R., Snell, E. J. (1981). Applied Statistics. Science Paperbacks. Chap- man and Hall, London.

REFERˆENCIAS BIBLIOGR ´AFICAS 76 [11] Chen, M. H.; Harrington, D. P.; Ibrahim, J. G. (2002). Bayesian Cure Rate Models for Malignant Melanoma: A Case-Study of Eastern Coopera- tive Oncology Group Trial E1690. Journal of the Royal Statistical Society, 51(2), 135-150.

[12] Chen, M. H.; Ibrahim, J. G.; Sinha, D. (1999). A new Bayesian model for survival data with a surviving fraction. Journal of the American Statistical Association, 94(447),909-919.

[13] Ehlers, R. S. (2011). Inferˆencia Bayesiana. Departamento de Matem´atica Aplicada e Estat´ıstica, ICMC-USP.

[14] Farewell, V. T. (1977). A model for a binary variable with time censored observations. Biometrika, 64, 43-46.

[15] Garthwaite, P. H.; Kadane, J. B.; O’Hagan, A. (2005). Statistical Methods for Eliciting Probability Distributions. Journal of the American Statistical Association, 100, 680-700.

[16] Gamerman e Lopes (2006). Markov chain Monte Carlo: Stochastic Si- mulation for Bayesian Inference. Texts in Statistical Science Series. CRC Press.

[17] Gelfand, A. E. e Smith, A. F. M. (1990). Sampling-based approaches to calculating marginal densities. Journal of the American Statistical Associ- ation, 85(410), 398-409.

[18] Gelman, A., Rubin, D. (1992). Inference from Iterative Simulation Using Multiple Sequences. Statistical Science, 7, 457-472.

[19] Geman, S.; Geman, D. (1984). Stochastic relaxation, gibbs distribution and the Bayesian rstoration of imagens. IEEE Transactions on Pattern Analysis and Machine Intelligence, v.6, p.721-741

[20] Geweke, J. (1992). Evaluating the Accuracy of Sampling-Based Appro- aches to Calculating Posterior Moments. Bayesian Statistics, 4, 169-193. [21] Greenwood, M. (1926). The natural duration of cancer. Reports on Public Health and Medical Subjects. 33:1-26. Her Majesty’s Stationery Office, London. [22] Ibrahim, J. G.; Chen, M. H.; Sinha, D. (2001). Bayesian Survival Analysis.

Springer, New York, NY.

REFERˆENCIAS BIBLIOGR ´AFICAS 77 [23] Kalbfleisch, L. D., Prentice, R. L. (2002). The Statistical Analysis of Failure

Time Data. John Wiley and Sons, New York, 2nd edition.

[24] Kaplan, E. L., Meier, P. (1958). Nonparametric estimation from incom- plete observations. Journal of the American Statistical Association, 53, 457- 81.

[25] Kersey, J. H.; Weisdorf, D.; Nesbit, M. E.; Lebien, T. W.; Woods, T. W.; Mc- Glave, P. B.; Kim, T.; Vallera, D. A.; Goldman, A. I.; Bostrom, B.; Ramsay, N. K. C. (1987). Comparison of autologous and allogeneic bone marrow transplantation for treatment of high-risk refractory acute lympho- blastic leukemia. New England Journal of Medicine, 317(8), 461-467.

[26] Laplace, P. S. (1774). Memoir on the probability of causes of events. M´emoires de Math´ematique et de Physique, Tome Sixi´eme. (English translation by S.M. Stigler 1986. Statistics Science, 1(19): 364-378).

[27] Lunn, D. J.; Thomas, A.; Best, N.; Spiegelhalter, D. (2000). WinBUGS A Bayesian modelling framework: Concepts, structure, and extensibi- lity. Statistics and Computing, 10, 325-337.

[28] Maller, R. A.; Zhou, S. (1996). Survival Analysis with Long-Term Survi- vors. Wiley, New York, NY.

[29] Migon, H. S.; Souza, A. D. P.; Schmidt, A. M. (2008). Modelos hier´arquicos e aplica¸c˜oes. Associa¸c˜ao Brasileira de Estat´ıstica, 18 Sinape, S˜ao Paulo,SP. [30] Nelson, W. (1972). Theory and Applications of Hazard Plotting for

Censored Failure Data. Technometrics, 14, 945-965.

[31] Paulino, C. D.; Turkman, M. A. A.; Murteira, B. (2003).Estat´ıstica Bayesi- ana. Funda¸c˜ao Calouste Gulbenkian, Lisboa.

[32] Peat, J. k. e Barton, B. (2005). Medical statistics: a guide to data analysis anda critical appraisal. 1 ed. BMJ books.

[33] Peng, Y.; Dear, K. B. G.; Carriere, K. C. (2001). Testingfor the presence of cured patients: a simulation study. Statistics in Medicine, 20, 17831796. [34] R Development Core Team, (2012). R: A language and environment for

statistical computing. R Foundation for Statistical Computing, Vienna, Aus- tria. ISBN 3-900051-07-0, URL http://www.R-project.org/.

REFERˆENCIAS BIBLIOGR ´AFICAS 78 [35] Robert, C. P.; Casella, G. (2004). Monte Carlo statistical methods. Sprin-

ger, 2nd ed.

[36] Rodrigues, J.; Cancho, V. G.; De Castro, M. (2008). Teoria Unificada de An´alise de Sobrevivˆencia. Associa¸c˜ao Brasileira de Estat´ıstica, 18 Sinape, S˜ao Paulo,SP.

[37] Sinha, D.; Chen, M.; Ibrahim, J. G. (2003). Bayesian Inference for Survival Data with a Surviving Fraction. Institute of Mathematical Statistics, 43, 117-138.

[38] Tierney, L.; Kadane, J. B. (1986). Accurate approximations for posterior moments and marginal densities. J. Amer. Statist. Assoc., 81, 82-86. [39] Tsodikov, A. (1998). A Proportional Hazards Model Taking Account of

Long-Term Survivors. Biometrics, 54(4), 1508-1516.

[40] Yakovlev, A.; Tsodikov, A. (1996). Stochastic Models of Tumor Latency and Their Biostatistical Applications. World Scientific, Singapore.

Apˆendice A

A.1 M´etodo de Laplace

• Demonstra¸c˜ao de 4.17 e 4.18

Desenvolvendo Ψ(θ) em s´erie de Taylor, temos: Ψ(θ) = Ψ(θ∗) + Ψ′(θ∗)(θ − θ ∗)1 1 + Ψ ′′)(θ − θ∗)2 2 + Ψ ′′′)(θ − θ∗)3 6 + ...

Sendo θ∗ ponto de m´ınimo, ent˜ao: Ψ′) = 0 e Ψ′′) > 0.

Usando o desenvolvimento at´e o segunda derivada ´e poss´ıvel obter uma boa aproxima¸c˜ao da integral. Logo, exp(−nΨ(θ)) = exp  −nΨ(θ∗) − nΨ′′(θ∗)(θ − θ ∗)2 2  = exp(−nΨ(θ∗)) exp  −nΨ′′(θ∗)(θ − θ ∗)2 2  = exp(−nΨ(θ∗)) exp  −12 (θ − θ ∗)2 [nΨ′′)]−1  Ent˜ao, Z exp(−nΨ(θ))dθ = Z exp(−nΨ(θ∗)) exp  −12 (θ − θ ∗)2 [nΨ′′)]−1  dθ = exp(−nΨ(θ∗)) Z exp  −12 (θ − θ ∗)2 [nΨ′′)]−1  dθ

A.1 M´etodo de Laplace 80 teremos: Z exp  −12 (θ − θ ∗)2 [nΨ′′)]−1  dθ = Z exp  −12(θ − µ) 2 σ2  dθ = √ 2πσ √ 2πσ Z exp  −12(θ − µ) 2 σ2  dθ = √2πσ Z 1 √ 2πσexp  −12(θ − µ) 2 σ2  dθ = √2π.σ.1 = √2πσ. Portanto, Z exp(−nΨ(θ))dθ = √2πσ exp(−nΨ(θ∗)) = √2π[nΨ′′(θ∗)]−1/2exp(−nΨ(θ∗)) = √2πn−1/2[Ψ′′(θ∗)]−1/2exp(−nΨ(θ∗)). Como quer´ıamos mostrar!