2 Theoretical framework
2.3.1 Theoretical Framework
Para investigar a proporcionalidade de cada covariável k utiliza-se os resíduos de Schoenfeld definidos para cada indivíduo i:
Em que é o indicador de ocorrência de evento para o indivíduo i, e por isso quando ocorre censura o resíduo é nulo. Define-se como a covariável e como uma média ponderada dos valores das covariáveis dos indivíduos em risco no tempo .
Suponhamos que o vetor de coeficientes varia com o tempo t. Logo, esse vetor pode ser dividido em duas partes: uma média constante e uma função que representa valores que variam no tempo. Seja o resíduo padronizado de Shoenfeld em definido por:
Em que é a matriz de covariância estimada do vetor de resíduos de Schoenfeld. Demonstra-se que o valor esperado desse resíduo padronizado é aproximadamente igual à parte de que varia no tempo. Assim, o gráfico dos resíduos padronizados de Schoenfeld contra os tempos de sobrevivência permite verificar se estes estão distribuídos igualmente ao longo do tempo, ou se aparece uma forma sugestiva de não proporcionalidade. Em outras
27
palavras, se a suposição de riscos proporcionais for satisfeita, não deverá existir tendência sistemática no gráfico de contra o tempo de sobrevivência (CARVALHO et al., 2011).
2.8.2 Resíduos de Cox-Snell
Os resíduos de Cox-Snell são amplamente utilizados na análise de dados de sobrevivência e recebem essa denominação porque são um exemplo particular da definição geral dos resíduos realizada por Cox & Snell (1968) (COLLET, 2003). Este tipo de resíduos auxilia na determinação do ajuste global do modelo, e tem quantidade determinada por:
Em que é a função de risco acumulado obtida pelo modelo ajustado.
Segundo Colosimo & Giolo (2006), para os modelos de regressão exponencial, Weibull e log-normal, os resíduos de Cox-Snell são dados de forma diferente, respectivamente, por:
Exponencial: Weibull: Log-normal:
Os resíduos vêm de uma população homogênea e devem seguir uma distribuição exponencial padrão, caso o modelo seja adequado (LAWLESS, 1982). O gráfico das curvas de sobrevivência desses resíduos, obtidas por Kaplan-Meier e pelo modelo exponencial padrão, também auxilia na verificação da qualidade do modelo ajustado; assim, quanto mais próximas as curvas se apresentarem, melhor será considerado o ajuste do modelo aos dados (COLOSIMO & GIOLO, 2006).
2.8.3 Resíduos padronizados
Os resíduos padronizados são quantidades calculadas por:
28
Assim, se, por exemplo, o modelo de regressão exponencial for adequado, esses resíduos devem ser uma amostra censurada da distribuição valor extremo padrão. De modo análogo, se o modelo log-normal for apropriado, os mesmos devem ser uma amostra censurada da distribuição normal padrão (COLOSIMO & GIOLO, 2006).
Os resíduos são estimativas dos erros que vêm de uma população homogênea. Os gráficos das curvas de sobrevivência dos resíduos, obtidas por Kaplan-Meier e pelo modelo log-normal padrão, também auxiliam a verificar a qualidade do modelo ajustado; quanto mais próxima elas se apresentarem, melhor é considerado o ajuste do modelo aos dados.
2.8.4 Resíduos Martingal
Os resíduos martingal, uma vez derivados por meio do método martingal (COLLET, 2003), são definidos por:
Em que é a variável qualificadora de falha e , os resíduos de Cox-Snell. Na realidade, os resíduos martingal são uma ligeira modificação dos de Cox-Snell, pois são vistos como uma estimativa do número de falhas em excesso observadas nos dados, mas não predito pelo modelo (COLOSIMO & GIOLO, 2006).
2.8.5 Resíduos Deviance
Embora os resíduos martingal compartilhem várias das propriedades de outros resíduos encontrados em outras análises, como na de regressão linear, eles não são simetricamente distribuídos em torno de zero, mesmo quando o modelo ajustado está correto (COLLET, 2003). Essa assimetria gera gráficos baseados nos resíduos, o que dificulta a sua interpretação. Os resíduos deviance, por sua vez, são mais simétricos quando distribuídos em torno de zero, e são definidos por:
Assim, se o modelo for apropriado, esses resíduos devem apresentar um comportamento aleatório em torno de zero. Gráficos dos resíduos martingal, ou deviance, versus os tempos
29
fornecem, assim, uma forma de verificar a adequação do modelo ajustado, bem como auxiliam na detecção de observações atípicas (COLOSIMO & GIOLO, 2006).
30
3 REFERÊNCIAS
AALEN, O.O. Nonparametric inference for a family of counting processes. Annals of
Statistics, v.6, p.701-726, 1978.
ALLISON, P.D. Survival analysis using SAS: a practical guide. 2. ed. Cary: SAS Institute Inc. 324p. 2010.
ANSARI-LARI, M.; ABBASI, S. Study of reproductive performance and related factors in four dairy herds in Fars province (southern Iran) by Cox proportional-hazard model.
Preventive Veterinary Medicine, v.85, p.158-165, 2008.
BAHONAR, A.R.; AZIZZADEH, M.; STEVENSON, M.A.; VOJGANI, M; MAHMOUDI, M. Factors affecting days open in Holstein dairy cattle in Khorasan Razavi Province, Iran: A Cox proportional hazard model. Journal of Animal and Veterinary Advances, v.8, n.4, p.747-754, 2009.
CARAVIELLO, D.Z.; WEIGEL, K.A.; GIANOLA, D. Analysis of the relationship between type traits, inbreeding, and functional survival in Jersey cattle using a Weibull proportional hazards model. Journal of Dairy Science, v.86, p.2984-2989, 2003.
CARDOSO, F.F.; ROSA, G.J.M.; TEMPELMAN, R.J.; TORRES JUNIOR, R.A.A. Modelos hierárquicos bayesianos para estimação robusta e análise de dados censurados em melhoramento animal. Revista Brasileira de Zootecnia, v.38, p.72-80, 2009.
CARVALHO, M.S.; ANDREOZZI, V.L.; CODEÇO, C.T.; CAMPOS, D.P.; BARBOSA, M.T.S.; SHIMAKURA, S.E. Análise de sobrevivência: teoria e aplicações em saúde. Rio de Janeiro: Editora Fiocruz; 2005. 225p.
COLLET, D. Modelling survival data in medical research, 2ed. Chapman and Hall, London, 2003.
COLOSIMO, E.A.; GIOLO, S.R. Análise de sobrevivência aplicada. São Paulo: Edgard Blücher, 2006. 370p.
COX, D.R. Partial likelihood. Biometrika, v.62, p.269-276, 1975.
COX, D.R. SNELL, E.J. A general definition of residuals. Journal of the Royal Statistical
Society B, v.30, p.248-275, 1968.
DANTAS, M.A.; VALENÇA, D.M.; FREIRE, M.P.S.; MEDEIROS, P.G.; SILVA, D.N.; ALOISE, D.J. Modelo de regressão Weibull para estudar dados de falha de equipamentos de sub-superfície em poços petrolíferos. Produção, v.20, n.1, p.127-134, 2010.
DUCROCQ, V. An analysis of length of productive life in dairy cattle. PhD thesis, Cornell University, N.Y., U.S.A, 1987.
DUCROCQ, V. Statistical analysis of length of productive life for dairy cows of the Normande Breed. Journal of Dairy Science, v.77, p.855-866, 1994.
31
DUCROCQ, V. Survival analysis, a statistical tool for longevity data. In: 48th Annual Meeting of the European Association for Animal Production, 25-28 August, 1997, Vienna.
Proceedings... Vienna: 1997. p.1-14.
DUCROCQ, V.; QUAAS, R.L.; POLLAK, E.J.; CASELLA, G. Length of productive life of dairy cows. II. Variance component estimation and sire evaluation. Journal Dairy Science, v.71, n.11, p.3071-3079, 1988.
DU RO Q, V.; ÖLKNER, J. “The urvival Kit – v3.0”, a package for large analysis of survival data. In: 6th WORD CONGRESS ON GENETICS APPLIED TO LIVESTOCK PRODUCTION, 27: Armidale, 1998, Proceedings... Armidale, Austrália, p.447-448.
HOUGAARD, P. A class of multivariate failure time distributions. Biometrika, v.3, n.73, p.671-678, 1986.
KAPLAN, E.L.; MEIER, P. Nonparametric estimation from incomplete observation. Journal
of the American Statistical Association, v.53, p.457-481, 1958.
LAWLESS, J.F. Statistical models and methods for lifetime data. New York: John Wiley, 580 p., 1982.
LEDIC, I.L. Idade ao primeiro parto de vacas Gir exploradas para leite. Revista Brasileira de
Zootecnia, v.23, p.272-282, 1993.
LEITE, T.E.; MORAES, J.C.F.; PIMENTEL, C.A. Eficiência produtiva e reprodutiva em vacas leiteiras. Ciência Rural, v.31, n.3, 2001.
MANTEL, N. Evaluation of survival data and two new rank order statistics arising in its consideration. Cancer Chemotherapy Reports, v.50, n.3, p.163-170, 1966.
MARCONDES, C.R.; PANETO, J.C.C.; SILVA, J.A. II V.; OLIVEIRA, H.N.; LÔBO, R.B. Comparação entre análises para permanência no rebanho de vacas Nelore utilizando modelo linear e modelo de limiar. Arquivo Brasileiro de Medicina Veterinária e Zootecnia, v.57, p.234-240, 2005.
MOUSSAVI, A.H. MESGARAN, M.D. Impact of age at first calving on lactation and reproduction of first-parity Iranian Holstein dairy cows. Journal of Animal and Veterinary
Advances, v.7, n.2, p.190-195, 2008.
NEIVA, R.S.; OLIVEIRA, A.I.G.; COELHO, M.M.; SILVA, A.R.P.; SILVA, H.C.M.; PACKER, I.U. Fatores de meio e genéticos em características produtivas e reprodutivas nas raças Holandesa e Pardo-Suíça. III - Idade ao Primeiro Parto. Revista Brasileira de
Zootecnia, v.21, n.4, p. 623-628, 1992.
NELSON, W. Theory and applications of hazard plotting for censored failure data.
Technometrics, v.14, p.945-965, 1972.
PIRLO, G.; MIGLIOR, F.; SPERONI, M. Effect of age at first calving on production traits and on difference between milk yield returns and rearing costs in Italian Holsteins. Journal of
32
POTO NIK, K.; GANTNER, V.; KRSNIK, J.; TEPEC, M.; LOGAR, B.; GORJANC, G. Analysis of longevity in Slovenian Holstein cattle. Acta argiculturae Slovenica, v.98, n.2, p.93-100, 2011.
RIBEIRO, A.C. Avaliação genético-econômica de rebanho da raça Holandesa. 2001. 125f. Tese (Doutorado em Produção Animal) – Faculdade de Ciências Agrárias e Veterinárias – Universidade Estadual Paulista, Jaboticabal, 2001.
SCHNEIDER, M. del P.; DURR, J.W.; CUE, R.I.; MONARDES, H.G. Impact of type traits on functional herd life of Quebec Holsteins assessed by survival analysis. Journal of Dairy
Science, v.86, p.4083-4089, 2003.
SCHNEIDER, M. del P.; STRANBERG, E.; DUCROCQ, V.; ROTH, A. Survival analysis applied to genetic evaluation for female fertility in dairy cattle. Journal of Dairy Science, v.88, p. 2253-2259, 2005.
SEWALEM, A.; KISTEMAKER, G.J.; DUCROCQ, V.; Van DOORMAAL, B.J. Genetic analysis of herd life in Canadian dairy cattle on a lactation basis using a Weibull proportional hazards model. Journal Dairy Science, v.88, p.368-375, 2005.
SEWALEN, A.; MIGLIOR, F.; KISTEMAKER, G.J.; SULLIVAN, P.; Van DOORMAAL, B.J. Relationship between reproduction traits and functional longevity in Canadian dairy cattle. Journal of Dairy Science, v.91, p. 1660-1668, 2008.
SMITH, S.P.; QUAAS, R.L. Productive lifespan of bull progeny groups: failure time analysis.
Journal of Animal Science, v.67, n.12, p. 2999-3007, 1984.
STRANDBERG, E.; SÖLKNER, J. Breeding for longevity and survival in dairy cattle. In: International Workshop on Genetic Improvement of Functional Traits in Cattle, Gembloux, Belgium, January 1996, Proceedings... Gembloux, Bulletin, (1996)12, p. 111-118.
VUKASINOVIC, N.; MOLL, J.; KUNZI, N. Analysis of productive life in Swiss Brown cattle. Journal of Dairy Science, v.80, p. 2572-2579, 1997.
WALD, A. Tests of statistical hypotheses concerning several parameters when the number of observations is large. Transactions of the American Mathematical Society, v.54, p.426- 482, 1943.
WEIBULL, W. A statistical theory of the strength of materials. Ingeniors Vetanskaps Akademien-Handlinger, n.151, p.1 -45, 1939.
YAZDI, M.H.; VISSCHER, P.M.; DUCROCQ, V.; THOMPSON, R. Heritability, reliability of genetic evaluations and response to selection in proportional hazard models. Journal of
Dairy Science, v.85, p.1563-1577, 2002.
ZAVADILOVÁ, L.; TÍPIKOVÁ, M.; NE MCOVÁ, E.; BOU KA, J.; MATE JÍ KOVÁ, J. Effect of type traits on functional longevity of Czech Holstein cows estimated from a Cox proportional hazards model, Journal of Dairy Science, v.94, p.4090-4009, 2011.
33
CAPÍTULO 2 – AVALIAÇÃO GENÉTICA DA IDADE AO PRIMEIRO PARTO DE VACAS PARDO-SUÍÇAS NO SEMIÁRIDO DO BRASIL POR MEIO DA ANÁLISE DE SOBREVIVÊNCIA
RESUMO
A idade ao primeiro parto de novilhas Pardo-Suíças criadas no Semiárido do Brasil foi analisada como o tempo até o evento por meio do método não-paramétrico de Kaplan-Meier e do modelo de fragilidade compartilhado gama, sob a metodologia de análise de sobrevivência. Foram estimadas curvas de sobrevivência e de taxa de risco associadas com este evento e identificada a influência das covariáveis consideradas sobre o tempo. Os tempos médio e mediano ao primeiro parto foram 987,77 e 1.003 dias, respectivamente; e as covariáveis significativas pelo teste de Log-Rank, na análise por Kaplan-Meier, foram estação de nascimento, ano de parto, touro (pai da vaca) e estação de parto. Na análise pelo modelo de fragilidade, foram preditos os valores genéticos e as fragilidades dos touros (pais) para o parto de suas filhas, modelando-se a função de risco de cada vaca em função da covariável fixa estação de nascimento e da covariável aleatória touro. A fragilidade seguiu a distribuição gama. Touros com valores genéticos positivos e altos possuem fragilidades altas, o que significa menor tempo de sobrevivência de suas filhas ao evento, ou seja, redução na idade ao primeiro parto delas.
34
CHAPTER 2 – GENETIC EVALUATION OF AGE AT FIRST CALVING FROM BROWN-SWISS COWS AT THE SEMIARID OF BRAZIL THROUGH SURVIVAL ANALYSIS
ABSTRACT
The age at first calving of Brown-Swiss heifers raised at the Semiarid of Brazil was analyzed as the time until the event by the nonparametric method of Kaplan-Meier and the gamma shared frailty model, under the survival analysis methodology. Survival and hazard rate curves associated with this event were estimated and identified the influence of the considered covariates on such time. The mean and median times at the first calving were 987.77 and 1,003 days, respectively, and significant covariates by the Log-Rank test, on the Kaplan- Meier analysis, were birth season, calving year, sire (cow’s father) and calving season. In the analysis by frailty model, the breeding values and the frailties of the sires (fathers) for the calving of their daughters were predicted modeling the risk function of each cow as a function of the birth season as fixed covariate and sire as random covariate. The frailty followed the gamma distribution. Sires with high and positive breeding values possess high frailties, what means shorter survival time of their daughters to the event, i.e., reduction in the age at first calving of them.
35
1. INTRODUÇÃO
Alguns estudos têm enfatizado a importância da eficiência reprodutiva e o seu papel sobre a produtividade e a rentabilidade de rebanhos bovinos leiteiros. Dentre as características que estão associadas à eficiência reprodutiva, está a idade ao primeiro parto (IPP), que é de fácil mensuração no rebanho, sendo também considerada como um indicador da precocidade sexual e fertilidade das fêmeas. Além disso, a IPP está diretamente relacionada com a taxa de crescimento do animal, sendo um parâmetro de expressiva importância econômica por estar relacionado com o início da vida produtiva da matriz (BRCKO et al., 2010). Vacas que parem mais cedo possibilitam um retorno mais rápido do capital investido pelo pecuarista, pois produzirão mais crias e serão mais produtivas ao longo de suas vidas e, consequentemente, mais lucrativas para os sistemas de produção de leite.
Contudo, na maioria dos rebanhos, é comum algumas fêmeas não possuírem o registro de primeiro parto no momento da avaliação, o que pode ser causado por motivos diversos como por doença, imaturidade fisiológica, morte ou mesmo pela venda de animais, denominando-se essas observações de dados censurados (CUNHA & MELO, 2012).
Nas avaliações genéticas utilizando a metodologia tradicional dos modelos lineares mistos, são analisados apenas os registros das fêmeas que pariram (dados não censurados), os quais podem não seguir a distribuição normal, descartando-se do banco de dados os animais que não têm informação. Neste sentido, a análise de sobrevivência considera as informações completas e incompletas dos indivíduos que são avaliadas, respectivamente, como dados não censurados e censurados (ALLISON, 2010) e tem sido aplicada aos estudos com características reprodutivas de animais de produção.
Alguns estudos envolvendo características reprodutivas e a eficácia da análise de sobrevivência para avaliar tais características tem sido observados na literatura: Schneider et al. (2006) estimaram valores genéticos de touros para avaliar a fertilidade de suas filhas, por meio de quatro modelos de risco proporcionais e dois modelos lineares mistos diferentes, considerando a característica intervalo entre a primeira e a última inseminação e afirmaram que os modelos de sobrevivência permitiram uma maior acurácia do que os modelos lineares para os valores genéticos preditos. Schneider et al. (2007) reportaram os efeitos da mastite e a confirmação de prenhez sobre o descarte de vacas leiteiras na Suécia. Potoc nik et al. (2011) analisaram a longevidade de vacas Holandesas utilizando um modelo de riscos proporcionais
36
Weibull; os autores sugeriram que este tipo de análise é adequada para a avaliação genética da longevidade.
Diante dos resultados de estudos envolvendo características reprodutivas e este tipo de análise, a IPP pode ser analisada em função do tempo até o evento (ocorrência de parto) sob esta metodologia. Neste tipo de análise, muitos métodos estatísticos diferentes, entre paramétricos e não-paramétricos, podem ser empregados para o tratamento da censura. Dentre os que têm sido amplamente utilizados, estão o método não-paramétrico de Kaplan-Meier ou estimador Limite-Produto e o modelo semiparamétrico de riscos proporcionais de Cox com fragilidade compartilhada.
O estimador de Kaplan-Meier informa o quanto cada covariável e seus estratos afetam a variável resposta (tempo). Isto é, ele permite estimar a probabilidade de sobrevivência ao evento em relação a cada variável considerada no estudo (COLOSIMO & GIOLO, 2006). A principal vantagem desse estimador é a simplicidade dos cálculos e a facilidade de compreensão, já que nenhuma estrutura paramétrica está envolvida (KAPLAN & MEIER, 1958).
No contexto da análise de sobrevivência multivariada, Ducrocq & Casella (1996) afirmam que os modelos de riscos proporcionais podem incluir efeitos aleatórios (genéticos) além dos efeitos fixos, tornando-se modelos mistos de sobrevivência sendo mais conhecidos por modelos de fragilidade. A fragilidade é um termo aleatório não observável que afeta multiplicativamente o risco comum aos indivíduos dentro de um mesmo grupo (família), pois descreve fatores genéticos compartilhados pelos membros desse grupo, como pelas filhas de um mesmo touro. Em gado leiteiro, a distribuição gama associada ao termo da fragilidade tem sido a mais usada, pois leva a uma distribuição aproximadamente normal para o efeito aleatório de touro (DUCROCQ & CASELLA, 1996).
Este trabalho objetiva avaliar a idade ao primeiro parto de novilhas Pardo-Suíças, identificando as covariáveis que influem sobre o tempo até esse evento, bem como predizer o valor genético e a fragilidade dos touros para a idade ao primeiro parto de suas filhas, utilizando a metodologia da análise de sobrevivência por meio do estimador não-paramétrico de Kaplan-Meier e do modelo de fragilidade compartilhado gama.
37
2. MATERIAL E MÉTODOS
Descrição do banco de dados
Os dados utilizados neste estudo foram provenientes de um rebanho da raça Pardo- Suíça pertencente à Empresa de Pesquisa Agropecuária do Rio Grande do Norte (EMPARN). O rebanho é criado na Estação Experimental do município de Cruzeta - Rio Grande do Norte, situado na mesorregião Central Potiguar e na microrregião Seridó Oriental. A sede do município tem uma altitude média de 226,46 m e coordenadas geográficas 06º24’43,2’’ de latitude sul e 36º47’24,0’’ de longitude oeste, distanciando-se da capital do estado cerca de 220 km.
O clima da região caracteriza-se como semiárido, com estação chuvosa atrasando-se para o outono. As médias anuais de temperatura mínima e máxima, umidade relativa do ar e precipitação pluviométrica para a região foram calculadas em: 18,0 ºC e 33,0 ºC; 64 % e 578 mm, respectivamente (INMET, 2014). Durante os meses de fevereiro a junho, as vacas eram criadas em regime semi-intensivo, alimentando-se de pasto nativo e concentrado formulado na fazenda; entre julho e janeiro, adotava-se o regime intensivo, em estábulo de alojamento livre, com a dieta baseada em silagem de sorgo e capim-elefante. Foram analisadas 121 vacas primíparas, filhas de 47 touros não aparentados (reprodução por inseminação artificial), nascidas em 1993 e de 1995 a 2007, com parições entre 1998 e 2009 e idades ao parto variando de 736 a 2.365 dias.
O tempo (em dias) até a ocorrência do primeiro parto (evento) foi considerado como a variável dependente, expressa na escala contínua. Sob a metodologia de análise de sobrevivência, todas as variáveis independentes (explicativas) no modelo são denominadas de covariáveis (COLOSIMO & GIOLO, 2006). Assim, foram consideradas as covariáveis que possivelmente poderiam influenciar a variável tempo, baseando-se em estudos divulgados na literatura com bovinos de leite nos quais a idade ao primeiro parto foi analisada com uso da metodologia de modelos lineares mistos. Desse modo, foram consideradas as covariáveis fixas: ano e estação de nascimento, bem como ano e estação de parto. A única covariável aleatória incluída foi touro (pai da vaca), desde que cada animal tivesse tido pelo menos uma filha com registro de primeiro parto no rebanho. Todas as covariáveis eram independentes do tempo, isto é, não mudavam com o tempo.
As estações de nascimento e de parto foram agrupadas em duas categorias: estação 1, de fevereiro a junho; e estação 2, de julho a janeiro. A estação 1 correspondeu aos meses de
38
maior precipitação pluviométrica na região, com temperatura e umidade do ar medianas, enquanto a estação 2 reuniu os meses de menor incidência de chuva, com altas temperaturas e baixa umidade do ar.
Dado que nos sistemas de produção leiteiros os animais que se reproduzem mais cedo são os mais eficientes e que a raça Pardo-Suíça tem origem europeia, foi estabelecido que o primeiro parto devesse ocorrer até os 36 meses de idade da vaca. Assim, na análise de sobrevivência, o tempo máximo para a censura foi fixado em 1.098 dias (36 meses) a contar da data de nascimento. Haja vista que nenhum parto ocorrera antes dos 700 dias de idade das fêmeas, ajustou-se a escala de tempo para descontar este longo período sem evento tomando-o como o tempo de origem. Logo, deve-se acrescentar 700 dias na interpretação dos resultados.
Foi criada a variável “status” para qualificar o registro de tempo de cada fêmea como: tempo de falha (não censurado) com “status” = 1 caso ela tivesse parido entre 0 e 398 dias (700 e 1.098 dias), inclusive; e tempo de censura com “status” = 0 caso ela não tivesse parido até 398 (1.098) dias. Assim, as fêmeas censuradas pariram em tempos situados à direita (depois) do tempo de censura; caso de censura à direita e do tipo I (COLOSIMO & GIOLO,