Neste capitulo vamos descrever a população da base de dados utilizada, bem como os resultados dos algoritmos criados para previsão de recidiva de Fibrilhação auricular após ablação.
Para a criação do algoritmo de previsão foi utilizada uma base de dados com um numero final de 437 doentes submetidos a ablação de FA, por isolamento das veias pulmonares, sendo que 317 doentes não tiveram recidiva até ao final do estudo e 120 tiveram recidiva. A idade média dos doentes foi de 60,8 anos variando entre 33 e 88 anos. (fig.4)
Fig. 6 – Variação do numero de doentes por idade
Ao analisarmos as idades do doente, por recidiva de Fibrilhação Auricular, podemos constatar que variam entre 35 e 82 anos, tendo como media 60,66 anos. (fig.5) Vários estudos indicam a idade avançada como preditor de insucesso de fibrilhação auricular, ao avaliar o gráfico seguinte referente à nossa amostra, não podemos afirmar que o tratamento em doentes com idade superior a 60 anos seja menos eficaz do que em doentes com idade inferior a 60 anos, o que está de acordo com a avaliação realizada por Deneke em 2012. (Mesquita et al, 2016)(Kornej, 2015)(HRS,2017)
24
Fig. 7 – Variação do numero de doentes por idade e por recidiva
Relativamente à distribuição por género sexual, podemos afirmar que a ablação foi realizada a 292 doentes do sexo masculino e 145 doentes do sexo feminino, sendo que a sua porporção se mantém quando se avalia por recidiva de FA, 211 doentes sem recidiva e 81 doentes com recidiva, no caso do sexo masculino e 106 doentes sem recidiva e 39 doentes com recidiva, no caso do sexo feminino. Na nossa amostra não se pode afirmar o sexo feminino como variavel preditora de insucesso para ablação, tal como foi descrito por Deneke em 2012, por outro lado existem vários estudos mais recentes, que apontam que esse caracter preditor do sexo feminino apenas se pode afirmar para recidiva mais tardia, o que tendo em conta o tempo médio de follow up da nossa amostra, pode ter sido insuficiente para se observar o respectivo padrão. (Mesquita et al, 2016)(HRS,2017)(Winkle,2016)
Quando avaliamos os tempos de seguimento médio dos doentes ou o tempo até à recidiva, podemos referir que o tempo médio de seguimento destes doentes foi de 25,3 meses +- 14,3 meses e em relação aos doentes com recidiva o seu tempo médio até à recidiva foi de 16,1 meses +- 12,3 meses. (tabela 1)
Média DesvioPadrão TempoRecidiva (meses) 16,1 12,3
TempoFU (meses) 25,4 14,3
Tabela 1 – Média e Desvio Padrão do temo de Follow up dos doentes e Tempo até recidiva
Em relação ao peso e altura dos doentes, em termos médios mediam 170,4 cm +- 9,7 cm e pesavam 79,7 kg +- 14 cm, valores justificados pelo maior numero de doentes do sexo masculino que
25 feminino. Os doentes do sexo masculino tinham em média uma altura de 175 cm e um peso de 84,6 kg, enquanto que os doentes do sexo feminino tinham uma altura média de 160,9 cm e um peso médio de 69,7 kg. Quando avaliamos se existem diferenças quando comparados com a ocorrência de recidiva de FA, observa-se que em termos de altura as doentes do sexo feminino com recidiva tinham em média mais 1 cm de altura e menos 2kg, enquanto que nos doentes do sexo masculino os valores médios da altura são semelhantes, mas relativamente ao peso os doentes com recidivam tinham em média mais 1,6 kg (84,1kg vs 85.7 kg). (tabela 2 e 3)
Altura Peso
Masculino Feminino Masculino Feminino
Recidiva 0 174,99 160,65 Recidiva 0 84,1 70,3 1 175,1 161,7 1 85,7 68,3 175 160,9 84,6 69,73
Tabela 2 – Média de altura por género e por recidiva Tabela 3 – Média de peso por género e por recidiva
Existem vários estudos que referem a obesidade como fator preditor negativo de recidiva de FA, avaliando os valores da nossa amostra, podemos afirmar que independentemente do grupo, com recidiva ou sem recidiva, em termos médios a população apresenta peso superior ao normal, no entanto, se avaliarmos o género feminino, observa-se que o peso médio é inferior no grupo com recidiva. (HRS, 2017)
Após caracterização dos doentes, passamos à avaliação das restantes variáveis como presença ou não de fatores de risco, bem como volume da aurícula esquerda.
Quando avaliamos o volume da aurícula esquerda calculado por TAC, segundo as variáveis VOL TAC e VOL TAC/SC, podemos referir que em termos médios se traduz em valores de 81,4 ml e valores de 42,9 ml/m2, quando indexados à superfície corporal. Relativamente às diferenças observadas dependendo se o doente recidivou ou não, observamos valores superiores no grupo de recidiva quando comparado com o grupo sem recidiva (85,4 ml vs 79,9 ml e 44,98 ml/m2 vs 42,13 ml/m2). (Fig 6). Relativamente à volumetria da AE, todos os estudos indicam a sua importância no sucesso da ablação, sendo igualmente observada na nossa amostra a tendência em que o volume aumentado da AE se encontra associado com a maior probabilidade de recidiva de FA. (Deneke, 2012)(HRS,2017)(Winkle,2016)
26
Fig. 8 – Volume Médio da AE avaliado por TAC e indexado à Superfície Corporal por recidiva
Em termos das variáveis binárias de fatores de risco, importa salientar que a maioria das variáveis apresenta valores positivos (1), ou seja prevalência, abaixo dos 10%, com exceção de Dislipidemia, tabagismo, Disfunção tiroideia e HTA, que são fatores de risco frequentes na população. Em termos de caracterização; 19,5% da população era fumadora, 36,2% tinha dislipidemia, 10,5% tinha disfunção tiroideia e 51,5% tinha HTA. Por outro lado, importa referir que nesta população não existiam doentes com Miocardiopatia Hipertrófica e apenas 0,5% da população tinha Insuficiência cardíaca congestiva. Os restantes valores encontram-se detalhados em anexo 1.
Quando avaliadas relativamente à nossa variável target – RecidivaFA, podemos observar que o em termos percentuais existe uma maior incidência de tabagismo na população com recidiva (17,7% vs 24,2 %). (fig. 7), situação também observada, no estudo ATLAS, realizado em 2016 por Mesquita J., que refere que o facto do doente ser fumador representa um aumento de risco para recidiva de FA após ablação.
27 Este tipo de diferenças percentuais significativas é também observavel nas variaveis Atletismo, doentes em que praticam exercicio fisico (3% vs 5%); Valvulopatia, doenças com presença de doença valvular prévia (1% vs 4%) e Disfunção tiroideia (10% vs 13%), doentes com doença tiroideia prévia. Por outro lado é curioso observar que na população estudada, a % de HTA é superior no grupo sem recidiva comparativamente ao grupo com recidiva (53% vs 48%). A baixa prevalencia destas condições na amostra, não permite retirar conclusões significativas quanto à sua importancia para o sucesso da ablação, no entanto vários estudos apontam doença cardiaca ou valvular prévia como preditor de insucesso para a ablação, tal como se pode verificar no nosso estudo. Relativamente à HTA, os dados da amostra, estão de acordo com o investigado por Deneke, que refere que apesar de a FA, frequentemente estar associada à HTA, não é clara a sua importancia na recidiva de FA após ablação.
Por fim avaliando a variável Diagnóstico1, que representa o tipo de FA de cada doente, observa-se que em termos gerais, 79,4% dos doentes tinha FA paroxistica e os restantes outros tipos de FA. Quando avaliando segundo a presença de recidiva, observa-se que se os valores percentuais de FA não paroxistica sobem de 16,7% para 31,8%, com uma duplicação de casos seja de FA permanente, seja de FA persistente. (fig.8). O tipo de FA, tal como o volume da AE, são identificados em vários estudos como preditores de insucesso da ablação, facto esse igualmente observado na nossa amostra. (Deneke, 2012)(HRS,2017)(Winkle,2016)
Fig. 10 – Distribuição em % da variável Diagnóstico (Tipo de FA) por recidiva
Após avaliação das variáveis conclui-se este capitulo com a apresentação e discussão dos resultados dos algoritmos.
28 Como se pode observar na tabela 4 e na figura 11, o algoritmo que apresentou melhor performance foi o Gradient tree boosting, utlizando a técnica de SMOTE, com o valor de área abaixo da curva de 0,665 e accuracy de 0,687, isto quando comparado com os valores obtidos pela regressão logistica (0,5346 e 0,619), bem como da rede neuronal testada (0,5966 e 0,625). Pode-se igualmente observar que os resultados dos modelos foram sempre superiores quando utilizado a técnica de SMOTE, comparativamente com a sua não utilização.
AUC Accuracy No Oversampling 0,496 0,595 SMOTE 0,5966 0,625 No Oversampling 0,458 0,607 SMOTE 0,5346 0,619 No Oversampling 0,515 0,571 SMOTE 0,665 0,687 NN LR GBC
Tabela 4 – Resultados (AUC e Accuracy) dos algoritmos testados (NN – rede neuronal; LR – Regressão Logistica; GBC- Classificador de Gradient Boosting) com e sem utilização de técnica SMOTE
Tal como descrito por Chawla (2002) e tendo em conta a dimensão da nossa amostra, a técnica de SMOTE revela melhoria nos resultados do nosso algoritmo comparativamente com a não utilização de técnicas de oversampling. Por outro lado relativamente ao melhor algoritmo do nosso estudo, os resultados estão de acordo com o descrito por Kennedy(2013), Galar(2011) ou Ayaru(2015), que utilizaram algoritmos de gradient boosting nos seus estudos, com resultados superiores quando comparados com outros algoritmos mais complexos e com maior necessidade de parametrização.
RecidivaFA Sensitivity Specificity
GBC 0,608 0,721
LR 0,348 0,721
NN 0,478 0,738
1
Tabela 5 – Resultados (Sensitivity e Specificity) dos algoritmos testados (NN – rede neuronal; LR – Regressão Logistica; GBC- Classificador de Gradient Boosting) com utilização de técnica SMOTE e apenas para Valor de RecidivaFA=1
Quando avaliamos a sensibilidade e a especificidade dos algoritmos (tabela 5), com a utilização de técnica SMOTE, podemos observar que os melhores resultados do GBC estão relacionados com um incremento na Sensibilidade do algoritmo, ou seja, na deteção de casos verdadeiros de recidiva, porque no que diz respeito à especificidade, os algoritmos apresentam resultados semelhantes.
Segundo Ayaru(2015), este resultado pode-se explicar pela melhor capacidade dos algoritmos de Gradient Boosting lidarem com outliers nas bases de dados.
29
FN FP TN TP
Média VolTAC/SC (ml/m2) 47,41 44,35 42,43 52,74
Resultado Algoritmo GBC
Tabela 6 – Vol TAC/SC por resultado de Gradient Boosting Classifier
Quando avaliamos o contributo das variáveis mais importantes para a performance do algoritmo de Gradient Boosting, observamos que relativamente à variável volume TAC/SC (tabela 6), que avalia o volume da AE indexado à superfície corporal, existe uma diferença relevante de quando o algoritmo acerta no resultado, comparado com quando falha. Assim e como referido por vários autores, volumes maiores estão associados a maior probabilidade de recidiva comparativamente a volumes menores (Deneke, 2012)(HRS,2017)(Winkle,2016), afirmação esta que se pode observar nos nossos dados, em que nos 4 resultados possíveis, quando a predição é um verdadeiro negativo, a média do volume é a mais baixa e quando a predição é um verdadeiro positivo, a média de volume é a mais alta. Por outro lado, quando o volume médio da AE, se encontra em valores intermédios o algoritmo têm uma tendência maior para errar.
Quanto à analise das outras variáveis não se encontra variações tão significativas como na variável relativa ao volume da AE.
Quanto ao resultado do algoritmo, que tenta prever se determinado doente vai ter recidiva ou não após a ablação, a apenas existência de scores de risco para recidiva de FA, impossibilita qualquer comparação com outros estudos, visto que estes se limitam a segmentar a população em grupos com risco maior ou menor de ter recidiva num período de 12 meses após a ablação. (Mesquita et al, 2016)(Kornej, 2015)(Winkle,2016)
30