• No results found

A Branching Algorithm for Independent Set

Para que se pudessem satisfazer os objetivos do negócio, foi preciso criar-se um mecanismo que permitisse estimar os valores dos índices de bem-estar cardíaco. Relativamente aos índices, convencionou-se que a sua escala seria expressa entre -5 e 5 e que cada valor corresponderia a uma cor. Neste caso, consideraram-se quatro cores possíveis, com o seguinte significado:

• Verde (valores entre 2.5 e 5) – o risco de desenvolvimento de DCV é reduzido. Os indivíduos devem manter os seus hábitos, de forma a que os fatores de risco não sejam aumentados.

• Amarelo (valores entre 0 e 5) – o risco de desenvolvimento de DCV é moderado e, por isso, é necessário algum controlo regular e agir de acordo com comportamentos que promovam a redução dos fatores de risco.

• Laranja (valores entre -2.5 e 0) – o risco de desenvolvimento de DCV é elevado. Aconselha-se a que, nesta situação, os indivíduos recorram a especialistas em DCV, de forma a realizarem exames de diagnóstico mais específicos.

• Vermelho (valores entre -5 e -2.5) – o risco de desenvolvimento de DCV é muito elevado. Deve-se procurar com urgência especialistas em DCV e realizar exames de diagnóstico específicos.

Os valores dos índices podem ser apurados pela implementação de um sistema que converta, para cada registo, os valores probabilísticos associados às classes “Doença” e “Sem Doença” em índices, recorrendo, para isso, ao modelo selecionado na fase da Modelação. No entanto, é preciso notar que esta conversão não deve ser efetuada de uma forma linear, uma vez que se pretende que os índices funcionem como meios de alerta, capazes de detetarem

antecipadamente o surgimento de DCV. Assim, o índice associado a um determinado registo deverá diminuir de forma exponencial perante um aumento no risco de doença.

Para se implantar o sistema descrito, considerou-se que os riscos de desenvolvimento de DCV de 0 e de 100% estão associados a valores de índice 5 e -5, respetivamente. Além disso, após várias simulações, definiu-se que o limiar entre as cores laranja e vermelho deveria corresponder a valores de risco de 55%. Deste modo, tendo-se três pontos selecionados, foi possível delinear uma curva exponencial que os intersetasse e cuja equação permitisse inferir quaisquer outros valores de índices. A curva construída, dada pela Equação 6, é a que se representa na Figura 16.

𝑓(𝑥) =−7.052755 + 12.05276 × 𝑒−1.77011 × (𝑥) (6)

De forma a avaliar-se se o modelo cumpria os objetivos iniciais, a partir dos dados de teste da etapa anterior, para cada um dos registos estimou-se o seu valor de índice e a sua correspondente cor. Assim, e dado que o dataset continha dados classificados, foi elaborado o gráfico da Figura 17, que permitiu identificar a percentagem de indivíduos doentes e não doentes previstos em cada uma das categorias, face ao total de registos em cada classe.

Globalmente, verificou-se que a maioria dos indivíduos doentes se enquadrava na cor vermelha do índice e que, ao todo, 86.56% dos indivíduos doentes tinham associados índices de cor vermelha ou laranja. Pelo contrário, observou-se que 1.94% destes indivíduos tinham um índice de cor verde associado. O “ideal”, neste caso, era que todos os indivíduos com índices de cor verde não tivessem DCV. No entanto, a percentagem de indivíduos doentes associada a esta cor verificou-se ser muito reduzida e inferior a 2%. A explicação mais plausível para se ter observado registos de indivíduos doentes com um índice verde reside no facto de alguma da informação do dataset ser de carácter subjetivo e poder estar errada, como é o caso do exercício físico, dos antecedentes familiares e do número de cigarros fumados. Além disso, os valores relativos à pressão arterial alta e baixa e aos dados das análises médicas não têm em conta os dados históricos e, consequentemente, podem refletir valores muito discrepantes em comparação aos do passado. É preciso ter ainda em conta que nem sempre a existência de baixos fatores de risco impede o surgimento deste tipo de doenças. Desta forma, considerou-se aceitável esta taxa de erro de cerca de 2%, uma vez que a cor verde não simboliza a existência de riscos nulos de desenvolvimento de DCV, mas sim de probabilidades muito reduzidas.

Quanto aos indivíduos sem doença, verificou-se que, ao todo, apenas 50.83% se inseria nas cores verde e amarelo. Deste modo, praticamente metade dos indivíduos saudáveis ficaram associados a índices laranja e vermelho. Este resultado pode ser considerado válido na medida em que diz respeito a pessoas com fatores de risco elevados de desenvolvimento de DCV, mas que não desenvolveram estas doenças e, deste modo, serve para as alertar e incentivar a consultarem profissionais de saúde especializados, para efetuarem exames de diagnóstico, de

forma a prevenir o seu surgimento. Além disso, os profissionais de saúde podem ainda informá- las acerca das melhores medidas a tomar para que os seus fatores de risco sejam diminuídos.

Outro modo complementar de se verificar a adequabilidade do índice proposto foi através da sua comparação com valores obtidos em simuladores online. Para isso, foram definidos os quatro tipos de perfis representados na Figura 18 e, para cada um destes perfis, foi calculado o seu índice através do modelo MLP selecionado, que corresponde ao valor indicado na figura. Posteriormente, para os mesmos perfis, utilizando-se os simuladores online, obteve-se os resultados expostos na Tabela 12, que representam o risco de se vir a sofrer de algum tipo de evento cardiovascular grave nos próximos dez anos.

Como estes simuladores não utilizavam os mesmos parâmetros preditivos e, em alguns deles, era requerida informação adicional que não estava indicada nos perfis selecionados, sempre que necessário, foram considerados os seguintes pressupostos:

• HDL de 40 mg/dL para os homens e de 50 mg/dL para as mulheres. • Proteína C reativa com o valor de 1 mg/L.

• Etnia caucasiana.

• Sem utilização de tratamentos com estatina. • Sem utilização de tratamentos à base de aspirina.

Os valores retornados pelos simuladores estavam expressos numa forma percentual e associados a níveis que se podiam considerar baixos quando o valor era inferior a 5%, ligeiros para valores entre 5 e 7.5%, médios quando o intervalo de valores era entre 7.5 e 20% e elevados para valores superiores a 20%.

Tabela 12 – Percentagem de risco de desenvolvimento de DCV a 10 anos pelos simuladores online

Simulador Perfil 1 Perfil 2 Perfil 3 Perfil 4

Framingham (Lípidos) 1.7% 4.5% 7.9% 21.1% Framingham (IMC) 2% 4.9% 9.8% 30.2% ASCVD 0.4% 1.3% 3.4% 18.8% Cuore 1% 0.9% 2.5% 13.5% Reynolds 0.3% 1% 3% 15%

Da análise dos valores obtidos e da comparação destes resultados com o dos índices associados a cada perfil, constatou-se que, no caso do perfil 1, todos os simuladores retornavam um nível de risco muito baixo e, por isso, os resultados estavam em concordância com o valor do índice de 3.6 (zona verde). Tal como no perfil 1, em relação ao perfil 2, os valores obtidos também se situavam na gama de risco baixo, embora os de Framingham apresentassem valores próximos do nível de risco superior. Desta forma, tendo em consideração este aumento no grau de risco, pôde-se considerar adequado o índice positivo de 1.26 (zona amarela) obtido pelo modelo de DM. Posteriormente, analisando-se os resultados dos simuladores para o perfil 3, verificou-se que, apesar de estas ferramentas retornarem valores mais elevados em comparação com os primeiros dois perfis, a sua classificação continua a ser do tipo baixo risco. Apesar disso, os simuladores de Framingham já o associam a um perfil de risco médio de desenvolvimento de DCV, dois níveis acima dos anteriores simuladores. Por sua vez, o índice calculado com recurso ao MLP é negativo e praticamente igual a -2 (zona laranja). De uma forma análoga à justificação do índice do perfil 2, esta classificação foi considerada apropriada, uima vez que se trata de uma forma de incentivo para que os utilizadores melhorem o valor e a cor correspondente ao seu índice de bem-estar. Por último, em relação ao grau de risco do perfil 4, os simuladores de Framingham consideram-no elevado, enquanto os restantes o categorizam como sendo um risco médio. Do ponto de vista do índice proposto, o valor obtido foi de -4.51 e, por isso, os indivíduos enquadrados neste perfil foram atribuídos à zona de mais elevado risco (zona vermelha). Mais uma vez, por estar em consonância com os resultados de maior risco, registados pelos simuladores de Framingham, considerou-se que o seu valor correspondia ao pretendido.

Assim, constatou-se que os índices calculados com suporte ao modelo MLP selecionado, apresentavam correspondências com os simuladores online, sobretudo os de Framingham. Por outro lado, quando a correspondência não era total, o índice apresentou valores do lado da segurança, promovendo, deste modo, a prevenção de surgimento de DCV.

Estes resultados e os anteriores, obtidos na Figura 17, provaram, assim, a validade do modelo e a sua possível expansão para registos não classificados. Deste modo, o modelo proposto possibilita que utilizadores que desconheçam o seu estado possam aferir o seu índice, de uma forma eficiente. No entanto, as suas principais vulnerabilidades prendem-se com o facto de o modelo:

1. Ser mais indicado para indivíduos adultos entre os 30 e os 65 anos, uma vez que existiram poucos registos utilizados no processo de DM fora deste intervalo etário. 2. Não ter em conta mais fatores de risco que, segundo a literatura, estão relacionados

com o surgimento de DCV, como é o caso da etnia.

3. Ter apenas em consideração, no processo de DM, valores pontuais médios de pressão arterial alta e baixa e de dados de análises, negligenciando-se o seu historial.

4. Ser específico para população da mesma região geográfica e para registos contemporâneos.

A próxima fase consistiu em rever-se todos os processos anteriores e, uma vez consolidados e aprovados, planeou-se uma estratégia de implementação dos resultados obtidos.