5.5.1 E
NQUADRAMENTOUma outra categoria inerente aos frames não relevantes é a do tipo desfocado. Um frame pode ser classificado como desfocado caso não apresente nitidez suficiente para uma visualização correta do conteúdo anatómico presente nesse mesmo frame. Podem ser destacadas duas razões relativas à respetiva aquisição. Esta pode ter sido efetuada muito de perto ou demasiado longe, de maneira a não ser possível focar a mucosa do TGI, ou abrangendo substâncias estranhas (e.g. fezes, bolhas de ar, sucos gastroinstestinais) [136]. No entanto, existem outros fatores que podem influenciar a presença de frames desfocados nos vídeos endoscópicos entre os quais se destacam os movimentos peristálticos do TGI. Na Figura 5.5 é possível verificar de forma clara dois exemplos relativos às razões para aquisição de frames desfocados, acima descritas.
(A) (B)
Figura 5.5 - Exemplos de frames desfocados (A) devido à aquisição ter sido efetuada demasiado perto e (B) devido à presença de sucos gastroinstestinais.
5.5.2 E
STADO DAA
RTEAssim como os frames captados antes e após a visualização, em tempo real, do TGI, os frames desfocados não vão influenciar o diagnóstico. No entanto, podem impedir a observação de uma dada patologia ou lesão. Existem várias técnicas que permitem que estes sejam eliminados.
Em 2004, Tong et al. [137] propuseram um método de deteção e classificação de imagens desfocadas com base na análise dos contornos e da nitidez, utilizando a Transformada de Haar (do inglês, Haar wavelet
CAPÍTULO 5.Redução do Vídeo Endoscópico
transform). Para além da classificação de imagens, esta solução permite ainda determinar até que ponto a imagem se encontra desfocada, através da análise da nitidez dos contornos [137].
Assim como Rungseekajee et al. [132], Oh et al. [136] desenvolveram um sistema CAD semiautomático com o intuito de se distinguirem dois tipos de frames - relevantes e não relevantes – reduzindo, assim, o número de frames a serem visualizados pelo profissional de saúde. Este sistema propõe duas soluções para classificar os respetivos frames, uma baseada em técnicas de clustering, através da Transformada Discreta de Fourier, e outra baseada na deteção de contornos de Canny (do inglês, Canny Edge Detector). Para além das técnicas referidas, é ainda proposta uma técnica de deteção de reflexão especular, ou seja, presença de reflexos brilhantes nos frames, de maneira a aumentar a precisão da classificação. Primeiramente, é calculada a percentagem de pixéis isolados. Se este valor for superior a um valor declarado de threshold, o frame é classificado como não relevante. De seguida, é implementada a Transformada Discreta de Fourier, sendo extraídas características com base na análise da textura dos frames e, posteriormente, a técnica de clustering [136].
No ano de 2008, Liu et al. [138] desenvolveram um sistema semiautomático de deteção de imagens desfocadas. Este sistema baseia-se na deteção das regiões desfocadas, através da extração de características baseadas na cor, no gradiente e no espectro das imagens. E, permite ainda obter uma classificação robusta [138].
Tsomko e Kim [139] propuseram um método baseado na previsão de regiões desfocadas entre pixéis vizinhos e na medida da variância para estimar a qualidade de imagem. Em vez de ser fornecida uma decisão binária, ou seja, se a imagem é nítida ou desfocada, o algoritmo proposto classifica as imagens em três grupos: imagens nítidas, desfocadas e de qualidade média [139].
5.5.3 S
OLUÇÃOD
ESENVOLVIDAA abordagem utilizada para a remoção de frames desfocados baseia-se em métricas de cor e na deteção de contornos de Canny, permitem classificar com exatidão os frames relevantes e os não relevantes [132][136].
A primeira etapa da solução desenvolvida depende da definição de algumas das características essenciais para a produção do vídeo final, como o codec, o container, o frame rate e a resolução. Novamente, estas
características mantiveram-se e foram definidas a partir dos vídeos previamente reduzidos pela solução descrita na secção anterior, Remoção de Frames Iniciais, Finais e Pretos.
A segunda etapa é iniciada pela transformação dos frames dos vídeos endoscópicos, que se encontram no espaço de cor RGB, para uma escala de cinzentos, através da função cvtColor(). Seguidamente, é
aplicada a função blur()para redução de ruído com um kernel de 3x3. A aplicação da deteção de
contornos de Canny é o passo seguinte, permitindo a obtenção de frames binários, nos quais as regiões relevantes vão ser detetadas e são desenhados os contornos.
A terceira etapa engloba o cálculo da percentagem de pixéis isolados [132]. Esta é conseguida através da relação entre o número de pixéis isolados e o número total de pixéis brancos presentes nos frames binários. Esta percentagem é comparada com os valores previamente declarados de threshold, referentes ao limite inferior e superior que este pode atingir. Caso, o valor da percentagem seja superior ao maior valor de threshold, o frame é classificado como não relevante, caso contrário o frame detetado é relevante.
Finalmente, foi utilizada a função countNonZero()para contar o número total de pixéis que são
diferentes de zero e, caso este seja superior a um valor total de pixéis previamente declarado, os frames são guardados, os restantes são eliminados e considerados não relevantes.
Na Figura 5.6 observa-se o esquema da solução desenvolvida e das etapas que nela estão envolvidas.
CAPÍTULO 5.Redução do Vídeo Endoscópico
5.5.4 R
ESULTADOS DAS
OLUÇÃOComo referido anteriormente, esta solução foi aplicada aos vídeos endoscópicos obtidos através da Remoção de Frames Iniciais, Finais e Pretos.
Através desta solução resultaram novos valores para o tamanho de armazenamento, a duração, o bit rate e para o número total de frames de cada vídeo, entre outros valores que podem ser encontrados no Apêndice B.
Na Tabela 5.7 podem ser observados os valores relativos aos ganhos resultantes da solução implementada. Estes resultados foram obtidos pela diferença entre os valores obtidos na e os valores registados posteriormente na Tab. B.1 do Apêndice B (Equação 5.2). Uma vez que os codec, container e resolução se mantiveram para todos os vídeos reduzidos, estes não vão ser encontrados na tabela imediatamente abaixo.
Resultado = Valor remoção de frames iniciais, finais e pretos− Valor remoção de frames desfocados
Equação 5.2 – Cálculo da diferença entre os valores obtidos através da solução de remoção de frames iniciais, finais e pretos e os obtidos pela solução para remoção de frames desfocados.
Tabela 5.7 – Ganhos ou perdas obtidos após aplicação da solução para remoção de frames desfocados, sendo que as células a azul são referentes aos valores que sofreram um aumento relativamente aos valores para os vídeos originais.
ID Tamanho (MB) Duração (s) Bit Rate (kbps) Frame Rate (fps) Frames Totais EDA001 4,4 25 -26,67 0 146 EDA002 8,8 30 12,72 0 179 EDA003 3,2 8 9,17 0 44 EDA004 2,4 13 -23,04 0 78 EDA005 2,2 10 4,68 0 61 EDA006 1,8 10 -62,52 0 58 EDA007 3,1 15 1,07 0 92 EDA008 2,8 13 -1,44 0 79 EDA009 4,6 26 -16,74 0 153 EDA010 6,6 34 11,52 0 206 COL001 22,3 141 -61,45 0 844 EDA011 2,2 12 -25,33 0 73 EDA012 1,9 8 2,07 0 53 EDA013 1,6 8 -5,40 0 48 EDA014 3,1 12 -1,33 0 70 EDA015 1,6 11 -46,20 0 70 EDA016 6,6 34 -1,65 0 203 EDA017 1,5 6 0,18 0 37 EDA018 5,4 41 -80,44 0 248 EDA019 1,2 1 16,57 0 3 EDA020 4,4 23 -18,59 0 140 EDA021 3,8 21 -10,64 0 127 EDA022 3,5 28 -71,71 0 169 COL002 10,8 50 2,48 0 299 EDA023 7,6 48 -50,95 0 288 COL003 3,2 2 22,73 0 18 COL004 12,2 68 -41,04 0 408
Na Tabela 5.8 encontram-se os valores totais de tamanho de armazenamento, duração e total de frames calculados pelo somatório dos respetivos dados contidos na Tabela 5.7, assim como os valores médios de duração. Observam-se também os valores de variação de tamanho de armazenamento e de duração, em percentagem, que podem ser encontrados na Tab. B.3 do Apêndice B.
CAPÍTULO 5.Redução do Vídeo Endoscópico Tabela 5.8 – Valores totais de tamanho de armazenamento, duração e frames totais; valores médios de duração calculados através dos dados relativos aos ganhos obtidos após aplicação da solução para remoção de frames desfocados; variações de tamanho de armazenamento e de duração.
De uma maneira geral, pode-se verificar que os resultados obtidos para esta solução foram satisfatórios.
Tamanho de Armazenamento
Relativamente ao tamanho de armazenamento do vídeo final, todos os 27 vídeos endoscópicos conseguiram ter um valor menor relativamente ao inicial. Os exemplos mais evidentes são os dos vídeos endoscópicos EDA002 e COL001, cujos valores de tamanho de armazenamento diminuíram em 8,8 MB e 22,3 MB, respetivamente. Os ganhos obtidos são de 84,3 MB, para EDAs, e de 48,5 MB, para EDBs, resultando numa poupança total de 132,8 MB para os 27 vídeos endoscópicos. Isto representa uma variação positiva de tamanho de armazenamento de 4,1 %, 4 % e 4,1 %, respetivamente. Uma vez que o tamanho de armazenamento foi reduzido, conclui-se que a presença de frames desfocados era elevada.
Duração
No que toca à duração dos vídeos endoscópicos, pode-se observar que todos eles foram reduzidos, sendo que as EDAs sofreram uma redução de 437 segundos, que se traduz num decréscimo de 4,6 %. As EDBs evidenciaram uma redução de 261 segundos, resultando numa variação positiva de 4,8 %. Na totalidade dos vídeos verifica-se que houve uma diminuição de 698 segundos, o que significa que ocorreu uma poupança de tempo para as tarefas de visualização e análise de 4,7 %.
Obteve-se uma poupança média do tempo despendido nas tarefas de visualização e análise, por parte do profissional de saúde, de: 25,9 segundos, para os 27 casos; 19 segundos, para as EDAs; e 65,3 segundos, para os exames de EDB.
Bit Rate
Verifica-se que maioritariamente os valores de bit rate voltaram a aumentar. Como foi mencionado Vídeos Endoscópicos Número de Vídeos Endoscópicos ∑ Tamanho (MB) ∆ Tamanho (%) ∑ Duração (s) Duração Média (s) ∆ Duração (%) ∑ Frames Totais EDA 23 84,3 4,1 437 19 4,6 2625 EDB 4 48,5 4 261 65,3 4,8 1569 TOTAL 27 132,8 4,1 698 25,9 4,7 4194
profissional de saúde. No entanto, pode influenciar a velocidade de conexão e de transmissão de vídeo. O que vai causar que o tempo de acesso ao vídeo aumenta, podendo este nunca ficar acessível, caso o valor de bit rate ultrapasse o valor máximo da velocidade de upload [38]. Observa-se ainda que 10 dos 27 vídeos reduziram o seu valor de bit rate. Estes resultados quantitativos são animadores e mostram que é possível o acesso mais rápido aos vídeos e à sua transmissão, por termos um vídeo ainda mais reduzido [130][140].
Frame Rate
Dado que o valor do frame rate não foi alterado entre as duas soluções desenvolvidas não houve qualquer tipo de ganho ou nem perda.
Número de Frames Totais
Por não se denotar uma variação tão acentuada, no que toca à redução da duração dos vídeos endoscópicos, também não são registados ganhos na ordem dos milhares relativos à totalidade de frames. Assim, contabiliza-se um total de 2625 e de 1569 frames não relevantes, em exames de EDA e de EDB, respetivamente, perfazendo um total de 4194 frames não relevantes que não foram incluídos nos vídeos endoscópicos finais.