mai 2008 av landbruks- og matminister Terje Riis-Johansen

5.4.1 E

NQUADRAMENTO

O tempo total de um vídeo de um exame endoscópico está apenas sujeito ao tempo de duração do mesmo, ou seja, ao tempo correspondente à visualização em tempo real do TGI, como também à restante gravação efetuada pelo profissional de saúde, sem que esta tenha relevância no diagnóstico. Alguns exemplos são a possibilidade: de começar por capturar o ambiente circundante, como a sala da onde ocorrem este tipo de exames ou alguns instrumentos médicos que possam vir a ser utilizados durante o próprio exame; e, de finalizar o exame sem terminar a captura, podendo gravar várias dezenas de segundos de vídeo com a câmara desligada, resultando num elevado número de frames pretos, como se pode verificar na Figura 5.2.

(A) (B)

Figura 5.2 – Exemplos de frames captados: (A) fora do TGI, neste caso observa-se a sala de intervenção; e (B) depois de finalizar o exame com a câmara desligada.

5.4.2 E

STADO DA

A

RTE

É bastante claro que este tipo de frames presentes nos vídeos endoscópicos não vai influenciar de maneira Vídeos

Endoscópicos

Número de Vídeos

Endoscópicos ∑ Tamanho (MB) ∑ Duração (s) ∑ Frames Totais

EDA 23 1959,2 17299 432745 EDB 4 1225,4 12252 306338 TOTAL 27 3184,6 29551 739083

Em 2009, Rungseekajee et al. [132] propuseram um método para classificação de imagens extraídas de vídeos de colonoscopia em duas categorias: frames informativos e não informativos. A classificação é dada em duas etapas. Na primeira etapa é calculada a percentagem de pixéis isolados, distinguindo as imagens em três categorias: frames informativos, não informativas e ambíguos. Na segunda e última etapa é utilizado o número total de pixéis, de forma a identificar os frames ambíguos em informativos ou não informativos. Após todos os frames terem sido alvo de classificação, os não informativos serão eliminados. Desta forma, apenas são enviados para o profissional de saúde os frames informativos [132].

Já Stanek et al. [133] desenvolveram um sistema para deteção automática do início e do fim de procedimentos endoscópicos, de forma a que não seja necessária interação humana para iniciar a captura dos mesmos. Inicialmente, todos os vídeos endoscópicos contêm informação anterior e posterior ao respetivo procedimento. De seguida, pretende-se remover o maior número de frames captados fora do TGI do paciente. Para o sistema conseguir localizar com maior precisão o início e o fim de cada vídeo endoscópico, foram adicionados recursos temporais e métricas de cor. Para cada frame são medidas a variação entre a média de pixéis vermelhos e a média normalizada de pixéis vermelhos, criados histogramas de energia, histogramas para verificação da média de pixéis vermelhos e da média duplamente normalizada de pixéis vermelhos. A média de pixéis vermelhos é calculada a partir do valor médio da intensidade de vermelho no espaço de cor RGB. Já a média normalizada de pixéis vermelhos é calculada pela quantidade média de saturação de vermelho, em cada frame, em comparação com a quantidade média de saturação verde e azul [133].

5.4.3 S

OLUÇÃO

D

ESENVOLVIDA

A abordagem utilizada para a remoção de frames não relevantes para o diagnóstico, mais propriamente, frames referentes a todo o tipo de captura fora do TGI, baseia-se em métricas de cor, uma vez que, após a realização da revisão bibliográfica, terá sido a técnica mais apropriada de implementar, permitindo com precisão e exatidão a distinção entre frames relevantes e não relevantes [134].

Assim, para o desenvolvimento do algoritmo de deteção e eliminação automáticas de frames não relevantes foram assumidos dois pressupostos. O primeiro consiste no facto de que os frames captados antes e depois do TGI apresentam uma intensidade próxima de zero e uma maior uma intensidade de pixéis azuis. O segundo pressuposto consiste no facto de que as regiões relevantes para o diagnóstico apresentam uma

CAPÍTULO 5.Redução do Vídeo Endoscópico

intensidade de pixéis vermelhos superior às dos frames com informações não relevantes. Estes pressupostos podem ser observados pelas diferenças dos frames representados na Figura 5.3.

(A) (B)

Figura 5.3 – Exemplos de frames captados (A) fora do TGI, ou seja, não relevante, e (B) durante uma EDA, ou seja, relevante.

A primeira etapa da solução desenvolvida reside na definição de algumas das características essenciais para a produção do vídeo final, como o codec, o container, o frame rate e a resolução. Seguidamente, são definidas várias restrições, com base na diferença das três possíveis cores dominantes, para serem detetados os frames relevantes, ao mesmo tempo que são eliminados os frames não relevantes presentes no vídeo endoscópico.

Inicialmente, para isolar os frames não relevantes, cuja área é preenchida por pixéis com uma intensidade igual a zero, foi utilizada a função countNonZero()da biblioteca OpenCV para contar o número de pixéis

que são diferentes de zero para cada uma das componentes B, G e R do espaço de cor RGB. Assim, todos os frames que tiverem um ou mais pixéis diferentes de zero são guardados, os restantes são eliminados e considerados não relevantes.

Para detetar frames relevantes e eliminar os restantes frames capturados fora do TGI, calcula-se a média das intensidades das componentes individuais B, G, e R do espaço de cor RGB, para cada frame. Deste modo, promove-se a separabilidade dos frames cuja cor dominante é o vermelho e o azul, respetivamente. Sempre que a média da intensidade da componente R for maior que a da componente B, o frame é considerado relevante e, por sua vez, é guardado para ingressar no vídeo final reduzido.

Figura 5.4 – Esquema da solução de remoção de frames iniciais, finais e pretos.

5.4.4 R

ESULTADOS DA

S

OLUÇÃO

Após a aplicação da solução desenvolvida e explicitada na secção anterior foram obtidos novos valores para o tamanho de armazenamento, a duração, o bit rate, o frame rate e para o número total de frames de cada vídeo endoscópico, entre outros valores que podem ser encontrados na Tab. A.1 do Apêndice A, mas que não têm influência nos resultados. Para além destes valores foram também calculados os totais de tamanho de armazenamento, duração e número total de frames para os 23 vídeos de EDA, para os 4 vídeos de EDB e para o conjunto dos 27 vídeos resultantes (Tab. A.2 do Apêndice A).

Na Tabela 5.5 podem ser observados os valores relativos aos ganhos ou às perdas resultantes da solução implementada ao conjunto de dados utilizados nesta dissertação. Estes resultados foram obtidos pela diferença entre os valores iniciais enunciados anteriormente, na Tabela 5.3, e os valores registados na Tab. A.1 do Apêndice A (Equação 5.1). Uma vez que os codec, container e resolução se mantiveram para todos os vídeos reduzidos, estes não vão ser encontrados na tabela seguinte.

Resultado = Valor inicial− Valor obtido através da solução

Equação 5.1 – Cálculo da diferença entre os valores iniciais e os valores obtidos pela implementação da solução de remoção de frames iniciais, finais e pretos.

CAPÍTULO 5.Redução do Vídeo Endoscópico Tabela 5.5 – Ganhos ou perdas obtidos após aplicação da solução para remoção de frames iniciais, finais e pretos, sendo que as células a azul são referentes aos valores que sofreram um aumento relativamente aos valores para os vídeos endoscópicos originais.

ID Tamanho (MB) Duração (s) Bit Rate (kbps) Frame Rate (fps) Frames Totais EDA001 -34,7 41 -688,0 19 10073 EDA002 -101,8 197 -576,2 19 3583 EDA003 -90,4 401 -879,2 19 33555 EDA004 -16,2 63 -823,1 19 6110 EDA005 -9 7 -496,0 19 3252 EDA006 -0,2 78 -948,7 19 3395 EDA007 -21,6 36 -556,2 19 8130 EDA008 -16,6 86 -690,9 19 8327 EDA009 150,8 1137 -402,5 19 32695 EDA010 -10 65 -375,2 19 9166 COL001 1 1040 -768,1 19 52885 EDA011 -8,7 24 -496,4 19 4539 EDA012 8,4 409 -1056,0 19 14788 EDA013 1,3 110 -516,1 19 7402 EDA014 3,5 117 -759,9 19 6105 EDA015 -1,2 137 -845,1 19 6729 EDA016 -9,7 15 -224,9 19 8659 EDA017 -22,2 67 -942,7 19 6693 EDA018 18,3 2807 -1524,1 19 78260 EDA019 -24,6 93 -635,8 19 46257 EDA020 -16,7 165 -734,1 19 12420 EDA021 18,8 388 -681,0 19 15322 EDA022 76,6 876 -714,1 19 27202 COL002 -65,4 3039 -982,6 19 122856 EDA023 31,9 563 -685,1 19 23526 COL003 -88,7 89 -887,5 17 18094 COL004 176 2691 -1004,4 19 78272

Na Tabela 5.6 encontram-se os valores totais de tamanho de armazenamento, duração e total de frames calculados pelo somatório dos respetivos dados contidos na Tabela 5.5, assim como os valores médios de duração. Para além dos anteriores, observam-se os valores de variação de tamanho de armazenamento e de duração, em percentagem, que podem ser encontrados na Tab. A.3 do Apêndice A.

Tabela 5.6 – Valores totais de tamanho de armazenamento, duração e frames totais; valores médios de duração relativos aos ganhos obtidos após aplicação da solução para remoção de frames iniciais, finais e pretos; Variações de tamanho de armazenamento e de duração.

Tamanho de Armazenamento

Pode-se verificar que no que toca ao tamanho de armazenamento do vídeo endoscópico final, apenas 10 em 27 conseguiram ter um valor menor relativamente ao inicial, isto significa que a presença de frames não relevantes era elevada. Os exemplos mais evidentes são os vídeos endoscópicos EDA009 e COL004, cujos valores de tamanho de armazenamento poupado foram de 150,8 MB e 176 MB, respetivamente. Os restantes 17 vídeos endoscópicos evidenciaram um aumento do mesmo, como é o caso do EDA002 cujo tamanho de armazenamento aumentou 101,8 MB relativamente ao inicial. O aumento do tamanho de armazenamento do vídeo deve-se ao peso que os algoritmos de Visão Computacional têm sobre o mesmo [135].

Verifica-se ainda que houve um acréscimo de tamanho de armazenamento de 74 MB que corresponde a um aumento de 3,8 %, no caso das EDAs, e um decréscimo de 22,9 MB que corresponde a uma redução de 1,9 %, no caso das EDBs. Ademais, contabilizando-se todos os valores de tamanho de armazenamento é possível concluir que houve um aumento de 51,1 MB, sendo que os todos os vídeos endoscópicos passam a ocupar 3235,7 MB, em vez dos 3184,6 MB iniciais. Neste caso, não houve uma poupança relativamente a esta variável, mas sim um acréscimo de 1,6 %.

Duração

Relativamente, à duração dos vídeos endoscópicos pode-se observar que todos foram reduzidos, destacando os EDA018 e COL002 que obtiveram ganhos de 2807 segundos e 3039 segundos, respetivamente. Esta redução proporciona uma poupança do tempo despendido nas tarefas de visualização e análise de 14741 segundos, para os 27 vídeos endoscópicos, que resulta da diferença entre os 29551 segundos iniciais e os 14810 segundos correspondentes ao tempo total útil despendido nas mesmas tarefas, perfazendo uma poupança de 49,9 %. Observam-se ainda variações positivas para ambos os exames de EDA e de EDB, de 45,6 % e 56%, respetivamente. Vídeos Endoscópicos Número de Vídeos Endoscópicos ∑ Tamanho (MB) ∆ Tamanho (%) ∑ Duração (s) Duração Média (s) ∆ Duração (%) ∑ Frames Totais EDA 23 -74 -3,8 7882 342,7 45,6 376188 EDB 4 22,9 1,9 6859 1714,8 56 272107 TOTAL 27 -51,1 -1,6 14741 546 49,9 648295

CAPÍTULO 5.Redução do Vídeo Endoscópico

A média do tempo despendido nas tarefas de visualização e análise, por parte do profissional de saúde, é de 342,7 segundos, para o caso das EDAs e de 1714,8 segundos, para os exames de EDB e, na totalidade dos vídeos endoscópicos é de 546 segundos.

Bit Rate

Verifica-se que todos os valores de bit rate aumentaram. Este valor em nada vai influenciar o tempo de visualização e análise despendido pelo profissional de saúde. Denota-se que o aumento do bit rate foi influenciado pelo aumento do tamanho de armazenamento do vídeo endoscópico final, como tal, maior será a quantidade de dados armazenados. Valores elevados de bit rate podem tornar-se num fator limitativo para a velocidade de conexão e de transmissão e para os custos associados à mesma. É necessário ter-se um valor de bit rate inferior ao valor máximo da velocidade de upload, caso contrário a transmissão simplesmente não é efetuada [38].

Frame Rate

No que toca ao frame rate é possível observar que o valor da diferença entre resultados foi de 19 fps, para 26 dos 27 vídeos, e de 17 fps para o único caso, COL003, ou seja, os valores de frame rate passaram de 25 fps para 6 fps e 8 fps, respetivamente. Esta propriedade sofreu ajustes em relação ao frame rate dos vídeos originais, uma vez que para o tipo de codec utilizado a função, get(CV_CAP_PROP_FPS), do

OpenCV que permite utilizar o valor de frame rate original não é suportada, tendo o frame rate final sido verificado manualmente, numa fase inicial de implementação desta solução.

Número de Frames Totais

Por fim, obteve-se valores bastante satisfatórios no que concerne à totalidade de frames classificados como não relevantes e que, por sua vez, não foram incluídos nos vídeos endoscópicos reduzidos, permitindo que um total de 648295 frames não relevantes não tenham sido incluídos nos mesmos, ou seja, 376188 e 272107 frames não relevantes, em exames de EDA e de EDB, respetivamente. Tal significa que dos 739083 frames, apenas 90788 foram guardados nos vídeos endoscópicos reduzidos.

In document Dokument nr. 15:7 (2007–2008) Spørsmål til skriftlig besvarelse med svar (sider 94-101)