• No results found

Kapittel 3: Resultater fra den kvantitative undersøkelsen

3.5 Heltid og deltid, ansiennitet og finansiering

Os algoritmos de segmentação de tumores, geralmente, encontram-se estruturados em três fases: pré-processamento, classificação e pós-processamento. Em conformidade com o modo de classificação implementado, os métodos de segmentação de tumores cerebrais podem ser divididos em dois grandes grupos: generativos e discriminativos [25].

Num modelo generativo a etapa de classificação é realizada tendo em consideração a probabilidade conjunta, p(x, y), dos diferentes pontos da imagem, x, e as respetivas classes, y. A seleção da classe

y mais provável, em cada ponto x é obtida, geralmente, pela regra de Bayes que calcula a probabilidade

posterior e condicional p(y|x) [26]. Neste tipo de modelo, a definição da probabilidade conjunta incorpora informação prévia relativa à aparência e distribuição dos diferentes tipos de tecidos a identificar [25], como por exemplo o crescimento ou atrofia da região. Vulgarmente, o crescimento ou atrofia de uma região são caracterizados através de metodologias de registo de atlas [27--29]. O registo de atlas é uma técnica baseada na informação espacial, cuja principal finalidade é modelar a anatomia do paciente alvo. Por

CAPÍTULO 3. ESTADO DA ARTE

defeito, esta técnica de registo não contabiliza qualquer informação patológica. Assim sendo, a localização do tumor é extraída com base no pressuposto de que regiões de tecido tumoral causam um desvio considerável na distribuição estatística dos tecidos. Em termos imagiológicos este evento corresponde a regiões de deformação. Posteriormente, a demarcação das fronteiras do tumor é efetuada através da distribuição da probabilidade conjunta das intensidades, observadas na RM, e o tecido a classificar (alvo) [30].

As principais desvantagens dos modelos generativos são a sua vulnerabilidade ao ruído presente e ainda à variabilidade da informação entre sujeitos. Apesar destes problemas serem transversais ao tipo de modelo aplicado, é nos modelos generativos em que estes problemas têm mais impacto [25, 30, 31]. O modo como o modelo é inicializado afeta o restante processo de identificação dos diferentes tipos de tecido em análise [32]. Complementarmente, um único modelo estatístico apresenta dificuldades na captura de informação relevante, quando a definição dos parâmetros destes englobam um conjunto de informação vasto [32, 33]. Por forma a superar estas dificuldades alguns métodos servem-se da interação humana (modelos semiautomáticos) para a colocação de marcadores capazes de uma inicialização mais robusta do método [25].

Por outro lado, no modelo discriminativo, a probabilidade condicional, p(y|x), é diretamente mo- delada [26]. Para tal, um modelo paramétrico de aprendizagem é definido e ajustado ao contexto do problema através de uma fase de treino. Durante a fase de treino o classificador procura capturar pa- drões capazes de discriminar os diferentes tipos de tecido, condicionados pela distribuição de um conjunto de características1extraídas através das intensidades de um ou mais protocolos de RM. Posteriormente,

na fase de teste, é efetuada a classificação de cada ponto da imagem (voxel), sendo-lhe atribuído uma classe por parte do classificador. O desempenho do classificador é extremamente influenciado pelo pro- cedimento de amostragem e a respetiva fase de treino, pois são fatores chave em assegurar um modelo com capacidade de generalização [25, 31].

Tal como foi descrito, um modelo discriminativo requer um conjunto de características extraídas para cadavoxeldo volume da RM. A extração de características tem como ponto de partida a informação for- necida pelas intensidades da RM. Daí que uma vantagem dos modelos discriminativos seja a capacidade em gerar características de elevada dimensão, isto é, que não dependem diretamente do valor das inten- sidades da RM, permitindo a computação de características com uma maior capacidade discriminativa das diferentes classes a segmentar [25, 26].

Os modelos discriminativos podem ainda ser desdobrados em duas subclasses: supervisionados e não supervisionados. Em métodos não supervisionados, tal como a própria designação o indica, os dados de treino não se encontram classificados, sendo o modelo responsável por criar uma estrutura capaz de agrupar os dados num determinado número de classes. Metodologias como k-means [34] (técnicas de clustering) e metodologias fuzzy [35, 36] são incluídas nos métodos discriminativos não supervisionados. No caso dos métodos supervisionados, na fase de treino, existe a informação sobre as classes a atribuir a cada voxel, o que no contexto do problema corresponde à presença de uma segmentação manual de todo o volume cerebral. A vantagem na aplicação de modelos supervisionados é em parte devido ao facto de se desconhecer o modelo de formação dos dados, da RM. Num método

1Do inglês:features

CAPÍTULO 3. ESTADO DA ARTE

supervisionado existe um modelo previamente definido, cujos parâmetros são ajustados ao conjunto de dados de treino. Uma vez determinados os parâmetros do modelo supervisionado estes permanecem fixos. Contudo, a aplicação de métodos supervisionados é condicionada pela existência de uma base de dados com a etiquetação dos dados. Por outro lado, quando o modelo de formação dos dados é conhecido as metodologias não supervisionadas são as ideais, se as inicializações forem as corretas. Nas metodologias não supervisionadas, o modelo é constatantemente adaptado a cada novo conjunto de dados, daí que o tempo de computação desta classe de metodologias é superior [25].

Na área da segmentação tumoral cerebral, os métodos supervisionados representam a metodologia mais recente [25]. Nestes destacam-se asRandom Forests[37] e asSupport Vector Machines[38].

Não obstante, um modelo generativo e um modelo discriminativo apresentam algumas semelhanças. Num modelo generativo, bem como num modelo discriminativo, as intensidades são o ponto de partida das metodologias de segmentação automática. Adicionalmente, ambos os modelos contêm funções probabilísticas que assentam no princípio independente e identicamente distribuído (i.i.d.), o que pode resultar em pontos isolados, ou agrupamentos de pontos, mal classificados [25]. Independentemente do modelo é fulcral assegurar uma coerência na informação das intensidades em diferentes regiões dos diversos pacientes em análise. A fase responsável por garantir tal objetivo é a etapa de pré-processamento, que engloba passos como a correção da falta de homogeneidade2das intensidades da RM, normalização

das intensidades [39, 40] e técnicas de registo linear ou não-linear [41, 42].