• No results found

5.1 CONCLUSÕES

Os resultados obtidos através do conjunto de classificadores na classificação de dados geográficos, de natureza multiespectrais e batimétricos, resultaram em 3 mapas te- máticos diferenciados representando os diversos tipos de fundos de interesse para cada uma das estruturas recifais analisadas. A verificação do índice de acurácia e a distribuição espa- cial dos resultados confirmaram que quando os dados de entrada são amostras representati- vas das classes, e os sistemas inteligentes são devidamente treinados para reconhecer as categorias de interesse, essas estruturas constituem um modelo computacional robusto que pode ser aplicado em diferentes situações de classificação.

Para definir os tipos de fundos presentes nas diversas estruturas recifais a partir de um conjunto de dados geográficos, os dados foram pré- processados visando sua compa- tibilização espacial e espectrais. Para isto, os dados batimétricos, as imagens multiespec- trais (Banda ETM+ 1, 2 e 3) e os mapas temáticos da área da APARC necessitaram passar por um refinamento do seu georreferenciamento, através dos dados de campo colhidos a- través de sistema GPS. Em adição, para uma maior compatibilidade dos dados espaciais, foi utilizado um único sistema de projeção, porém, além disso, nenhum outro pressuposto so- bre as propriedades paramétricas dos dados de entrada foi requerido.

O treinamento e validação dos dois conjuntos de SVM usando dados multies- pectrais e batimétricos adquiridos de uma determinada área de trabalho, da qual se tinha uma maior quantidade de dados complementares, e a aplicação posterior destes conjuntos de máquinas aos dados das outras formações recifais, é perfeitamente factível desde que os dados de entrada tenham sido submetidos a um rigoroso procedimento de uniformização.

Uma vez que a idéia inicial era identificar a configuração do conjunto de classi- ficadores, que apresentasse os melhores resultados tanto em relação a acurácia, quanto a uma capacidade de generalização. Os conjuntos de máquinas que produziram os melhores resultados, em relação a acurácia geral alcançada quando da classificação da área de traba- lho (Maracajaú), foram avaliados em relação a sua capacidade de classificação das outras áreas de trabalho (Rio do Fogo e Cioba).

As avaliações realizadas, levaram à conclusão de que apesar das máquinas trei- nadas com base no kernel linear apresentarem os melhores resultados quanto aos índices de acurácia, bem como a melhor performance em relação ao tempo computacional, o mesmo desempenho não foi verificado quando da classificação das formações recifais de Rio do Fogo e Cioba. Uma das razões para que este resultado seja diretamente relacionado à característica dos hiperplanos de separação gerados, quando da utilização do kernel linear no treinamento das SVM. Uma análise final, com base nos diversos resultados apresenta nas duas fases do processamento das imagens, onde foram classificadas as imagens relati- vas às formações recifais de Rio do Fogo e Cioba, demonstrou que a utilização do kernel polinomial apresentou um melhor desempenho quando da análise conjunta do índice acurá- cia e a capacidade de generalização dos resultados em relação às áreas de trabalho de Rio do Fogo e Cioba.

Um ponto importante observado com o desenvolvimento do processo de classi- ficação por etapas de refinamento do processo de classificação dos diferentes tipos de fun- do da APARC, foi a possibilidade de se realizar uma análise da ambigüidade entre as clas- ses, no decorrer das várias etapas do processo de geração da imagem classificada final. O simples procedimento de incorporar as informações, relativas aos falsos positivos associa- dos aos pixels que receberam classificação ambígua, desempenhou um papel importante na discriminação final entre as classes. A partir do conjunto de informações recebidas, que representou um nível de detalhamento significativamente maior em relação à ambigüidade

gerada durante a fase anterior, foi possível aumentar a chance de diferenciar as classes de forma correta, e paralelamente diminuir o tempo de processamento geral, uma vez que se tornou possível processar os pixels ambíguos apenas sobre os falsos positivos recebidos.

A utilização do mapa batimétrico, como mais uma camada de informação de entrada, foi fundamental para caracterizar de maneira mais precisa os diversos tipos de fun- do presentes, indicando os locais onde haveria uma maior probabilidade da existência de determinadas classes, bem como, aquelas áreas onde se poderia esperar um maior índice de confusão.

A possibilidade de utilização do mapa temático da área da formação recifal de Maracajaú (elaborado por Amaral (2003)), desconsiderando as possíveis discrepâncias de- correntes do georreferenciamento em imagens multiespectrais, possibilitou estabelecer um critério quantitativo, e qualitativo, para avaliar o desempenho e validar o conjunto de má- quinas utilizadas nas classificações.

A concepção diferenciada da combinação de vários classificadores, ao invés de um único classificador, no processamento de dados de sensoriamento remoto de ambientes costeiros, surgiu com a perspectiva de se desenvolver um arranjo de classificadores no qual a idéia central era que os erros fossem minimizados através das várias etapas lineares de classificação parciais. Durante os diferentes momentos de processamento, os classificado- res estavam habilitados a utilizar as informações relativas à ambigüidade, encontradas du- rante o processamento dos dados na fase anterior, para aprimorar o seu próprio desempe- nho, criando assim um refinamento sucessivo do processo de classificação, otimizado pela troca de informações.

A escolha do arranjo de classificadores foi inspirada na técnica de análise gra- nulométrica dos solos, que permite identificar o tamanho e a distribuição dos grãos. O pro- cesso é realizado através do peneiramento do material de diferentes aberturas. A idéia cen- tral era que, como acontece na análise granulométrica, a cada etapa do processo uma certa quantidade de pixel pudesse ser identificada de forma não ambígua por um determinado classificador. Assim sucessivamente, como acontece no peneiramento das amostras de so- los, ao final as amostras pudessem ser classificadas sem ambigüidades.

A metodologia empregada neste trabalho, com o uso de múltiplos classificado- res ao invés de um único classificador, e da utilização de máquinas SVM, mostrou-se par-

ticularmente adequada. Os resultados apresentados, quando da avaliação da acurácia, atra- vés da matriz de erro, e da análise visual da distribuição espacial apresentada nas imagens classificadas, corresponderam ao esperado. A comparação dos resultados alcançados com os resultados apresentados pela aplicação de outros classificadores, demonstrou o potencial a ser explorado com a utilização de um conjunto de classificadores e da combinação de classificados binários (SVM) como instrumento de análise de imagens orbitais, particular- mente, para classificação das imagens de áreas submersas, sujeitas aos ruídos provocados pelo efeito atmosférico e da coluna d’água.

5.2 PERSPECTIVAS

Por sua natureza multidisciplinar, várias perspectivas de aplicações podem ser visualizadas a partir deste trabalho. Em relação às questões relacionadas à aplicação de múltiplos classificadores no processamento de dados multiespectrais e geográficos, existem muitos aspectos técnicos que precisam ser mais bem avaliados, dentre eles, podemos citar as diferentes estratégias de combinar os resultados de classificação alcançados por cada um desses classificadores em um único resultado. Questões específicas relacionadas com os procedimentos de correção atmosférica e correção da coluna d’água e sua influência direta na performance dos algoritmos de classificação, quando aplicados em ambientes costeiros, podem ser avaliadas em trabalhos futuros.

Uma outra sugestão, agora relacionado à aquisição de amostras de treinamento representativas, seria a realização de estudo sobre as vantagens de realizar um processa- mento dos dados de entrada no contexto de uma janela (e não apenas pixel a pixel), bem como o tamanho adequado de janela para a extração de características importantes, ques- tões que não foram abordadas nesse trabalho. Em uma outra vertente, a aplicação da Lógica Nebulosa mostra-se como uma vertente a ser explorada para o tratamento das incertezas e ambigüidades enfrentadas durante o processo de classificação, particularmente em relação ao problema das interclasses e as áreas de fronteiras entre os diversos tipos de fundo.

Mesmo aspectos mais básicos relacionados com a definição dos diversos parâ- metros usados no treinamento das SVM, merecem uma avaliação mais aprofundada, inves- tigar o comportamento de misturas de classificadores baseadas em SVM, concebidos com aspectos estruturais e paramétricos diferentes, tais como tipos de kernel estratégias diferen- tes de treinamento e além da possibilidade de utilização de diferentes especialistas em regi- ões diferentes do espaço de entrada constitui em uma perspectiva atraente para a aplicação dessas estruturas, em propostas de classificação de imagens de sensoriamento de áreas cos- teiras. O estudo da utilização da informação de textura, principalmente aquela derivada do índice de fragmentação, pode ter uma contribuição significativa na discriminação das clas- ses com elevado grau de ambigüidade.

Os resultados da aplicação de múltiplos classificadores indicam que esta nova abordagem conduz a ganhos de desempenho e acurácia da classificação e em termos de generalização, quando comparada com a utilização de classificadores e abordagens padrões de SVM, quanto ao tratamento dos falsos positivos recebidos. Em relação aos classificado- res baseados em SVM, devido à grande possibilidade de variar, além do arranjo dos diver- sos classificadores, os parâmetros estruturais e paramétricos da SVM, somadas ao fato de que as SVM apresentam tempos de treinamento consideravelmente menores que vários algoritmos de AM e da vantagem de uma alta capacidade de generalização faz com que as técnicas baseadas em SVM possam ser exploradas em trabalhos futuros.