• No results found

As abordagens estudadas compartilham o objetivo comum de resolver o problema de planejamento de rota de aeronaves (trajectory prediction) levando em consideração infor- mações sobre as condições meteorológicas do espaço aéreo. Em geral estas abordagens se diferenciam entre si no que se refere aos parâmetros otimizados e às informações me- teorológicas utilizadas. No trabalho proposto, são utilizados dados de rastreamento de aeronaves e de posições de células convectivas no espaço aéreo. Mais especificamente, é utilizado o Sistema de Tempo Severo Convectivo (STSC) para rastreamento de células convectivas no espaço aéreo brasileiro. Uma grande vantagem dessa fonte de dados com relação às outras fontes de dados vistas é que esta pode ser acessada livremente, podendo assim, ser acessada por outros pesquisadores.

A abordagem proposta difere das abordagens da seção 2.1, modeladas como shortest

path problem, dado que não é permitida uma navegação free-flight, onde aeronaves pos-

proposta, aeronaves navegam o espaço aéreo utilizando aerovias pré-definidas. A aborda- gem também difere dos trabalhos estudados na seção 2.2 no que se refere ao objetivo da solução final. Na seção 2.2 as abordagens se preocupam em trajectory prediction e na pre- dição do horário previsto de chegada (ETA). A abordagem proposta indica a existência de interseções entre aerovias no espaço aéreo e células convectivas, servindo como um serviço auxiliar no processo de tomada de decisões ATM. Entende-se que outros fatores, como de ordem meteorológicas, controle de tráfego aéreo, etc., são tão importantes quanto tempo severo convectivo, por isso deixa-se a cargo das partes interessadas em ATM a decisão final sobre a rota mais eficiente a ser utilizada.

Capítulo 3

Fundamentação Teórica

Este capítulo descreverá os fundamentos teóricos que compreendem conceitos sobre Mi- neração de Dados (Data Mining) e Análise de Agrupamento de Dados (Clustering).

O processo de Descoberta do Conhecimento é utilizado como arcabouço teórico para a formulação da metodologia proposta. Processos, como limpeza, integração, seleção e transformação de dados, são constatados e desenvolvidos na prática na metodologia proposta. Neste capítulo também são apresentados os padrões em Mineração de Dados e é detalhado o padrão de Agrupamento de Dados (Clustering), utilizado na metodologia proposta. Mais especificamente, os algoritmos de clustering estudados nesta seção serão utilizados no processo de delimitação de aerovias, responsável por delimitar as fronteiras das aerovias no espaço aéreo (seção 5.5).

3.1

Mineração de Dados

Mineração de Dados (Data Mining) é o processo de descoberta de padrões de grandes quantidades de dados [10]. Com o crescimento explosivo do volume de dados, resultado do avanço da tecnologia e de ferramentas de coleta e armazenamento de dados, a mineração de dados visa atender a necessidade de se extrair conhecimento dessa vasta quantidade de dados disponível (também chamada de big data). Dessa forma, são necessárias ferramentas poderosas capazes de transformar essa enorme quantidade de dados em conhecimento a ser utilizado no processo de tomada de decisões.

3.1.1

Processo de Descoberta do Conhecimento

O processo de Descoberta do Conhecimento (Knowledge Discovery from Data) tem por objetivo final a obtenção de conhecimento, e segue, de forma geral, as seguintes etapas [10]:

1. Limpeza de Dados - ruídos e dados inconsistentes são removidos.

2. Integração de Dados - dados de múltiplas fontes de informação são combinados. 3. Seleção de Dados - dados relevantes são selecionados do banco de dados para a

tarefa de análise.

4. Transformação de Dados - dados são transformados e manipulados para serem utilizados de forma eficaz no processo seguinte de Data Mining.

5. Mineração de Dados (Data Mining) - métodos / algoritmos inteligentes são apli- cados para a extração de padrões de dados.

6. Avaliação de Padrões (Pattern Evaluation) - identificação de padrões relevantes para a geração de conhecimento.

7. Apresentação de Conhecimento - técnicas de visualização e de representação de conhecimento são utilizadas para apresentar o conhecimento obtido às partes interessadas.

As etapas de 1 a 4 fazem parte do pré-processamento de dados, onde os dados são preparados para a mineração. Nas etapas 5 e 6, padrões relevantes e conhecimento são descobertos e, posteriormente, apresentados aos usuários na etapa 7. As etapas estão ilustradas pela Figura 3.1.

Figura 3.1: Etapas do processo de mineração de dados.

3.1.2

Padrões em Mineração de Dados

No que se refere aos tipos de padrões que podem ser extraídos no processo de mineração de dados, têm-se [10]:

1. Padrões Frequentes, Associações e Correlações - padrões que ocorrem com frequência nos dados resultando na descoberta de associações e correlações.

2. Classificação e Regressão para Análise Preditiva - processo de descoberta de um modelo (função) capaz de descrever classes de dados distintas.

3. Agrupamento de Dados (Clustering) - processo de descoberta de diferentes gru- pos clusters presentes na massa de dados.

4. Análise de Outliers (Outlier Analysis) - processo de identificação e remoção de

outliers presentes na massa de dados (dados que representam ruído ou exceções).

Algumas considerações sobre os padrões apresentados acima são necessárias. No pro- cesso de classificação, os dados vêm categorizados em classes (labels) de antemão. Estes dados e suas respectivas classes são utilizados para a construção de um modelo, repre- sentando a associação entre dado e classe. Dessa forma, o modelo pode ser utilizado na predição de classe de novos dados cujas classes são desconhecidas. Enquanto a classifica- ção prediz categorias (categorical labels), a regressão prediz valores numéricos (numerical

labels).

Ao contrário da classificação e regressão, que analisam dados categorizados em classes (ou labels), o agrupamento de dados (clustering) analisa dados sem levar em conta suas classes, que podem existir ou não. Este processo pode ser utilizado para a geração de classes entre os diferentes grupos de dados, também chamados de clusters. A seguir serão estudadas as técnicas de agrupamento de dados, que serão utilizadas no desenvolvimento do presente trabalho.