Em conformidade com as orientações da MDADP, o subprocesso Preparação dos dados
para mineração de processos foi realizado para extrair, avaliar, tratar e exportar os re-
gistros de eventos no padrão XES e fazer mais aprofundada avaliação da qualidade e da semântica dos dados de eventos disponibilizados. A execução desse subprocesso contem- plou as seguintes atividades: Extrair os dados de eventos do processo; Tratar os registros
de eventos; Avaliar a qualidade dos registros de eventos; e Gerar arquivo de logs de even- tos.
A atividade Extrair os dados de eventos do processo utilizando o aplicativo de consulta
pgAdmin III do próprio sistema gerenciador de banco de dados PostgreSQL e a ferramenta
de análise de dados Anaconda.
Esta atividade foi responsável por extrair os dados de eventos, fazer as transforma- ções iniciais necessárias e armazená-los em tabelas temporárias do servidor de banco de dados para posterior utilização nas demais atividades desse subprocesso. Sua realização foi facilitada pela disponibilidade da descrição dos dados produzida na fase anterior da MDADP.
Feita a extração dos dados, a próxima atividade, Tratar os registros de eventos, foi realizada utilizando as mesmas ferramentas e teve como meta fazer tratamentos específicos nos registros de eventos do processo, a fim de prepará-los para atender os requisitos exigidos pela ferramenta de mineração de processos. Essa atividade foi uma das que apresentou maiores desafios de realização. Os principais tratamentos realizados foram:
• Selecionar o conjunto de eventos relevantes;
• Vincular os eventos com as atividades do processo;
• Vincular os eventos com as transições de atividades do processo;
• Agregar os eventos no nível de agregação necessário para os objetivos esperados da mineração de processos;
• Inserir atributos adicionais necessários.
A descrição detalhada da execução dessa atividade, é apresentada no Apêndice C. Concluído o tratamento dos registros de eventos do processo, passou-se para a execução da atividade Avaliar a qualidade dos registros de eventos, a fim de avaliar a existência de problemas que poderiam comprometer a utilização das técnicas de mineração de processos. Como já mencionado na Seção 2.2 do Capítulo 2, a ideia básica da Mineração de Processos é extrair conhecimento a partir de registos de eventos, geralmente disponíveis nos sistemas (de informação) existentes, com o objetivo de descobrir, monitorar e melhorar processos reais.
Portanto, o requisito base para utilização de qualquer técnica de mineração de proces- sos é um conjunto adequado de registros de eventos do processo. Esse conjunto de eventos deve estar registrado sequencialmente de tal forma que cada evento represente uma ati- vidade ou etapa do processo e esteja relacionado com um caso em particular, como por exemplo, uma solicitação de atendimento específica.
Dada a correlação da qualidade dos dados de eventos com a qualidade dos resultados da mineração da processos, faz-se necessário uma avaliação dos critérios de qualidades dos registros de eventos.
Na primeira avaliação de qualidade de dados ocorrida na Fase de Planejamento da MDADP, foi constatado que pelo fato do sistema de gestão da CSTI possuir módulo de
workflow para controlar o processo de atendimento, seus registros são classificados como ⋆ ⋆ ⋆⋆ (quatro estrelas), uma vez que seus eventos são registados automaticamente de uma
forma sistemática e consistente. Ele armazena informações suficientes para a obtenção do conjunto de eventos sequenciais que ocorrem durante a execução de cada solicitação de atendimento, permitindo identificar claramente as atividades e etapas do processo.
Nessa atividade, ocorreu nova avaliação dos eventos a partir dos critérios de qualidade dos dados e como resultado os eventos foram assim classificados:
• Fidedignidade: Existe garantia de segurança para assumir que os eventos regis- tados foram realmente executados. No entanto, as informações de data e hora dos eventos podem em alguns casos não refletir a realidade do processo de atendimento, pois existem casos que o técnico realiza a atividade, mas registra no sistema em momento posterior.
• Completude: Existe garantia de que os registos de eventos são completos, visto que o fluxo do processo é controlado pelo sistema e operações realizadas são automa- ticamente registradas nos eventos armazenadas. Constatou-se ainda que o sistema armazena mais informações que o necessário para a mineração de processo e por isso foi necessário descartar alguns registros, de acordo com o que foi descrito na atividade anterior desse subprocesso.
• Clareza: Existe garantia de que os evento registado tem uma semântica bem de- finida. Todavia, essa semântica é registrada em forma de categoria de operação realizada no sistema. Isso exigiu a derivação da semântica dos conceitos de ativi- dade e transição de atividade para facilitar a mineração do processo e a interpretação dos resultados.
• Segurança: A privacidade e segurança é levada em conta no registro dos eventos e os envolvidos têm conhecimento dos tipos de eventos que estão sendo registados, inclusive esses eventos são acessíveis, tanto aos técnicos, quanto ao solicitantes, por meio de interface do sistema de gestão. Além do mais, esses eventos são usados no dia-a-dia para rastrear as operações realizadas requisição de serviços de CSTI. Assim, fica evidente que os dados de logs de eventos disponíveis na base de dados do Citsmart são adequados para a aplicação de técnicas e mineração de processos e plena- mente compatíveis com os objetivos da pesquisa.
Verificada a qualidade dos dados, conclui-se haver segurança sobre a viabilidade da aplicação das técnicas de mineração de processos. Passou-se, então, para a execução da última atividade deste subprocesso: Gerar arquivo de logs de eventos.
Os dados foram primeiramente exportados do sistema de gerenciamento em formato CSV, em seguida foram utilizadas as funcionalidades do pacote python XES.py, descrito na Seção 3.4 do Capítulo 3, com intenção de gerar arquivos no padrão XES.
Terminada a geração dos arquivos de eventos, conclui-se com sucesso a execução do subprocesso Preparação dos dados para mineração de processos e passou-se para a execu- ção do subprocesso Mineração de processos.
A realização do subprocesso Preparação dos dados para mineração de processos foi de suma importância, porque permitiu a produção do arquivo de eventos para aplicação de técnicas de mineração de dados, além disso, promoveu uma profunda avaliação da qualidade e da semântica dos dados de eventos disponibilizados.