2.3 Business Intelligence e a Informação Mé-
dica
O conjunto de tecnologias de apoio à decisão dedicado a aplicações ana- líticas que permitem a administradores e analistas adquirir conhecimento a partir do processamento, representação e análise da informação descreve o conceito deBusiness Intelligence [10,43,44].
Nas últimas décadas, o número de serviços e produtos de BItem crescido exponencialmente, assim como o seu uso por parte da classe industrial. Este crescimento é alimentado pelo decréscimo no custo de aquisição e manutenção deTIseSIspara armazenar e processar grandes quantidades de informação, como transações bancárias, etiquetas de RFID, registos de pesquisa, emails, controlo de inventários e muito mais [43]. O BI é agora usado globalmente para a obtenção de conhecimento de forma intuitiva e em tempo real, ele- vando o domínio do apoio à decisão nas mais diversas áreas cientícas [10].
No sector da saúde, o conceito deBItem vindo a ter visibilidade por parte dos prossionais de saúde pela sua aplicabilidade na informação estruturada e não estruturada dos Sistema de Informação [45,46]. As ferramentas de BI vêm dar um aproveitamento benéco aos registos médicos e organizacionais e contribuir para o melhoramento operacional e eciência clínica [47].
As tecnologias de BI incluem várias aplicações de software responsáveis pela extração, transformação e carregamento de informação (processo de Extract, Transform and Load (ETL)), criação de Data Warehouse (DW) e visualização e análise dos dados, através de On-line Analytical Processing (OLAP) [48]. Todos estes métodos permitem desenvolver uma compreensão da dinâmica organizacional baseada na evidência [49].
A arquitetura representativa do processo de BI está presente na gura 2.1 [43]. A informação utilizada pode derivar de várias fontes de dados heterogéneas, de várias unidades hospitalares. Os procedimentos de ETL encarregam-se de limpar e normalizar estes dados, para a sua integração nas tarefas de BI. O DW vai estruturar a informação, para facilitar a sua aná- lise. O acesso e interpretação destes dados utiliza ferramentas de visualização como dashboards eOLAP, que pretendem ajudar na tomada de decisões.
14 CAPÍTULO 2. REVISÃO DA LITERATURA
Figura 2.1: Arquitetura genérica do processo de BI (adaptado de [43]).
2.3.1 Extração, Transformação e Carregamento (ETL)
O aumento explosivo da informação tornou clara a necessidade de gestão de conteúdos integrados. Uma vez que os conteúdos são registados de dife- rentes formas, são necessárias soluções para integrar e unicar a informação, através da interoperabilidade de sistemas heterogéneos [50].A dinâmica ETL representa o fundamento para o processo de Data Wa- rehousing, que soluciona esta questão. O sistema ETL extraí os dados dos sistemas On-line Transaction Processing (OLTP), impõe padrões de quali- dade e consistência, normaliza a informação para que dados de diferentes fontes possam ser utilizados em conjunto e, por m, transmite essa informa- ção para o DW, permitindo a posterior criação de aplicações de BI[51,52].
A primeira fase de qualquer cenário de ETLé a extração da informação, responsável por extrair os dados das diferentes fontes de informação. Cada base de dados tem uma série de características distintas, como a gestão da base de dados, o sistema operativo e diferentes protocolos de comunicação, que precisam de ser controladas e resolvidas para que o processo de extração seja ecaz. A segunda fase é a transformação da informação, onde é efetuada a limpeza e conciliação dos dados recebidos, de forma a evitar inconsistências e denir as dimensões e tabelas de factos. Por último, o carregamento trata
2.3. BUSINESS INTELLIGENCE E A INFORMAÇÃO MÉDICA 15 de transportar os dados para a estrutura alvo multidimensional, acedida pelos utilizadores nais e aplicações do sistema [53,54]. A estrutura genérica deste procedimento está presente na gura2.2.
Figura 2.2: Estrutura genérica do processo de ETL (adaptado de [53]). O desempenho e qualidade destas fases são fundamentais para a confor- midade, precisão e usabilidade do Data Warehouse resultante para posterior representação do conhecimento e tomada de decisões [55].
2.3.2 Data Warehousing
Nos anos 90 o conceito de Data Warehousing foi proposto para solucionar de forma genérica o problema da gestão organizacional da informação vinda de várias fontes de dados, como bases de dados. Hoje em dia, o DW faz parte do processo para a obtenção de conhecimento abrangente e suporte à decisão empresarial em tempo real [5658]. Utilizações bem sucedidas da integração de DW permitem o ajuste e a revisão dos processos de negócio sobre informações de toda a organização e a elaboração de alterações, assim que necessário [59].
Um DW pode estar ligado a um conjunto de Data Marts (DMs), cria- dos para fornecer informações especícas para um grupo de utilizadores ou tarefas de decisão. Os utilizadores nais podem fazer análises e consultas à informação guardada nestas estruturas através da formulação de queries ou ferramentas de visualização como aplicaçõesOLAP [56].
A arquitetura de um DW deve obedecer a um conjunto de característi- cas como a interdependência entre unidades organizacionais, a acessibilidade
16 CAPÍTULO 2. REVISÃO DA LITERATURA para os utilizadores nais, a aplicação de restrições de acesso e a compatibi- lidade com os sistemas de informação e representação adotados pela institui- ção [58].
Na área da saúde, o processo de Data Warehousing permite partilhar a informação clínica ecientemente e integrar os registos eletrónicos produzidos na instituição hospitalar a nível institucional, regional ou até nacional. Esta estratégia, quando bem implementada, é capaz de responder aos desaos do sector clínico: velocidade, variedade, volume e validade [60].
Um vasto número de metodologias para Data Warehousing está presente- mente disponível. Tendo em conta o foco do modelo de negócio e a estrutura dimensional da informação, este projeto adota uma metodologia bottom-up sugerida por Ralph Kimball, descrita posteriormente na secção 4.3 [61].
2.3.3 Visualização da Informação
As ferramentas para a representação e análise da informação dependem do utilizador nal, e podem aceder diretamente à informação do DW ou através de um browser [43,62].
A formulação de queries permitem representar informação relevante a partir de consultas ao DW na forma de dashboards ou outras ferramentas grácas, transformando-a num contexto apropriado e legível. A análise mul- tidimensional tem-se tornado um conceito popular no contexto de BI, e pro- porciona a extensão das capacidades da comunicação por queries. A visu- alização multidimensional capacita os utilizadores com um maior nível de pormenor, determinado dinamicamente. As relações complexas da informa- ção são analisadas através de um processo iterativo que permite uma pesquisa detalhada, e ao mesmo tempo sintetizada e agregada, facilitando o processo de tomada de decisões face a um problema de negócio [62].
On-line Analytical Processing (OLAP)
A tecnologia On-line Analytical Processing surge para responder à ne- cessidade de obtenção de informações que apoiem o processo de tomada de decisões de forma transparente e percetível. OLAP suporta operações de
2.3. BUSINESS INTELLIGENCE E A INFORMAÇÃO MÉDICA 17 ltragem, agregação e rotação, permitindo visualizar a informação multidi- mensional com o detalhe requisitado [63].
Os servidores OLAP são implementados através de Sistemas de Gestão de Bases de Dados (SGBD)relacionais ou dimensionais capazes de computar cubos de dados de forma a aumentar o processamento de queries. A vantagem desta abordagem manifesta-se na indexação de propriedades e rapidez na resposta das queries, proporcionando ao utilizador nal uma visão analítica e global dos dados [43].
As bases de dados OLAP integram as medidas, dados numéricos, e as dimensões, classes para organizar as medidas. Os cubos caracterizam as medidas por nível dimensional e hierarquia que uma dada decisão deve ter em conta [63]. Estes conceitos encontra-se representados na gura 2.3.
Figura 2.3: Representação de uma estrutura OLAP (adaptado de [63]). Cada cubo tem várias medidas (os valores representados nas faces da gura2.3), que dependem das dimensões que se escolhe analisar (neste caso, as dimensões x e y).
As operações comOLAP permitem aumentar e diminuir o nível de agre- gação dos dados, através de tecnologias de roll up e drill down, ao longo de uma ou mais hierarquias dimensionais. As capacidades de slice e dice, permitem selecionar e projetar informação especíca, e o pivot proporciona
18 CAPÍTULO 2. REVISÃO DA LITERATURA a rotação do eixo de dados, para alterar a perceção da informação.
Há várias ferramentas open-source capazes de suportar este tipo de re- presentação multidimensional de dados estruturados em DWs. Na secção 4.5 é descrita a tecnologia Pentaho, utilizada na construção da camada de visualização da informação de GO [63].