• No results found

Capítulo 4

CAPÍTULO 4 -

TRABALHOS CORRELATOS

O trabalho a ser apresentado neste capítulo servirá de base e comparação quanto à exploração de algumas alternativas uma vez que esta pesquisa de mestrado o estende em alguns aspectos.

Especificação e Avaliação de Algoritmos para Processamento Multidimensional-Geográfico

O trabalho de Medeiros et al. (2008) possui certa similaridade com este trabalho de mestrado e as suas conclusões servirão de base para alguns aspectos a serem explorados.

A motivação destaca o fato de que um DWE precisa de ferramentas e métodos especiais para integrar a execução dos predicados convencional e espacial e cita os trabalhos de Kouba et al. (2002), Ferreira et al. (2001); Sampaio et al. (2006); Bimonte et al. (2007); Rivest et al. (2005) e Scotch e Parmanto (2006) para mostrar que isso é conseguido por meio da “cooperação entre um serviço multidimensional e uma ferramenta geográfica, sendo principalmente da interface gráfica a responsabilidade de abstrair do usuário a complexidade de manipular ambientes que operam separadamente e com linguagens de consulta diferentes”. Também é destacado que tais trabalhos não detalham a forma de execução das consultas.

A partir daí Medeiros et al. (2008) pondera que as consultas em um DWE podem ser de mapeamento (quando os elementos não possuem restrição espacial, i.e. o conjunto-resposta é formado apenas filtrando-se a parte multidimensional (com dados convencionais) e mostrados em um mapa) ou de integração (quando há restrições multidimensional e espaciais).

Por serem o foco do trabalho, as consultas de integração são pormenorizadas, sendo definido o conceito denominado Consulta multidimensional-geográfica de mapeamento como sendo um par ordenado de

Capítulo 4 - Trabalhos Correlatos 58

constantes (consultaMD, consultaGeo), onde consultaMD denota o tipo de consulta Multi-Dimensional enquanto consultaGeo representa o tipo de consulta Geográfica.

Seguindo com o raciocínio, é ponderado que consultas de integração podem ser executadas limitando-se primeiro a parte multidimensional e depois a geográfica – (consultaMD, consultaGeo) – ou invertendo-se a ordem de limitação ao excluir-se primeiro os registros que não satisfaçam a parte geográfica – (consultaGeo,

consultaMD).

Uma segunda definição é feita para uma Consulta multidimensional-

geográfica de integração q onde esta é representada por um par ordenado (𝑥, 𝑦) com 𝑥 𝑒 𝑦 ∈ {𝑐𝑜𝑛𝑠𝑢𝑙𝑡𝑎𝑀𝐷, 𝑐𝑜𝑛𝑠𝑢𝑙𝑡𝑎𝐺𝑒𝑜} e 𝑥 ≠ 𝑦. Usa-se o operador FST(q) (em referência a first do inglês) para identificar o primeiro predicado a ser considerado durante o processamento da consulta q.

Dois algoritmos de execução são então apresentados sendo um para a execução dos predicados multidimensionais antes dos predicados geográficos e vice-versa (chamados MDFirst e GEOFirst, respectivamente).

Uma consideração importante é feita com relação ao tipo de agregação realizada na parte multidimensional das consultas. Shekhar et al. (2001) classifica as funções de agregação em um DW como distributivas (por exemplo, soma, mínimo, máximo e quantidade), algébricas (como média) e holísticas (como percentil, mediana e ranqueamento). Devido à sua característica de precisar acessar diretamente todos os registros do conjunto resposta para gerar um resultado correto, agregações holísticas são uma restrição à ordem de execução dos predicados e devem ser executadas somente após a aplicação da restrição geográfica. Já as funções distributivas e algébricas não restringem a ordem de execução dos predicados.

Após exemplos de tal constatação, o trabalho segue definindo o método de execução dos testes com a definição do esquema dos dados a ser utilizado, a carga dos dados e a definição dos operadores multidimensionais e geográficos a serem utilizados. Em uma parte subsequente, é apresentada uma forma de analisar estatisticamente a amostragem das consultas realizadas (uma vez que nem todas as combinações poderiam ser exercitadas) considerando um intervalo de confiança, a média amostral, o desvio padrão amostral e uma fórmula envolvendo o quartil de uma variável t-Student com n-1 graus de liberdade. Tal análise permite verificar quão distantes dois pares de valores são distintos entre si e onde, caso o intervalo de

Capítulo 4 - Trabalhos Correlatos 59

confiança contenha o valor 0, pode-se concluir que os valores medidos não são significantemente diferentes.

Uma tabela com os resultados obtidos é mostrada ao final do trabalho concluindo-se que grande parte dos testes não apresentaram diferença significativa de desempenho com pequena diferença a favor do algoritmo GEOFirst quando tal diferença foi encontrada. Ao ponderarem sobre uma heurística para decidir qual o melhor algoritmo a ser usado para cada consulta a ser executada, os autores concluíram que não compensaria usá-la uma vez o ganho de tempo na execução das consultas não seria menor a ponto de sobrepujar o tempo dos cálculos adicionais. Uma consequência direta é a redução da complexidade do sistema.

Diferenças e Contribuições

Ao comparar o trabalho de Medeiros et al. (2008) a este trabalho de mestrado, pode-se notar que o primeiro se aplica a DWEs enquanto que esta pesquisa de mestrado enfoca DWETs e, portanto, uma nova definição de consulta se faz necessária para incluir o predicado temporal. Com relação ao escopo, este mestrado fica restrito a consultas de integração (onde todos os predicados estão presentes) e tal consulta pode ser redefinida como Consulta multidimensional-

geográfica-temporal de integração onde um trio ordenado (ao invés de um par

ordenado) pode ser definido com os valores MDFirst, GEOFirst e TIMEFirst para os predicados multidimensionais (chamados de convencionais neste trabalho), geográficos e temporais, respectivamente. A Tabela 2 mostra as principais diferenças encontradas entre os dois trabalhos.

Tabela 2 - Comparativo entre as caraterísticas do trabalho correlato a esta dissertação de mestrado

Trabalho Tipo de DW Tipos de Consultas

Medeiros et al. (2008) DWE Mapeamento e Integração

Trabalho atual DWET Integração

Possíveis contribuições para esta dissertação vêm da consideração da função de agregação na parte multidimensional e da tratativa estatística dos dados. A primeira consiste na diferenciação das funções de agregação dos predicados

Capítulo 4 - Trabalhos Correlatos 60

convencionais em distributivas, algébricas e holísticas para posterior limitação do escopo às funções distributivas e algébricas uma vez que as opções de implementação vistas na proposta de trabalho preveem a livre comutação na ordem de execução dos predicados. A segunda contribuição é a apresentação de uma possível maneira de análise estatística dos dados coletados e que pode se aplicar a este trabalho.

Considerações finais

Mais importante que as semelhanças, o trabalho correlato mostrou importantes diferenças com possibilidade de melhorias à proposta deste trabalho de mestrado.

Até aqui foram apresentados os conceitos teóricos e um trabalho relacionado formando as ferramentas necessárias para a apresentação da metodologia de pesquisa utilizada neste trabalho. Por fim, segundo o nosso conhecimento (orientador e orientando de mestrado), não existem na literatura outros trabalhos que investiguem a influência da ordem de execução de predicados convencionais e espaciais em consultas submetidas a DWEs, ou ainda dos predicados convencionais, espaciais e temporais em consultas submetidas a DWETs.