• No results found

Concluding Remarks and Further Work

8.1 Further Work

Na simulação sequencial directa dos teores em TPH, para fazer a amostragem do histograma local, são estimados por krigagem simples a média e variância locais. Para aferir a melhor forma de incorporação das médias locais, foi conduzido um teste de validação cruzada. O teste consiste em comparar cada valor verdadeiro com os valores simulados segundo as várias variantes.

Neste teste foram seleccionadas aleatoriamente 20% das amostras (31 no total) para conjunto de controlo. Com as restantes 80%, foram simuladas 100 imagens dos teores em TPH da área de estudo. No final, para cada uma das 31 amostras, foram seleccionados os 100 valores simulados e analisados os desvios.

Os testes de simulação foram feitos com duas versões da SSD, respectivamente com um histograma global (versão clássica) e com histogramas locais, condicionados às classes de reacção ao óleo estimadas por krigagem da indicatriz. Na análise foram considerados os 2 cenários de estimação das classes de reacção ao óleo, com 2 e 3 conjuntos de classes. Os valores médios globais e condicionais por classe de reacção ao óleo e por horizonte estão listados nas tabelas 3.5 e 3.6 do capítulo 3. Em conjunto foram testadas sete variantes:

SSD_MG – simulação sequencial directa com médias globais (sem influência das classes de reacção ao óleo) – cenário de referência.

SSD_ML_CRO (01_234)e SSD_ML_CRO (0_1_234) – simulação sequencial directa com médias locais por classe de reacção ao óleo e condicionamento a histograma global. As classes de reacção ao óleo foram tratadas de duas formas: 2 conjuntos (0+1 e 2+3+4) e 3 conjuntos (0, 1 e 2+3+4).

SSD_HL_ML_CRO (01_234) e SSD_HL_ML_CRO (0_1_234) – simulação sequencial directa com médias locais por classe de reacção ao óleo e condicionamento aos histogramas locais. As classes de reacção ao óleo foram tratadas de duas formas: 2 conjuntos (0+1 e 2+3+4) e 3 conjuntos (0, 1 e 2+3+4).

SSD_HL_ML_CRO&Z (01_234) e SSD_HL_ML_CRO&Z (0_1_234) – simulação sequencial directa com médias locais por classe de reacção ao óleo e horizonte (profundidade) e condicionamento aos histogramas locais. As classes de reacção ao óleo foram tratadas de duas formas: 2 conjuntos (0+1 e 2+3+4) e 3 conjuntos (0, 1 e 2+3+4).

Nas figuras 4.14 e seguintes apresentam-se box-plots por amostra dos 100 valores obtidos com a simulação e indica-se também o valor verdadeiro da amostra (asterisco vermelho).

Figura 4.14 – Box-plot por amostra, representando o conjunto de valores simulados e sobreposição do

valor verdadeiro da amostra (asterisco vermelho), cenário base SSD_MG.

Figura 4.15 – Box-plot por amostra, representando o conjunto de valores simulados e sobreposição do

4. SÍNTESE E CONSIDERAÇÕES FINAIS

Figura 4.16 – Box-plot por amostra, representando o conjunto de valores simulados e sobreposição do

valor verdadeiro da amostra (asterisco vermelho), cenário base SSD_ML_CRO (0_1_234).

Figura 4.17 – Box-plot por amostra, representando o conjunto de valores simulados e sobreposição do

Figura 4.18 – Box-plot por amostra, representando o conjunto de valores simulados e sobreposição do

valor verdadeiro da amostra (asterisco vermelho), cenário base SSD_HL_ML_CRO (0_1_234).

Figura 4.19 – Box-plot por amostra, representando o conjunto de valores simulados e sobreposição do

4. SÍNTESE E CONSIDERAÇÕES FINAIS

Figura 4.20 – Box-plot por amostra, representando o conjunto de valores simulados e sobreposição do

valor verdadeiro da amostra (asterisco vermelho), cenário base SSD_HL_ML_CRO&Z (0_1_234).

Na tabela 4.2 listam-se os resultados do teste de validação cruzada. Na tabela consideram-se as seguintes estatísticas:

EM – erro médio, médias dos desvios entre o valor verdadeiro e a média dos valores simulados.

EQM – erro quadrático médio, médias do quadrado dos desvios entre o valor verdadeiro e a média dos valores simulados.

Dispersão – média das variâncias dos valores simulados amostra a amostra. Mede a incerteza na caracterização dos teores, se conhecida a classe de reacção ao óleo.

BB; AA; AB e BA – dados relativos a um teste conduzido com um valor de corte de 1000 ppm. BB é o número de vezes em que o valor verdadeiro e a média dos valores simulados estão simultaneamente abaixo do teor de corte; AA idem ao anterior mas ambos acima. AB e BA significam más estimações, ou seja, contabilização do número de vezes que o valor verdadeiro e a média dos valores simulados não coincidem do ponto de vista de estarem acima ou abaixo do teor de corte.

% acertos – percentagem de amostras bem caracterizadas do ponto de vista de um teor de corte ou seja, 100.(AA+BB)/(AA+BB+AB+BA).

Tabela 4.2 – Análise estatística comparativa da diferença entre o valor verdadeiro e os 100 valores

simulados amostra a amostra.

Método EM EQM Dispersão Teor de corte de 1000 ppm

BB AA AB BA %acertos SSD_MG -833 143,365,815 153,595,448 1 17 13 58 SSD_ML_CRO(01_234) -2,187 136,838,356 179,056,462 3 17 11 65 SSD_HL_MG(01_234) 3,641 167,381,706 11,012,549 2 16 1 12 58 SSD_HL_ML_CRO(01_234) 3,787 169,874,247 11,390,565 8 14 3 6 71 SSD_HL_ML_CRO&Z(01_234) 3,701 170,048,518 13,390,593 7 14 3 7 68 SSD_ML_CRO(0_1_234) -2,732 132,601,795 197,716,833 1 16 1 13 55 SSD_HL_MG(0_1_234) 4,582 174,486,362 5,795,421 12 7 10 2 58 SSD_HL_ML_CRO(0_1_234) 4,653 175,281,736 5,507,754 12 7 10 2 61 SSD_HL_ML_CRO&Z(0_1_234) 4,877 181,361,442 2,890,613 13 5 12 1 58

Estes resultados mostram que:

 Os valores absolutos do erro médio e do erro quadrático médio são muito elevados, o que mostra grande dispersão dos teores.

 As simulações sem condicionamento aos histogramas locais são sistematicamente sobre-estimadas, motivado por uma distribuição assimétrica e positiva dos dados experimentais e que é assumida para toda a área de estudo.

 Os erros quadráticos médios são todos da mesma ordem de grandeza.

 Os valores de dispersão têm 3 patamares, é sempre muito elevado quando se utiliza o histograma global, baixa muito quando se passa a utilizar um histograma local e mais ainda quando se consideram 3 modalidades de classes de reacção ao óleo. Este resultado vai ao encontro do que é esperado, porque se se considerarem histogramas locais a geração dos valores simulados por Monte Carlo é mais restritiva do ponto de vista do universo de soluções.

 No que respeita à análise com o valor de corte a 1000 ppm, os resultados obtidos com histogramas globais são pouco satisfatórios, por sobre-estimação sistemática. Os melhores resultados são obtidos quando se consideram 2 modalidades de classes de reacção ao óleo (0+1 e 2+3+4) e entre estes com médias locais sem discriminação do horizonte (cerca de 71%).

 Quando se consideram histogramas locais, existem valores verdadeiros de algumas amostras que ficam de fora do intervalo de valores simulados (ver figuras 4.18 a 4.21). Isto acontece principalmente quando a classe de reacção ao óleo estimada não coincide com a do valor experimental e então, na fase de simulação, os teores são simulados por Monte Carlo sobre o histograma “errado”. Este facto poderá ser obviado

4. SÍNTESE E CONSIDERAÇÕES FINAIS

em trabalhos futuros, fazendo a mistura ponderada dos histogramas de acordo com as probabilidades estimadas de pertença a cada classe ao invés da imagem binária classificada. A título de exemplo, para a variante SSD_HL_ML_CRO(01_234), se considerarmos apenas os 22 pontos em 31 do total onde a estimação das classes de reacção ao óleo está certa, os valores EM e EQM são respectivamente -28,47 e 2024646, ou seja, os desvios quase não têm enviesamento e têm baixa magnitude média.

Tendo em conta os resultados obtidos, considerou-se esta metodologia de utilização dos histogramas locais como evidenciando potencial para melhorar os resultados da simulação e optou-se por fazer a simulação de imagens com a variante SSD_HL_ML_CRO(01_234), que é aquela que gera a melhor taxa de acertos quando se considera um valor de corte de 1000 ppm, ligeiramente superior a 70%.

Mesmo considerando que a informação secundária é mais densa do que a informação principal, mas não é contínua e necessita de ser estimada, este resultado em particular mostra que existem vantagens na utilização da informação secundária das classes de reacção ao óleo para o controlo da distribuição espacial dos teores.

4.3. C

O

-

SIMULAÇÃO DE

I

MAGENS DOS TEORES EM

TPH

C

ONDICIONADO