diseases. Much of the evolution of health is consistent with the expected changes in disease burden with development

Um modelo é como uma teoria que propõe relações entre variáveis (Triola, 2008). Os modelos estatísticos são expressos em maneira matemática, como equações, onde as relações entre as variáveis podem ser bem definidas (Fielding e Gilbert, 2000). Com o objetivo de analisar conjuntamente a correlação existente entre os valores espectrais e texturais da imagem com os dados dendrométricos obtidos em campo foi usado o método de análise de regressão múltipla.

Em alguns casos, duas variáveis se relacionam de forma determinística, o que significa que, dado um valor de uma variável, o valor da outra fica automaticamente determinado. A análise de regressão simples descreve a relação entre duas variáveis através de um gráfico e da equação da reta que melhor representa a relação entre elas (Triola, 2008). A reta é chamada de reta de regressão, e sua equação é denominada equação de regressão (Tabachnick e Fidell, 2007). A equação de regressão expressa uma relação entre x (chamada de variável explanatória, previsora ou independente) e y (chamada de variável resposta ou variável dependente). Quando utilizamos mais de duas variáveis a regressão torna-se múltipla e assim como a regressão simples temos uma variável dependente, mas agora duas ou mais variáveis previsoras - x1, x2,..., xk (Howel,

ŷ =b0+b1x1+b2x2+...+bkxk+ε (5.17) Onde: ŷ representa a variável dependente esperada, x1...xk as variáveis independentes. Os outros termos são b0 e b1 que são estatísticas amostrais representadas respectivamente no gráfico como intercepto e inclinação da reta. O ε é o valor de erro inserido, uma vez que ŷ é um valor esperado e muitas vezes não o valor real – y (Triola, 2008).

A intensidade da relação linear entre os valores quantitativos emparelhados x e y em uma amostra é medido pelo coeficiente de correlação linear r (Triola, 2008). O coeficiente de correlação linear é também chamado de coeficiente de correlação do produto de momentos de Pearson, ou apenas coeficiente de Pearson (Howel, 2007). O cálculo do coeficiente de Pearson (r) é dado pela Equação 5.18:

∑

∑ ∑

− ∗ − − = 2 2 2 2 ) y ( ) y ( n ) x ( ) x ( n ) y )( x ( ) xy ( n r (5.18)

Onde: r = ao coeficiente de correlação linear para uma amostra; n = ao número de pares de dados presentes;

x = à variável independente e; y = à variável dependente.

Podemos encontrar uma equação linear que expresse y em função de x, se ocorrer uma correlação linear entre as variáveis previsoras e resposta. Todavia, um valor previsto para y não será necessariamente um valor exato, pois além da variável x, há outros fatores que afetam y. Por este motivo o coeficiente de correlação é ajustado levando em consideração estas variações. O coeficiente de determinação (R2) é a quantidade de variação em y que é explicada pela reta de regressão. O coeficiente R2 representa o coeficiente de determinação múltipla que é uma medida de quanto bem à equação de regressão múltipla se ajusta aos dados amostrais (Fielding e Gilbert, 2000).

Se uma equação de regressão múltipla se ajusta bem aos dados amostrais, ela pode ser usada para previsões, sendo assim denominadas de modelos estatísticos. O cálculo do R2 é utilizado para avaliar estes modelos. Um ajuste perfeito é representado por um R2=1 (ou 100%), para um ajuste nulo temos um R2=0 (ou 0%).

O coeficiente R2 pode aumentar pelo simples fato de adicionar mais variáveis à equação. No entanto, isto não significa que a melhor equação de regressão é a que utiliza todas as variáveis disponíveis. Por este motivo, o método de Stepwise foi usado para a

seleção das variáveis que melhor se ajustavam para a construção dos modelos. Este método inclui no modelo, a cada iteração, uma variável independente até encontrar a melhor equação de regressão (Hair et al., 2005). Para que as variáveis fizessem parte da equação, a significância da correlação deveria ser menor que 0,05%.

O resíduo é a diferença entre o valor real e o que foi previsto para a variável dependente. A sua análise é uma importante medida na validação dos resultados da regressão. Os valores explicados pela reta de regressão não podem depender dos dados que não são explicados (Triola, 2008).

O objetivo dos modelos estatísticos é tentar explicar os dados biofísicos adquiridos em campo através dos dados espectrais e de textura. Para isto, os dados biofísicos compõem as variáveis respostas e os dados espectrais e de textura as variáveis previsoras. O resumo geral de todas as variáveis utilizadas pode ser verificado na Tabela 5.9:

Tabela 5.8 – Variáveis utilizadas na etapa de modelagem estatística

Variável Grupo Aquisição Parâmetro

Resposta Biofísico Campo Altura Derivado dos dados de campo DAP AB Volume Densidade Riqueza

Índice de Diversidade de Shannon Índice de Diversidade de Margalef

Abertura do Dossel LAI Previsora Espectral Imagem IKONOS (4m) Banda Azul Banda Verde Banda Vermelha Banda Infravermelha Índice da Razão Simples Índice da Diferença Normalizada

Índice Ajustado para o Solo

Textura

GLCM IKONOS

(1m)

Contraste

Segundo Momento Angular Entropia

Momento da Diferença Inversa Correlação Semi- variograma IKONOS (1m) Nugget Range Sill Slope IGF

Antes de se iniciar as regressões foi realizada uma análise das parcelas e de possíveis presenças de outiliers nos dados. Algumas parcelas levantadas, pela equipe da

UNIMONTES, estão localizadas em áreas fora da vegetação arbórea (áreas de pastagem ou descampadas). Estas parcelas foram excluídas das regressões, uma vez que um dos objetivos da pesquisa é modelar apenas a vegetação ribeirinha arbórea. A identificação destas parcelas foi feita através das visitas de campo, da análise das planilhas do levantamento de campo e dos desenhos das parcelas realizados e sobrepostos às imagens. Os outiliers podem ser definidos como valores amostrais que se localizam muito longe da grande maioria dos outros valores (Triola, 2008). Ao explorarmos um conjunto de dados, os outliers devem ser considerados, pois eles podem influenciar fortemente os resultados das regressões.

Para a identificação dos possíveis outliers um diagrama de dispersão utilizando os dados normalizados (z score) de DAP e altura foi elaborado. Em um diagrama de dispersão, um outlier é um ponto que se situa muito afastado dos demais pontos amostrais. Estes pontos foram identificados e analisados individualmente, tendo como base as planilhas de levantamento de campo. Todas as parcelas consideradas outiliers foram também desconsideradas na etapa de regressão.

Outro objetivo do diagrama de dispersão é de realizar uma possível divisão das parcelas em grupos homogêneos que poderiam ser testados também de forma individual nas regressões. Para etapa, utilizou-se o algoritmo k-means para realizar os agrupamentos das parcelas. As parcelas foram divididas em três classes distintas: grupo 1 - parcelas com menores valores de altura e DAP; classe 2 - grupos com valores medianos de altura e DAP e grupo 3 - parcelas com maiores valores de altura e DAP.

As regressões foram realizadas em cinco etapas diferentes (Tabela 5.10). Em um primeiro momento todas as parcelas selecionadas em cada um dos sítios de análise foram processadas em conjunto (Anexo 4). Este procedimento foi realizado para avaliar a possibilidade de elaboração de modelos explicativos únicos, mesmo com a variação de ambientes ao longo do Rio Pandeiros, e as diferentes datas de aquisição das cenas IKONOS. Nas etapas de dois a quatro, as parcelas foram separadas nos três grupos de vegetação e seus dados foram processados de forma individual, para verificar a influência dos diferentes padrões de estrutura nos resultados dos modelos. A última etapa do processamento envolveu a análise dos dados agrupados por cada cena IKONOS utilizada na constituição do mosaico.

Tabela 5.9 – Regressões realizadas para a elaboração dos modelos. Etapa de

regressão

Sítios Parcelas

1 Catolé, Balneário, Agropop e Pântano todas

2 Catolé, Balneário, Agropop e Pântano grupo 1 de vegetação

3 Catolé, Balneário, Agropop e Pântano grupo 2 de vegetação

4 Catolé, Balneário, Agropop e Pântano grupo 3 de vegetação

5 agrupados por cena IKONOS todas

Após a elaboração das equações os melhores valores de R2 foram escolhidos para o processo de aplicação dos modelos nas imagens de alta resolução. Este processo consiste em aplicar as equações obtidas nas imagens para elaborar mapas explicativos dos parâmetros biofísicos da vegetação ribeirinha arbórea. A análise visual e os coeficientes de determinação foram utilizados para avaliar o resultado final dos modelos.

CAPÍTULO 6 - RESULTADOS

Este capítulo apresenta os resultados de acordo com a metodologia empregada. O capítulo é dividido em seis seções: (i) processamento das imagens Landsat-5 TM; (ii) delimitação da zona ribeirinha e espacialização das parcelas; (iii) análise estatística dos dados biofísicos de campo; (iv) classificação não-supervisionada da vegetação arbórea ribeirinha; (v) textura de imagem e (vi) modelos explicativos da vegetação ribeirinha.

In document Global, regional, and national disability-adjusted life-years (DALYs) for 315 diseases and injuries and healthy life expectancy (HALE), 1990-2015: a systematic analysis for the Global Burden of Disease Study 2015 (sider 47-56)