6. Presentasjon av rekrutteringskanaler
6.2 Formelle rekrutteringskanaler
Com base nos dados coletados a partir dos três experimentos realizados em diferentes sites sobre o “Arco do Desflorestamento” foi possível obter diferentes redes neurais artificiais numa tentativa de inferir a influência de diferentes tipos de variáveis sobre o fluxo de gás carbônico da região.
O conjunto de dados de cada um dos sites estudados foi devidamente “integrado”, isto é, os dados de fluxo foram combinados com os dados meteorológicos, que por sua vez, foram postos juntos aos dados obtidos via satélite. É importante ressaltar que os dados de fluxo possuem intervalo amostral de 30 minutos, enquanto os dados de satélite são pontuais, ou seja, ocorre uma passagem em um intervalo curtíssimo de tempo, que registra um valor referente a um único minuto; e os dados meteorológicos apresentam intervalos de tempo variados, portanto, fez-se necessária uma integração da base de dados para que todos os dados retratassem o mesmo momento de medição.
A partir da “integração” de toda a base de dados foi possível fazer uma análise mais robusta do conjunto, a fim de serem utilizados como inputs para as redes neurais artificiais. Alguns cuidados foram tomados com os inputs para se evitar análises errôneas das saídas, por exemplo, os pontos associados a valores de u* menores que 0,2 ms-1 foram excluídos do processo de treinamento, teste e validação, para se evitar eventos de calmaria, que poderiam comprometer os dados de fluxo de CO2 obtidos através da técnica da covariância dos vórtices
turbulentos. Além disso, foram excluídos dos conjuntos de inputs todos os dados acima ou abaixo de três desvios padrão, por serem considerados outliers. A partir deste tratamento foi possível iniciar os estudos com as redes neurais artificiais.
As variáveis utilizadas para treinar as redes neurais artificiais foram: a radiação fotossinteticamente ativa incidente em superfície (PARi), em Wm-2, a partição da radiação fotossinteticamente ativa na forma difusa (PARdif), em %, derivada do método de Reindl (1990) (apresentado no Apêndice A), o ângulo zenital solar (SZA), em graus, a temperatura média do ar no dossel (T), em graus Celsius, o déficit da pressão de vapor (VPD), em kPa, a velocidade de fricção (u*), em ms-1 e a profundidade óptica do aerossol em 550 nm
(AOD550nm). Portanto, sete variáveis foram usadas como inputs das redes neurais artificiais e
uma como output, o fluxo de gás carbônico (FCO2), em mol CO2 m-2s-1.
Foram geradas 200 redes neurais para cada um dos três sites e, apenas a com menor erro foi avaliada. Do conjunto total de dados, aleatoriamente, 70% foram utilizados no processo de treinamento das redes neurais artificiais, 15% no processo de validação e 15% para teste.
As melhores ANNs de FCO2 encontradas para cada um dos sites apresentaram
algumas semelhanças na forma em que foram construídas. Todas as três foram geradas a partir do modelo de treinamento RBF (Radial Basis Function), utilizaram uma função gaussiana para a ativação das hidden units e a função identidade para a ativação do output. Contudo, as redes diferiram entre si quanto ao número de hidden units. A rede gerada para a Ilha do Bananal apresentou 30 hidden units, a gerada para Sinop utilizou 21 e para a Rebio Jaru, 19. Basicamente, quanto maior for o número de hidden units em um modelo de rede neural, mais robusto será o modelo, isto é, a rede neural possui uma maior capacidade de modelar relações mais complexas.
Ao final, porém, o número de hidden units fornece um indicativo de que a base de dados dos três sites analisados apresentaram complexidades distintas na relação entre as variáveis apresentadas no momento da construção das redes, no entanto, as funções que melhor conseguiram descrever estas relações foram as mesmas, e o que as difere entre si, é a grandeza dos erros.
A Figura 4.2.1 mostra o conjunto de dados de FCO2 utilizados para validação,
medidos pelo método de eddy covariance, no eixo horizontal (Eddy), e obtidos pelas ANNs, no eixo vertical, com o respectivo coeficiente de Pearson, a RMSE e a MAE, para os três sites estudados. E a Tabela 4.2.1 mostra a quantidade de dados utilizados como inputs das redes neurais artificiais criadas, o tipo de dado gerado por ela, ou seja, a média, o desvio padrão, os valores máximo e mínimo e os erros associados aos valores utilizados para a validação, retirados da Figura 4.2.1.
a. Ilha do Bananal - T
b. Rebio Jaru - RO
c. Sinop - MT
Figura 4.2.1. FCO2 ( mol
obtidos pelas ANNs, com (espessa) e a reta ajustada (d
TO
ol CO2 m-2s-1) obtidos pelo método eddy co
m respectivo coeficiente de Pearson, RMSE a (delgada) também são mostradas.
covariance (Eddy) vs.
Tabela 4.2.1. Dados gerados a partir das Redes Neurais Artificiais para os três sites e respectivos erros associados aos dados de validação.
Ilha do Bananal - TO Rebio Jaru - RO Sinop - MT
Nº de Inputs 330 162 237 Tipo de Dado Média -7,1 -12,4 -17,3 Desvio Padrão 2,4 5,0 3,7 Máximo -1,2 0,7 -9,7 Mínimo -14,3 -22,5 -28,3 Erros Pearson 0,57 0,82 0,58 RMSE 3,2 4,3 5,7 MAE 2,4 3,6 4,8
O site da Rebio Jaru apresentou o maior coeficiente de Pearson (0,82) dos três sites avaliados, que representa uma alta correlação entre os dados observados e os gerados pelo modelo. Este site foi o único que apresentou cobertura diária contínua de dados de AOD550nm,
isto é, várias medições ao longo do dia. A partir disso, foi possível construir uma série de dados que continha um registro da variação diurna das variáveis. Nos demais sites, um único dia possuía no máximo dois pontos de dados de AOD, associados às passagens dos satélites TERRA e AQUA. Isto significa que a cobertura diurna contínua dos dados forneceu um melhor mapeamento, pela ANN, do comportamento das variáveis e sua influência no FCO2,
que resultou em uma “previsibilidade” mais robusta. A Figura 4.2.2 mostra a variação diurna do FCO2 obtido pela técnica “eddy covariance”, em comparação aos valores simulados pela
ANN gerada. É possível notar que em todos os dias mostrados na figura, os resultados da ANN seguem a tendência dos dados observados. Durante o período avaliado (agosto, setembro e outubro de 2007), a média do FCO2 observado foi de -12,2 mol CO2 m-2s-1,
enquanto a média do FCO2 gerada pela ANN para o mesmo período foi de -12,4 mol CO2 m- 2
s-1, uma diferença relativa de 1,9%. O site da Ilha do Bananal apresentou os menores valores de RMSE (3,20) e de MAE (2,43), mesmo sem apresentar uma cobertura diária completa, isto é, com no máximo dois pontos por dia. Uma possível explicação para isto é o fato de que este
site possui uma vasta série temporal de dados, de outubro de 2003 a dezembro de 2008, com
320 pontos de input, e a partir daí, foi possível estabelecer um mapeamento mais robusto da descrição da série intrassazonal.
Figura 4.2.2. FCO2 ( mol C
pretos – e obtidos pela AN dias de 2007, na Rebio Jaru
Durante todo o per m-2s-1, enquanto a média diferença relativa pequena,
O site de Sinop foi de Pearson (0,58), quanto dados de tamanho intermed não apresentava dados obse de transferência radiativa transferência radiativa foram neurais. Mesmo assim, a dif ANN foi de 1,2%.
ol CO2 m-2s-1) obtidos pelo método eddy covari
NN – linha vermelha – em relação às horas ( ru – RO.
período analisado, a média do FCO2 observado
a do FCO2 gerada pela ANN foi de -7,1 m
a, 1,3%.
foi o que apresentou as piores avaliações de erro to nos valores de RMSE (5,69) e MAE (4,78
ediário, se comparado aos demais sites (237 po bservados de PAR em superfície, estes foram g
va (libRadtran). Os erros associados às sa ram, de certa forma, incluídos no processo de diferença relativa entre a média do FCO2 obser
ariance (Eddy) – pontos
s (UTC) do dia, de seis
do foi de -7,0 mol CO2
mol CO2 m-2s-1, uma
erro, tanto no coeficiente ,78). Com uma base de pontos), o site de Sinop gerados com o modelo saídas do modelo de e treinamento das redes servada e calculada pela