Alternativ 3 – Nasjonalt helse- - Beskrivelse og drøfting av de

7.5 Beskrivelse og drøfting av de

7.5.3 Alternativ 3 – Nasjonalt helse-

As variáveis que caracterizam as chuvas intensas são a duração, a intensidade e a frequência de ocorrência, também conhecida como período de retorno. Nas avaliações dos riscos de eventos climáticos extremos devem ser aplicados métodos para estimar estatisticamente seus períodos de retorno a partir dos dados medidos e coletados (GUIMARÃES, 2011). Neste sentido, pode- se representar a chuvas intensas através de alguma distribuição teórica de probabilidade, onde os coeficientes das equações intensidade-duração-frequência (IDF) são obtidos com base nas alturas pluviométricas, estimadas pela função teórica de distribuição de probabilidade, para diferentes períodos de retorno.

O método estatístico para determinação de valores máximos de variáveis hidrológicas é denominado “Análise de Frequência”. O primeiro objetivo da análise de frequência é relacionar a magnitude de eventos extremos com suas frequências de ocorrência, através do uso das distribuições de probabilidade.

A análise de frequência de dados hidrológicos ou método estatístico envolve, basicamente, as seguintes etapas: seleção da série de dados de precipitações máximas anuais (amostra), que deve satisfazer os critérios estatísticos de aleatoriedade, independência, homogeneidade e estacionariedade, além de ter sido objeto de verificações de valores atípicos (outliers); propor uma ou algumas distribuições teóricas de probabilidade; realizar a estimativa de seus respectivos parâmetros e ajustar a melhor distribuição probabilística teórica aos dados

92 utilizando as técnicas disponíveis e; utilização da distribuição ajustada para inferir comportamentos referente à população, como por exemplo o período de retorno.

Período de retorno ou intervalo de recorrência de um evento extremo é o período de tempo médio, em anos, em que um determinado evento hidrológico é igualado ou superado pelo menos uma vez (GALLO, 2007). Para Naghettini e Pinto (2007) e Salas e Obeysekera (2014) o período de retorno, também denominado por tempo de retorno, está associado à probabilidade anual de excedência. Podendo ser definido como o inverso da probabilidade de excedência, sendo expresso por meio da equação

𝑻(𝒙_𝑻) =_{𝐏(𝐗>𝐱}𝟏

𝑻)= 𝟏

𝟏−𝐅𝑿(𝐱𝑻) , (02)

em que FX (XT ) é probabilidade de não excedência.

Há uma grande variedade de funções teóricas de distribuição aplicados em análises de eventos extremos hidrológicos (como precipitações ou vazões máximas ou mínimas), entre as quais pode-se destacar: Gumbel, Log-Pearson III, Log-Normal, Normal, Exponencial, Weibull, Fréchet, Distribuição Generalizada de Valores Extremos (GEV), que engloba as de Gumbel, Fréchet e Weibull), e a distribuição Generalizada de Pareto (ELSEBAIE, 2011; BEM-ZVI, 2009; NAGHETTINI, PINTO, 2007; ALVES et. al.,2013). No geral é preciso identificar, entre as diversas funções de distribuição de probabilidades conhecidas, aquela que melhor se ajusta aos dados disponibilizados para análise.

Para estudos de precipitações máximas tem sido bastante utilizado as funções de distribuição de Gumbel, GEV e LogPearson III. De todas as distribuições, a de Gumbel é a mais usada, não somente pela sua adequação às séries de precipitações máximas, para identificar o período de recorrência de eventos extremos de chuvas intensas, mas também pela simplicidade dos cálculos para estimação de seus parâmetros (HAKTANIR et al, 2010). Ainda segundo Haktanir et al (2010), nas últimas duas décadas, a distribuição GEV vem sendo a mais utilizada para análises de frequências, tanto para séries de picos anuais de enchentes quanto para precipitações máximas anuais. Já a distribuição Log-Pearson tipo III é mais utilizada nos Estados Unidos, onde o Conselho de Recursos Hídricos recomenda seu uso em projetos hidrológicos (MILLINGTON et al, 2011). No Brasil é mais comum a utilização da função Gumbel, com ajustes dos dados às funções densidade de probabilidade utilizando o teste não-paramétrico de Kolmogorov-Smirnov (OLIVEIRA et. al., 2011; SILVA et. al., 2013).

93 Para esta etapa da pesquisa foram utilizadas as distribuições de probabilidade Log-Pearson Tipo III, Gumbel e Generalizada de Valores Extremos (GEV). Após a aplicação das distribuições de probabilidade, suas respectivas aderências foram testadas utilizando os testes Kolmogorov- Smirnov (KS), Anderson-Darling (AD) e Cramér-von Mises (CVM).

A função GEV possui três parâmetros a serem estimados, quais sejam: forma, escala e posição. O parâmetro de forma representa onde a maioria dos dados está concentrada. O parâmetro de escala descreve quão espalhado a distribuição é; na medida em que o valor do parâmetro cresce, a função se torna mais espalhada. O parâmetro de posição descreve a posição da distribuição em uma dada direção do eixo horizontal (Millington et al, 2011). A Equação 3 descreve a função de probabilidades acumuladas FAP da distribuição GEV.

𝐹𝑦(𝑦) = exp⁡{− [1 − 𝑘 (𝑦−𝛽_𝛼 )] 1/𝐾

} (03) onde:

Fy(y) = probabilidade acumulada de ocorrência de um evento y; κ, α, β, = parâmetros de forma, escala e posição respectivamente.

A distribuição de Gumbel, conhecida também como função de valores extremos do Tipo I, possui apenas dois parâmetros (posição e de escala) e pode ser obtida a partir da função GEV quando k é igual a zero. A Equação 4 descreve a função de probabilidades acumuladas FAP da distribuição Gumbel.

𝐹𝑦(𝑦) = 𝑒𝑥𝑝 [−𝑒𝑥𝑝 (−𝑦−𝛽_𝛼 )] (04)

onde:

Fy(y) = probabilidade acumulada de ocorrência de um evento y;

α, β = parâmetros de escala e posição respectivamente.

A distribuição Log-Pearson Tipo III, também conhecida como função Gamma de 3 parâmetros, é assim denominada por descrever variáveis (ou seu logaritmo) cuja distribuição se comportam como uma função Gamma. A função densidade da distribuição Log-Pearson Tipo III (LPIII) possui uma grande variedade de formas. Para a análise de frequência de eventos hidrológicos máximos, somente as distribuições Log-Pearson Tipo III, com valores de 𝛽 maiores do que 1 e valores de 1

94 do coeficiente de assimetria implicam em 𝛼 < 0⁡e, por conseguinte, em um limite superior para a variável aleatória. A FAP da distribuição Log-Pearson Tipo III é dada por

𝐹𝑥(𝑥) =_{𝛼𝛤(𝛽)}1 ∫ _𝑥1(ln⁡(𝑥)−𝛾_𝛼 ) 𝛽−1

𝑒𝑥𝑝 (−ln⁡(𝑥)−𝛾_𝛼 )

𝑥

0 ⁡𝑑𝑥 , (05)

onde se y =[ln(x)-ϒ] a FAP Log-Pearson Tipo III torna-se:

𝐹𝑌(𝑦) =_𝛤(𝛽)1 ∫ (𝑦)₀𝑦 𝛽−1⁡𝑒𝑥𝑝(−𝑦)𝑑𝑦. (06)

onde:

Fy(y) = probabilidade acumulada de ocorrência de um evento y; α, β, γ = parâmetros de escala, forma, e posição respectivamente.

Conforme menção anterior, uma vez escolhida a distribuição a ser ajustada aos dados amostrais, seus parâmetros devem ser estimados por algum procedimento de otimização. Há uma variedade de métodos de estimação de parâmetros, entre os quais destacam-se: os métodos dos momentos (MOM), de máxima verossimilhança (MVS) e dos momentos-L (MML). Para este trabalho foi escolhido o Método da Máxima verossimilhança (MVS) por ser considerado o método de estimação mais eficiente porque produz os estimadores de menor variância. De um ponto de vista estatístico, maximizar a função de verossimilhança determina os parâmetros que têm maior probabilidade de produzir os dados observados. Entretanto, para alguns casos, a maior eficiência do método MVS é apenas assintótica, o que faz com que sua aplicação a amostras de pequeno tamanho produza estimadores de qualidade comparável ou inferior a outros métodos. O método MVS exige um maior esforço computacional, pelo fato de envolver soluções numéricas de sistemas de equações, frequentemente, não lineares e implícitas, contudo atualmente este não é um grande problema devido à grande capacidade computacional.

Para verificar qual das distribuições possui maior aderência às estimativas das funções de distribuições de probabilidade utilizadas, foram aplicados alguns testes de aderência. Os testes de aderência são utilizados para verificar se, e quanto, as distribuições de probabilidades testadas (distribuições em hipótese) se ajustam de forma correta ou não ao conjunto de dados (amostra finita) em análise. Assim, compara-se as frequências amostrais com as frequências teóricas esperadas pelo modelo probabilístico que se está julgando válido para descrever os dados observados (Naghettini e Pinto, 2007). A estatística dos testes de aderência é calculada pela maior diferença absoluta dada entre as frequências teórica e empírica, isto é:

95 𝐷_𝑚á𝑥 = |𝐹(𝑥)_{𝑒𝑚𝑝í𝑟𝑖𝑐𝑎}𝐹(𝑥)_{𝑡𝑒ó𝑟𝑖𝑐𝑎}| (07)

A diferença Dmax é comparada com o valor crítico Dcrítico para um determinado nível de significância. Sempre que o valor Dmax é inferior ao valor Dcrítico aceita-se a hipótese de que a frequência dos valores observados segue a distribuição teórica. Desta forma, todos os testes de aderência testam a hipótese de determinada distribuição empírica pertencer ou não à determinada distribuição teórica.

Para este trabalho foram utilizados os testes de aderência de Kolmogorov-Smirnov (KS), Anderson-Darling (AD) e Cramér-von Mises (CVM). Estes testes são normalmente recomendados para estudos de extremos hidrológicos (Naghettini e Pinto, 2007). Os testes foram comparados a um nível de 5% de significância.

Em resumo, para cada estação foi realizada os seguintes procedimentos: análise de consistência dos dados; a identificação e a construção das séries de chuvas máximas anuais; a aplicação de testes de verificação da presença de “outliers” e tratamento dos mesmos caso existam; ajuste das distribuições probabilísticas e determinação dos seus respectivos parâmetros; realização de testes de aderência; e análise gráfica. Assim, foi selecionada a distribuição que melhor se ajusta à série de dados disponível e determinado os valores extremos de chuva associados aos períodos de retorno dos eventos, juntamente com seus respectivos intervalos de confiança. Após análise e comparação foi realizado o cruzamento dos resultados obtidos com os eventos ocorridos de desastres naturais dentro das áreas de influências pesquisadas, identificando separadamente o grau de susceptibilidade à desastres naturais, por ocorrência de eventos extremos de precipitação de chuvas. Com base nos resultados obtidos com os processos descritos acima, pode-se descobrir os limiares de acumulado de chuva que desencadearam os eventos de desastres naturais em algumas localidades do Brasil.

A estimação dos parâmetros das funções de distribuição, aplicação dos testes de aderência e plotagem dos resultados foram realizadas com o programa R® com auxílio dos pacotes estatísticos FAdist e Fitdistrplus. A Figura 17 apresenta um organograma da metodologia utilizada no processo de análise de distribuição de frequência utilizada nesta etapa do trabalho.

96 Figura 17 - Organograma da metodologia utilizada no processo de análise de distribuição de frequência utilizada neste trabalho.

In document Organisering og styring av spesialisthelsetjenesten NOU (sider 136-149)