4. Fremveksten av frivillighetssentralene 15
4.3 Andre fase: En permanent ordning
A análise de frequência no contexto da hidrologia tem como objetivo relacionar a magnitude de eventos hidrológicos com sua frequência de ocorrência. A aplicação da teoria de probabilidades e da estatística matemática é utilizada para ajustar uma distribuição de probabilidade ao conjunto de observações. Através destas distribuições é possível obter a probabilidade com que uma variável aleatória pode ser igualada ou excedida. Definido um quantil de referência , de modo que o 'sucesso' seja a superação de , então o tempo de retorno , corresponde ao número médio de anos necessário para que o evento { } recorra, em um ano qualquer.
Para aplicação da análise estatística, a variável em estudo deve atender as condições de aleatoriedade, independência, homogeneidade, estacionariedade e representatividade. Outros pontos definidos preliminarmente ao estudo devem ser a determinação da abrangência da análise, local ou regional, e da seleção dos máximos da série, anual ou parcial. Em relação à extensão espacial, a análise local utiliza os registros de apenas uma estação do local de interesse. Na análise regional são utilizadas várias estações selecionadas pelas suas semelhanças fisiográficas e/ou climáticas dentro de uma área geográfica. A abrangência regional é utilizada quando se pretende realizar a transferência de informações de um local para outro ou quando as amostras locais apresentam períodos muito curtos e pretende-se obter valores mais confiáveis na estimação de parâmetros e quantis de distribuições de probabilidades. Os estudos com séries anuais considera apenas um valor máximo (ou mínimo) da variável por ano hidrológico, que corresponde ao período de 12 (doze) meses a partir do início da estação chuvosa até o fim da estação seca. Na avaliação de durações parciais são selecionados registros de magnitudes superiores (ou inferiores) a um determinado limite de referência, sem restrição do período de ocorrência.
Os procedimentos para AFL de séries de vazões máximas anuais são: avaliação dos dados quanto à aleatoriedade, homogeneidade, independência, estacionariedade e representatividade; proposta de distribuições teóricas de probabilidade, com a estimativa de seus parâmetros, quantis e intervalos de confiança; verificação de aderência da distribuição empírica; identificação e tratamento de eventuais pontos atípicos, e caso encontrados, a nova série deverá passar novamente pelas etapas precedentes; e finalmente, a seleção da
distribuição de probabilidade mais apropriada (NAGHETTINI; PINTO, 2007). A definição da posição de plotagem, da distribuição de probabilidade, do método de estimação de parâmetros e os testes de aderência (ajuste à curva teórica) fazem parte das etapas da AFL de séries de vazões máximas anuais.
As variáveis hidrológicas na maioria dos casos não possuem distribuição de probabilidade pré-estabelecida. A seleção das distribuições de probabilidades aptas à modelação de uma determinada variável hidrológica é realizada com base (i) nas características físicas do fenômeno em foco; (ii) em possíveis deduções teóricas quanto às propriedades da variável em questão; e (iii) na aderência da distribuição proposta à distribuição empírica dos valores amostrais.
Os testes de aderência mais empregados na hidrologia estatística são os testes do Qui- Quadrado, o de Kolmogorov-Smirnov, o de Anderson-Darling, e o de Filliben (NAGHETTINI; PINTO, 2007). Também é utilizada a comparação de quocientes de momentos-L (CÂNDIDO, 2003; HOSKING; WALLIS, 1997; LIMA, 2005). Esses testes podem ser utilizados para auxiliar durante o processo de seleção da função de distribuição de probabilidades que mais se adequa para representar a amostra, mas não são suficientes, principalmente no caso de amostras curtas. A escolha da distribuição que melhor represente a população da qual os dados foram extraídos constitui uma das dificuldades no estudo da hidrologia.
2.2.1 Posição de Plotagem
A série de dados, para o estudo de vazões máximas anuais, formada pelo maior valor diário registrado em cada ano hidrológico, deverá ser ordenada de forma decrescente. A probabilidade empírica com que, o valor , entre valores ordenados de modo decrescente, ser igualado ou superado é definida pela sua posição de plotagem, dada por formulações empíricas (ver Quadro 2.2). A posição de plotagem é usada com a finalidade de comparar duas ou mais distribuições de dados, para comparar o ajuste dos dados a uma distribuição de probabilidade, e para calcular as probabilidades de excedência.
A fórmula mais geral para a posição de plotagem é dada por:
Equação 2.1
sendo uma constante; o número de elementos da série; a ordem do elemento da série ordenada de forma crescente (CUNNANE, 1978). Por exemplo, para , obtém-se a
fórmula de Weibull. Outras fórmulas para determinação da posição de plotagem são apresentadas na literatura (CUNNANE, 1978; RAO; HAMED, 2000). A posição de plotagem recomendada (STEDINGER, 1993) para algumas das distribuições de probabilidade são: Blom para as distribuições Normal, Lognormal 2 parâmetros, Pearson III, Log Pearson III; Gringorten para as distribuições de Gumbel, Exponencial; Cunnane para distribuição generalizada de valores extremos (GEV); e Weibull para distribuição generalizada de Pareto (GPA).
Quadro 2.2 - Fórmulas para o cálculo da posição de plotagem F (adaptada de Cunnane (1978); Stedinger (1993); Rao; Hamed (2000)).
Posição de Plotagem Fórmula Motivação Adamowski2 Blom3 (1958)
Quantis não-enviesados para a distribuição Normal. California Chegodayev (1900) Cunnane (1978)
Quantis aproximadamente não-enviesados para quase todas as distribuições
Gringorten (1963)
Otimizada para distribuição de Gumbel
Hazen4 (1914)
Uma escolha tradicional
Hosking (1990) Usada como momento de peso probabilístico
Weibull5 (1939)
Probabilidades de superação não-enviesadas para todas as distribuições
é a probabilidade acumulada de não excedência; é o tempo de retorno (em anos); é a posição na amostra em ordem crescente ; é a posição na amostra em ordem decrescente ; é número de observações.
2.2.2 Distribuições estatísticas
As funções de distribuições estatísticas permitem relacionar os dados hidrológicos com suas frequências de ocorrência. Bobée et al. (1993) apresenta as distribuições mais utilizadas na análise de frequência (ver Quadro 2.3) e propõe uma abordagem sistemática para comparar as distribuições.
2 Adamowski, K. (1981). “Plotting Formula for Flood Frequency”, Water Research Bulletin, Vol. 17, No. 2, pp.
197-202.
3 Blom, G., 1958, Statistical Estimates and Transformed Beta Variables: John Wiley, New York, 68-75, 143-146.
4 Hazen, A., 1914. Storage to be provided in impounding reservoirs for municipal water supply. Trans. Am. Soc. Cir. Eng., Pap. 1308, 77: 1547-1550.
5 Weibull, W., 1939, The Phenomenon of Rupture in Solids: Ingeniors Vetenskaps Akademien Handlinga 153,
Quadro 2.3 - Distribuições utilizadas em análise de frequência de cheias (BOBÉE et al., 1993).
Distribuição Comentário Referência
Normal (N) Horton6 (1913)
Log Normal 2 parâmetros (LN2) Hazen7 (1914)
Pearson tipo 1 e 3 (PIII) Curvas estabelecidas em convenientes formas para
análise de frequência de cheias Foster
8 (1924)
Gumbel (EV1) Gumbel (1941)
Halphen-system Família de 3 parâmetros com estatística suficiente Halphen9 (1941)
Log-normal 3 parâmetros (LN3)
A distribuição de valores extremos tipo I (EVI) é
virtualmente uma caso especial da LN3 Morlat (1956)
Generalizada de valores extremos (GEV)
Chow10 (1954)
Log-Pearson tipo 3 (LPIII) Recomendada por USWRC11 (1967) Beard (1962)
Benson (1968)
Gamma generalizada (GAM) Conhecida pelos hidrologistas como distribuição
Krirsky-Menkel Kritsky e Menkel (1969)
Wakeby (WK5) 5 parâmetros Houghton (1978)
Dois componentes de valores extremos
4 parâmetros Rossi, Fiorentino e Versace (1984) Quadro 2.4 - Funções de distribuição de probabilidade.
Distribuição Parâmetros Função Densidade de Probabilidade Distribuição Acumulada Função de
Normal (N) μ e σ [ ] ⁄ ∫ Log-Normal 2 parâmetros (LN2) com y = ln(x), x > 0 μy e σy [ ] ⁄ ∫
Gama (GAM) e | | ⁄ Integral
Pearson tipo III (PIII) ⁄ ( = assimetria) ⁄ Integral Log-Pearson tipo III (LPIII)
com ⁄ ( = assimetria) ⁄ Integral Valores Extremos tipo – I (EV1) ⁄ e [ ] [ ] Weibul (W) solver [ ] ( ) Generalizada de Valores Extremos (GEV) [ ( )] ⁄ { [ ( )] ⁄ }
6 Horton, R.E., 1913. Frequency of recurrence of Hudson River floods. U.S. Weather Bur. Bull., 2:109-112. 7 Hazen, A., 1914. Storage to be provided in impounding reservoirs for municipal water supply. Trans. ASCE,
Pap. 1308, 77: 1547-1550.
8 Foster, H.A., 1924. Theoretical Frequency Curves and their Application to Engineering Problems. American
Society of Civil Engineers, New York, Vol. 87, pp. 142-173.
9 Halphen, E., 1941. Sur un nouveau type de courbe de fr6quence. C.R. Acad. Sci., 213: 634-635. 10 Chow, V.T., 1964. Handbook of Applied Hydrology. McGraw-Hill, New York.
11 U.S. Water Resources Council (WRC). 1967. A uniform technique for determining flood flow frequencies.
As distribuições mais usuais em hidrologia são a log-normal 2 parâmetros, log-normal 3 parâmetros, Gama, Pearson tipo III, log-Pearson tipo III, Gumbel ou valores extremos tipo – I, Weibull, logística, generalizada de valores extremos, Wakeby 4 parâmetros, Wakeby 5 parâmetros, Pareto generalizada, logística generalizada e Two Component Extreme Value (TCEV). As funções de distribuição de probabilidade para algumas das distribuições são apresentadas no Quadro 2.4.
A literatura oferece vasta apresentação das distribuições de probabilidade, métodos de estimação de parâmetros e testes de aderência, dentre as referências destacam-se os seguintes documentos: NAGHETTINI e PINTO (2007), RAO; HAMED (2000) e USDA (2012).
2.2.3 Métodos de estimação dos parâmetros e testes de aderência
A estimação dos parâmetros das distribuições é usada para produzir as estimativas de parâmetros populacionais a partir de uma amostra. A estimação pontual é mais frequentemente usada em hidrologia. Após a escolha da distribuição de probabilidade a ser ajustada aos dados amostrais, são utilizados os métodos de estimação de parâmetros para obtenção de seus parâmetros. Dentre estes métodos destacam-se o dos momentos (MM), da máxima verossimilhança (MV), dos momentos-L (MML), dos momentos ponderados por probabilidade (MP), da máxima entropia, dos mínimos quadrados (MQ), generalizado dos momentos, e o dos momentos mistos (NAGHETTINI; PINTO, 2007).
Os conceitos para os momentos biased e unbiased apresentados no USDA (2012): um parâmetro é não enviesado ou não tendencioso (unbiased) se a média das estimativas feita a partir de amostras do mesmo tamanho converge para o valor da média da população. Um parâmetro é enviesado ou tendencioso (biased), se a estimativa média não converge para o valor médio da população. Dentre os testes de aderência para a verificação do ajuste da distribuição à série de dados destacam-se o Qui-Quadrado, Kolmogorov-Smirnov, Anderson- Darling, Filiben e o de Momentos e Momentos-L amostrais versus teóricos.