ArticuloCientifico

ANÁLISIS DE FRECUENCIA DE VALORES EXTREMOS DE CAUDALES CON EL SOFTWARE HEC-SSP

FREQUENCY ANALYSIS OF EXTREME VALUES FLOW WITH THE SOFTWARE HEC-SSP

Abdón L. Valentín-Miguel

Departamento de Irrigación, Universidad Autónoma Chapingo. Carretera México-Texcoco, km 38.5, Chapingo, Estado de México, C.P. 56230, MÉXICO.

Correo-e: [email protected]

RESUMEN

Se destaca la importancia del análisis de frecuencia de valores extremos de caudales, debido a

que es la base del diseño hidrológico e hidráulico de las obras de infraestructura hidráulica para el

control de avenidas para evitar inundaciones. Se cita la ventaja fundamental del Software HEC-

SSP (Hydrologic Engineering Center - Statistical Software Package) para realizar análisis de

frecuencia de flujos de inundación siguiendo los lineamiento del Boletín 17B “Guidelines for

Determining Flood Flow Frequency”. La metodología consiste en la comparación de resultados

entre este software y una hoja de cálculo de Excel de Microsoft Office 2007® en donde se

programaron 4 distribuciones probabilísticas con el Método de los Momentos, mismos que son

descritos con detalle. Se exponen después los cuantiles calculado a un periodo de retorno de 2, 5,

10, 25, 50, 100, 200 y 500 años para cada uno de los 16 registros hidrológicos, cuyos tamaños

variaron de 11 a 55 datos. Se comparan los datos calculados con los observados con la prueba de

bondad de ajuste de Kolmogorov-Smirnov. Se concluye que el Software HEC-SSP realiza el

análisis de frecuencia por la distribución Normal, Log Normal, Pearson tipo III y Log Pearson

tipo III con el Método de los Momentos, por lo que se tienen los mismos resultados que usando la

1

hoja de cálculo de Excel, presentado la desventaja de no realizar el análisis con la distribución

Gumbel y no tiene una prueba de bondad de ajuste.

Palabras clave adicionales: Boletín 17B, hoja de Excel, distribuciones probabilísticas, Método

de los Momentos.

ABSTRACT

Traducir texto anterior.

Additional key words: Bulletin 17B, sheet of Excel, Probabilistic distributions,

INTRODUCCIÓN

El Software HEC-SSP (Hydrologic Engineering Center - Statistical Software Package), fue

desarrollado por el Centro de Ingeniería Hidrológica del Cuerpo de Ingenieros del Ejército de los

Estados Unidos. Este software permite realizar análisis estadísticos de datos hidrológicos. La

versión actual de HEC-SSP puede realizar: 1) Análisis de frecuencia de los flujos de inundación

basada en el Boletín 17B, "Guidelines for Determining Flood Flow Frequency" (1982), 2)

Análisis de frecuencia general en no sólo datos de flujo, sino también en distintos datos

hidrológicos y 3) Análisis de frecuencia duración-volumen.

En el Sureste Mexicano, en especial de ríos ubicados en las regiones hidrológicas 23 y 30 tienen

una historia de inundaciones dramáticas en los últimos 10 años. En dichas regiones hidrológicas

resulta importante la determinación de cuantiles para varios periodos de retorno, ya que basados

en dichos valores se realiza una prevención y combate de inundaciones. Ante la importancia de

2

evitar inundaciones, se han diseñado y construido estructuras de control de avenidas para ciertos

periodos de retornos, es por ello la importancia de caracterizar la ocurrencia de los valores

extremos.

El objetivo del presente estudio tiene la finalidad de conocer la funcionalidad (exploración) de

este nuevo software para las condiciones de información hidrológica que se tienen de México y

comparar los resultados entre este nuevo software con los de una hoja de cálculo de Excel que

realiza la estimación de parámetros de una función de probabilidad con el Método de los

Momentos.

MATERIALES Y MÉTODOS

Información hidrométrica utilizada

Ésta corresponde a la disponible sobre caudales máximos anuales (m3/s) en el sistema BANDAS

(IMTA, 2009), para las estaciones hidrométricas de la región hidrológica número 23 Costa de

Chiapas y 30 Grijalva-Usumacinta, con más de 10 años de datos. Con esa restricción se

obtuvieron 16 estaciones hidrométricas cuyas características generales se presentan en el cuadro

1.

Cuadro 1. Estaciones Hidrométricas de las Regiones Hidrológicas 23 y 30.

Región Hidrológica Nombre del Río Estación Hidrométrica Clave del BANDAS23 Costa Chiapas Coatán Coatán 23006

Huixtla Huixtla 23008Huehuetán Huehuetán 23020

30 Grijalva Usumacinta Mezcapala Las Peñitas 30015Reforma 30051

Usumacinta Boca del Cerro 30019El Tigre 30095

Grijalva Puente Colgante 30014Arco de Piedra 30030Mal Paso II 30076

3

Gaviotas II 30083Puente Colgante II 30089Grijalva 30098La Angostura 30128Chicoasen 30129

Acala 30210

Análisis estadístico previo de los datos

Para que los resultados de los análisis probabilísticos sean teóricamente válidos, la serie de datos

históricos debe satisfacer ciertos criterios estadísticos: aleatoriedad, independencia,

homogeneidad y estacionalidad (Campos, 2006). La aleatoriedad significa que las fluctuaciones

de la variable son originadas por causas naturales; la independencia se refiere a que ningún dato

de la serie está influenciado por valores anteriores, o que él no influye a los posteriores; la

homogeneidad implica que los datos proceden de una misma población y, finalmente, la

estacionalidad significa que las propiedades estadísticas de los datos no cambian en el tiempo.

Los registros de lluvias máxima anuales en general son aleatorios y muestran independencia.

Función de distribución Normal

La solución inversa de la función Normal que permite el cálculo de una predicción X es:

X=μ+z∗σ (1)

donde μ y σ son los parámetros de la distribución (media y desviación estándar respectivamente)

y z es la variable normal estandarizada. Utilizando la hoja de cálculo se Excel se escribir la

función “= PROMEDIO(se eligieron todos los datos)” en una celda al final del conjunto de

4

datos, con ello se obtuvo la media (μ), en la siguiente celda se escribió el comando

“=DESVEST(todos los datos)”, esto para calcular la desviación estándar (σ ) del conjunto de

datos de flujo máximo. Teniendo estos parámetros estadísticos, se procedió a construir una tabla

con los periodos de retorno (Tr) más destacables y comunes, estos son: 2, 5, 10, 25, 50, 100, 200

y 500 años, a los cuales se les calculó la probabilidad (F(x)). F(x) es la probabilidad de no

excedencia [P(X≤x)], cuyo recíproco de su diferencia con la unidad corresponde al periodo de

retorno (Tr). Para encontrar el cuantil (X) de la distribución Normal, se escribió la función

=DISTR.NORM.INV(F(x), μ, σ ) que el software de Excel trae cargado por defecto, esta función

se escribe para cada frecuencia, siendo constantes la media y desviación estándar.

Utilizando el software HEC-SSP, después de crear un nuevo proyecto de estudio, al igual que de

importar los datos con la opción Data→New→MS Excel, se eligió el menú

Analysis→New→General Frequency Analysis. Con lo cual se muestra la Figura 1.

Figura 1. Ventana principal del análisis de frecuencia del software HEC-SSP.

5

En la ventana que nuestra la Figura 1 se eligió la opción “Don not use Log Transform”, después

se di clic en la pestaña Analytical y en el campo Distribution se eligió la opción Normal, por

último se presiono el botón Compute, con lo cual se obtuvieron los cálculos de los cauntiles a un

periodo de retorno dado, esto se muestra en la pestaña “Tabular Results” (Figura 2).

Figura 2. Ventana del software HEC-SSP para elegir la función de distribución.

Función de Distribución Log-Normal

Este procedimiento es el mismo realizado para la distribución Normal, excepto que en esta

distribución se toma el logaritmo de base 10 del conjunto de datos, con el cual se calcula la media

y la desviación estándar. En la hoja de Excel se escribe la función

=10^(DISTR.NORM.INV(F(x), μ, σ )) obteniendo con ello los cuantiles para distintos periodos

de retorno, al cambiar el valor de la probabilidad según corresponda al Tr.

6

Utilizando el software HEC-SSP, se realizó el mismo procedimiento con la diferencia que se

eligió la opción “Use Log Transform” de la ventana que muestra la Figura 1. Después de este

paso, estando en la ventana que muestra la Figura 2, en el campo Distribution se eligió la opción

Log Normal, con lo que se obtuvieron los cuantiles de esta distribución en la pestaña “Tabular

Results” (Figura 2).

Función de Distribución Pearson tipo III

También conocida como distribución gamma de tres parámetros, para esta distribución el cálculo

de una predicción X es:

X=μ+k∗σ (2)

donde μ y σ son los parámetros de la distribución (media y desviación estándar respectivamente)

y k es el factor de frecuencia. En la hoja de cálculo de Excel, esta distribución emplea α y β los

cuales son parámetros de distribución, el valor de α se obtiene con la ecuación:

α=( 2Cs )

2 (3)

donde Cs es el coeficiente de sesgo de la muestra, el cual se obtiene escribiendo la función

“=COEFICIENTE.ASIMETRIA(datos)”, por el contrario β solo puede adquirir un valor

verdadero o falso, cuando β = verdadero se sigue una distribución gamma estándar. Teniendo el

valor de α se calculó la distribución Gamma inversa (Ginv) escribiendo la función

“=DISTR.GAMMA.INV(F(x), α, VERDADERO)” con ello se calculo el valor de k con la

siguiente expresión:

K=(GINV∗Cs2 )−( 2Cs )

(4)

Una vez calculado k se aplico la ecuación 2, utilizando la μ y σ del conjunto de datos observados.

7

Utilizando el software HEC-SSP, se eligió la opción “Do not use Log Transform” de la ventana

que muestra la Figura 1, al igual que para la distribución Normal. Después de este paso, estando

en la ventana que muestra la Figura 2, en el campo Distribution se eligió la opción Pearson III,

con lo que se obtuvieron los cuantiles de esta distribución en la pestaña “Tabular Results” (Figura

2).

Función de Distribución Log-Pearson tipo III

En este método al conjunto de datos de caudales máximos se les cálculos el logaritmo de base 10

para trabajar con estos últimos, al igual que en las distribuciones anteriores, se calculo la media,

desviación estándar y coeficiente de sesgo de la muestra.

Utilizando una hoja de Excel se calcularon los parámetros estadísticos (µ, σ, Cs) de los datos

transformados a logaritmos de base 10, el valor del coeficiente de sesgo (Cs) se tomo como dos

valores, el primero representado como el Cs truncado a una decima y el según valor fue el valor

truncado mas una decima; con estos dos valores y quedando entre ellos el Cs calculado, se

realizaron interpolaciones para determinar el valor de K que le corresponde de acuerdo a un Tr

dado (Cuadros 2 y 3). Continuando se aplica la ecuación 2 obteniendo el gasto máximo para un

periodo de retorno nado.

Utilizando el software HEC-SSP, se eligió la opción “Use Log Transform” de la ventana que

muestra la Figura 1, al igual que para la distribución Log Normal. Después de este paso, estando

en la ventana que muestra la Figura 2, en el campo Distribution se eligió la opción Log Pearson

III, con lo que se obtuvieron los cuantiles de esta distribución en la pestaña “Tabular Results”

(Figura 2).

8

Cuadro 2. Valores de KT para la distribución Log Pearson tipo III. Fuente: U. S. Water Resources Council (1981).

9

RESULTADOS Y DISCUSIÓN

Generalidades

Se produjeron los mismos resultados al utilizar una hoja de cálculo de Excel y el Software HEC-

SSP para los l6 registros hidrológicos, excepto para la distribución Pearson tipo III de los datos

de la región hidrológica La Angostura, ya que Excel produjo un resultado incoherente y el

software no, los cuales se muestran en el Cuadro 3. Para simplificar el numero de cuadro no se

presentaran los cuantiles calculados para distintos periodos de retorno, si no solo para un Tr más

significativo siendo este de 100 años de retorno.

Cuadro 3. Cuantiles obtenidos con un Tr de 100 años en Excel y con HEC-SSP.

Distribución Normal

Distribución Pearson tipo III

Distribución Log Normal

Distribución Log Pearson tipo III

Estaciones Coatán 975.24 1359.06 1359.16 1811.91Huixtla 625.18 710.32 1416.59 693.25Huehuetán 815.02 987.65 1040.25 873.29Puente Colgante 4416.59 5812.55 4601.99 6310.74Las Peñitas 7621.70 8737.27 9723.07 9704.00Boca del Cerro 7781.93 8150.07 8231.08 8246.65Arco de Piedra 2611.11 2679.93 2828.81 2803.85Reforma 1792.12 1859.40 2355.90 2182.51Mal Paso II 6580.24 9434.09 7946.47 10819.04Gaviotas II 1323.14 1362.94 1422.36 1416.52Puente Colgante II 4132.90 4274.73 7266.01 4230.51El Tigre 8338.84 8417.66 8669.88 8498.84Grijalva 3545.51 4361.69 4134.71 5243.89La Angostura 4128.01 4142.25 5867.21 3710.08Chicoasen 5970.36 7829.14 9147.97 7507.81Acala 1177.74 1213.61 1210.44 1225.59

La igualdad de resultados entre la hoja de cálculo de Excel y el software HEC-SSP, se entiende

porque este software utiliza el Método de los Momentos para el cálculo de los parámetros

estadísticos de la muestra de datos obtenidos.

10

Bondad de ajuste

Tomando como medida la prueba de Kolmogorov-Smirnov, se tiene que la distribución de

probabilidad que más se asemeja a los datos observados de caudales máximos para las estaciones

hidrométricas de las regiones hidrológicas número 23 Costa de Chiapas y 30 Grijalva-

Usumacinta es la distribución Log Pearson tipo III, como se muestra en el Cuadro 4 , según la

prueba de Kolmogorov-Smirnov, pero es importante mencionar que esta no se puede recomendar

como la mejor distribución para el análisis de todas las estaciones hidrométricas de México ya

que varía de acuerdo a cada lugar y longitud de registro. Como en Inglaterra la distribución

recomendada es la distribución Log Gumbel y en Estados Unidos la distribución Log Pearson

tipo III.

Cuadro 4. Prueba de bondad de Kolmogorov-Smirnov para las 16 estaciones hidrométricas.

Distribución Normal

Distribución Pearson tipo III

Distribución Log Normal

Distribución Log Pearson tipo III

Estaciones Coatán 0.210 0.135 0.127 0.105*

Huixtla 0.072 0.070* 0.139 0.073

Huehuetán 0.140 0.168 0.160 0.134*

Puente Colgante 0.207 0.142 0.120 0.091*

Las Peñitas 0.112 0.058* 0.071 N/D

Boca del Cerro 0.070 0.044* 0.046 N/D

Arco de Piedra 0.107 0.092* 0.097 N/D

Reforma 0.134* 0.143 0.171 0.164

Mal Paso II 0.169 N/D 0.166 0.138*

Gaviotas II 0.099 0.095 0.092* N/D

Puente Colgante II 0.053 0.047 0.121 0.046*

El Tigre 0.101 0.109 0.128 0.116

Grijalva 0.218 0.144 0.176 0.134*

La Angostura 0.087* N/D 0.168 N/D

Chicoasen 0.157 0.176 0.170 0.145*

Acala 0.121 0.097 0.101 0.093*

* Distribución que más se ajusta a los datos observados.

11

CONCLUSIONES

Se observo el software HEC-SSP realiza el análisis de frecuencia por medio de cuatro métodos de

distribuciones de probabilidad, utilizando el Método de los Momentos para calcular los

parámetros estadísticos y presenta los resultados de manera grafica y en tablas, a demás de

proporcionar un archivo de informe en donde se muestra a detalle los datos de entrada, cálculos

preliminares, cálculos de los cuantiles, limites de confianza, numero de eventos, los parámetros

estadísticos de la muestra y demás.

Se puede concluir que el Software HEC-SSP es una buena herramienta para el análisis de

frecuencia de valores extremos ya que arroja los mismos resultados que se obtuvieron con la hoja

de cálculo de Excel. Pero tiene dos desventajas, la primera es que no realiza el análisis con la

distribución Gumbel y no tiene una prueba de bondad de ajuste, para elegir a la distribución que

más se ajuste a los datos observados.

LITERATURA CITADA

Aparicio, M. F. J. 2001, Fundamentos de hidrología de superficie, Editorial Limusa, D. F. México. pp: 239-282.

Bedient, P. B., Huber, W. C. 2008, Hydrology and Floodplain Analysis, 4ta. Ed. Prentice Hall. U.S.A. pp: 142-156.

Chow, V. T., D.R. Maidment y L. W. Mays, (1994), Hidrología Aplicada, Mc Graw Hill Interamericana, Santa Fe de Bogotá, Colombia. pp: 361-421.

12

Instituto Mexicano de Tecnología del Agua, 2009, Banco Nacional de Datos de Aguas Superficiales (BANDAS). 9 CD´S

Interagency Advisory Committee on Water Data, IACWD, 1982, “Guidelines for Determining Flood Flow Frequency”, Bulletin # 17B of the Hydrology Subcommittee, office of Water Data Coordination, U.S. Geological Survey Reston. 194 p.

13

Date post:	05-Jul-2015
Category:	Documents
Upload:	abdones
View:	426 times
Download:	0 times

ArticuloCientifico

Documents