ANÁLISIS DE FRECUENCIA DE VALORES EXTREMOS DE CAUDALES CON EL SOFTWARE HEC-SSP
FREQUENCY ANALYSIS OF EXTREME VALUES FLOW WITH THE SOFTWARE HEC-SSP
Abdón L. Valentín-Miguel
Departamento de Irrigación, Universidad Autónoma Chapingo. Carretera México-Texcoco, km 38.5, Chapingo, Estado de México, C.P. 56230, MÉXICO.
Correo-e: [email protected]
RESUMEN
Se destaca la importancia del análisis de frecuencia de valores extremos de caudales, debido a
que es la base del diseño hidrológico e hidráulico de las obras de infraestructura hidráulica para el
control de avenidas para evitar inundaciones. Se cita la ventaja fundamental del Software HEC-
SSP (Hydrologic Engineering Center - Statistical Software Package) para realizar análisis de
frecuencia de flujos de inundación siguiendo los lineamiento del Boletín 17B “Guidelines for
Determining Flood Flow Frequency”. La metodología consiste en la comparación de resultados
entre este software y una hoja de cálculo de Excel de Microsoft Office 2007® en donde se
programaron 4 distribuciones probabilísticas con el Método de los Momentos, mismos que son
descritos con detalle. Se exponen después los cuantiles calculado a un periodo de retorno de 2, 5,
10, 25, 50, 100, 200 y 500 años para cada uno de los 16 registros hidrológicos, cuyos tamaños
variaron de 11 a 55 datos. Se comparan los datos calculados con los observados con la prueba de
bondad de ajuste de Kolmogorov-Smirnov. Se concluye que el Software HEC-SSP realiza el
análisis de frecuencia por la distribución Normal, Log Normal, Pearson tipo III y Log Pearson
tipo III con el Método de los Momentos, por lo que se tienen los mismos resultados que usando la
1
hoja de cálculo de Excel, presentado la desventaja de no realizar el análisis con la distribución
Gumbel y no tiene una prueba de bondad de ajuste.
Palabras clave adicionales: Boletín 17B, hoja de Excel, distribuciones probabilísticas, Método
de los Momentos.
ABSTRACT
Traducir texto anterior.
Additional key words: Bulletin 17B, sheet of Excel, Probabilistic distributions,
INTRODUCCIÓN
El Software HEC-SSP (Hydrologic Engineering Center - Statistical Software Package), fue
desarrollado por el Centro de Ingeniería Hidrológica del Cuerpo de Ingenieros del Ejército de los
Estados Unidos. Este software permite realizar análisis estadísticos de datos hidrológicos. La
versión actual de HEC-SSP puede realizar: 1) Análisis de frecuencia de los flujos de inundación
basada en el Boletín 17B, "Guidelines for Determining Flood Flow Frequency" (1982), 2)
Análisis de frecuencia general en no sólo datos de flujo, sino también en distintos datos
hidrológicos y 3) Análisis de frecuencia duración-volumen.
En el Sureste Mexicano, en especial de ríos ubicados en las regiones hidrológicas 23 y 30 tienen
una historia de inundaciones dramáticas en los últimos 10 años. En dichas regiones hidrológicas
resulta importante la determinación de cuantiles para varios periodos de retorno, ya que basados
en dichos valores se realiza una prevención y combate de inundaciones. Ante la importancia de
2
evitar inundaciones, se han diseñado y construido estructuras de control de avenidas para ciertos
periodos de retornos, es por ello la importancia de caracterizar la ocurrencia de los valores
extremos.
El objetivo del presente estudio tiene la finalidad de conocer la funcionalidad (exploración) de
este nuevo software para las condiciones de información hidrológica que se tienen de México y
comparar los resultados entre este nuevo software con los de una hoja de cálculo de Excel que
realiza la estimación de parámetros de una función de probabilidad con el Método de los
Momentos.
MATERIALES Y MÉTODOS
Información hidrométrica utilizada
Ésta corresponde a la disponible sobre caudales máximos anuales (m3/s) en el sistema BANDAS
(IMTA, 2009), para las estaciones hidrométricas de la región hidrológica número 23 Costa de
Chiapas y 30 Grijalva-Usumacinta, con más de 10 años de datos. Con esa restricción se
obtuvieron 16 estaciones hidrométricas cuyas características generales se presentan en el cuadro
1.
Cuadro 1. Estaciones Hidrométricas de las Regiones Hidrológicas 23 y 30.
Región Hidrológica Nombre del Río Estación Hidrométrica Clave del BANDAS23 Costa Chiapas Coatán Coatán 23006
Huixtla Huixtla 23008Huehuetán Huehuetán 23020
30 Grijalva Usumacinta Mezcapala Las Peñitas 30015Reforma 30051
Usumacinta Boca del Cerro 30019El Tigre 30095
Grijalva Puente Colgante 30014Arco de Piedra 30030Mal Paso II 30076
3
Gaviotas II 30083Puente Colgante II 30089Grijalva 30098La Angostura 30128Chicoasen 30129
Acala 30210
Análisis estadístico previo de los datos
Para que los resultados de los análisis probabilísticos sean teóricamente válidos, la serie de datos
históricos debe satisfacer ciertos criterios estadísticos: aleatoriedad, independencia,
homogeneidad y estacionalidad (Campos, 2006). La aleatoriedad significa que las fluctuaciones
de la variable son originadas por causas naturales; la independencia se refiere a que ningún dato
de la serie está influenciado por valores anteriores, o que él no influye a los posteriores; la
homogeneidad implica que los datos proceden de una misma población y, finalmente, la
estacionalidad significa que las propiedades estadísticas de los datos no cambian en el tiempo.
Los registros de lluvias máxima anuales en general son aleatorios y muestran independencia.
Función de distribución Normal
La solución inversa de la función Normal que permite el cálculo de una predicción X es:
X=μ+z∗σ (1)
donde μ y σ son los parámetros de la distribución (media y desviación estándar respectivamente)
y z es la variable normal estandarizada. Utilizando la hoja de cálculo se Excel se escribir la
función “= PROMEDIO(se eligieron todos los datos)” en una celda al final del conjunto de
4
datos, con ello se obtuvo la media (μ), en la siguiente celda se escribió el comando
“=DESVEST(todos los datos)”, esto para calcular la desviación estándar (σ ) del conjunto de
datos de flujo máximo. Teniendo estos parámetros estadísticos, se procedió a construir una tabla
con los periodos de retorno (Tr) más destacables y comunes, estos son: 2, 5, 10, 25, 50, 100, 200
y 500 años, a los cuales se les calculó la probabilidad (F(x)). F(x) es la probabilidad de no
excedencia [P(X≤x)], cuyo recíproco de su diferencia con la unidad corresponde al periodo de
retorno (Tr). Para encontrar el cuantil (X) de la distribución Normal, se escribió la función
=DISTR.NORM.INV(F(x), μ, σ ) que el software de Excel trae cargado por defecto, esta función
se escribe para cada frecuencia, siendo constantes la media y desviación estándar.
Utilizando el software HEC-SSP, después de crear un nuevo proyecto de estudio, al igual que de
importar los datos con la opción Data→New→MS Excel, se eligió el menú
Analysis→New→General Frequency Analysis. Con lo cual se muestra la Figura 1.
Figura 1. Ventana principal del análisis de frecuencia del software HEC-SSP.
5
En la ventana que nuestra la Figura 1 se eligió la opción “Don not use Log Transform”, después
se di clic en la pestaña Analytical y en el campo Distribution se eligió la opción Normal, por
último se presiono el botón Compute, con lo cual se obtuvieron los cálculos de los cauntiles a un
periodo de retorno dado, esto se muestra en la pestaña “Tabular Results” (Figura 2).
Figura 2. Ventana del software HEC-SSP para elegir la función de distribución.
Función de Distribución Log-Normal
Este procedimiento es el mismo realizado para la distribución Normal, excepto que en esta
distribución se toma el logaritmo de base 10 del conjunto de datos, con el cual se calcula la media
y la desviación estándar. En la hoja de Excel se escribe la función
=10^(DISTR.NORM.INV(F(x), μ, σ )) obteniendo con ello los cuantiles para distintos periodos
de retorno, al cambiar el valor de la probabilidad según corresponda al Tr.
6
Utilizando el software HEC-SSP, se realizó el mismo procedimiento con la diferencia que se
eligió la opción “Use Log Transform” de la ventana que muestra la Figura 1. Después de este
paso, estando en la ventana que muestra la Figura 2, en el campo Distribution se eligió la opción
Log Normal, con lo que se obtuvieron los cuantiles de esta distribución en la pestaña “Tabular
Results” (Figura 2).
Función de Distribución Pearson tipo III
También conocida como distribución gamma de tres parámetros, para esta distribución el cálculo
de una predicción X es:
X=μ+k∗σ (2)
donde μ y σ son los parámetros de la distribución (media y desviación estándar respectivamente)
y k es el factor de frecuencia. En la hoja de cálculo de Excel, esta distribución emplea α y β los
cuales son parámetros de distribución, el valor de α se obtiene con la ecuación:
α=( 2Cs )
2 (3)
donde Cs es el coeficiente de sesgo de la muestra, el cual se obtiene escribiendo la función
“=COEFICIENTE.ASIMETRIA(datos)”, por el contrario β solo puede adquirir un valor
verdadero o falso, cuando β = verdadero se sigue una distribución gamma estándar. Teniendo el
valor de α se calculó la distribución Gamma inversa (Ginv) escribiendo la función
“=DISTR.GAMMA.INV(F(x), α, VERDADERO)” con ello se calculo el valor de k con la
siguiente expresión:
K=(GINV∗Cs2 )−( 2Cs )
(4)
Una vez calculado k se aplico la ecuación 2, utilizando la μ y σ del conjunto de datos observados.
7
Utilizando el software HEC-SSP, se eligió la opción “Do not use Log Transform” de la ventana
que muestra la Figura 1, al igual que para la distribución Normal. Después de este paso, estando
en la ventana que muestra la Figura 2, en el campo Distribution se eligió la opción Pearson III,
con lo que se obtuvieron los cuantiles de esta distribución en la pestaña “Tabular Results” (Figura
2).
Función de Distribución Log-Pearson tipo III
En este método al conjunto de datos de caudales máximos se les cálculos el logaritmo de base 10
para trabajar con estos últimos, al igual que en las distribuciones anteriores, se calculo la media,
desviación estándar y coeficiente de sesgo de la muestra.
Utilizando una hoja de Excel se calcularon los parámetros estadísticos (µ, σ, Cs) de los datos
transformados a logaritmos de base 10, el valor del coeficiente de sesgo (Cs) se tomo como dos
valores, el primero representado como el Cs truncado a una decima y el según valor fue el valor
truncado mas una decima; con estos dos valores y quedando entre ellos el Cs calculado, se
realizaron interpolaciones para determinar el valor de K que le corresponde de acuerdo a un Tr
dado (Cuadros 2 y 3). Continuando se aplica la ecuación 2 obteniendo el gasto máximo para un
periodo de retorno nado.
Utilizando el software HEC-SSP, se eligió la opción “Use Log Transform” de la ventana que
muestra la Figura 1, al igual que para la distribución Log Normal. Después de este paso, estando
en la ventana que muestra la Figura 2, en el campo Distribution se eligió la opción Log Pearson
III, con lo que se obtuvieron los cuantiles de esta distribución en la pestaña “Tabular Results”
(Figura 2).
8
Cuadro 2. Valores de KT para la distribución Log Pearson tipo III. Fuente: U. S. Water Resources Council (1981).
9
RESULTADOS Y DISCUSIÓN
Generalidades
Se produjeron los mismos resultados al utilizar una hoja de cálculo de Excel y el Software HEC-
SSP para los l6 registros hidrológicos, excepto para la distribución Pearson tipo III de los datos
de la región hidrológica La Angostura, ya que Excel produjo un resultado incoherente y el
software no, los cuales se muestran en el Cuadro 3. Para simplificar el numero de cuadro no se
presentaran los cuantiles calculados para distintos periodos de retorno, si no solo para un Tr más
significativo siendo este de 100 años de retorno.
Cuadro 3. Cuantiles obtenidos con un Tr de 100 años en Excel y con HEC-SSP.
Distribución Normal
Distribución Pearson tipo III
Distribución Log Normal
Distribución Log Pearson tipo III
Estaciones Coatán 975.24 1359.06 1359.16 1811.91Huixtla 625.18 710.32 1416.59 693.25Huehuetán 815.02 987.65 1040.25 873.29Puente Colgante 4416.59 5812.55 4601.99 6310.74Las Peñitas 7621.70 8737.27 9723.07 9704.00Boca del Cerro 7781.93 8150.07 8231.08 8246.65Arco de Piedra 2611.11 2679.93 2828.81 2803.85Reforma 1792.12 1859.40 2355.90 2182.51Mal Paso II 6580.24 9434.09 7946.47 10819.04Gaviotas II 1323.14 1362.94 1422.36 1416.52Puente Colgante II 4132.90 4274.73 7266.01 4230.51El Tigre 8338.84 8417.66 8669.88 8498.84Grijalva 3545.51 4361.69 4134.71 5243.89La Angostura 4128.01 4142.25 5867.21 3710.08Chicoasen 5970.36 7829.14 9147.97 7507.81Acala 1177.74 1213.61 1210.44 1225.59
La igualdad de resultados entre la hoja de cálculo de Excel y el software HEC-SSP, se entiende
porque este software utiliza el Método de los Momentos para el cálculo de los parámetros
estadísticos de la muestra de datos obtenidos.
10
Bondad de ajuste
Tomando como medida la prueba de Kolmogorov-Smirnov, se tiene que la distribución de
probabilidad que más se asemeja a los datos observados de caudales máximos para las estaciones
hidrométricas de las regiones hidrológicas número 23 Costa de Chiapas y 30 Grijalva-
Usumacinta es la distribución Log Pearson tipo III, como se muestra en el Cuadro 4 , según la
prueba de Kolmogorov-Smirnov, pero es importante mencionar que esta no se puede recomendar
como la mejor distribución para el análisis de todas las estaciones hidrométricas de México ya
que varía de acuerdo a cada lugar y longitud de registro. Como en Inglaterra la distribución
recomendada es la distribución Log Gumbel y en Estados Unidos la distribución Log Pearson
tipo III.
Cuadro 4. Prueba de bondad de Kolmogorov-Smirnov para las 16 estaciones hidrométricas.
Distribución Normal
Distribución Pearson tipo III
Distribución Log Normal
Distribución Log Pearson tipo III
Estaciones Coatán 0.210 0.135 0.127 0.105*
Huixtla 0.072 0.070* 0.139 0.073
Huehuetán 0.140 0.168 0.160 0.134*
Puente Colgante 0.207 0.142 0.120 0.091*
Las Peñitas 0.112 0.058* 0.071 N/D
Boca del Cerro 0.070 0.044* 0.046 N/D
Arco de Piedra 0.107 0.092* 0.097 N/D
Reforma 0.134* 0.143 0.171 0.164
Mal Paso II 0.169 N/D 0.166 0.138*
Gaviotas II 0.099 0.095 0.092* N/D
Puente Colgante II 0.053 0.047 0.121 0.046*
El Tigre 0.101 0.109 0.128 0.116
Grijalva 0.218 0.144 0.176 0.134*
La Angostura 0.087* N/D 0.168 N/D
Chicoasen 0.157 0.176 0.170 0.145*
Acala 0.121 0.097 0.101 0.093*
* Distribución que más se ajusta a los datos observados.
11
CONCLUSIONES
Se observo el software HEC-SSP realiza el análisis de frecuencia por medio de cuatro métodos de
distribuciones de probabilidad, utilizando el Método de los Momentos para calcular los
parámetros estadísticos y presenta los resultados de manera grafica y en tablas, a demás de
proporcionar un archivo de informe en donde se muestra a detalle los datos de entrada, cálculos
preliminares, cálculos de los cuantiles, limites de confianza, numero de eventos, los parámetros
estadísticos de la muestra y demás.
Se puede concluir que el Software HEC-SSP es una buena herramienta para el análisis de
frecuencia de valores extremos ya que arroja los mismos resultados que se obtuvieron con la hoja
de cálculo de Excel. Pero tiene dos desventajas, la primera es que no realiza el análisis con la
distribución Gumbel y no tiene una prueba de bondad de ajuste, para elegir a la distribución que
más se ajuste a los datos observados.
LITERATURA CITADA
Aparicio, M. F. J. 2001, Fundamentos de hidrología de superficie, Editorial Limusa, D. F. México. pp: 239-282.
Bedient, P. B., Huber, W. C. 2008, Hydrology and Floodplain Analysis, 4ta. Ed. Prentice Hall. U.S.A. pp: 142-156.
Chow, V. T., D.R. Maidment y L. W. Mays, (1994), Hidrología Aplicada, Mc Graw Hill Interamericana, Santa Fe de Bogotá, Colombia. pp: 361-421.
12
Instituto Mexicano de Tecnología del Agua, 2009, Banco Nacional de Datos de Aguas Superficiales (BANDAS). 9 CD´S
Interagency Advisory Committee on Water Data, IACWD, 1982, “Guidelines for Determining Flood Flow Frequency”, Bulletin # 17B of the Hydrology Subcommittee, office of Water Data Coordination, U.S. Geological Survey Reston. 194 p.
13