Mar 02, 2024
Firmas de flujo y atributos de cuencas para la agrupación de HCA en una evaluación de similitud hidrológica (caso tunecino)
Scientific Reports volumen 13, número de artículo: 12144 (2023) Cite este artículo 70 Accesos Detalles de métricas Los métodos de partición, como el análisis de conglomerados, son ventajosos para agrupar cuencas en
Scientific Reports volumen 13, número de artículo: 12144 (2023) Citar este artículo
70 Accesos
Detalles de métricas
Los métodos de partición, como el análisis de conglomerados, son ventajosos para agrupar cuencas en regiones hidrométricas similares. Ayudan a superar la escasez de datos en cuencas no calibradas, que es un problema común en las zonas del sur del Mediterráneo. Sin pronósticos precisos, es difícil evaluar y gestionar los recursos hídricos de manera eficiente; esta situación no será de ninguna ayuda para los tomadores de decisiones en materia de hidrología. Este artículo ilustra un caso de aplicación tunecino, cuyo objetivo es agrupar cuencas con un algoritmo de agrupamiento jerárquico (HCA) basado en distancias calculadas en un espacio fisiográfico e hidrométrico multidimensional. La homogeneidad de los conglomerados generados se comprueba mediante el índice de silueta. Luego se comparan las eficiencias de las distancias. Se estudian diecinueve cuencas semiáridas tunecinas monitoreadas desde 1992. En el HCA con dos grupos se consideran doce atributos fisiográficos, nueve señales de lluvia y caudal. La distancia de correlación proporciona los grupos más homogéneos. Estadísticamente: porcentaje de área afectada por prácticas antierosivas, porcentaje de cubierta forestal y área de captación son los atributos más discriminatorios. Sin embargo, las firmas hidrométricas parecen ser irrelevantes. Estas particiones resaltan dos comportamientos hidrológicos diferentes que deben respaldar la previsión. Los resultados son prometedores en el caso del Mediterráneo Sud, donde la escasez de datos hidrométricos es un problema constante. Tienen la ventaja de permitir la predicción hidrológica sin requerir mucha información.
La gestión de los recursos hídricos (por ejemplo, planificación del uso de la tierra, riego, diseño de estructuras hidráulicas, previsión de inundaciones) requiere conocimiento de la cantidad de agua en un sitio o cuenca objetivo. Sin embargo, varias cuencas en muchas partes del mundo no están calibradas o están mal calibradas; esta falta de datos a menudo aumenta con la disminución del tamaño de las cuencas, lo que genera grandes dificultades en su gestión1,2. Por lo tanto, la predicción de la escorrentía en un río o cuenca no aforada se lleva a cabo mediante algún tipo de extrapolación de un sitio aforado a un sitio no aforado, y esto no es sencillo. Ésta es la razón de ser de la iniciativa de Predicción de Cuencas No Medidas (PUB)2. PUB fue diseñado para desarrollar una mejor base científica para la hidrología con mayor consistencia, aumentando las perspectivas de avances científicos y reduciendo las incertidumbres3.
Las técnicas de regionalización son herramientas PUB necesarias para transferir información. Pertenecen a dos categorías; basado en estadísticas o procesos. La transferencia de información de una o varias cuencas aforadas (donantes) a otra cuenca no aforada (receptora)4 requiere la identificación de cuencas aforadas similares, que pueden seleccionarse mediante:
Proximidad geográfica o espacial.
Similitudes en sus atributos hidrológicos y/o fisiográficos y climáticos aplicados con enfoques de agrupación. Por lo tanto, las distancias métricas se identifican comúnmente entre cuencas en un espacio de atributos multidimensional para evaluar su proximidad5,6.
En la práctica, los hidrólogos exploraron una amplia gama de enfoques para la regionalización a lo largo del tiempo, ya que no existen criterios establecidos mediante los cuales se pueda demostrar claramente la superioridad de cualquier enfoque7,8.
Burn y Goel9 adoptaron la agrupación como punto de partida para las particiones de cuenca basadas en características fisiográficas de la cuenca con distancia euclidiana ponderada. Luego se propuso un proceso heurístico de revisión regional para aumentar la homogeneidad de la región10. Últimamente, Jared et al.11 estudiaron, en un marco de clasificación, pequeñas cuencas canadienses dentro de la pradera basándose en atributos climáticos y biofísicos. Identificaron regiones similares con el método de agrupación jerárquica aglomerativa de componentes principales (HCPC). Por lo tanto, se puede subrayar que los estudios de regionalización frecuentemente requieren una clasificación de las cuencas, de la cual depende estrechamente su precisión.
A pesar de los grandes esfuerzos realizados en PUB, todavía queda un largo camino por recorrer en términos de lograr predicciones sólidas y confiables. Las cuencas no aforadas han tenido menos éxito hasta ahora que las cuencas aforadas, lo que es perjudicial para los países en desarrollo donde la gestión de los recursos hídricos sostenibles y el desarrollo de estrategias eficaces de mitigación de inundaciones y sequías seguirán viéndose obstaculizados por nuestra incapacidad de predecir con precisión el futuro3.
La clasificación no supervisada es una técnica de minería de datos que sin duda constituye un área de investigación desafiante. Podría definirse como la organización de una colección de patrones en grupos basándose en un análisis de similitud12,13. Muchos estudiosos de la hidrología aplicaron esta clase de algoritmos de agrupamiento con el fin de analizar la similitud de las cuencas en función de sus características fisiográficas, climáticas, de flujo de corrientes, etc.14. Goval y Gupta15 dividen los métodos de agrupamiento en jerárquicos (aglomerativos y divisivos) y particionales (agrupamiento duro [por ejemplo, k-media] y suave [por ejemplo, C-media difusa]).
Los métodos de agrupamiento particional dividen un conjunto de datos de objetos en función de su similitud. Para la agrupación de K-Means16, el número de agrupaciones (K) se define previamente; Los grupos iniciales se seleccionan primero al azar y luego se modifican para generar nuevos grupos que minimicen la varianza dentro de cada grupo. Cada objeto puede pertenecer a varios grupos en el caso de una clasificación suave.
Los algoritmos de análisis de conglomerados jerárquicos (HCA) agrupan objetos similares en una jerarquía de conglomerados. Ofrecen una serie de particiones entrelazadas en forma de árboles llamados dendrogramas. La principal ventaja de HCA en comparación con los métodos de agrupamiento particional radica en la representación del dendrograma, que resalta información adicional, como el aumento de la dispersión en un grupo generado por una agregación. Tampoco requiere determinar de antemano el número de grupos. De hecho, al observar el dendrograma y jugar con la profundidad del árbol, podemos explorar diferentes posibilidades y elegir el número de clústeres que mejor se adapte a nuestro caso de aplicación. Por lo tanto, es conceptualmente simple, bueno para conjuntos de datos pequeños y menos sensible al ruido en el conjunto de datos17.
En nuestro caso, HCA es más adecuado para identificar grupos de cuencas con comportamientos hidrológicos similares. Se utilizan métricas (o distancias) para medir esta similitud9. Por lo tanto, las distancias evalúan la proximidad o relevancia de cada cuenca calibrada con respecto a la ubicación objetivo e identifican la más similar hidrológicamente18. Dado que su objetivo es reducir la variación entre entidades dentro de un grupo, lo utilizamos junto con el método de vinculación de Ward19.
En la literatura se citaron muchas distancias útiles, como la euclidiana, la euclidiana al cuadrado, Manhattan, Chebyshev, coseno, Canberra, Minkowski y Mahalanobis. Nathan y Mc Mahon20 compararon combinaciones de medidas de similitud (euclidiana, euclidiana al cuadrado, Manhattan, Chebyshev y coseno) y métodos de vinculación (simple, completo, promedio y Ward) para identificar subregiones homogéneas de 184 cuencas en el sureste de Australia y pronosticar bajas características del flujo. Descubrieron que las mejores combinaciones son Ward con euclidiana al cuadrado y media con coseno. Posteriormente, Cunderlik y Burn21 recomendaron utilizar la distancia de Mahalanobi ya que considera la varianza y covarianza de las variables, lo que no es obvio con otras distancias. Shirkhorshidi et al.22 compararon medidas de similitud y disimilitud al agrupar varios conjuntos de datos continuos. Emplearon la familia Minkowski, incluidas las distancias euclidiana y de Manhattan y las versiones modificadas de la distancia euclidiana: distancia promedio, euclidiana ponderada y de cuerda; medida de similitud del coseno; y correlación de Pearson. Llegaron a la conclusión de que la distancia promedio estaba entre las medidas más precisas para todos los algoritmos de agrupación.
En las regiones del sur del Mediterráneo, los casos de estudio no son tan numerosos. Singla et al.23 estudiaron los regímenes hidrológicos de 27 cuencas fluviales en Marruecos para evaluar el impacto del cambio climático en los recursos hídricos. Aplicaron el método del vector regional para delinear la variabilidad homogénea de las precipitaciones y evaluar la representatividad y persistencia de las señales regionales. Destacan que en el Rif y el mar Mediterráneo, las precipitaciones revelaron una tendencia hacia un aumento relativo desde 1980, pero una disminución significativa en otras regiones. Los análisis de descargas mensuales y anuales mostraron una disminución desde finales de los años 1970. En 2017, Totz et al.24 desarrollaron un nuevo método de pronóstico empírico (HCA) basado en conglomerados para predecir anomalías de precipitación en invierno. Este método superó a los modelos estadísticos y dinámicos durante períodos históricos comparables en las regiones europea y mediterránea.
En la región del sur del Mediterráneo, Ahattab et al.25 utilizaron parámetros morfológicos y la serie de precipitaciones mensuales registradas en 23 estaciones pluviométricas (con un período de observación común de 15 años) repartidas en la cuenca de Tensift (Marruecos) para identificar cuatro grupos homogéneos que pueden Se puede considerar que exhiben comportamientos hidrológicamente similares y para los cuales se pueden aplicar los mismos modelos para estimar los picos de inundación. En Túnez, se realizaron pocos estudios de regionalización hidrológica que involucraran la clasificación de cuencas. Bargaoui et al.26 aplicaron el método ISODATA para regionalizar 39 cuencas tunecinas y evaluar la inundación centenaria. Gargouri y Bargaoui27 investigaron posteriormente la clasificación del modelo de cópula basada en las características fisiográficas y geográficas de las cuencas para delinear 22 cuencas tunecinas en regiones hidrofisiográficas. Señalaron que las cuencas de una misma región no son necesariamente contiguas geográficamente.
Posteriormente, en 55 estaciones de la red de aforos de Túnez, Bargaoui y Chebchoub28 aplicaron el análisis multifractal de los caudales máximos de inundación anuales. Identificaron un modelo de cascada aleatoria después de conectar con éxito los distintos momentos estadísticos de los caudales superficiales de las cuencas mediante una ley de invariancia de escala.
A continuación, Cherif y Bargaoui29 utilizaron HCA para construir una curva de frecuencia regional media para las escorrentías máximas anuales y aplicaron descriptores topográficos para el análisis de conglomerados. Utilizaron Trellis y clasificaciones jerárquicas para dividir una muestra de 40 cuencas hidrográficas tunecinas. Se estudiaron varios espacios multidimensionales con pares o tripletas de atributos para construir las medidas de distancia. Finalmente, se verificó la homogeneidad hidrológica de los conglomerados resultantes aplicando la prueba de Hosking y Wallis. Concluyeron que el índice de pendiente global se destaca como factor de escala para el índice de inundaciones.
Luego, Cherif y Gargouri30 estudiaron el comportamiento hidrológico de veinte cuencas situadas en la cordillera tunecina. Para definir las regiones hidrológicas, utilizaron la prueba de Hosking y Wallis y el método de agrupamiento de media móvil relacionado con los atributos hidrogeomorfológicos de la cuenca34. A continuación, se aferran a las curvas de frecuencia regionales del índice de descarga específico máximo.
Posteriormente, Kotti et al.31 utilizaron el método del vector regional para dividir el área de estudio en seis subregiones climáticamente homogéneas después de identificar los componentes regionales de la variabilidad de los caudales de los ríos en la cuenca del Medjerda (la cuenca fluvial más grande de Túnez). Luego desarrollaron modelos de regresión regionalizados para determinar el coeficiente de escorrentía y estudiaron las intercorrelaciones entre estaciones para completar una serie de datos de flujo.
Validaron la posibilidad de estimar la escorrentía en una estación basándose en la tasa máxima y la lluvia de la misma estación y los parámetros hidrológicos de una estación de medición vecina, con una mejora notable en los valores de profundidad de escorrentía en comparación con la literatura. Recientemente, Gargouri et al. [32] utilizaron el algoritmo de Ward con distancia euclidiana y agrupamiento jerárquico aglomerativo para estudiar 22 cuencas tunecinas, donde la disimilitud entre los grupos se calcula en el espacio multidimensional de variables geomorfológicas y fisiográficas. Luego, la homogeneidad y consistencia de las regiones se miden mediante el índice de silueta. Este estudio condujo a tres regiones homogéneas, realizadas mediante una cópula multivariada.
Aunque se han realizado importantes investigaciones sobre aplicaciones de PUB en casos mediterráneos que agrupan cuencas tunecinas y regiones del sur del Mediterráneo, las aplicaciones de las técnicas HCA siguen siendo limitadas. Se necesitan más esfuerzos para agrupar aplicaciones de análisis que aún son poco comunes y están subrepresentadas debido a las difíciles circunstancias de medición y la falta de datos hidrométricos en la región.
De hecho, una mejor comprensión del comportamiento de las cuencas tunecinas puede ser muy valiosa para los hidrólogos de Túnez. Contribuye al avance de la modelización hidrológica, apoya los procesos de toma de decisiones en la gestión de los recursos hídricos y ofrece información beneficiosa sobre las características hidrológicas de otras regiones mediterráneas, especialmente el Sudeste. Mediterráneo que tienen similitudes climáticas y de prácticas agrícolas.
Este estudio tiene como objetivo analizar la similitud hidrológica entre las cuencas de la cordillera tunecina basándose en el algoritmo HCA y el índice de homogeneidad de los grupos delineados. Se aplicaron varias distancias métricas en el método de vinculación y se comparan sus eficiencias.
Para intentar este objetivo, se llevarán a cabo los siguientes pasos: aplicar HCA para cuencas tunecinas con distancias de similitud basadas en sus atributos geomorfológicos y firmas hidrométricas.
Integración del índice Silhouette para validar la homogeneidad de los clusters. Por lo tanto, comparamos la eficiencia de todas las distancias para predecir la más precisa.
Analizar los resultados para comprender mejor los comportamientos de las cuencas hidrográficas de Túnez.
HCA es un análisis multivariado no supervisado que clasifica los datos proporcionados en grupos similares, superpuestos o no superpuestos. Tiene grandes aplicaciones para encontrar grupos homogéneos de objetos basándose en distancias métricas entre objetos. HCA busca construir una jerarquía de conglomerados que puedan ser aglomerados o divisivos. Los algoritmos de aglomeración fusionan clústeres. Por el contrario, los algoritmos divisivos dividen grupos. Ambos pueden ilustrarse como una secuencia anidada o un diagrama de árbol, llamado dendrograma. Muestra los puntos de vinculación y los grupos que están conectados en niveles crecientes de disimilitud. Las alturas de los puntos de ramificación indican cuán similares o diferentes son entre sí; cuanto mayor es la altura, mayor es la diferencia.
En el estudio actual, el algoritmo HCA se aplica para delimitar grupos de cuencas similares; Nos centramos en definir los clusters más homogéneos. La homogeneidad se define por el comportamiento hidrodinámico similar de las cuencas. Por tanto, buscamos la distancia más adecuada que proporcione la mejor similitud en los clusters.
Como primer paso, se calculan las correlaciones entre todos los atributos y firmas después de su estandarización. Luego, todos los atributos y firmas especificados se implementan en HCA. Se supone que la homogeneidad de los conglomerados está asegurada; posteriormente, para validar esta hipótesis, se calcula el índice de silueta. Cada grupo se caracteriza por su índice de silueta, que compara su estanqueidad y separación. Ilustra qué vectores de características pertenecen al grupo y cuáles se encuentran justo entre los grupos. Los índices de silueta de los conglomerados muestran coherencia dentro de los conglomerados y proporcionan un medio para evaluar la calidad de los conglomerados32. Se calculan para cada grupo y luego se comparan entre todas las distancias de similitud aplicadas para delinear la mejor para el enfoque de agrupación jerárquica. Los pasos de la metodología de agrupamiento aplicada en nuestro estudio actual se resumen en la Fig. 1.
Ilustración de los pasos de la metodología de clustering.
Consideremos una matriz X de tamaño \(n\times p\): las filas son los individuos (n) y las columnas son las variables (p) (Ec. 1.)
Con xi: iésima fila y xj: jésima columna.
La distancia \(d\left({x}_{i},{x}_{j}\right)\) se define entre dos vectores xi y xj (i, j = 1…n) en la dimensión p espacio \({\mathbb{R}}^{p}\). Las distancias utilizadas en este trabajo, para el análisis jerárquico, se ilustran en la Tabla 1.
Uno de los objetivos del estudio actual es evaluar y comparar la eficiencia de las distancias métricas en el enfoque HCA. Es crucial confirmar que los grupos delineados realmente reflejan la homogeneidad hidrológica.
El índice de silueta describe cada grupo contrastando su rigidez y separación para evaluar la homogeneidad. Ilustra qué vectores de características pertenecen a su grupo y cuáles están justo entre los grupos. Las siluetas de los conglomerados se trazan en un gráfico que muestra la coherencia dentro de los conglomerados y permite evaluar la calidad de los conglomerados32.
Para cada vector de características xi, el índice de silueta correspondiente s(i) se define como:
donde, para un xi dado perteneciente al grupo A (con ) y una distancia d (.,.),
¿Dónde está el número cardinal? Se piensa como una clase de equivalencia de conjuntos. a (i) es la distancia promedio desde el i-ésimo vector de características a todos los demás vectores de características en el grupo A; b(i) es la distancia promedio mínima desde el i-ésimo vector de características a todos los vectores de características en otro grupo C. De esta ecuación se deduce que -1 ≤ s(i) ≤ 1. Si s(i) es grande, entonces el i-ésimo El vector de características está bien asignado al clúster. Por otro lado, cuando s(i) está cerca de -1, el i-ésimo vector de características no está bien clasificado.
Cuanto más se acerca el índice de silueta a 1, mejores son la cohesión y la separación33.
Por lo tanto, en este estudio se aplica para evaluar y comparar enfoques de agrupamiento, se calculan los índices de silueta para cada cuenca del grupo y luego se deducen sus promedios. Un valor positivo revela que la cuenca coincide bien con su grupo. Un valor negativo significa que la cuenca no está en el grupo correcto, por lo que podría trasladarse a uno más estrechamente relacionado34.
Por lo tanto, un índice de silueta alto demuestra que el vector de características clasificado (captación) está bien agrupado y no coincide adecuadamente con los grupos vecinos. Si el valor del índice de silueta está cerca de (-1), significa que el individuo no está en el grupo correcto39.
En la investigación actual comparamos el uso de la clasificación jerárquica con varias distancias especificadas en la Tabla 1 (ver § 2.2) para delinear las cuencas en regiones hidrológicas. Luego se calculan los índices de silueta para cada cuenca en cada grupo delineado para definir la mejor distancia que proporcione una mayor homogeneidad para los grupos (regiones). Por lo tanto, se utiliza el paquete de software MATLAB.
Se consideraron diecinueve cuencas situadas en la cordillera tunecina y monitoreadas desde 1992, controladas por presas de cabecera. Las latitudes varían entre 35°N y 37°N; Con longitudes de 8°E y 11°E, áreas que van desde 1 km2 a 10 km2 y precipitaciones promedio anuales varían entre 280 y 500 mm, estas cuencas se encuentran en una zona semiárida. Estas cuencas son poco permeables a impermeables y presentan relieves bastante elevados que favorecen un rápido escurrimiento. La red de pluviómetros está compuesta por 19 pluviómetros Fig. 2, ubicados en cada cabecera de presa35.
Red hidrométrica de Túnez considerada en este estudio (mapa de https://d-maps.com, código abierto y modificado por QGIS: Licencia pública general GNU, versión 2.0).
Se utilizan dos conjuntos de datos (atributos de la cuenca y firmas de flujo), con el algoritmo HCA, para delinear regiones homogéneas. El primer conjunto ilustra los atributos fisiográficos de la cuenca y se seleccionan porque pueden predeterminar el comportamiento hidrológico [37; 5; 38], se encuentra en la Tabla A.1 de los apéndices y está compuesto por: Latitud (LatN); longitud (LongE); área (A); Perímetro (P); desnivelación específica (DS); índice de pendiente global (Is); Índice Gravellus (IG); el porcentaje de recorrido (Pp); el porcentaje de cubierta forestal (Pf); el porcentaje de superficie de cultivo de cereales (Pc); el porcentaje de área de arboricultura (Pa); el porcentaje de área afectada por prácticas antierosivas (Aae)).
El segundo conjunto se encuentra en la Tabla A.2 de los apéndices y resume las firmas hidrométricas definidas como:
Intensidad máxima de lluvia (Imax).
duración de la lluvia (D), profundidad de escorrentía.
Profundidad de escurrimiento (R): volumen de escurrimiento de una cuenca de drenaje, dividido por su área, en un tiempo determinado expresado en mm.
Tiempo de pico del hidrograma (tp): el tiempo de aumento del hidrograma.
Tiempo base del hidrograma (tb): tiempo entre el inicio y el final del hidrograma.
Índice de infiltración (ϕ): tasa promedio de infiltración derivada de un gráfico de intensidad temporal de la lluvia de tal manera que el volumen de lluvia que exceda esta tasa será igual al volumen de escorrentía de la tormenta38.
Coeficiente de escorrentía (Cr): relación entre la profundidad de escorrentía y la profundidad de precipitación.
Caudal medio (Qmedia): escurrimiento medio diario.
Caudal Máximo Específico (QSmax): caudal máximo dividido por la zona de captación.
Estas firmas cuantifican la respuesta hidrológica y proporcionan información sobre el comportamiento funcional de la cuenca37. Se incluyen para apoyar la hipótesis de homogeneidad hidrológica. Las tablas A.1 y A.2 contienen también estadísticas específicas como valores medios, desviación estándar, valores mínimos y valores máximos, que se denotan como Min, Max, μ y σ respectivamente. Todos los datos proceden de informes hidrológicos de la División de Recursos Hídricos de Túnez (DGRE).
Como primer paso, se calculan las correlaciones entre todos los atributos y firmas hidrométricas después de su estandarización (Tabla 2a, b). Con un rango entre −0,7 y 1, revelan que los atributos geomorfológicos están estrechamente o ligeramente relacionados con las firmas de flujo y los descriptores de lluvia, con intercorrelaciones que varían entre −0,5 y 0,8. De ahí que las cuencas tengan comportamientos hidrológicos influenciados por su geomorfología. Este resultado concuerda con el trabajo de Kotti et al.35 en su estudio de la cuenca de Medjerdah, donde deducen que los flujos son una respuesta relativa a diferentes factores (tamaño de la cuenca, relieve, geología, suelos y cobertura vegetal).
Luego, se aplica HCA con distancias calculadas a partir de atributos geomorfológicos y firmas hidrométricas (previamente definidas) para delinear grupos de cuencas con comportamiento similar (grupos homogéneos). Por lo tanto, buscamos trazar la mejor distancia entre los clusters más homogéneos. Para intentar este objetivo, todas las similitudes de distancia citadas anteriormente en la Tabla 1 se aplican a los atributos y firmas de la cuenca.
Debido al limitado número total de cuencas. Se dividen en dos grupos con aglomeración de dendrogramas y los grupos se concatenan gráficamente. El nivel de homogeneidad de los conglomerados se determina luego calculando índices de silueta.
Los resultados del agrupamiento se resumen en la Tabla 3. Esta tabla revela que las cuencas 7, 8 y 9 están consistentemente en el mismo grupo, destacando una similitud persistente independientemente de la distancia. Los valores promedio de la silueta y la partición de las cuencas para cada distancia se muestran en la Tabla 4, lo que indica que las distancias entre cuadras, Hamming, Spearman y Jaccard proporcionan una distribución equitativa de las cuencas.
Todas las distancias indican valores promedio positivos de índices de silueta (ASI) para ambos conglomerados, que van de 0,04 a 0,418 para el primer conglomerado y de 0,001 a 0,188 para el segundo. Por lo tanto, las cuencas del primer grupo indican una mayor consistencia (homogeneidad).
Por lo tanto, deducimos que la distancia de correlación proporciona los grupos más consistentes con valores de ASI de 0,42 y 0,18. El primer cluster está compuesto por el 32% del total de cuencas mientras que el segundo implica el 68% de las mismas. Le siguen las distancias de coseno y Spearman con índices de silueta respectivamente de [0,28; 0,21] y [0,27; 0,17]. Euclidiana y Seuclidiana revelan resultados similares. Las distancias entre manzanas, Hamming y Jaccard producen una distribución casi igual (con 9 y 10 cuencas en cada grupo). Sin embargo, las distancias de Hamming y Jaccard muestran grupos con las similitudes más bajas para las cuales los índices de silueta son iguales respectivamente a [0,048 y 0,0005]. Concluimos que con estas distancias, las cuencas del primer grupo son más hidrométricamente similares.
La distancia de correlación revela los grupos más homogéneos. La Figura 3 se refiere a las cuencas pertenecientes a cada grupo. Vale la pena señalar que las cuencas de un mismo grupo no son necesariamente contiguas geográficamente; en efecto, la proximidad geográfica de las cuencas no es garantía de su similitud hidrológica39. Este resultado está de acuerdo con el descrito por Gargouri-Ellouze y Bargaoui35.
Los Clústeres logrados con la distancia de correlación (mapa de https://d-maps.com, código abierto y modificado por QGIS: Licencia Pública General GNU, versión 2.0).
Por lo tanto, señalamos que la selección de la distancia podría mejorar la precisión del método de agrupamiento y la homogeneidad hidrológica en los grupos: este resultado debe considerarse cuando se tratan estudios de regionalización en regiones del sur del Mediterráneo.
Este efecto concuerda con el estudio de Totz et al.24, en el que desarrollaron un nuevo método de pronóstico empírico (HCA) basado en conglomerados para predecir las anomalías de las precipitaciones invernales en las regiones europeas y mediterráneas.
Su método logra una mayor habilidad que otros métodos empíricos utilizados en el pasado, como el modelo de regresión múltiple desarrollado por Eden et al.40 o el algoritmo basado en CCA aplicado por Barnston et al.41.
Las cuencas dentro de cada grupo, las estadísticas de atributos fisiográficos y firmas hidrométricas se resumen a continuación (Tabla 5), así como las proporciones de medias (ρ) en cada grupo para todos los atributos y firmas. ρ = µ1/µ2 donde µ1 y µ2 son medias de (atributo o firma) en el primer y segundo grupo, respectivamente.
Notamos que el primer grupo contiene áreas y escurrimientos promedio más grandes, lo que indica cuencas más grandes y más húmedas. Con tasas de escorrentía media dos veces mayores que las del segundo grupo (ρ = 1,8). El porcentaje de datos forestales (Pf) es tres veces mayor que los registrados en el segundo grupo, lo que revela que controla en gran medida los resultados de agrupación. Por lo tanto, las grandes cuencas con importantes cubiertas forestales tienen escorrentías similares que indican comportamientos hidrológicos similares. Este resultado puede ser valioso para los países vecinos dentro del mismo clima (regiones mediterráneas) y luego extenderse a otros índices antropogénicos.
La Figura 4 contiene valores logarítmicos absolutos de estas proporciones que pueden ilustrarnos sobre los atributos y firmas más discriminantes. Cero indica promedios similares entre los dos grupos y cuanto más lejos de cero, más discriminatorio es el atributo (resp. firma). Demuestra tres atributos discriminantes: el porcentaje de área afectada por prácticas antierosivas (Aae) que es el más significativo, seguido por el porcentaje de cobertura forestal (Pf) y las áreas de captación (A). El cluster1 está formado por cuencas con importante cobertura forestal, prácticas antierosivas débiles y mayores de 5 km2. El cluster 2 está constituido por cuencas con cobertura forestal débil, importantes prácticas antierosivas y menores de 5km2. Cada grupo tiene su propio comportamiento hidrológico específico. Este punto deberá respetarse en la modelización de cuencas y en la previsión de escorrentías.
Variación de las razones log absolutas de los atributos de las medias (ρ = µ1/µ2).
Estos resultados están en armonía con revisiones que detallan aspectos específicos de la hidrología de las cuencas mediterráneas, como el impacto de los bosques mediterráneos en las respuestas de las cuencas42, la hidrología de las tierras secas43 y los procesos de erosión44,45.
Finalmente, el enfoque de delineación aplicado en el trabajo actual revela que la distancia entre los atributos geomorfológicos y las firmas hidrométricas impacta los resultados de la delineación de HCA en las regiones hidrológicas agrupadas. Este estudio puede considerarse un caso de ejemplo para las cuencas del Mediterráneo Sur que puede extrapolarse con otros datos vecinos como las cuencas argelinas.
La investigación actual descrita en este artículo explora el uso de HCA no supervisado en la agrupación de cuencas tunecinas que se aplica con varias distancias calculadas a partir de atributos y firmas asociados. Están involucradas diecinueve cuencas y se exploran nueve distancias métricas para identificar los grupos hidrológicamente más similares. En este trabajo se aplican diecinueve atributos geomorfológicos y firmas hidrométricas (precipitaciones y flujos) para calcular diversas distancias métricas en HCA consideradas para delinear conglomerados homogéneos.
Después de realizar el paso de agrupación, se calculan los índices de silueta para cada grupo. Revelan que la distancia de correlación proporciona en gran medida los grupos más homogéneos, en comparación con las otras distancias. Da dos conglomerados, no igualmente dispersos (32% y 68% del total de cuencas) con índices de silueta promedio iguales a 0,42 y 0,18.
Las estadísticas muestran que el porcentaje de superficie afectada por prácticas antierosivas, el porcentaje de cubierta forestal y la zona de captación son los atributos más discriminantes. Sin embargo, las firmas hidrométricas parecen no ser relevantes. Esta partición permitió resaltar dos comportamientos hidrológicos diferentes que deben ser considerados en la modelización y/o predicción.
Finalmente, estos resultados pueden ser útiles en la estrategia de regionalización para calibrar modelos hidrológicos en regiones del sur del Mediterráneo cuando la escasez de datos hidrométricos es un problema. Pueden considerarse prometedores por el hecho de que pueden resultar ventajosos en algunos casos de predicciones hidrológicas sin necesidad de mucha información hidrológica en cuencas no aforadas. Nuestro estudio puede considerarse como una muestra de cuencas del Mediterráneo Sur que puede extrapolarse con datos de otras regiones vecinas como las cuencas argelinas.
Todos los datos generados o analizados durante este estudio se incluyen en el artículo publicado “Gargouri-Ellouze E. & Bargaoui Z. Investigación con diagramas de Kendall sobre la relación entre el índice de infiltración y la intensidad máxima de lluvia para la regionalización. Física y química de la Tierra, partes A/B/C, 34(10–12), 642–653. (2009)” y sus fichas de información complementaria.
Sivapalan, M. y col. Década de la IAHS sobre predicciones en cuencas no aforadas (PUB), 2003-2012: dando forma a un futuro apasionante para las ciencias hidrológicas. Hidrol. Ciencia. J. 48, 857–880 (2003).
Artículo de Google Scholar
McGlynn, B. y col. Un marco de adquisición de datos para la predicción de escorrentía en cuencas no aforadas. En Predicción de escorrentía en cuencas no calibradas: síntesis transversal, lugares y escalas de procesos (eds Blöschl, G. et al.) (Cambridge University Press, 2013).
Google Académico
Hrachowitz, M. y col. Una década de predicciones en cuencas no aforadas (PUB): una revisión. Hidrol. Ciencia. J.58(6), 1198-1255 (2013).
Artículo de Google Scholar
Viglione, A. y col. Evaluación comparativa de predicciones en cuencas no aforadas. Parte 3: Firmas de escorrentía en Austria. Hidrol. Sistema Tierra. Ciencia. 17, 22632279 (2013).
Artículo de Google Scholar
Oudin, L., Kay, A., Andréassian, V. y Perrin, C. ¿Las cuencas aparentemente físicamente similares son realmente hidrológicamente similares? Recurso Acuático. Res. 46, W11558 (2010).
ADS del artículo Google Scholar
Singh, R., Archfield, SA y Wagener, T. Identificación de controles dominantes en la transferencia de parámetros hidrológicos de cuencas calibradas a no calibradas: un enfoque de hidrología comparada. J. hidrol. 517, 985–996 (2014).
ADS del artículo Google Scholar
Srinivas, VV, Tripathi, S., Ramachandra Rao, A. y Govindaraju, RS Análisis de frecuencia de inundaciones regionales mediante la combinación de mapas de características autoorganizadas y agrupaciones difusas. J. hidrol. 348(1–2), 148–166 (2008).
ADS del artículo Google Scholar
Rao, AR & Srinivas, VV Regionalización de cuencas hidrográficas: un enfoque basado en el análisis de conglomerados Biblioteca de ciencia y tecnología del agua (Springer, 2010).
Google Académico
Burn, DH & Goel, NK La formación de grupos para el análisis regional de la frecuencia de inundaciones. Hidrol. Ciencia. J.45(1), 97-112 (2000).
Artículo de Google Scholar
Tsakiris, G., Nalbantis, I. & Cavadias, G. Regionalización de flujos bajos basada en análisis de correlación canónica. Adv. Recurso Acuático. 34, 865–872 (2011).
ADS del artículo Google Scholar
Jared, D. y col. Un enfoque de clasificación de cuencas que va más allá de la hidrología: aplicación a una región agrícola semiárida de Canadá. Hidrol. Sistema Tierra. Ciencia. 23, 3945–3967 (2019).
Artículo de Google Scholar
Jain, A. & Dubes, R. Algoritmos para agrupar datos (Prentice-Hall, Upper Saddle River, 1988).
MATEMÁTICAS Google Scholar
Li, FF y cols. Métodos de descomposición-ANN para la predicción de descargas a largo plazo basados en la agrupación ordenada de Fisher con MESA. Recurso Acuático. Gestionar 33, 3095–3110 (2019).
Artículo de Google Scholar
Merz, R. & Blöschl, G. Regionalización de los parámetros del modelo de cuenca. J. hidrol. 287(1), 95-123 (2004).
ADS del artículo Google Scholar
Goyal, MK & Gupta, V. Identificación de regímenes de precipitaciones homogéneos en la región noreste de la India mediante análisis de conglomerados difusos. Recurso Acuático. Gestionar. 28, 4491–4511 (2014).
Artículo de Google Scholar
MacQueen JB Algunos métodos de clasificación y análisis de observaciones multivariadas. En Actas del 5º Simposio de Berkeley sobre estadística matemática y probabilidad, 1, 281–297 (University of California Press, Berkeley, 1967)
Peerzada, HA & Shilpa, D. Evaluación del desempeño del algoritmo de agrupamiento utilizando diferentes conjuntos de datos. J.Inf. Ing. Aplica. 5(1), 39–47 (2015).
Google Académico
Durocher, M., Chebana, F. & Ouarda, T. Delineación de regiones homogéneas utilizando variables hidrológicas predichas mediante regresión de búsqueda de proyecciones. Hidrol. Sistema Tierra. Ciencia. 20, 4717–4729 (2016).
ADS del artículo Google Scholar
Mirkin, B. Agrupación en clústeres para la minería de datos: un enfoque de recuperación de datos, 1.ª ed. (Chapman y Hall/CRC, 2005).
Libro MATEMÁTICAS Google Scholar
Nathan, RJ & Mc Mahon, TA Identificación de regiones homogéneas a efectos de regionalización. J. hidrol. 121, 217–238 (1990).
ADS del artículo Google Scholar
Cunderlik, JM y Burn, DH Cambio de las distancias de similitud de agrupación: Mahalanobis por euclidean. Recurso Acuático. Res. 42–3 (2006).
Shirkhorshidi, AS, Aghaboborgi, S. & Wah, TY Un estudio comparativo sobre medidas de similitud y disimilitud en la agrupación de datos continuos. PLoSONE 10, 12 (2015).
Artículo de Google Scholar
Singla, S. y col. Evolución de las relaciones pluie-débit sur des bassins versants du Maroc. En la Conferencia Mundial FRIEND. Cambio global: Enfrentando riesgos y amenazas a los recursos hídricos: Actas de la sexta conferencia mundial FRIEND Vol. 25–29 (eds Servat, E. et al.) 679–687 (AISH, Wallingford, 2010).
Google Académico
Totz, S. y col. Previsión de precipitaciones invernales en las regiones europea y mediterránea mediante análisis de conglomerados. Geofís. Res. Letón. 44(24), 12–418 (2017).
Artículo de Google Scholar
Ahattab, J., Serhir, N. & Lakhal, EK Hacia el desarrollo de un sistema de apoyo a la decisión para la selección de métodos de evaluación de picos de inundación en Marruecos: Readaptación de métodos clásicos a datos hidrológicos recientes. La Houille Blanche 1, 63–70 (2015).
Artículo de Google Scholar
Bargaoui, Z., Fortin, V., Bobée, B. & Duckstein, L. Un enfoque difuso para determinar la región de influencia de una estación hidrométrica. Revue des Sciences de l'eau Water 11(2), 255–328 (1998).
Artículo de Google Scholar
Gargouri-Ellouze E., & Bargaoui Z. Aplicabilidad del hidrograma unitario instantáneo geomorfológico de tipo gamma en un conjunto conjunto EGS-AGU-EUG de subcuenca semiárida pequeña, 4288 (2003).
Bargaoui, Z. & Chebchoub, A. Investigaciones de la naturaleza multifractal de las descargas máximas de inundaciones anuales. Hidrol. Ciencia. J. 49, 549–562 (2004).
Artículo de Google Scholar
Chérif, R. & Bargaoui, Z. Regionalización del escurrimiento máximo anual mediante métodos jerárquicos y enrejados con información topográfica. Recurso Acuático. Gestionar. 27, 2947–2963 (2013).
Artículo de Google Scholar
Chérif R., & Gargouri-Ellouze E. Construcción de la curva de inundación del índice regional estadístico basada en la agrupación de descriptores hidrogeomorfológicos de cuencas hidrográficas. STAHY 10–11. Abu Dabi (2014)
Kotti, FC y col. Estudio de precipitaciones y vertidos en la cuenca de Medjerda, Túnez. Boletín del Instituto Científico Rabat 38, 19–28 (2016).
Google Académico
Gargouri-Ellouze E., Chérif R. y Eslamian S. Geoestadística e inundaciones, delimitación de regiones homogéneas para análisis de frecuencia regional multivariado. En Análisis y modelado del manual de inundaciones, capítulo CRC (Press Taylor and Francis Group, 2022).
Rousseeuw, PJ Silhouettes: Una ayuda gráfica para la interpretación y validación del análisis de conglomerados. J. Computación. Aplica. Matemáticas. 20, 53–65 (1987).
Artículo MATEMÁTICAS Google Scholar
Xiaogang, G. y col. Un método de agrupación de flujo OD basado en restricciones vectoriales: un estudio de caso para los datos de origen-destino de taxis de Beijing ISPRS. En t. J. Geo-Inf. 9, 128 (1992).
Google Académico
Wazneh, H., Chebana, F. & Ouarda, TBMJ Delineación de regiones homogéneas para análisis de frecuencia regional utilizando una función de profundidad estadística. J. hidrol. 521, 232–244 (2014).
Artículo de Google Scholar
Gargouri-Ellouze, E. & Bargaoui, Z. Investigación con diagramas de Kendall de la relación índice de infiltración-intensidad máxima de lluvia para la regionalización. Física. Química. Tierra A/B/C 34(10–12), 642–653 (2009).
ADS del artículo Google Scholar
McIntyre N. et al. Conjunto de predicciones de escorrentía en cuencas no calibradas. Recurso Acuático. Res. 41 (2005).
Sawicz, K. y col. Clasificación de cuencas: análisis empírico de la similitud hidrológica basado en la función de las cuencas en el este de los Estados Unidos. Hidrol. Sistema Tierra. Ciencia. 15, 2895–2911 (2011).
ADS del artículo Google Scholar
UNESCO. Glosario internacional de hidrología. Preimpreso en https://library.wmo.int/doc_num.php?explnum_id=8209 (2012).
Ouarda, TBMJ, St-Hilaire, A. & Bobée, B. Una revisión de los desarrollos recientes en el análisis de frecuencia regional de extremos hidrológicos. J. Ciencias del agua. 21, 219–232 (2008).
Google Académico
Edén, J. et al. Un sistema empírico global para la predicción climática estacional probabilística. Geociencias. Desarrollo de modelos. 8(12), 3947–3973 (2015).
Artículo ADS CAS Google Scholar
Barnston, AG & Smith, TM Especificación y predicción de la temperatura superficial global y la precipitación a partir de la TSM global utilizando CCA. J. Clim. 9(11), 2660–2697 (1996).
2.0.CO;2" data-track-action="article reference" href="https://doi.org/10.1175%2F1520-0442%281996%29009%3C2660%3ASAPOGS%3E2.0.CO%3B2" aria-label="Article reference 42" data-doi="10.1175/1520-0442(1996)0092.0.CO;2">ADS del artículo Google Scholar
Cosandey, C. et al. El impacto hidrológico del bosque mediterráneo: una revisión de la investigación francesa. J. hidrol. 301(1–4), 235–249 (2005).
ADS del artículo Google Scholar
Cudennec, C., Leduc, C. & Koutsoyiannis, D. Hidrología de tierras secas en las regiones mediterráneas: una revisión. Ciencias hidrológicas. J. Ciencias. Hidrol. 52(6), 1077–1087 (2007).
Artículo de Google Scholar
Shakesby, RA Erosión del suelo después de incendios forestales en el Mediterráneo: revisión y direcciones futuras de investigación. Ciencia de la Tierra. Rev. 105(3–4), 71–100 (2011).
ADS del artículo Google Scholar
García-Ruiz, JM, Nadal-Romero, E, Lana-Renault, N & Beguería, S. Erosión en los paisajes mediterráneos: cambios y retos de futuro. Geomorfología 198, 20–36 (2013).
ADS del artículo Google Scholar
Descargar referencias
LR99ES19 Laboratorio de Modelado en Hidráulica y Medio Ambiente (LMHE), Escuela Nacional de Ingeniería de TÚNEZ (ENIT), Universidad de Túnez El Manar, BP 37, 1002, Túnez, Túnez
Rim Chérif y Emna Gargouri-Ellouze
Instituto Superior de Ciencias y Tecnología Ambientales (HIEST), Borj Cedria. Universidad de Cartago, Túnez, Túnez
Borde Cherif
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
RC y GE escribieron el manuscrito principal. Las figuras 2,3,4 fueron preparadas por GE, las demás y las tablas fueron preparadas por RC. Dos autores revisaron el manuscrito.
Correspondencia a Rim Chérif.
Los autores declaran no tener conflictos de intereses.
Springer Nature se mantiene neutral con respecto a reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.
Acceso Abierto Este artículo está bajo una Licencia Internacional Creative Commons Attribution 4.0, que permite el uso, compartir, adaptación, distribución y reproducción en cualquier medio o formato, siempre y cuando se dé el crédito apropiado al autor(es) original(es) y a la fuente. proporcione un enlace a la licencia Creative Commons e indique si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la normativa legal o excede el uso permitido, deberá obtener permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.
Reimpresiones y permisos
Chérif, R., Gargouri-Ellouze, E. Firmas de flujo y atributos de cuencas para la agrupación de HCA en una evaluación de similitud hidrológica (caso tunecino). Representante científico 13, 12144 (2023). https://doi.org/10.1038/s41598-023-38608-6
Descargar cita
Recibido: 13 de febrero de 2023
Aceptado: 11 de julio de 2023
Publicado: 26 de julio de 2023
DOI: https://doi.org/10.1038/s41598-023-38608-6
Cualquier persona con la que compartas el siguiente enlace podrá leer este contenido:
Lo sentimos, actualmente no hay un enlace para compartir disponible para este artículo.
Proporcionado por la iniciativa de intercambio de contenidos Springer Nature SharedIt
Al enviar un comentario, acepta cumplir con nuestros Términos y pautas de la comunidad. Si encuentra algo abusivo o que no cumple con nuestros términos o pautas, márquelo como inapropiado.