数据描述
2025 全球城市城市内涝风险数据集(Urban Flood Risk Data):覆盖 58 城 2900 + 监测点,含地理 / 水文 / 排水特征,助力内涝热点识别与风险预测模型训练
在全球气候变化背景下,城市内涝(降雨驱动型)已成为威胁城市安全运行、影响居民生活质量的重要灾害,而精准的内涝风险评估依赖于多维度、高 granularity 的数据支撑。传统城市内涝数据常存在空间覆盖有限、特征维度单一、数据标准化不足等问题,难以满足跨城市风险对比、内涝热点定位及机器学习模型训练的需求。Urban Flood Risk Data: Global City Analysis 2025 作为聚焦城市内涝风险的综合性数据集,通过整合全球 elevation 数据、土地利用数据、排水设施数据及降雨数据,构建了涵盖 58 个城市、2900 + 监测点的标准化数据库,为城市管理者、科研人员、环境工程师提供了全流程风险评估与模型开发的核心资源,对推动城市内涝防治、排水设施优化、内涝风险预测算法研发具有重要价值。
一、数据基本信息
Urban Flood Risk Data: Global City Analysis 2025 是专为城市内涝(降雨驱动型)风险评估设计的合成数据集,从数据覆盖范围来看,数据集涵盖全球 58 个城市的微观区域(“segments”),包含 2900 + 内涝监测点,每个监测点对应一条空间单元记录,实现跨城市、大尺度的内涝风险数据覆盖。
在数据特征设计上,数据集按功能划分为六大核心维度,兼顾地理信息、水文特征、基础设施属性与风险标签,具体如下:
- 地理标识特征:包含唯一区域标识(segment_id,字符串类型,如 “SEG-00001”)、城市名称(city_name,含国家信息,如 “Colombo, Sri Lanka”)、行政分区(admin_ward,如 “Ward D”“District 18”)、地理坐标(latitude/longitude,WGS84 坐标系,十进制度)、水文汇水区标识(catchment_id,如 “CAT-136”,用于关联同汇水区的空间单元);
- 地形与土地特征:涵盖地面 elevation(elevation_m,单位米,-3.0 表示低于海平面或缺失值)、数字高程模型来源(dem_source,如 SRTM_1arc、Copernicus_GLO-30_v2023)、主导土地利用类型(land_use,含住宅、商业、道路、水域、绿地等 9 类)、水文土壤分组(soil_group,A/B/C/D 四类,字母越靠后入渗能力越低);
- 排水设施特征:包含排水密度(drainage_density_km_per_km²,单位 km/km²,密度越高理论上积水风险越低)、距最近雨水口距离(storm_drain_proximity_m,单位米,距离越近排水便利性越高)、雨水口类型(storm_drain_type,如路缘进水口、格栅进水口、检修井等,或 “None” 表示数据缺失);
- 降雨特征:含降雨数据来源(rainfall_source,如 ERA5 再分析数据、IMD gauge 数据、混合数据源等,或 “None” 表示无指定来源)、历史降雨强度(historical_rainfall_intensity_mm_hr,单位 mm/hr,如 33.4、106.0)、降雨重现期(return_period_years,单位年,含 2/5/10/25/50/100 年六类,为水文设计标准值);
- 风险标签特征:采用竖线分隔的多值标签(risk_labels),包含内涝热点(ponding_hotspot)、低洼区域(low_lying)、排水稀疏(sparse_drainage)、极端降雨历史(extreme_rain_history)及具体事件日期(event_YYYY-MM-DD,如 event_2025-03-21),标签可空;
- 数据质量说明:部分字段存在缺失值或标记值(如 elevation_m=-3.0、storm_drain_type=“None”),排水设施相关指标可能因基础设施测绘不全而缺失,降雨来源字段可能为 “None”,需用户在使用时针对性处理。
此外,数据集无明确更新频率(预期 “Never”),数据稳定性强,且提供详细的字段说明与集成建议,降低用户使用门槛。
二、数据优势
- 跨城市覆盖与高空间 granularity 兼具:涵盖全球 58 个城市、2900 + 监测点,支持跨区域内涝风险对比;同时以微观 “segment” 为单位记录数据,精准到具体地理坐标与汇水区,满足小尺度内涝热点定位需求,填补传统宏观数据的精度空白。
- 多维度特征整合,信息密度高:整合地理、地形、土地、排水、降雨、风险六大类特征,全面捕捉影响内涝风险的关键因素(如 elevation 决定地形高低、drainage_density 影响排水能力、rainfall_intensity 关联降雨驱动源),为多因子风险评估与模型训练提供充足信息支撑。
- 标准化与灵活性平衡:采用统一的坐标系统(WGS84)、字段格式与风险标签定义,确保数据跨城市可比;同时保留数据缺失标记与多值标签设计,适配不同城市的基础设施差异与风险场景多样性,避免 “一刀切” 的数据标准化导致的信息失真。
- 场景针对性强,直接服务核心需求:特征设计完全匹配内涝风险评估的核心任务 —— 如 drainage_density 与 storm_drain_proximity 直接关联排水能力评估,rainfall_intensity 与 return_period 适配水文模型校准,risk_labels 可直接作为机器学习模型的分类目标,无需用户额外构建标签体系。
三、应用场景
(一)城市排水设施维护与内涝热点精准治理
城市排水设施维护中,传统 “全面巡检” 模式效率低、成本高,难以精准定位需优先维修的区域;而内涝治理常因 “找不到重点” 导致资源浪费。利用 Urban Flood Risk Data,城市管理部门可构建 “数据驱动的精准维护与治理体系”:首先基于数据集中的 elevation_m(识别低洼区域)、storm_drain_proximity_m(判断排水便利性)、risk_labels(提取 ponding_hotspot 标签),筛选出 “低 elevation + 远雨水口 + 内涝热点” 的高风险 segment;再结合 drainage_density_km_per_km² 与 land_use,进一步判断风险成因 —— 如 “Residential 区域 + 低 drainage_density” 可能因排水管网不足导致内涝,“Road 区域 + 近雨水口但仍为 ponding_hotspot” 可能因雨水口堵塞导致排水失效。
(二)城市内涝防治 capital works 优先级排序
城市内涝防治的 capital works(如新建排水管网、提升路面 elevation、建设雨水调蓄设施)需结合成本与效益确定优先级,传统决策常依赖经验判断,易出现 “高投入低效果” 的问题。该数据集可提供量化的优先级评估依据:通过整合 elevation_m(地形风险)、drainage_density_km_per_km²(现有设施基础)、historical_rainfall_intensity_mm_hr(降雨风险)、land_use(人口与资产密度)四大核心指标,构建 “内涝风险 - 防治效益” 评估模型,为 capital works 排序提供数据支撑。
具体而言,可将指标转化为量化分数:elevation_m 越低(如 <3m)、drainage_density 越低(如 < 2km/km²)、rainfall_intensity 越高(如> 80mm/hr)、land_use 为 Residential/Commercial(人口或资产密集),则优先级分数越高。
(三)内涝风险预测机器学习模型训练与水文模型校准
在机器学习内涝风险预测与传统水文模型开发中,高质量的标注数据与参数输入是核心。该数据集可同时支撑两类模型的研发:对于机器学习模型,可将 risk_labels 中的 “ponding_hotspot” 作为二分类目标(1 = 是,0 = 否),以 elevation_m、drainage_density、rainfall_intensity、soil_group(编码为数值)等为特征,训练 XGBoost、LightGBM 等分类模型,用于预测未监测区域的内涝风险;对于水文模型(如 SWMM、HEC-HMS),可利用数据集中的 drainage_density_km_per_km²(校准管网参数)、soil_group(确定下渗率参数)、historical_rainfall_intensity_mm_hr 与 return_period_years(设定降雨输入边界条件),结合 risk_labels 中的 event_YYYY-MM-DD(验证模型模拟的内涝事件与实际事件的一致性),完成模型校准。
(四)全球城市内涝风险对比分析与政策制定支持
在全球气候变化与城市化加速的背景下,跨城市内涝风险对比与区域政策制定需要大尺度、可比的数据支撑。国际组织(如 UN-Habitat)或国家层面的环境部门可利用该数据集开展 “全球城市内涝风险格局分析”:首先按 continent、income level 等维度对 58 个城市分组,对比不同组别城市的 risk_labels 分布(如高收入城市 vs 低收入城市的 ponding_hotspot 比例)、drainage_density_km_per_km² 差异(反映基础设施水平)、historical_rainfall_intensity_mm_hr(关联气候差异),识别内涝风险的全球分布特征与主要驱动因素 —— 如发现 “亚洲低收入城市” 的 ponding_hotspot 比例(35%)远高于 “欧洲高收入城市”(8%),且前者 drainage_density 平均仅为后者的 1/3,说明基础设施差距是关键驱动因素。
基于这类分析,政策制定者可针对性出台政策:对于基础设施薄弱的城市,推动 “排水管网建设专项计划”;对于降雨强度高的城市(如 historical_rainfall_intensity>100mm/hr 的城市),重点推广 “海绵城市” 建设(如增加 Green land_use 比例,提升下渗能力)。例如,某国际环保组织基于该数据集的分析结果,向东南亚低收入城市提供 “排水设施建设技术指南”,并推动国际援助资金向 “高 rainfall_intensity + 低 drainage_density” 的城市倾斜,助力这些城市提升内涝防治能力,体现数据集在全球尺度政策制定中的支撑价值。
四、结尾
Urban Flood Risk Data: Global City Analysis 2025 凭借跨城市覆盖、多维度特征、场景化设计与无门槛使用优势,成为城市内涝防治、排水设施管理、水文模型开发、机器学习风险预测的核心数据资源。它不仅解决了传统内涝数据 “覆盖有限、维度单一、标准化不足” 的痛点,还搭建了 “全球数据” 与 “本地应用” 的桥梁 —— 无论是城市管理者的精准治理需求,还是科研人员的模型研发需求,亦或是国际组织的全球风险分析需求,都能通过该数据集获得可靠支撑。在全球内涝灾害频发的背景下,该数据集对提升城市韧性、减少内涝损失、推动内涝防治技术创新具有重要现实意义,应用前景极为广泛。
验证报告
以下为卖家选择提供的数据验证报告:

2025 全球城市城市内涝风险数据集(Urban Flood Risk Data):覆盖 58 城 2900 + 监测点,含地理 / 水文 / 排水特征,助力内涝热点识别与风险预测模型训练
¥1.9
已售 0
597.69KB
申请报告