# 孟买卫星图像语义分割数据集深度解析
## 引言与背景
随着遥感技术和深度学习的快速发展,卫星图像语义分割已成为城市规划、环境监测和灾害管理等领域的重要研究方向。孟买作为印度最大的城市之一,其快速的城市化进程和复杂的土地利用模式为语义分割算法提供了极具挑战性的研究场景。本数据集专为孟买地区的土地覆盖分类任务设计,包含110张高分辨率卫星图像及其对应的手动标注语义分割掩码,同时提供经过预处理的8909张小尺寸图像,可直接用于深度学习模型的训练、验证和测试。
该数据集不仅包含完整的原始卫星图像文件,还提供了详细的类别标注信息和数据划分方案,为科研人员和开发者提供了一站式的研究资源。无论是进行算法创新研究,还是开发实际的城市分析应用,该数据集都具有重要的参考价值和应用潜力。
## 数据基本信息
### 数据字段说明
| 字段名称 | 字段类型 | 字段含义 | 数据示例 | 完整性 |
| --- | --- | --- | --- | --- |
| image | 字符串 | 图像文件名 | jp22_1.0.tif | 100% |
| mask | 字符串 | 掩码文件名 | jp22_1.0.png | 100% |
| name | 字符串 | 类别名称 | Informal Settlements | 100% |
| r | 整数 | RGB红色通道值 | 250 | 100% |
| g | 整数 | RGB绿色通道值 | 235 | 100% |
| b | 整数 | RGB蓝色通道值 | 185 | 100% |
### 数据分布情况
#### 数据集划分分布
| 数据集 | 图像数量 | 占比 |
| --- | --- | --- |
| Main_Dataset | 110 | 1.2% |
| Prepared_Dataset-Train | 7127 | 79.3% |
| Prepared_Dataset-Val | 891 | 9.9% |
| Prepared_Dataset-Test | 891 | 9.9% |
| 总计 | 8909 | 100% |
#### 类别分布
| 类别名称 | RGB颜色 | 用途说明 |
| --- | --- | --- |
| Informal Settlements | (250, 235, 185) | 非正规住区/棚户区 |
| Built-Up | (200, 200, 200) | 建成区/建筑物 |
| Impervious Surfaces | (100, 100, 150) | 不透水表面/道路 |
| Vegetation | (80, 140, 50) | 植被/绿地 |
| Barren | (200, 160, 40) | 荒地/裸地 |
| Water | (40, 120, 240) | 水体/河流湖泊 |
| Unlabelled | (0, 0, 0) | 未标注区域 |
#### 文件格式分布
| 文件类型 | 文件格式 | 数量 | 占比 |
| --- | --- | --- | --- |
| 卫星图像 | .tif | 9019 | 50.06% |
| 语义掩码 | .png | 9009 | 49.94% |
| 总计 | - | 18028 | 100% |
### 数据规模与类型
- 图像尺寸: Main_Dataset为600×600像素,Prepared_Dataset为120×120像素
- 图像格式: TIFF格式(卫星图像)、PNG格式(掩码)
- 标注类型: 像素级语义分割标注
- 覆盖区域: 印度孟买市及周边区域
- 数据来源: 高分辨率卫星影像
## 数据优势
| 优势特征 | 具体表现 | 应用价值 |
| --- | --- | --- |
| 完整原始文件 | 包含110张600×600像素的原始卫星图像及对应掩码 | 支持高精度图像分析和算法研究 |
| 高质量标注 | 手动标注的语义分割掩码,包含7个土地覆盖类别 | 保证模型训练的准确性和可靠性 |
| 预处理数据集 | 提供8909张120×120像素的小图,已划分训练/验证/测试集 | 可直接用于深度学习模型训练,节省预处理时间 |
| 类别多样性 | 涵盖非正规住区、建成区、道路、植被、荒地、水体等7类 | 支持复杂场景下的土地覆盖分类任务 |
| 数据一致性 | 图像与掩码一一对应,命名规范统一 | 便于数据管理和算法开发 |
## 数据样例
### 文件列表样例
Main_Dataset图像样例(600×600像素): - jp22_1.0.t看了又看
验证报告
以下为卖家选择提供的数据验证报告:






