きゅがんせん

verify-tag火灾检测数据集:3048张标注图像与4528个YOLO格式目标框,适用于火灾识别模型训练与安防监测算法研发

火灾应急救援智能安防

19.9

122.94MB

数据标识:D17824616691793673

发布时间:2026/06/26

# 火灾检测数据集:3048张标注图像与4528个YOLO格式目标框,适用于火灾识别模型训练与安防监测算法研发

## 引言与背景

火灾是公共安全领域中一类突发性强、危害性大的风险事件,如何利用计算机视觉技术实现对火灾的自动检测与早期预警,已成为智能安防、应急救援、工业安全等多个行业的核心研究课题。高质量的火灾图像目标检测数据集是训练深度学习模型、评估检测算法性能的基础性资源,它直接决定了火灾检测模型在真实场景中的泛化能力与落地效果。

本数据集(fire-dataset-2 v11,原始版本)通过 Roboflow 平台整理发布,采用 CC BY 4.0 开源许可协议。数据集共包含 3048 张真实场景图像,统一以 YOLO v5 PyTorch 格式提供目标检测标注,涵盖训练集与验证集两个数据划分。数据集的完整内容包括三大部分:一是原始 JPG 图像文件;二是与图像一一对应的 YOLO 格式标注文本文件(.txt);三是数据描述文件(data.yaml、README.roboflow.txt、README.dataset.txt),其中 data.yaml 明确给出了类别名称(仅含 "fire" 一个类别)与数据划分路径。所有图像均经过 EXIF 方向自动校正预处理,以确保模型训练时图像朝向一致。

该数据集对于火灾检测领域的研究与应用具有多方面价值。首先,它提供了完整的原始图像与配套目标框标注,研究人员可以直接将其用于 YOLO 系列、Faster R-CNN、SSD 等主流检测模型的训练与迁移学习。其次,数据来源多元、图像分辨率多样、火灾表现形式丰富,既包含近距离清晰火焰,也包含远距离烟雾与小火苗,有助于提升模型在复杂场景下的鲁棒性。再次,数据集已预先划分为训练集与验证集,并完成方向校正,研究人员无需再进行繁琐的数据预处理即可快速开展实验,显著降低研发门槛。对于安防监控、森林火情预警、工厂火灾检测、智能家居报警等行业应用而言,该数据集可作为构建行业专用火灾检测模型的重要基础数据资源。

## 数据基本信息

本数据集整体规模为 3048 张图像,按照 92.9:7.1 的比例划分为训练集(2837 张)与验证集(211 张)。所有图像均为 JPG 格式,标注为 YOLO v5 PyTorch 格式(即每行一个目标,格式为 class_id center_x center_y width height,各坐标值均为相对图像宽高归一化后的浮点数)。数据集仅包含一个类别 "fire"(class_id = 0),所有目标框均为火灾相关的视觉目标。

### 数据字段说明

本数据集以"图像—标注文件"成对形式组织,标注文件为纯文本格式,每一行描述一个目标框。字段含义如下:

| 字段名称 | 字段类型 | 字段含义 | 数据示例 | 完整性 |
| --- | --- | --- | --- | --- |
| class_id | 整数 | 目标类别编号,本数据集固定为 0(fire) | 0 | 100%(全部标注行均有效) |
| center_x | 浮点数 | 目标框中心点 x 坐标,相对图像宽度归一化至 [0,1] | 0.41928571428571426 | 100% |
| center_y | 浮点数 | 目标框中心点 y 坐标,相对图像高度归一化至 [0,1] | 0.5867469879518072 | 100% |
| width | 浮点数 | 目标框宽度,相对图像宽度归一化至 [0,1] | 0.43 | 100% |
| height | 浮点数 | 目标框高度,相对图像高度归一化至 [0,1] | 0.7012048192771084 | 100% |
| image_file | 字符串 | 图像文件名(含扩展名,对应原始图像) | 20-fire_jpg.rf.2af2a50ea02d4bebb4397cc702d21716.jpg | 100% |
| label_file | 字符串 | 标注文件名(与图像同名,扩展为 .txt) | 20-fire_jpg.rf.2af2a50ea02d4bebb4397cc702d21716.txt | 100%(共 3048 份,与图像一一对应) |
| split | 枚举(train/valid) | 所属数据划分 | train | 100% |

### 数据集划分与目标框分布

按全量数据统计,训练集共 2837 张图像、4260 个目标框;验证集共 211 张图像、268 个目标框;合计 3048 张图像、4528 个目标框,平均每张图像约 1.49 个火灾目标。

| 数据划分 | 图像数量 | 图像占比 | 目标框数量 | 目标框占比 | 平均目标框数/张 |
| --- | --- | --- | --- | --- | --- |
| 训练集 (train) | 2837 | 93.07% | 4260 | 94.19% | 1.502 |
| 验证集 (valid) | 211 | 6.93% | 268 | 5.81% | 1.270 |
| 合计 | 3048 | 100.00% | 4528 | 100.00% | 1.486 |

### 类别(标签)分布

本数据集为单类别火灾检测数据集,所有目标框均属于同一类别 "fire"。

| 类别 ID | 类别名称 | 含义 | 目标框数量 | 占比 |
| --- | --- | --- | --- | --- |
| 0 | fire | 火灾/火焰/火情相关目标 | 4528 | 100.00% |

### 单图目标框数量分布

按每张图像所包含的目标框数量进行分箱统计,可观察到绝大多数图像包含 1—2 个火灾目标,少量图像为空白或包含较多目标框。

| 单图目标框数区间 | 训练集图像数 | 训练集占比 | 验证集图像数 | 验证集占比 | 全量合计 | 全量占比 |
| --- | --- | --- | --- | --- | --- | --- |
| 0(无目标) | 94 | 3.31% | 11 | 5.21% | 105 | 3.45% |
| 1—2 | 2479 | 87.35% | 188 | 89.10% | 2667 | 87.49% |
| 3—5 | 216 | 7.61% | 11 | 5.21% | 227 | 7.44% |
| 6—10 | 33 | 1.16% | 1 | 0.47% | 34 | 1.12% |
| 11 及以上 | 15 | 0.53% | 0 | 0.00% | 15 | 0.49% |
| 合计 | 2837 | 100.00% | 211 | 100.00% | 3048 | 100.00% |

### 图像分辨率分布(按抽样 Top 分辨率统计)

数据集覆盖多档常见视频与监控分辨率,兼顾低分辨率远景与高分辨率近景,有利于模型学习不同尺度的火灾特征。以下为抽样 500 张训练集图像与全量验证集图像的分辨率分布统计。

| 分辨率 (宽×高) | 训练集样本数 | 训练集占比 | 验证集样本数 | 验证集占比 |
| --- | --- | --- | --- | --- |
| 478×358 | 70 | 14.00% | 50 | 23.70% |
| 1280×720 | 58 | 11.60% | 31 | 14.69% |
| 600×336 | 57 | 11.40% | 59 | 27.96% |
| 854×480 | 56 | 11.20% | — | — |
| 224×224 | 53 | 10.60% | 20 | 9.48% |
| 720×1280 | 46 | 9.20% | 15 | 7.11% |
| 480×360 | 45 | 9.00% | — | — |
| 480×320 | 24 | 4.80% | 13 | 6.16% |
| 960×720 | 20 | 4.00% | — | — |
| 360×178 | 19 | 3.80% | — | — |
| 1920×1080 | — | — | 12 | 5.69% |
| 其他分辨率 | 56 | 11.20% | 11 | 5.21% |
| 合计 | 500 | 100.00% | 211 | 100.00% |

### 图像文件格式分布

| 文件格式 | 训练集图像数 | 训练集占比 | 验证集图像数 | 验证集占比 |
| --- | --- | --- | --- | --- |
| JPG / .jpg | 2837 | 100.00% | 211 | 100.00% |

### 主要数据来源(按文件名前缀 Top N)

根据文件名中的语义前缀(如 firevid、part、classk、img、3_mp4、6_mp4 等),可大致推断数据源自多段不同的视频源与图片采集源,覆盖监控视频截帧、新闻/网络图片、实地拍摄等多种渠道。

| 来源前缀(推断) | 训练集图像数 | 训练集占比 | 说明 |
| --- | --- | --- | --- |
| part | 981 | 34.58% | 多段视频截帧片段 |
| firevid | 812 | 28.63% | 火灾视频截帧 |
| classk | 402 | 14.17% | 课程/课堂素材 |
| img | 300 | 10.57% | 通用图片采集 |
| 3_mp4 | 109 | 3.84% | MP4 视频 3 截帧 |
| 6_mp4 | 104 | 3.67% | MP4 视频 6 截帧 |
| test | 30 | 1.06% | 测试/样例图像 |
| 其他前缀 | 99 | 3.49% | 含 clouds、screenshot、编号序号等 |
| 合计 | 2837 | 100.00% | — |

## 数据优势

| 优势特征 | 具体表现 | 应用价值 |
| --- | --- | --- |
| 完整原始图像覆盖 | 全部 3048 张 JPG 图像均提供原始文件,配套 YOLO 标注一一对应,无缺失 | 研究人员可直接用于目标检测、图像分类、分割等多任务建模,也便于进行数据增强与迁移学习 |
| 专业 YOLO v5 PyTorch 标注格式 | 采用主流 YOLO 系列框架默认支持的文本标注格式,无需额外转换即可接入 YOLOv5 / YOLOv8 / YOLOv10 等训练流水线 | 显著降低工程接入成本,适合算法工程师快速迭代模型 |
| 单类别纯净标注 | 仅包含 "fire" 一个类别,所有 4528 个目标框均为火灾相关目标,标注语义边界清晰 | 训练火灾单类检测器时不受其他类别噪声干扰,有利于提升模型精度与收敛速度 |
| 多分辨率、多尺度覆盖 | 分辨率跨度从 224×224 到 1920×1080,既有远景小火苗也有近景大面积火焰 | 提升模型在真实监控、无人机巡检、手持设备等不同成像条件下的泛化能力 |
| 已完成数据划分 | 提供训练集 2837 张与验证集 211 张,划分比例合理(约 93:7) | 可直接用于模型训练与验证,避免研究者自行划分带来的数据泄露风险 |
| 图像来源多元 | 涵盖多段 MP4 视频截帧、实地拍摄、网络采集等多种渠道,场景丰富 | 覆盖工厂、森林、室内、车辆等多种火灾场景,提升模型跨场景适应性 |
| 已做 EXIF 方向校正 | 预处理阶段已剥离 EXIF 旋转方向信息,所有图像朝向一致 | 避免模型训练时因方向不一致引入噪声,提高训练稳定性 |
| 开放 CC BY 4.0 许可 | 以 CC BY 4.0 协议发布,可在注明来源的前提下用于科研与商用 | 适合高校、企业、科研院所的广泛研究与产业化应用 |

## 数据样例

为更直观地展示数据集内容,以下给出若干具有代表性的样例。需要说明的是:由于 Markdown 文档无法直接嵌入大量原始 JPG 图像文件,这里仅展示 YOLO 格式的标注文本样例与文件命名样例。实际数据集中包含完整的 3048 张原始 JPG 图像文件,可直接下载用于模型训练与算法研发。

### 样例一:标注文件样例(YOLO v5 格式)

每张图像配套一个同名 .txt 文件,每行对应一个火灾目标框,字段依次为 class_id center_x center_y width height(全部为相对比例,取值范围 [0,1])。

文件:train/20-fire_jpg.rf.2af2a50ea02d4bebb4397cc702d21716.txt(包含 3 个火灾目标)
0 0.41928571428571426 0.5867469879518072 0.43 0.7012048192771084
0 0.019285714285714285 0.5542168674698795 0.03571428571428571 0.05301204819277108
0 0.24928571428571428 0.06626506024096386 0.04428571428571428 0.12289156626506025
文件:train/12-factory_fire_jpg.rf.b7c6a25aab14fa8f8381c528f97c3876.txt(包含 1 个大面积火灾目标)
0 0.5010416666666667 0.5006944444444444 0.9979166666666667 0.9986111111111111
文件:train/11-121124-Bangladesh_fire-AP26053436630_jpg.rf.7c923b60f18a0e7adb1be8c04842f1b4.txt(包含 10 个火灾目标,多目标密集场景)
0 0.12578125 0.2833333333333333 0.0515625 0.1375
0 0.2984375 0.325 0.0875 0.1
0 0.315625 0.8354166666667 0.115625 0.13333333333333333
0 0.5796875 0.40520833333333334 0.046875 0.08125
0 0.4328125 0.37083333333333335 0.08125 0.13333333333333333
0 0.65078125 0.7008333333333333 0.109375 0.1875
0 0.6734375 0.2783333333333333 0.0703125 0.1
0 0.8484375 0.3741666666666666 0.06875 0.1125
0 0.5734375 0.5591666666666667 0.0796875 0.10416666666666667
0 0.85625 0.6604166666666666 0.090625 0.10833333333333333
文件:valid/3_mp4-77_jpg.rf.6c58f0872beb12a737a64dc1b78f5ae9.txt(验证集样例,单目标小火焰)
0 0.536328125 0.6083333333333333 0.07421875 0.125

### 样例二:文件命名与列表样例

数据集采用"原图文件名 + .jpg"与同名 .txt 标注文件成对组织,文件名前缀通常保留原始数据来源信息,便于研究者回溯与分类。以下为若干典型的文件名样例,涵盖不同分辨率、不同来源、不同场景。

| 类型 | 文件名 | 场景/来源推断 | 分辨率(抽样) | 目标框数 |
| --- | --- | --- | --- | --- |
| 训练集样例 | train/images/20-fire_jpg.rf.2af2a50ea02d4bebb4397cc702d21716.jpg | 近距离火灾场景 | 478×358 | 3 |
| 训练集样例 | train/images/12-factory_fire_jpg.rf.b7c6a25aab14fa8f8381c528f97c3876.jpg | 工厂火灾场景 | 1280×720 | 1 |
| 训练集样例 | train/images/10-image_jpg.rf.8a91f82adf23f19b14458bf830aa9a4b.jpg | 网络图片 | 854×480 | 6 |
| 训练集样例 | train/images/3_mp4-77_jpg.rf.ddf42a29ef25325e95f18dee777622c0.jpg | MP4 视频 3 截帧 | 600×336 | 1 |
| 训练集样例 | train/images/6_mp4-82_jpg.rf.b23cbd21b2074a670212e0c47afe6974.jpg | MP4 视频 6 截帧 | 1280×720 | 2 |
| 训练集样例 | train/images/img_144_jpg.rf.ad3800110e6a08aa3ae2a220333120a1.jpg | 通用采集图片 | 478×358 | 1 |
| 训练集样例 | train/images/img_378_jpg.rf.0811bd57c89325010f2c29680e336e80.jpg | 通用采集图片 | 720×1280 | 2 |
| 训练集样例 | train/images/76-delhifire_jpg.rf.e82de6b8cd4eca72841061e9f65ca5a0.jpg | 新德里火灾实拍 | 480×360 | 1 |
| 训练集样例 | train/images/68-09fire1_jpg.rf.dab57805fb033c380a852ad5597a4c42.jpg | 火灾实拍 | 224×224 | 1 |
| 训练集样例 | train/images/38-fire-tent_jpg.rf.80e0226d1f99dcfeaddae6918fe9f1fc.jpg | 帐篷火灾 | 960×720 | 2 |
| 训练集样例 | train/images/23-fire751_jpg.rf.ee358754cb46050bb1dfce4305997104.jpg | 编号 751 火灾 | 480×320 | 1 |
| 训练集样例 | train/images/62-khoun-7_jpg.rf.3b826089563c73d1136d280e3e8262f.jpg | 网络图片 | 854×480 | 1 |
| 验证集样例 | valid/images/3_mp4-47_jpg.rf.83e5a7a940f7aec931540326dc4d44e0.jpg | MP4 视频截帧 | 600×336 | 1 |
| 验证集样例 | valid/images/3_mp4-90_jpg.rf.fee6f47de241380432799f10c3abd1e4.jpg | MP4 视频截帧 | 1280×720 | 1 |
| 验证集样例 | valid/images/6_mp4-55_jpg.rf.7386c25958eb643b7eb4671a7339cf62.jpg | MP4 视频截帧 | 1920×1080 | 1 |

### 样例三:data.yaml 配置文件样例

yaml
train: ../../input/dataset-2/dataset_2/train/images
val: ../../input/dataset-2/dataset_2/valid/images

nc: 1
names: ['fire']

该配置文件可直接配合 YOLOv5 / YOLOv8 等框架进行训练。

## 应用场景

火灾检测数据集在科研与产业中具有广泛的应用价值。结合本数据集的完整原始图像资源与高质量 YOLO 标注,可支持多种基于视觉的火灾智能应用。

### 场景一:火灾目标检测模型训练与迁移学习

这是本数据集最直接、最核心的应用场景。研究人员可以基于本数据集训练各类主流火灾检测模型,包括两阶段检测器(如 Faster R-CNN、Cascade R-CNN)、单阶段检测器(如 YOLO 系列、SSD、RetinaNet)以及基于 Transformer 的检测架构(如 DETR、Deformable DETR 等)。由于数据集仅包含单一 "fire" 类别,研究人员可以将训练重点聚焦于火灾特征的学习,避免多类别检测中常见的类别不平衡与语义冲突问题。同时,数据集覆盖多分辨率与多尺度目标,有助于模型学习从微小火苗到大面积火灾的尺度不变特征。在迁移学习方面,用户可以先在本数据集上预训练火灾检测基础模型,再将其迁移至特定行业(如森林火情、工厂火情、家庭厨房火情)的小样本数据集上进行微调,从而显著降低标注成本。该场景的价值在于,为火灾检测算法研究提供了一个开箱即用的高质量基准数据,有助于推动火灾检测领域的算法创新与性能评测。

### 场景二:智能安防监控与早期火灾预警系统

在公共安防领域,火灾的早期发现对于降低人员伤亡与财产损失至关重要。本数据集可用于构建面向实时监控画面的火灾检测算法,支持摄像头、NVR、家用摄像机等设备的实时火情分析。算法可以对每帧监控图像进行火灾目标检测,一旦识别到火灾目标,即刻触发报警并联动安防设施(如喷淋系统、门禁、广播疏散等)。由于数据集覆盖多种分辨率与多种距离的火灾目标,算法在真实监控场景中具有较强的适应性。此外,还可以结合时序信息,将本数据集的单帧标注作为基础,进一步扩展为视频火灾检测或异常行为检测数据集,用于研究连续火情演变规律。该场景的价值体现在通过 AI 视觉手段提升传统安防系统的主动预警能力,为构建智慧消防与智慧城市提供核心算法支撑。

### 场景三:森林火情监测与应急指挥决策支持

森林火灾具有突发性强、蔓延快、扑救难度大的特点,无人机巡检与卫星遥感是当前森林火情监测的重要技术手段。本数据集可作为森林火灾检测模型训练的基础数据源之一,通过与无人机航拍图像、卫星遥感图像的联合微调,可构建面向森林场景的火情检测模型。模型能够自动识别烟雾、明火、火点等视觉特征,并在地图上进行定位标注,为应急指挥中心提供实时火情分布、蔓延趋势等决策支持信息。相比传统人工瞭望与巡逻方式,基于计算机视觉的自动化监测具有响应速度快、覆盖范围广、全天候工作的优势,可显著提升森林火灾的早期发现与应急处置效率。

### 场景四:工业场景火灾安全监测

在化工厂、仓库、机房、变电站等工业场所,火灾的早期预警对于保障安全生产至关重要。本数据集覆盖工厂、仓库等多种场景的火灾图像,可用于训练面向工业场景的火灾检测模型。企业可以在关键区域部署摄像头,利用该模型实时监测火情隐患,并联动 DCS 控制系统自动触发停机、断气、报警等安全流程。特别是在无人值守机房、自动化仓库、易燃易爆场所等场景下,基于本数据集训练的火灾检测算法可作为重要的主动安全防线,有效降低火灾风险,减少生产事故与经济损失。

### 场景五:移动端与边缘设备火灾检测应用

随着智能手机、智能相机、家用机器人等边缘设备的普及,在端侧部署轻量级火灾检测模型成为一种重要的应用方向。本数据集可用于训练 MobileNet、ShuffleNet 等轻量骨干网络配合 YOLO 等检测头的边缘模型,通过知识蒸馏、量化、剪枝等压缩技术,将模型部署到移动端与边缘设备。用户可以通过手机 App 对家中、办公场所进行自助火灾隐患检查,家用扫地机器人也可在巡航时进行火情监测。本数据集多分辨率、多尺度的特点,使得所训练的模型在移动端不同成像条件下仍具备良好的检测性能,为 C 端消费者提供了便捷的火灾安全自检能力。

### 场景六:火灾检测算法的基准评测与学术研究

在学术研究领域,本数据集可作为火灾检测算法的基准测试集,用于对比不同检测算法、不同骨干网络、不同训练策略的性能表现。研究者可以在统一的数据划分与评价指标下(如 mAP、Precision、Recall、F1-Score、FPS 等),客观评价所提方法的先进性。同时,数据集丰富的场景与多样的分辨率,也为研究人员开展小目标检测、多尺度特征融合、单/零样本检测、领域自适应等前沿课题提供了良好的数据基础,对推动火灾检测领域的学术发展具有积极意义。

## 结尾

本数据集是一份面向火灾检测任务的高质量、开源、即用型数据集,共包含 3048 张原始 JPG 图像与 4528 个 YOLO v5 格式标注目标框,覆盖训练集与验证集两个划分。数据集具有原始文件完整、标注格式规范、类别语义纯净、分辨率多样、来源多元等核心优势,可广泛应用于火灾检测模型训练、智能安防监控、森林火情监测、工业安全、移动端边缘应用以及算法评测等多个科研与产业场景。

特别需要强调的是,数据集中包含完整的 3048 张原始 JPG 图像文件,这是其区别于仅含元数据的汇总型数据集的核心优势。研究人员与工程师无需额外寻找原始图像资源,即可直接开展从数据预处理、模型训练、到系统部署的全流程研发工作,大幅降低技术门槛与时间成本。

本数据集基于 CC BY 4.0 协议发布,遵循"署名—非商业性使用—相同方式共享"的开放原则,欢迎在注明来源的前提下用于科学研究、教育教学与产品开发。如在使用过程中有更多需求,可私信获取更多信息。希望本数据集能够为火灾智能检测技术的发展提供有力的数据支撑,为公共安全与智慧城市建设贡献价值。

看了又看

验证报告

以下为卖家选择提供的数据验证报告:

data icon
火灾检测数据集:3048张标注图像与4528个YOLO格式目标框,适用于火灾识别模型训练与安防监测算法研发
19.9
122.94MB
申请报告