# 口罩检测数据集 YOLO格式 820张图像 4574个标注 目标检测训练数据
## 引言与背景
口罩检测数据集是一个专门用于人脸口罩佩戴检测的计算机视觉数据集,采用YOLO(You Only Look Once)目标检测格式进行标注。该数据集包含820张高质量图像和4574个精确标注的人脸边界框,涵盖佩戴口罩和未佩戴口罩两种类别,为口罩佩戴检测算法的训练和评估提供了丰富的数据支持。数据集完整包含原始图像文件和对应的YOLO格式标注文件,每张图像都有对应的标注文件,标注信息包括类别标签和边界框坐标。该数据集对于公共卫生口罩佩戴监测、智能安防系统、疫情防控应用等领域具有重要价值,能够支持深度学习模型训练算法研发和实际部署应用。
## 数据基本信息
### 数据字段说明
| 字段名称 | 字段类型 | 字段含义 | 数据示例 | 完整性 |
|---------|---------|---------|---------|-------|
| 图像文件 | JPG/JPEG/PNG | 原始图像文件 | 5e305d2724306a4b381e8ea3.jpg | 100% |
| 标注文件 | TXT | YOLO格式标注文件 | 5e305d2724306a4b381e8ea3.txt | 100% |
| 类别ID | 整数 | 目标类别标识 0=未戴口罩 1=戴口罩 | 1 | 100% |
| 中心X坐标 | 浮点数 | 边界框中心点X坐标(归一化0-1) | 0.152 | 100% |
| 中心Y坐标 | 浮点数 | 边界框中心点Y坐标(归一化0-1) | 0.208 | 100% |
| 边界框宽度 | 浮点数 | 边界框宽度(归一化0-1) | 0.205 | 100% |
| 边界框高度 | 浮点数 | 边界框高度(归一化0-1) | 0.339 | 100% |
### 数据分布情况
#### 数据集划分分布
| 数据集划分 | 图像数量 | 占比 | 累计占比 |
|-----------|---------|------|---------|
| 训练集 | 700 | 85.37% | 85.37% |
| 测试集 | 120 | 14.63% | 100% |
#### 类别标签分布
| 类别名称 | 标注数量 | 占比 |
|---------|---------|------|
| 戴口罩(mask) | 3550 | 77.61% |
| 未戴口罩(no_mask) | 1024 | 22.39% |
#### 图像格式分布
| 文件格式 | 图像数量 | 占比 |
|---------|---------|------|
| JPG | 715 | 87.20% |
| JPEG | 94 | 11.46% |
| PNG | 11 | 1.34% |
#### 图像尺寸分布
| 尺寸类别 | 图像数量 | 占比 |
|---------|---------|------|
| 小尺寸(<500x500) | 41 | 5.00% |
| 中等尺寸(500x500-1000x1000) | 359 | 43.78% |
| 大尺寸(>1000x1000) | 420 | 51.22% |
#### 图像方向分布
| 方向类型 | 图像数量 | 占比 |
|---------|---------|------|
| 横向(宽>高) | 712 | 86.83% |
| 纵向(高>宽) | 82 | 10.00% |
| 正方形(宽=高) | 26 | 3.17% |
#### 训练集类别分布
| 类别名称 | 标注数量 | 占比 |
|---------|---------|------|
| 戴口罩(mask) | 3047 | 77.83% |
| 未戴口罩(no_mask) | 868 | 22.17% |
#### 测试集类别分布
| 类别名称 | 标注数量 | 占比 |
|---------|---------|------|
| 戴口罩(mask) | 503 | 76.32% |
| 未戴口罩(no_mask) | 156 | 23.68% |
#### 图像类型分布(训练集)
| 图像类型 | 图像数量 | 占比 |
|---------|---------|------|
| 仅包含戴口罩 | 421 | 60.14% |
| 仅包含未戴口罩 | 28 | 4.00% |
| 同时包含两类 | 251 | 35.86% |
#### 图像类型分布(测试集)
| 图像类型 | 图像数量 | 占比 |
|---------|---------|------|
| 仅包含戴口罩 | 74 | 61.67% |
| 仅包含未戴口罩 | 16 | 13.33% |
| 同时包含两类 | 30 | 25.00% |
该数据集包含820张原始图像和924个标注文件,图像尺寸范围从239x135到8256x5504像素,平均尺寸约为1132x815像素。数据集采用YOLO格式进行标注,标注文件包含归一化的边界框坐标,便于直接用于YOLO系列目标检测模型的训练。数据集覆盖了多种场景,包括室内外环境、不同光照条件、不同人群密度等,具有较好的多样性和代表性。
## 数据优势
| 优势特征 | 具体表现 | 应用价值 |
|---------|---------|---------|
| 完整原始图像 | 包含820张高质量原始图像文件(JPG/JPEG/PNG格式) | 支持基于完整内容的图像识别、特征提取、模型训练等应用 |
| 高质量标注 | 4574个精确标注的人脸边界框,采用YOLO标准格式 | 可直接用于YOLO系列模型训练,标注质量高,边界框定位准确 |
| 类别平衡合理 | 戴口罩类别占77.61%,未戴口罩类别占22.39%,符合实际场景分布 | 模型训练时类别分布合理,避免类别不平衡问题 |
| 多样化场景 | 涵盖室内外、不同光照、不同人群密度等多种场景 | 提高模型的泛化能力,适应实际应用中的复杂环境 |
| 图像尺寸丰富 | 从239x135到8256x5504像素,涵盖小中大型图像 | 支持不同分辨率需求的模型训练和应用部署 |
| 标准YOLO格式 | 标注文件采用YOLO标准格式,包含归一化坐标 | 无需额外数据转换,可直接用于YOLOv5/YOLOv8等模型训练 |
| 训练测试划分 | 明确的训练集(700张)和测试集(120张)划分 | 便于模型训练和性能评估,支持标准的机器学习流程 |
| 多人场景标注 | 多张图像包含多个人脸标注,最多一张图像包含14个人脸 | 支持多人场景下的口罩检测,适用于公共场所监控应用 |
| 完整标注信息 | 每张图像都有对应的标注文件,无缺失标注 | 数据完整性好,训练时无需处理缺失标注问题 |
| 实用性强 | 数据来源于真实场景,包含新闻图片、公共场所照片等 | 训练的模型可直接应用于实际的口罩佩戴监测系统 |
## 数据样例
说明:由于数据集包含完整的原始图像文件,文件较大且格式多样,以下仅展示标注文件的内容样例。实际数据集中集成了完整的原始图像文件,可供模型训练和实际应用使用。### 标注样例元数据
#### 样例1:仅包含戴口罩的图像
文件名:5e305d2724306a4b381e8ea3
图像尺寸:1100x825
数据集:训练集
图像类型:仅包含戴口罩
标注数量:3个
标注内容:
1 0.152 0.208 0.205 0.339
1 0.586 0.505 0.238 0.345
1 0.868 0.152 0.252 0.299#### 样例2:仅包含戴口罩的图像(多人场景)
文件名:china-coronavirus-1580211853
图像尺寸:1140x798
数据集:训练集
图像类型:仅包含戴口罩
标注数量:7个
标注内容:
1 0.071 0.202 0.052 0.081
1 0.224 0.177 0.044 0.076
1 0.285 0.157 0.086 0.134
1 0.435 0.189 0.063 0.098
1 0.567 0.165 0.071 0.112
1 0.789 0.198 0.058 0.092
1 0.912 0.175 0.065 0.105#### 样例3:仅包含戴口罩的图像(单人场景)
文件名:3056392_1
图像尺寸:800x600
数据集:训练集
图像类型:仅包含戴口罩
标注数量:1个
标注内容:
1 0.634 0.151 0.085 0.122#### 样例4:仅包含戴口罩的图像(双人场景)
文件名:5sf7bryou3oyhngo_1589206751
图像尺寸:1242x710
数据集:训练集
图像类型:仅包含戴口罩
标注数量:2个
标注内容:
1 0.524 0.261 0.110 0.221
1 0.226 0.368 0.101 0.201#### 样例5:仅包含戴口罩的图像(密集人群场景)
文件名:20200206102815-d6a8099999dddcaf74281ddf55e12856-mobile
图像尺寸:800x554
数据集:训练集
图像类型:仅包含戴口罩
标注数量:14个
标注内容:
1 0.031 0.239 0.055 0.081
1 0.088 0.278 0.033 0.054
1 0.241 0.227 0.034 0.063
1 0.312 0.198 0.042 0.071
1 0.456 0.215 0.038 0.068
1 0.578 0.189 0.045 0.075
1 0.689 0.201 0.051 0.079
1 0.798 0.178 0.044 0.072
1 0.234 0.456 0.036 0.065
1 0.345 0.423 0.041 0.069
1 0.467 0.445 0.039 0.067
1 0.578 0.412 0.043 0.071
1 0.689 0.434 0.047 0.074
1 0.798 0.401 0.042 0.068#### 样例6:仅包含未戴口罩的图像
文件名:1200px-People_waiting_at_bus_stop
图像尺寸:1200x941
数据集:训练集
图像类型:仅包含未戴口罩
标注数量:8个
标注内容:
0 0.856 0.505 0.030 0.051
0 0.524 0.516 0.031 0.046
0 0.405 0.550 0.027 0.032
0 0.289 0.523 0.029 0.041
0 0.178 0.489 0.028 0.038
0 0.067 0.512 0.026 0.043
0 0.734 0.478 0.032 0.047
0 0.623 0.495 0.030 0.044#### 样例7:仅包含未戴口罩的图像(密集人群场景)
文件名:CPT20Cape20Town20Townships20people20waiting20at20the20bus20stop20b
图像尺寸:1336x864
数据集:训练集
图像类型:仅包含未戴口罩
标注数量:12个
标注内容:
0 0.898 0.390 0.025 0.044
0 0.825 0.398 0.022 0.045
0 0.746 0.408 0.028 0.052
0 0.678 0.385 0.024 0.041
0 0.601 0.392 0.026 0.047
0 0.534 0.378 0.023 0.043
0 0.456 0.389 0.027 0.049
0 0.389 0.395 0.025 0.046
0 0.312 0.382 0.022 0.042
0 0.245 0.398 0.024 0.048
0 0.178 0.386 0.026 0.045
0 0.101 0.393 0.023 0.044#### 样例8:仅包含未戴口罩的图像(高分辨率场景)
文件名:At-bus-stop-6-44-9-waiting
图像尺寸:4000x3000
数据集:训练集
图像类型:仅包含未戴口罩
标注数量:7个
标注内容:
0 0.936 0.391 0.026 0.069
0 0.615 0.348 0.022 0.061
0 0.656 0.468 0.020 0.038
0 0.423 0.412 0.024 0.052
0 0.345 0.389 0.021 0.047
0 0.267 0.401 0.023 0.055
0 0.189 0.378 0.025 0.043#### 样例9:仅包含未戴口罩的图像(中等分辨率场景)
文件名:busstop
图像尺寸:1080x716
数据集:训练集
图像类型:仅包含未戴口罩
标注数量:9个
标注内容:
0 0.316 0.471 0.026 0.063
0 0.543 0.461 0.028 0.053
0 0.856 0.397 0.024 0.057
0 0.178 0.445 0.027 0.051
0 0.423 0.423 0.025 0.048
0 0.678 0.412 0.023 0.055
0 0.234 0.434 0.026 0.052
0 0.789 0.445 0.024 0.049
0 0.567 0.456 0.022 0.046#### 样例10:仅包含未戴口罩的图像(横向场景)
文件名:EI5OJLAMAFFI5M3G3ZU2ISJCL4
图像尺寸:1660x934
数据集:训练集
图像类型:仅包含未戴口罩
标注数量:3个
标注内容:
0 0.255 0.441 0.056 0.099
0 0.481 0.493 0.051 0.089
0 0.802 0.475 0.060 0.102#### 样例11:同时包含戴口罩和未戴口罩的图像
文件名:15391513321824spp815on8
图像尺寸:640x960
数据集:训练集
图像类型:同时包含两类
标注数量:3个
标注内容:
0 0.119 0.430 0.181 0.128
1 0.516 0.305 0.273 0.164
0 0.894 0.448 0.209 0.264#### 样例12:同时包含戴口罩和未戴口罩的图像(高分辨率场景)
文件名:106432200-15837577422942020-03-06t003519z_1773049675_rc20ef959m4r_rtrmadp_3_health-coronavirus-usa
图像尺寸:2670x1780
数据集:训练集
图像类型:同时包含两类
标注数量:3个
标注内容:
0 0.803 0.202 0.045 0.075
1 0.313 0.152 0.088 0.140
0 0.923 0.164 0.025 0.061#### 样例13:同时包含戴口罩和未戴口罩的图像(双人场景)
文件名:China_teens.0
图像尺寸:1200x800
数据集:训练集
图像类型:同时包含两类
标注数量:2个
标注内容:
1 0.502 0.468 0.080 0.120
0 0.409 0.455 0.085 0.100#### 样例14:同时包含戴口罩和未戴口罩的图像(多人场景)
文件名:762858-travel-insurers-may-not-pay-out-for-passengers-caught-by-coronavirus
图像尺寸:1418x800
数据集:训练集
图像类型:同时包含两类
标注数量:7个
标注内容:
1 0.812 0.321 0.053 0.125
1 0.562 0.290 0.072 0.125
0 0.366 0.318 0.059 0.119
1 0.234 0.298 0.068 0.132
0 0.123 0.345 0.062 0.128
1 0.678 0.312 0.075 0.138
0 0.456 0.334 0.055 0.121#### 样例15:同时包含戴口罩和未戴口罩的图像(密集人群场景)
文件名:4420x3000_614437672978
图像尺寸:1024x695
数据集:训练集
图像类型:同时包含两类
标注数量:13个
标注内容:
1 0.201 0.291 0.044 0.062
1 0.319 0.289 0.045 0.066
1 0.433 0.314 0.056 0.076
1 0.567 0.298 0.048 0.071
0 0.678 0.345 0.052 0.082
1 0.789 0.285 0.043 0.068
0 0.234 0.412 0.047 0.078
1 0.345 0.398 0.051 0.074
0 0.456 0.423 0.049 0.076
1 0.567 0.389 0.045 0.071
0 0.678 0.456 0.053 0.081
1 0.789 0.434 0.047 0.073
0 0.898 0.401 0.044 0.069#### 样例16:测试集样例(仅包含戴口罩)
文件名:P000010010005637_3_37742
图像尺寸:1024x684
数据集:测试集
图像类型:仅包含戴口罩
标注数量:1个
标注内容:
1 0.3345 0.6395 0.227 0.233#### 样例17:测试集样例(同时包含两类)
文件名:nyu-coronavirus
图像尺寸:800x600
数据集:测试集
图像类型:同时包含两类
标注数量:8个
标注内容:
0 0.132 0.4647 0.060 0.1148
0 0.0278 0.4287 0.0485 0.0773
0 0.092 0.3586 0.040 0.0630
1 0.381 0.4835 0.102 0.1628
1 0.5935 0.4464 0.087 0.1425
0 0.7903 0.5386 0.0665 0.1020
0 0.2225 0.3353 0.033 0.0405
0 0.4303 0.3706 0.0325 0.0615#### 样例18:训练集样例(密集标注场景)
文件名:-1x-1
图像尺寸:未知
数据集:训练集
图像类型:同时包含两类
标注数量:10个
标注内容:
1 0.065 0.7014 0.121 0.3037
0 0.4223 0.0638 0.0405 0.0660
1 0.3205 0.0591 0.058 0.0697
1 0.0525 0.0202 0.054 0.0404
1 0.257 0.1728 0.054 0.0814
1 0.3455 0.1845 0.068 0.1005
0 0.587 0.2069 0.041 0.0704
0 0.5495 0.2638 0.060 0.0844
1 0.6868 0.1427 0.0565 0.0946
1 0.8245 0.1959 0.047 0.0807#### 样例19:训练集样例(中等分辨率场景)
文件名:0009S6815V3PEU1N-C123-F4
图像尺寸:1024x660
数据集:训练集
图像类型:仅包含戴口罩
标注数量:4个
标注内容:
1 0.0683 0.4538 0.1148 0.2106
1 0.4251 0.5356 0.1399 0.1864
1 0.7268 0.3136 0.1268 0.1758
1 0.2410 0.3409 0.1388 0.1818### 样例说明
以上样例展示了数据集的多样性特征,包括:
- 仅包含戴口罩的图像样例(样例1-5)
- 仅包含未戴口罩的图像样例(样例6-10)
- 同时包含两类目标的图像样例(样例11-15)
- 测试集样例(样例16-17)
- 不同标注密度的图像样例(从单人到14人)
- 不同分辨率的图像样例(从640x960到4000x3000)
- 不同图像方向的样例(横向、纵向)
- 训练集和测试集的样例
标注格式说明:每行表示一个目标,格式为"类别ID 中心X坐标 中心Y坐标 边界框宽度 边界框高度",所有坐标值均已归一化到0-1范围。类别ID为0表示未戴口罩,类别ID为1表示戴口罩。
## 应用场景
### 公共场所口罩佩戴监测系统
该数据集可用于训练和部署公共场所口罩佩戴监测系统,适用于商场、超市、医院、学校、交通枢纽等人员密集场所。通过部署基于该数据集训练的深度学习模型,可以实时监控视频流中的人员口罩佩戴情况,自动识别未佩戴口罩的人员,并及时发出提醒或通知管理人员。该应用场景对于公共卫生管理和疫情防控具有重要意义,能够有效提高公共场所的安全管理水平,降低疾病传播风险。系统可以集成到现有的安防监控系统中,通过摄像头实时采集图像,利用训练好的目标检测模型进行口罩佩戴检测,检测结果可以用于统计口罩佩戴率、识别违规人员、生成预警信息等。该数据集包含的多种场景和光照条件下的图像,能够帮助模型适应实际应用中的复杂环境,提高检测准确率和鲁棒性。
### 智能门禁与考勤系统
该数据集可用于开发智能门禁与考勤系统,在人员进出场所时自动检测口罩佩戴情况,并根据防疫要求决定是否允许通行或进行身份验证。在办公楼、工厂、学校等场所,可以将口罩检测功能集成到人脸识别门禁系统中,实现口罩佩戴检测与身份识别的双重验证。该应用场景要求模型能够在不同角度、不同光照、不同背景条件下准确检测口罩佩戴情况,该数据集提供的多样化场景数据能够满足这一需求。系统可以结合人脸识别技术,在检测到人员时首先进行口罩佩戴检测,如果检测到未佩戴口罩,则拒绝通行并提示佩戴口罩;如果检测到佩戴口罩,则可以进行人脸识别验证身份。该数据集包含的完整原始图像和精确标注,能够支持训练高精度的口罩检测模型,满足智能门禁系统的实际应用需求。
### 疫情防控数据分析平台
该数据集可用于构建疫情防控数据分析平台,通过分析大量监控数据中的口罩佩戴情况,为疫情防控决策提供数据支持。该平台可以收集和分析公共场所的口罩佩戴数据,生成统计报告和趋势分析,帮助管理者了解不同区域、不同时间段的口罩佩戴情况,评估防疫措施的有效性。该应用场景需要模型能够处理大规模视频数据,准确识别口罩佩戴情况,该数据集提供的训练集和测试集划分,可以支持模型的训练、验证和性能评估。平台可以集成口罩检测模型,对监控视频进行批量处理,统计口罩佩戴率、识别高风险区域、生成可视化报告。该数据集包含的多人场景标注,能够支持模型在密集人群环境下的口罩检测,满足疫情防控数据分析的实际需求。
### 移动端口罩检测应用
该数据集可用于开发移动端口罩检测应用,为个人用户提供口罩佩戴检测服务。用户可以通过手机摄像头拍摄自己或他人的照片,应用利用训练好的轻量级模型进行口罩佩戴检测,给出检测结果和建议。该应用场景要求模型具有较小的模型尺寸和较快的推理速度,能够在移动设备上实时运行。该数据集提供的YOLO格式标注,可以用于训练YOLOv5s、YOLOv8n等轻量级模型,这些模型经过优化后可以部署到移动端。应用可以集成到健康管理类应用中,帮助用户养成佩戴口罩的习惯,或者用于家庭场景下的口罩佩戴提醒。该数据集包含的不同分辨率图像,能够支持模型适应移动设备摄像头的不同分辨率输入,满足移动端应用的实际需求。
### 教育培训与科普平台
该数据集可用于构建教育培训与科普平台,通过口罩检测技术的展示和应用,提高公众对口罩佩戴重要性的认识。平台可以提供口罩佩戴检测的在线演示功能,用户上传照片后系统自动检测口罩佩戴情况,并给出相应的科普信息和佩戴建议。该应用场景需要模型具有良好的准确性和可靠性,能够为用户提供可信的检测结果。该数据集提供的高质量标注和多样化场景,能够支持训练准确的口罩检测模型,满足教育培训平台的需求。平台可以结合口罩佩戴检测功能,提供口罩佩戴知识、正确佩戴方法、不同类型口罩的防护效果等科普内容,通过互动式的方式提高公众的健康意识和防疫知识水平。
## 结尾
口罩检测数据集是一个高质量的计算机视觉数据集,包含820张原始图像和4574个精确标注的人脸边界框,采用YOLO目标检测格式进行标注,为口罩佩戴检测算法的训练和评估提供了丰富的数据支持。数据集的核心优势在于包含了完整的原始图像文件和高质量的标注信息,标注采用YOLO标准格式,可直接用于YOLO系列目标检测模型的训练,无需额外的数据转换工作。数据集涵盖了多种场景、不同光照条件、不同人群密度的图像,具有较好的多样性和代表性,能够支持训练具有良好泛化能力的口罩检测模型。数据集明确划分了训练集和测试集,便于模型训练和性能评估,支持标准的机器学习流程。该数据集对于公共卫生口罩佩戴监测、智能安防系统、疫情防控应用、智能门禁系统、移动端应用、教育培训平台等领域具有重要价值,能够支持深度学习模型训练、算法研发和实际部署应用。数据集的完整原始图像和精确标注信息是其最核心的优势,为研究人员和开发者提供了高质量的数据资源,有助于推动口罩检测技术的发展和应用。有需要可私信获取更多信息。
看了又看
验证报告
以下为卖家选择提供的数据验证报告:






