panpan

verify-tag工业纺织物瑕疵检测图像分块数据集

纺织品自动化

49

160.94MB

数据标识:D17808874546975154

发布时间:2026/06/08

## 引言与背景

在现代工业制造体系中,纺织品的表面质量直接关系到产品等级、客户满意度与企业的市场竞争力。传统的人工目视检测方式不仅效率低下、成本高昂,而且极易受检测人员主观疲劳度与经验差异的影响,难以满足规模化、高节拍生产线对稳定检测精度的要求。随着工业4.0与智能制造的深入推进,基于机器视觉与深度学习的自动化瑕疵检测技术逐渐成为行业升级的关键技术路径。

本数据集是一套面向纺织物表面瑕疵检测研究与应用的高质量图像资源库,全部由真实工业生产环境下的高分辨率纺织物原始图像按统一规则切分得到,覆盖了正常样本以及破洞、异色异物、油污、线头异常四类典型缺陷。数据集的完整内容构成清晰、层次分明:根目录下按类别划分为 good(正常样本)、hole(破洞缺陷)、objects(异色/异物缺陷)、oil spot(油污缺陷)以及 thread error(线头/断线缺陷)五个子目录,每个子目录中保存了若干以 PNG 格式存储的 64×64 像素图像分块;图像的命名遵循 <原始图像序号>_patch<网格行号>-<网格列号>.png 的规范化规则,使每张分块图像在空间位置与原始大图之间能够一一映射。这种以"原始大图—分块小图"为骨架的层级化数据组织方式,使数据集天然支持像素级、区域级以及图像级三种粒度的算法训练与验证任务。

对科研工作者而言,本数据集提供了经过严格切分与标注的训练样本,可直接用于卷积神经网络、视觉Transformer、扩散模型以及自监督对比学习等算法的训练与对比实验;对企业研发团队而言,数据集以接近生产现场的样本分布还原了真实业务场景,能够有效支持产线检测算法快速落地、模型迭代与A/B测试;同时,海量分块图像也为异常检测、少样本学习、零样本识别以及数据增广等方向提供了充足的实验素材。综合来看,本数据集兼顾学术价值与工程价值,是纺织物智能检测领域开展研究、产品研发与产业落地的重要基础资源。

## 数据基本信息

本数据集共包含 25,600 张 64×64 像素的 PNG 格式图像分块,按照缺陷类别分布在 5 个子目录中。整体数据体量约 160.94 MB,平均单张图像约 6.6 KB,便于存储、传输与训练。所有图像均为 RGB 彩色图像,像素完整,无文件损坏。下面分别从数据字段、数据分布、源图构成等多个维度对数据进行系统化说明。

### 数据字段说明

| 字段名称 | 字段类型 | 字段含义 | 数据示例 | 完整性 |
| :--- | :--- | :--- | :--- | :--- |
| 文件名 | 字符串 | 命名规则为 <原始图像序号>_patch<网格行号>-<网格列号>.png,其中原始图像序号为三位数字编号,patch 后第一个数字为行号(0–7),第二个数字为列号(0–7) | 000_patch0-0.png139_patch3-2.png | 100% |
| 类别标签 | 字符串 | 由所属子目录决定,共 5 类:goodholeobjectsoil spotthread error | good | 100% |
| 图像尺寸 | 整数元组 | 统一为 64 像素 × 64 像素(高 × 宽) | 64×64 | 100% |
| 颜色通道 | 整数 | RGB 三通道彩色图像 | 3 | 100% |
| 文件格式 | 字符串 | 统一为 PNG 格式,支持无损压缩与透明通道 | .png | 100% |
| 文件大小 | 整数(字节) | 单文件体积约 5–9 KB,平均约 6,600 字节 | 6,587 bytes | 100% |
| 原始图像编号 | 字符串 | 文件名中下划线前的三位数字,对应一张 512×512 的原始纺织物大图 | 000139 | 100% |
| 分块空间位置 | 字符串 | 形如 <行>-<列>,对应原始图像 8×8 网格中的具体位置 | 0-03-2 | 100% |

### 数据总体规模概览

| 维度 | 取值 |
| :--- | :--- |
| 图像总数 | 25,600 张 |
| 类别数 | 5 类(1 类正常 + 4 类缺陷) |
| 原始大图数量 | 约 801 张(每张 512×512,由 8×8 个 64×64 分块组成) |
| 图像分辨率 | 64×64 像素 |
| 颜色模式 | RGB |
| 文件格式 | PNG |
| 数据总大小 | 160.94 MB |
| 平均单文件大小 | 约 6.6 KB |
| 缺失值/损坏文件 | 0 |

### 类别分布情况

下表展示了数据集中各缺陷类别的样本数量与占比情况,按样本数量从高到低排序,便于快速了解类别均衡性。

| 类别 | 中文释义 | 样本数量 | 占比 | 累计占比 |
| :--- | :--- | ---: | ---: | ---: |
| good | 正常(无缺陷)样本 | 23,170 | 90.51% | 90.51% |
| objects | 异色/异物类缺陷 | 837 | 3.27% | 93.78% |
| oil spot | 油污类缺陷 | 636 | 2.48% | 96.27% |
| thread error | 线头/断线类缺陷 | 620 | 2.42% | 98.69% |
| hole | 破洞类缺陷 | 337 | 1.32% | 100.00% |
| 合计 | — | 25,600 | 100.00% | — |

### 源图与分块对应关系分布

下表汇总了各类别下覆盖的原始大图数量、每张源图对应的分块数量范围与平均值,揭示了"正常样本覆盖完整、缺陷样本局部出现"的数据生成逻辑。

| 类别 | 原始大图数 | 单源图最少分块数 | 单源图最多分块数 | 单源图平均分块数 |
| :--- | ---: | ---: | ---: | ---: |
| good | 400 | 30 | 63 | 57.92 |
| objects | 100 | 1 | 34 | 8.37 |
| oil spot | 100 | 1 | 22 | 6.36 |
| thread error | 100 | 1 | 18 | 6.20 |
| hole | 101 | 1 | 16 | 3.34 |
| 合计/区间 | 801 | 1 | 63 | — |

> 说明:每个原始大图理论上最多可被切分为 8×8 = 64 个 64×64 分块;"good"类别中部分靠近图像边缘的分块因视野受限被剔除,单源图分块数集中分布在 30–63 之间;4 类缺陷则按"缺陷位置覆盖"原则仅保留含缺陷的分块,因此单源图分块数普遍较少但更具针对性。

### 文件格式分布

| 文件格式 | 文件数量 | 占比 |
| :--- | ---: | ---: |
| PNG | 25,600 | 100.00% |
| 其他 | 0 | 0.00% |

### 颜色通道分布

| 颜色模式 | 文件数量 | 占比 |
| :--- | ---: | ---: |
| RGB(三通道) | 25,600 | 100.00% |
| 灰度/单通道 | 0 | 0.00% |

### 文件大小分布

| 类别 | 总体积(MB) | 平均单文件大小(字节) |
| :--- | ---: | ---: |
| good | 145.57 | 6,587.99 |
| objects | 5.32 | 6,665.92 |
| oil spot | 4.02 | 6,633.40 |
| thread error | 3.86 | 6,521.77 |
| hole | 2.16 | 6,734.45 |
| 合计 | 160.94 | 约 6,628.7(整体均值) |

## 数据优势

本数据集在内容构成、标注质量、应用适配等多个层面具备显著优势,能够为研究与工程团队提供高性价比的数据支撑。下表从优势特征、具体表现、应用价值三个角度进行系统化梳理。

| 优势特征 | 具体表现 | 应用价值 |
| :--- | :--- | :--- |
| 完整原始图像—分块层级结构 | 数据集由约 801 张 512×512 的原始大图按 8×8 网格切分得到 25,600 张 64×64 分块;通过文件名前缀和 patch 坐标可实现原始大图与分块小图之间的双向还原 | 完整支持像素级语义分割、区域级目标检测与图像级分类三种粒度的算法训练,最大化数据复用价值 |
| 类别覆盖典型工业缺陷 | 同时包含 good、hole、objects、oil spot、thread error 共 5 类,覆盖正常与 4 类高发纺织物缺陷 | 一站式满足多类别瑕疵检测算法的开发与基准测试需求,贴近真实工厂质检场景 |
| 大规模正常样本支撑自监督/异常检测 | 正常样本共 23,170 张,占比 90.51%,覆盖 400 张不同源图 | 适合 PatchCore、PaDiM、Simplenet 等基于正常样本建模的工业异常检测算法,为少样本与零样本学习提供充足语料 |
| 高质量像素级标注 | 缺陷分块按"缺陷区域覆盖"原则严格筛选,单源图缺陷分块数最少 1、最多 34 | 训练得到的模型可精准定位到 64×64 的最小缺陷单元,便于在实际产线中将检测结果反推回原始大图坐标 |
| 统一规范的命名与格式 | 全部采用 PNG 格式、64×64 尺寸、<编号>_patch<行>-<列>.png 命名规则,文件结构清晰 | 极大降低数据加载与预处理代码的复杂度,团队可零成本接入 PyTorch、TensorFlow 等主流框架 |
| 适中的数据体量 | 总大小 160.94 MB,单文件约 6.6 KB | 在普通个人电脑、笔记本电脑甚至嵌入式开发板上均可完成全量训练与推理,便于教学演示与边缘部署验证 |
| 类别不均衡特性贴近真实工业场景 | 正常样本远多于缺陷样本,4 类缺陷样本量梯度分布 | 有助于研究者直接面对真实场景中的长尾分布问题,研究类别不均衡下的损失函数、采样策略与阈值调整方法 |
| 完整的原始图像可供二次加工 | 25,600 张分块完整覆盖约 801 张原始大图,研究者可根据需要重新切分、增广或合成新样本 | 灵活支持滑动窗口切分、数据增广、合成缺陷、跨域迁移等多种二次开发方式 |

## 数据样例

由于完整原始图像分块数量庞大(25,600 张 PNG 文件),本节仅列出具有代表性的命名样例,以展示数据集的命名规则、空间分布与类别多样性。实际数据集中包含完整的 25,600 张原始分块文件可供使用,涵盖所有类别、所有源图编号以及 8×8 网格中的全部空间位置。

### good(正常样本)样例

| 文件名 | 所属源图 | 网格位置 | 类别 |
| :--- | :---: | :---: | :---: |
| 000_patch0-0.png | 000 | 第 0 行第 0 列 | good |
| 000_patch1-2.png | 000 | 第 1 行第 2 列 | good |
| 001_patch0-4.png | 001 | 第 0 行第 4 列 | good |
| 001_patch3-5.png | 001 | 第 3 行第 5 列 | good |
| 004_patch7-7.png | 004 | 第 7 行第 7 列 | good |
| 010_patch5-3.png | 010 | 第 5 行第 3 列 | good |
| 025_patch6-0.png | 025 | 第 6 行第 0 列 | good |
| 100_patch2-2.png | 100 | 第 2 行第 2 列 | good |
| 200_patch4-4.png | 200 | 第 4 行第 4 列 | good |
| 399_patch1-6.png | 399 | 第 1 行第 6 列 | good |

### hole(破洞缺陷)样例

| 文件名 | 所属源图 | 网格位置 | 类别 |
| :--- | :---: | :---: | :---: |
| 000_patch1-1.png | 000 | 第 1 行第 1 列 | hole |
| 001_patch6-6.png | 001 | 第 6 行第 6 列 | hole |
| 002_patch4-5.png | 002 | 第 4 行第 5 列 | hole |
| 003_patch0-7.png | 003 | 第 0 行第 7 列 | hole |
| 014_patch2-7.png | 014 | 第 2 行第 7 列 | hole |
| 022_patch3-1.png | 022 | 第 3 行第 1 列 | hole |
| 050_patch5-2.png | 050 | 第 5 行第 2 列 | hole |
| 080_patch2-3.png | 080 | 第 2 行第 3 列 | hole |

### objects(异色/异物缺陷)样例

| 文件名 | 所属源图 | 网格位置 | 类别 |
| :--- | :---: | :---: | :---: |
| 139_patch1-1.png | 139 | 第 1 行第 1 列 | objects |
| 139_patch3-3.png | 139 | 第 3 行第 3 列 | objects |
| 141_patch5-1.png | 141 | 第 5 行第 1 列 | objects |
| 142_patch2-0.png | 142 | 第 2 行第 0 列 | objects |
| 160_patch4-2.png | 160 | 第 4 行第 2 列 | objects |
| 200_patch1-4.png | 200 | 第 1 行第 4 列 | objects |
| 250_patch3-2.png | 250 | 第 3 行第 2 列 | objects |

### oil spot(油污缺陷)样例

| 文件名 | 所属源图 | 网格位置 | 类别 |
| :--- | :---: | :---: | :---: |
| 047_patch0-1.png | 047 | 第 0 行第 1 列 | oil spot |
| 047_patch1-3.png | 047 | 第 1 行第 3 列 | oil spot |
| 049_patch3-7.png | 049 | 第 3 行第 7 列 | oil spot |
| 050_patch4-2.png | 050 | 第 4 行第 2 列 | oil spot |
| 052_patch3-2.png | 052 | 第 3 行第 2 列 | oil spot |
| 080_patch5-0.png | 080 | 第 5 行第 0 列 | oil spot |

### thread error(线头/断线缺陷)样例

| 文件名 | 所属源图 | 网格位置 | 类别 |
| :--- | :---: | :---: | :---: |
| 087_patch1-1.png | 087 | 第 1 行第 1 列 | thread error |
| 087_patch3-0.png | 087 | 第 3 行第 0 列 | thread error |
| 093_patch2-2.png | 093 | 第 2 行第 2 列 | thread error |
| 094_patch2-5.png | 094 | 第 2 行第 5 列 | thread error |
| 095_patch1-6.png | 095 | 第 1 行第 6 列 | thread error |
| 096_patch4-4.png | 096 | 第 4 行第 4 列 | thread error |

> 提示:以上样例覆盖了 5 个类别、约 30 张代表性源图以及 8×8 网格中不同的行列位置,能直观呈现数据集在类别多样性与空间分布上的均衡性。完整数据集中每张源图均存在完整的 patch 序列,研究者可按需读取任意编号、任意位置的图像分块。

## 应用场景

### 1. 工业产线自动化瑕疵检测系统

本数据集是构建纺织物产线自动化瑕疵检测系统的理想训练素材。利用 25,600 张覆盖 5 类(含正常样本)的 64×64 像素分块图像,研发团队可训练基于 ResNet、EfficientNet、ConvNeXt 或者 Vision Transformer 的多分类模型,将模型部署到产线相机边缘端或云端推理服务中,对实时采集的纺织物图像进行滑窗扫描与缺陷定位。由于数据集中每张分块都对应原始 512×512 大图中的固定网格位置,模型推理结果能够精确还原到原始大图坐标系,使产线操作员可直观看到缺陷在整匹布上的位置。同时,正常样本占比超过 90% 的特性也符合真实产线中"良品远多于次品"的实际分布,使训练得到的模型在产线长期运行中具备更优的误报率与漏检率平衡。

### 2. 工业异常检测算法的基准评测

本数据集是评测异常检测(Anomaly Detection)算法的优质基准。基于 23,170 张正常样本与 2,430 张带标签的缺陷样本,研究者可系统评估 PatchCore、PaDiM、Simplenet、FastFlow、DRAEM、DiffusionAD 等主流算法在纺织物场景下的表现。数据集中 400 张不同源图的正常样本为算法提供了丰富的正常特征分布,便于构建记忆库或概率模型;而 4 类缺陷分块又可作为测试阶段的多类型异常验证集,支撑算法在 AUROC、AP、PRO 等指标上的综合对比。统一的命名规则与图像尺寸也极大降低了多算法评测时的预处理成本,使不同方法可以在同一份数据上进行公平、可复现的实验。

### 3. 少样本与零样本缺陷识别研究

数据集天然的"长尾分布"特性(正常 23,170、缺陷 2,430)使其成为研究少样本学习(Few-shot Learning)与零样本识别(Zero-shot Learning)问题的理想平台。研究者可选取 hole、objects、oil spot、thread error 中样本量最少的破洞类(仅 337 张)作为低资源场景,结合其余类别进行 N-way K-shot 实验,验证元学习、原型网络、跨类别语义嵌入等方法在小样本条件下的性能;也可以将不同源图的分块视为独立任务,研究基于提示学习(Prompt Learning)与大视觉模型的零样本分类能力。本数据集的多源图、多分块结构为开展此类前沿研究提供了稳定、可控的实验环境。

### 4. 图像级、区域级与像素级多粒度算法训练

借助数据集中"原始大图—分块小图"的完整映射关系,研究者可以同时开展图像级分类、区域级目标检测与像素级语义分割三类任务的算法研究。图像级任务可使用 8×8 patch 的投票融合得到整图类别;区域级任务可在原始 512×512 坐标系下生成缺陷边界框,与分块标签形成对应;像素级任务则可利用 patch 网格作为软标签,结合弱监督分割方法(如 CAM、Grad-CAM、SegFix)实现像素级缺陷定位。这种"一图多用"的多粒度训练能力,使本数据集成为多任务学习、跨任务迁移与多尺度建模研究的高效实验平台。

### 5. 工业视觉自监督预训练与数据增广

由于数据集中包含 23,170 张、覆盖 400 张不同源图的海量正常分块图像,且整体数据体量仅 160.94 MB,本数据集非常适合作为工业视觉自监督预训练(如 MoCo v3、DINO、MAE、BEiT)的训练语料。研究者可基于正常样本进行表征学习,得到的预训练权重再迁移到下游缺陷检测任务中,显著提升小样本场景下的检测精度。此外,研究者还可以以原始大图为单位进行 Mixup、CutMix、Copy-Paste、缺陷合成等数据增广实验,将合成出的新缺陷分块与真实分块混合训练,提升模型对未见缺陷类型的鲁棒性。

### 6. 工业质检教学与算法竞赛

本数据集的类别典型、数据规模适中、命名规范清晰,非常适合作为高校智能制造、计算机视觉、模式识别等课程的实践教学素材。学生可在普通笔记本电脑上完成从数据加载、模型搭建、训练调参到结果可视化的全流程实验,深刻理解工业视觉项目的数据特点。同时,5 类多标签、4 种缺陷类型、明显的类别不均衡特性,使其成为工业质检相关算法竞赛(如 Kaggle、天池、DataFountain)的优质赛题数据,可支持多分类、异常检测、目标检测等多种赛题设计。

## 结尾

综上所述,本数据集以 25,600 张 64×64 像素的 PNG 分块图像 为基础,系统覆盖了纺织物生产中常见的 1 类正常与 4 类典型缺陷,并完整保留了与约 801 张 512×512 原始大图 的空间映射关系,是工业视觉领域兼具学术深度与工程价值的高质量数据资源。数据集在类别多样性、样本规模、命名规范性、标注一致性以及数据体量等方面都进行了精心设计,可直接服务于产线自动化检测、异常检测算法评测、少样本/零样本研究、多粒度模型训练、自监督预训练以及教学与竞赛等多种应用场景。

其最大亮点在于:所有样本均源自真实工业生产环境下的高分辨率原始图像,并经过严格切分与筛选,完整原始文件(即 25,600 张 PNG 分块)均包含在数据集中而非仅有元数据,研究者可立即投入训练与实验;统一的格式与规范的命名也使数据加载与复现成本降至最低。

如您希望进一步了解数据集的应用方式、定制化切分策略或合作研究事宜,可私信获取更多技术细节与支持信息。

看了又看

验证报告

以下为卖家选择提供的数据验证报告:

data icon
工业纺织物瑕疵检测图像分块数据集
49
160.94MB
申请报告