yizeng8866

verify-tagVOICED DATASET:208条语音障碍数据集深度解析

19.9

已售 0
110.09MB

数据标识:D17781257637781136

发布时间:2026/05/07

# VOICED DATASET:208条语音障碍数据集深度解析

## 引言与背景

语音障碍是一种常见的健康问题,影响着全球数百万人的生活质量。准确的语音障碍诊断对于早期干预和治疗至关重要。随着人工智能和机器学习技术的发展,基于语音信号的自动诊断系统成为研究热点。然而,高质量、标注完整的语音障碍数据集仍然稀缺,限制了相关算法的训练和验证。

VOICED DATASET正是为解决这一问题而构建的专业数据集。该数据集包含208条语音样本,涵盖多种语音障碍类型及健康对照样本。每个样本不仅包含完整的原始音频数据,还附带详细的元数据标注,包括年龄、性别、诊断结果、职业信息、语音障碍指数评分、反流症状指数评分、吸烟状态、饮酒习惯和饮食习惯等丰富信息。

该数据集的核心价值在于其完整性和多样性。研究人员可以利用这些数据开发和验证语音障碍诊断算法,探索语音特征与病理状态之间的关联,为临床诊断提供辅助支持。同时,数据集的多维度标注信息为多模态分析提供了可能性,有望推动语音医学领域的研究突破。

## 数据基本信息

### 数据字段说明

| 字段名称 | 字段类型 | 字段含义 | 数据示例 | 完整性 |
| :--- | :--- | :--- | :--- | :--- |
| ID | 字符串 | 样本唯一标识 | voice001 | 100% |
| Age | 整数 | 受试者年龄 | 32 | 100% |
| Gender | 字符串 | 受试者性别 | m/f | 100% |
| Diagnosis | 字符串 | 诊断结果 | hyperkinetic dysphonia | 100% |
| Occupation status | 字符串 | 职业状态 | Researcher/Teacher/Singer | 约95% |
| Voice Handicap Index (VHI) Score | 整数 | 语音障碍指数(0-100) | 15 | 100% |
| Reflux Symptom Index (RSI) Score | 整数 | 反流症状指数(0-45) | 5 | 100% |
| Smoker | 字符串 | 吸烟状态 | yes/no/casual smoker | 100% |
| Alcohol consumption | 字符串 | 饮酒状态 | nondrinker/casual drinker/habitual drinker | 100% |
| Amount of water's litres drink every day | 浮点数 | 每日饮水量(升) | 1.5 | 100% |
| Carbonated beverages | 字符串 | 碳酸饮料饮用频率 | almost never/sometimes/almost always/always/never | 100% |
| Tomatoes | 字符串 | 西红柿食用频率 | sometimes/almost always/never | 100% |
| Coffee | 字符串 | 咖啡饮用频率 | almost always/always/sometimes/never | 100% |
| Chocolate | 字符串 | 巧克力食用频率 | almost never/sometimes/almost always | 100% |
| Soft cheese | 字符串 | 软奶酪食用频率 | sometimes/almost always/almost never | 100% |
| Citrus fruits | 字符串 | 柑橘类水果食用频率 | sometimes/almost never/almost always/never | 100% |

### 诊断类型分布

| 诊断类型 | 记录数量 | 占比 |
| :--- | :--- | :--- |
| hyperkinetic dysphonia | 68 | 32.69% |
| healthy | 52 | 25.00% |
| hypokinetic dysphonia | 48 | 23.08% |
| hyperkinetic dysphonia (nodule) | 24 | 11.54% |
| hyperkinetic dysphonia (Reinke's edema) | 8 | 3.85% |
| reflux laryngitis | 4 | 1.92% |
| hyperkinetic dysphonia (Prolapse) | 4 | 1.92% |
| 总计 | 208 | 100% |

### 性别分布

| 性别 | 记录数量 | 占比 |
| :--- | :--- | :--- |
| 男性 (m) | 104 | 50.00% |
| 女性 (f) | 104 | 50.00% |
| 总计 | 208 | 100% |

### 年龄分布

| 年龄段 | 记录数量 | 占比 |
| :--- | :--- | :--- |
| 20-29岁 | 28 | 13.46% |
| 30-39岁 | 64 | 30.77% |
| 40-49岁 | 56 | 26.92% |
| 50-59岁 | 44 | 21.15% |
| 60岁以上 | 16 | 7.69% |
| 总计 | 208 | 100% |

### 职业分布(Top 10)

| 职业 | 记录数量 | 占比 |
| :--- | :--- | :--- |
| Researcher | 72 | 34.62% |
| Employee | 44 | 21.15% |
| Teacher | 28 | 13.46% |
| Singer | 16 | 7.69% |
| Call center operator | 12 | 5.77% |
| Hairstylist | 8 | 3.85% |
| NU (未指定) | 12 | 5.77% |
| 其他 | 16 | 7.69% |
| 总计 | 208 | 100% |

### 吸烟状态分布

| 吸烟状态 | 记录数量 | 占比 |
| :--- | :--- | :--- |
| no | 116 | 55.77% |
| yes | 48 | 23.08% |
| casual smoker | 44 | 21.15% |
| 总计 | 208 | 100% |

### 饮酒状态分布

| 饮酒状态 | 记录数量 | 占比 |
| :--- | :--- | :--- |
| casual drinker | 96 | 46.15% |
| nondrinker | 56 | 26.92% |
| habitual drinker | 56 | 26.92% |
| 总计 | 208 | 100% |

### 文件格式分布

| 文件类型 | 描述 | 单文件大小范围 | 总文件数 |
| :--- | :--- | :--- | :--- |
| .info.txt | 元数据文件 | 750-800字节 | 208 |
| .dat | 音频数据文件 | ~150KB | 208 |
| .hea | 头文件 | 160-175字节 | 208 |
| .txt | 波形数据文件 | ~400KB | 208 |
| 总计 | - | - | 832 |

## 数据优势

| 优势特征 | 具体表现 | 应用价值 |
| :--- | :--- | :--- |
| 完整原始音频数据 | 每个样本包含.dat音频文件和.txt波形数据文件 | 支持语音信号处理、特征提取和深度学习模型训练 |
| 多维度标注信息 | 包含年龄、性别、诊断、职业、VHI/RSI评分、生活习惯等15+字段 | 支持多模态分析和交叉验证研究 |
| 诊断类型丰富 | 涵盖7种诊断类型,包括健康对照和多种语音障碍 | 支持分类算法训练和疾病亚型识别研究 |
| 样本量充足 | 208条样本,训练集和测试集划分灵活 | 保证模型训练的可靠性和泛化能力 |
| 数据完整性高 | 核心字段完整性达100%,无缺失值 | 减少数据清洗工作量,提高研究效率 |
| 专业医学标注 | 标注由专业人员完成,诊断结果可靠 | 确保模型训练数据的准确性和可信度 |
| 性别分布均衡 | 男女比例1:1 | 避免性别偏差,提高模型的普适性 |
| 年龄跨度合理 | 覆盖20-60+岁年龄段 | 支持年龄相关的语音特征研究 |

## 数据样例

以下展示数据集的元数据样例(实际数据集包含完整的音频文件和波形数据):

### 元数据样例

样例1:健康男性 - ID: voice002 - Age: 55 - Gender: m - Diagnosis: healthy - Occupation status: Employee - VHI Score: 17 - RSI Score: 12 - Smoker: casual smoker - Alcohol consumption: habitual drinker - Daily water intake: 0.5L样例2:运动亢进性发音障碍(结节) - ID: voice003 - Age: 34 - Gender: m - Diagnosis: hyperkinetic dysphonia (nodule) - Occupation status: Researcher - VHI Score: 42 - RSI Score: 26 - Smoker: no - Alcohol consumption: casual drinker - Daily water intake: 1.5L样例3:运动减退性发音障碍女性 - ID: voice004 - Age: 28 - Gender: f - Diagnosis: hypokinetic dysphonia - Occupation status: Researcher - VHI Score: 20 - RSI Score: 9 - Smoker: casual smoker - Alcohol consumption: casual drinker - Daily water intake: 1L样例4:健康年轻男性 - ID: voice100 - Age: 24 - Gender: m - Diagnosis: healthy - Occupation status: NU - VHI Score: 0 - RSI Score: 5 - Smoker: no - Alcohol consumption: casual drinker - Daily water intake: 1.5L样例5:教师职业语音障碍 - ID: voice150 - Age: 38 - Gender: f - Diagnosis: hyperkinetic dysphonia - Occupation status: Teacher - VHI Score: 16 - RSI Score: 10 - Smoker: no - Alcohol consumption: nondrinker - Daily water intake: 1.5L样例6:歌手职业语音障碍 - ID: voice200 - Age: 57 - Gender: m - Diagnosis: hyperkinetic dysphonia - Occupation status: Singer - VHI Score: 41 - RSI Score: 3 - Smoker: yes - Alcohol consumption: habitual drinker - Daily water intake: 1L样例7:客服中心操作员 - ID: voice208 - Age: 39 - Gender: f - Diagnosis: hyperkinetic dysphonia - Occupation status: Call center operator - VHI Score: 32 - RSI Score: 15 - Smoker: no - Alcohol consumption: nondrinker - Daily water intake: 2L样例8:反流性喉炎 - ID: voice050 - Age: 41 - Gender: f - Diagnosis: reflux laryngitis - Occupation status: Researcher - VHI Score: 39 - RSI Score: 3 - Smoker: No - Alcohol consumption: habitual drinker - Daily water intake: 1.5L样例9:任克水肿 - ID: voice020 - Age: 53 - Gender: m - Diagnosis: hyperkinetic dysphonia (Reinke's edema) - Occupation status: Employee - VHI Score: 9 - RSI Score: 22 - Smoker: yes - Alcohol consumption: nondrinker - Daily water intake: 1.5L样例10:声带脱垂 - ID: voice080 - Age: 57 - Gender: f - Diagnosis: hyperkinetic dysphonia (Prolapse) - Occupation status: Researcher - VHI Score: 40 - RSI Score: 16 - Smoker: yes - Alcohol consumption: habitual drinker - Daily water intake: 1L

> 说明:上述仅展示元数据样例,实际数据集包含完整的音频数据文件(.dat)和波形数据文件(.txt),可供直接用于语音信号处理和机器学习模型训练。

## 应用场景

### 语音障碍自动诊断系统开发

基于VOICED DATASET,研究人员可以开发高精度的语音障碍自动诊断系统。通过提取语音信号的时域、频域特征,结合深度学习模型如CNN、LSTM等,可以实现对不同类型语音障碍的自动识别和分类。该系统可以作为临床诊断的辅助工具,帮助医生快速筛查和初步诊断,提高诊断效率和准确性。

具体应用方式包括:利用.dat音频文件进行语音特征提取,如基频、共振峰、谐波噪声比等;结合.txt波形数据进行更精细的信号分析;利用元数据中的诊断标签进行监督学习训练;通过VHI和RSI评分建立严重程度评估模型。

### 语音病理特征分析研究

数据集的多维度标注为语音病理特征分析提供了丰富的研究素材。研究人员可以探索不同诊断类型的语音特征差异,分析年龄、性别、职业等因素对语音障碍的影响,以及生活习惯与语音健康之间的关联。

例如,可以比较健康人群与患者的语音特征差异,分析不同职业(如教师、歌手、客服人员)的语音损伤模式,研究吸烟、饮酒等生活习惯对语音质量的影响。这些研究成果可以为语音障碍的预防和干预提供科学依据。

### 语音质量评估算法优化

VHI和RSI评分是评估语音障碍严重程度的重要指标。研究人员可以利用数据集中的评分信息,开发和优化语音质量评估算法。通过建立语音特征与评分之间的映射关系,可以实现自动化的语音质量评估,为临床治疗效果评估提供客观依据。

该应用场景的价值在于:替代传统的主观评估方法,提高评估的客观性和一致性;实现远程语音质量监测,方便患者在家进行康复训练和效果评估;为语音康复治疗提供量化反馈,优化治疗方案。

### 语音合成与修复技术研究

对于语音障碍患者,语音合成和修复技术可以帮助改善沟通能力。利用VOICED DATASET中的健康语音样本和病理语音样本,可以研究语音修复算法,将病理语音转换为自然、清晰的语音。

具体应用包括:基于健康语音样本训练语音合成模型,为患者生成个性化的合成语音;开发语音修复算法,实时改善患者的发音质量;研究语音增强技术,提高病理语音的可懂度。这些技术可以显著改善语音障碍患者的生活质量和社交能力。

### 医疗辅助决策支持系统

结合数据集的多维度信息,可以构建医疗辅助决策支持系统。该系统可以整合患者的语音数据、诊断信息、生活习惯等多方面数据,为医生提供综合分析和决策建议。

应用价值包括:帮助医生快速获取患者的全面信息,辅助制定个性化治疗方案;通过数据分析发现潜在的风险因素,提供预防建议;建立语音障碍的预后预测模型,帮助评估治疗效果和康复进展。

## 结尾

VOICED DATASET是一个高质量、多维度的语音障碍数据集,包含208条语音样本,涵盖7种诊断类型,附带完整的原始音频数据和丰富的元数据标注。该数据集为语音障碍研究提供了宝贵的资源,支持从基础研究到临床应用的全链条创新。

数据集的核心优势在于其完整性和多样性:每个样本都包含完整的音频文件和波形数据,支持直接的语音信号处理和机器学习训练;多维度的元数据标注为多模态分析提供了可能性;均衡的性别分布和合理的年龄跨度保证了数据的代表性。

该数据集可广泛应用于语音障碍自动诊断、病理特征分析、语音质量评估、语音合成修复等多个研究领域,有望推动语音医学和人工智能交叉领域的发展。

如需获取更多信息或完整数据集,可私信联系获取详细资料。

看了又看

数据加载中

验证报告

以下为卖家选择提供的数据验证报告:

data icon
VOICED DATASET:208条语音障碍数据集深度解析
19.9
已售 0
110.09MB
申请报告