yizeng8866

VOICED DATASET：208条语音障碍数据集深度解析

￥19.9

110.09MB

数据标识：D17781257637781136

发布时间：2026/05/07

# VOICED DATASET：208条语音障碍数据集深度解析

## 引言与背景

语音障碍是一种常见的健康问题，影响着全球数百万人的生活质量。准确的语音障碍诊断对于早期干预和治疗至关重要。随着人工智能和机器学习技术的发展，基于语音信号的自动诊断系统成为研究热点。然而，高质量、标注完整的语音障碍数据集仍然稀缺，限制了相关算法的训练和验证。

VOICED DATASET正是为解决这一问题而构建的专业数据集。该数据集包含208条语音样本，涵盖多种语音障碍类型及健康对照样本。每个样本不仅包含完整的原始音频数据，还附带详细的元数据标注，包括年龄、性别、诊断结果、职业信息、语音障碍指数评分、反流症状指数评分、吸烟状态、饮酒习惯和饮食习惯等丰富信息。

该数据集的核心价值在于其完整性和多样性。研究人员可以利用这些数据开发和验证语音障碍诊断算法，探索语音特征与病理状态之间的关联，为临床诊断提供辅助支持。同时，数据集的多维度标注信息为多模态分析提供了可能性，有望推动语音医学领域的研究突破。

## 数据基本信息

### 数据字段说明

| 字段名称 | 字段类型 | 字段含义 | 数据示例 | 完整性 |
| :--- | :--- | :--- | :--- | :--- |
| ID | 字符串 | 样本唯一标识 | voice001 | 100% |
| Age | 整数 | 受试者年龄 | 32 | 100% |
| Gender | 字符串 | 受试者性别 | m/f | 100% |
| Diagnosis | 字符串 | 诊断结果 | hyperkinetic dysphonia | 100% |
| Occupation status | 字符串 | 职业状态 | Researcher/Teacher/Singer | 约95% |
| Voice Handicap Index (VHI) Score | 整数 | 语音障碍指数(0-100) | 15 | 100% |
| Reflux Symptom Index (RSI) Score | 整数 | 反流症状指数(0-45) | 5 | 100% |
| Smoker | 字符串 | 吸烟状态 | yes/no/casual smoker | 100% |
| Alcohol consumption | 字符串 | 饮酒状态 | nondrinker/casual drinker/habitual drinker | 100% |
| Amount of water's litres drink every day | 浮点数 | 每日饮水量(升) | 1.5 | 100% |
| Carbonated beverages | 字符串 | 碳酸饮料饮用频率 | almost never/sometimes/almost always/always/never | 100% |
| Tomatoes | 字符串 | 西红柿食用频率 | sometimes/almost always/never | 100% |
| Coffee | 字符串 | 咖啡饮用频率 | almost always/always/sometimes/never | 100% |
| Chocolate | 字符串 | 巧克力食用频率 | almost never/sometimes/almost always | 100% |
| Soft cheese | 字符串 | 软奶酪食用频率 | sometimes/almost always/almost never | 100% |
| Citrus fruits | 字符串 | 柑橘类水果食用频率 | sometimes/almost never/almost always/never | 100% |

### 诊断类型分布

| 诊断类型 | 记录数量 | 占比 |
| :--- | :--- | :--- |
| hyperkinetic dysphonia | 68 | 32.69% |
| healthy | 52 | 25.00% |
| hypokinetic dysphonia | 48 | 23.08% |
| hyperkinetic dysphonia (nodule) | 24 | 11.54% |
| hyperkinetic dysphonia (Reinke's edema) | 8 | 3.85% |
| reflux laryngitis | 4 | 1.92% |
| hyperkinetic dysphonia (Prolapse) | 4 | 1.92% |
| 总计 | 208 | 100% |

### 性别分布

| 性别 | 记录数量 | 占比 |
| :--- | :--- | :--- |
| 男性 (m) | 104 | 50.00% |
| 女性 (f) | 104 | 50.00% |
| 总计 | 208 | 100% |

### 年龄分布

| 年龄段 | 记录数量 | 占比 |
| :--- | :--- | :--- |
| 20-29岁 | 28 | 13.46% |
| 30-39岁 | 64 | 30.77% |
| 40-49岁 | 56 | 26.92% |
| 50-59岁 | 44 | 21.15% |
| 60岁以上 | 16 | 7.69% |
| 总计 | 208 | 100% |

### 职业分布（Top 10）

| 职业 | 记录数量 | 占比 |
| :--- | :--- | :--- |
| Researcher | 72 | 34.62% |
| Employee | 44 | 21.15% |
| Teacher | 28 | 13.46% |
| Singer | 16 | 7.69% |
| Call center operator | 12 | 5.77% |
| Hairstylist | 8 | 3.85% |
| NU (未指定) | 12 | 5.77% |
| 其他 | 16 | 7.69% |
| 总计 | 208 | 100% |

### 吸烟状态分布

| 吸烟状态 | 记录数量 | 占比 |
| :--- | :--- | :--- |
| no | 116 | 55.77% |
| yes | 48 | 23.08% |
| casual smoker | 44 | 21.15% |
| 总计 | 208 | 100% |

### 饮酒状态分布

| 饮酒状态 | 记录数量 | 占比 |
| :--- | :--- | :--- |
| casual drinker | 96 | 46.15% |
| nondrinker | 56 | 26.92% |
| habitual drinker | 56 | 26.92% |
| 总计 | 208 | 100% |

### 文件格式分布

| 文件类型 | 描述 | 单文件大小范围 | 总文件数 |
| :--- | :--- | :--- | :--- |
| .info.txt | 元数据文件 | 750-800字节 | 208 |
| .dat | 音频数据文件 | ~150KB | 208 |
| .hea | 头文件 | 160-175字节 | 208 |
| .txt | 波形数据文件 | ~400KB | 208 |
| 总计 | - | - | 832 |

## 数据优势

## 数据样例

以下展示数据集的元数据样例（实际数据集包含完整的音频文件和波形数据）：

### 元数据样例

样例1：健康男性 - ID: voice002 - Age: 55 - Gender: m - Diagnosis: healthy - Occupation status: Employee - VHI Score: 17 - RSI Score: 12 - Smoker: casual smoker - Alcohol consumption: habitual drinker - Daily water intake: 0.5L样例2：运动亢进性发音障碍（结节） - ID: voice003 - Age: 34 - Gender: m - Diagnosis: hyperkinetic dysphonia (nodule) - Occupation status: Researcher - VHI Score: 42 - RSI Score: 26 - Smoker: no - Alcohol consumption: casual drinker - Daily water intake: 1.5L样例3：运动减退性发音障碍女性 - ID: voice004 - Age: 28 - Gender: f - Diagnosis: hypokinetic dysphonia - Occupation status: Researcher - VHI Score: 20 - RSI Score: 9 - Smoker: casual smoker - Alcohol consumption: casual drinker - Daily water intake: 1L样例4：健康年轻男性 - ID: voice100 - Age: 24 - Gender: m - Diagnosis: healthy - Occupation status: NU - VHI Score: 0 - RSI Score: 5 - Smoker: no - Alcohol consumption: casual drinker - Daily water intake: 1.5L样例5：教师职业语音障碍 - ID: voice150 - Age: 38 - Gender: f - Diagnosis: hyperkinetic dysphonia - Occupation status: Teacher - VHI Score: 16 - RSI Score: 10 - Smoker: no - Alcohol consumption: nondrinker - Daily water intake: 1.5L样例6：歌手职业语音障碍 - ID: voice200 - Age: 57 - Gender: m - Diagnosis: hyperkinetic dysphonia - Occupation status: Singer - VHI Score: 41 - RSI Score: 3 - Smoker: yes - Alcohol consumption: habitual drinker - Daily water intake: 1L样例7：客服中心操作员 - ID: voice208 - Age: 39 - Gender: f - Diagnosis: hyperkinetic dysphonia - Occupation status: Call center operator - VHI Score: 32 - RSI Score: 15 - Smoker: no - Alcohol consumption: nondrinker - Daily water intake: 2L样例8：反流性喉炎 - ID: voice050 - Age: 41 - Gender: f - Diagnosis: reflux laryngitis - Occupation status: Researcher - VHI Score: 39 - RSI Score: 3 - Smoker: No - Alcohol consumption: habitual drinker - Daily water intake: 1.5L样例9：任克水肿 - ID: voice020 - Age: 53 - Gender: m - Diagnosis: hyperkinetic dysphonia (Reinke's edema) - Occupation status: Employee - VHI Score: 9 - RSI Score: 22 - Smoker: yes - Alcohol consumption: nondrinker - Daily water intake: 1.5L样例10：声带脱垂 - ID: voice080 - Age: 57 - Gender: f - Diagnosis: hyperkinetic dysphonia (Prolapse) - Occupation status: Researcher - VHI Score: 40 - RSI Score: 16 - Smoker: yes - Alcohol consumption: habitual drinker - Daily water intake: 1L

> 说明：上述仅展示元数据样例，实际数据集包含完整的音频数据文件（.dat）和波形数据文件（.txt），可供直接用于语音信号处理和机器学习模型训练。

## 应用场景

### 语音障碍自动诊断系统开发

基于VOICED DATASET，研究人员可以开发高精度的语音障碍自动诊断系统。通过提取语音信号的时域、频域特征，结合深度学习模型如CNN、LSTM等，可以实现对不同类型语音障碍的自动识别和分类。该系统可以作为临床诊断的辅助工具，帮助医生快速筛查和初步诊断，提高诊断效率和准确性。

具体应用方式包括：利用.dat音频文件进行语音特征提取，如基频、共振峰、谐波噪声比等；结合.txt波形数据进行更精细的信号分析；利用元数据中的诊断标签进行监督学习训练；通过VHI和RSI评分建立严重程度评估模型。

### 语音病理特征分析研究

数据集的多维度标注为语音病理特征分析提供了丰富的研究素材。研究人员可以探索不同诊断类型的语音特征差异，分析年龄、性别、职业等因素对语音障碍的影响，以及生活习惯与语音健康之间的关联。

例如，可以比较健康人群与患者的语音特征差异，分析不同职业（如教师、歌手、客服人员）的语音损伤模式，研究吸烟、饮酒等生活习惯对语音质量的影响。这些研究成果可以为语音障碍的预防和干预提供科学依据。

### 语音质量评估算法优化

VHI和RSI评分是评估语音障碍严重程度的重要指标。研究人员可以利用数据集中的评分信息，开发和优化语音质量评估算法。通过建立语音特征与评分之间的映射关系，可以实现自动化的语音质量评估，为临床治疗效果评估提供客观依据。

该应用场景的价值在于：替代传统的主观评估方法，提高评估的客观性和一致性；实现远程语音质量监测，方便患者在家进行康复训练和效果评估；为语音康复治疗提供量化反馈，优化治疗方案。

### 语音合成与修复技术研究

对于语音障碍患者，语音合成和修复技术可以帮助改善沟通能力。利用VOICED DATASET中的健康语音样本和病理语音样本，可以研究语音修复算法，将病理语音转换为自然、清晰的语音。

具体应用包括：基于健康语音样本训练语音合成模型，为患者生成个性化的合成语音；开发语音修复算法，实时改善患者的发音质量；研究语音增强技术，提高病理语音的可懂度。这些技术可以显著改善语音障碍患者的生活质量和社交能力。

### 医疗辅助决策支持系统

结合数据集的多维度信息，可以构建医疗辅助决策支持系统。该系统可以整合患者的语音数据、诊断信息、生活习惯等多方面数据，为医生提供综合分析和决策建议。

应用价值包括：帮助医生快速获取患者的全面信息，辅助制定个性化治疗方案；通过数据分析发现潜在的风险因素，提供预防建议；建立语音障碍的预后预测模型，帮助评估治疗效果和康复进展。

## 结尾

VOICED DATASET是一个高质量、多维度的语音障碍数据集，包含208条语音样本，涵盖7种诊断类型，附带完整的原始音频数据和丰富的元数据标注。该数据集为语音障碍研究提供了宝贵的资源，支持从基础研究到临床应用的全链条创新。

数据集的核心优势在于其完整性和多样性：每个样本都包含完整的音频文件和波形数据，支持直接的语音信号处理和机器学习训练；多维度的元数据标注为多模态分析提供了可能性；均衡的性别分布和合理的年龄跨度保证了数据的代表性。

该数据集可广泛应用于语音障碍自动诊断、病理特征分析、语音质量评估、语音合成修复等多个研究领域，有望推动语音医学和人工智能交叉领域的发展。

如需获取更多信息或完整数据集，可私信联系获取详细资料。

看了又看

验证报告

以下为卖家选择提供的数据验证报告：

VOICED DATASET：208条语音障碍数据集深度解析

￥19.9

110.09MB

申请报告

VOICED DATASET：208条语音障碍数据集深度解析

关于典枢

下载与支持

服务协议

关于我们

官方公众号

技术交流群