# 俄罗斯情感语音对话数据集-RESD情感语音数据含1396条记录7种情感标签与文本转录支持语音情感识别与对话系统研究
## 引言与背景
语音情感识别是人机交互领域的重要研究方向,能够使计算机理解人类的情感状态,从而提供更加智能和人性化的服务。俄罗斯情感语音对话数据集(RESD)是一个高质量的俄语情感语音数据集,包含多种情感标签和对应的文本转录,是研究语音情感识别、对话系统和情感计算的宝贵资源。
数据集包含完整的语音文件和标注信息,为深入分析俄语情感表达、开发情感识别模型提供了坚实的数据基础。
## 数据基本信息
### 数据集概览
| 项目 | 描述 |
|------|------|
| 数据类型 | 语音文件 + 文本标注 |
| 文件格式 | WAV音频 + CSV标注 |
| 覆盖内容 | 情感语音、对话文本 |
| 语言 | 俄语 |
| 总记录数 | 1396条 |
| 训练集 | 1116条 |
| 测试集 | 280条 |
### 文件结构
| 文件名 | 内容描述 |
|--------|----------|
| train/ | 训练集语音文件目录 |
| test/ | 测试集语音文件目录 |
| train.csv | 训练集标注文件 |
| test.csv | 测试集标注文件 |
### 核心字段说明
| 字段名称 | 字段类型 | 字段含义 | 数据示例 | 完整性 |
|----------|----------|----------|----------|----------|
| name | string | 文件名 | 32_happiness_enthusiasm_h_120 | 100% |
| path | string | 文件路径 | happiness_enthusiasm_32/32_happiness_enthusiasm_h_120.wav | 100% |
| emotion | string | 情感标签 | happiness | 100% |
| text | string | 文本转录 | Конечно, расскажу, обязательно. | 100% |
### 数据分布情况
#### 训练集情感分布
| 情感标签 | 记录数量 | 占比 |
|----------|----------|------|
| fear | 178 | 15.9% |
| anger | 175 | 15.7% |
| happiness | 174 | 15.6% |
| enthusiasm | 158 | 14.2% |
| neutral | 153 | 13.7% |
| disgust | 148 | 13.3% |
| sadness | 130 | 11.6% |
| 合计 | 1116 | 100.0% |
#### 测试集情感分布
| 情感标签 | 记录数量 | 占比 |
|----------|----------|------|
| fear | 45 | 16.1% |
| anger | 44 | 15.7% |
| happiness | 44 | 15.7% |
| enthusiasm | 40 | 14.3% |
| neutral | 38 | 13.6% |
| disgust | 37 | 13.2% |
| sadness | 32 | 11.4% |
| 合计 | 280 | 100.0% |
#### 数据集划分分布
| 数据集 | 记录数量 | 占比 |
|--------|----------|------|
| train | 1116 | 79.9% |
| test | 280 | 20.1% |
| 合计 | 1396 | 100.0% |
## 数据优势
| 优势特征 | 具体表现 | 应用价值 |
|----------|----------|----------|
| 情感多样 | 7种情感标签,分布均衡 | 支持多情感分类研究 |
| 语音完整 | WAV原始音频文件 | 支持语音特征提取与分析 |
| 文本配对 | 每条语音配对应文本转录 | 支持多模态情感分析 |
| 对话场景 | 对话式语音数据 | 支持对话系统研究 |
| 语言独特 | 俄语语音数据 | 支持小语种情感研究 |
| 划分合理 | 训练集80%,测试集20% | 支持模型评估 |
## 数据样例
### 情感标注样例
| name | emotion | text |
|------|---------|------|
| 32_happiness_enthusiasm_h_120 | happiness | Конечно, расскажу, обязательно. Ой, сейчас расскажу. |
| 36_disgust_happiness_d_130 | disgust | Вы ещё и профессию решили поменять. |
| 34_anger_fear_a_060 | anger | Ты знаешь, чем это для тебя закончится? |
| 27_neutral_fear_f_100 | fear | Но я же люблю свою работу, я же справляюсь со своими обязанностями. |
| 32_happiness_enthusiasm_e_060 | enthusiasm | Ну хорошо, если, например, друзьям, то что, может быть, лотерейные билеты... |
| 27_neutral_fear_n_030 | neutral | Анна Сергеевна, но мне неудобно вам говорить... |
| 33_sadness_disgust_s_080 | sadness | Уже одно то, что ты пришла — это уже праздник. |
### 文件路径样例
| name | path |
|------|------|
| 32_happiness_enthusiasm_h_120 | happiness_enthusiasm_32/32_happiness_enthusiasm_h_120.wav |
| 34_anger_fear_a_060 | anger_fear_34/34_anger_fear_a_060.wav |
## 应用场景
### 语音情感识别
基于该数据集,可以开发语音情感识别模型。通过分析语音特征和情感标签,可以训练模型自动识别语音中的情感状态。这对于提高人机交互的自然性、开发情感化服务具有重要应用价值。
### 对话系统研究
数据集包含对话式语音数据,可以用于对话系统研究。通过分析对话中的情感变化和上下文关系,可以开发更加智能和情感感知的对话系统。这对于提高用户体验、实现个性化服务具有重要意义。
### 情感计算研究
数据集支持情感计算研究。通过分析不同情感状态下的语音特征和语言表达,可以深入了解人类情感表达的规律和机制。这对于推动情感计算理论的发展、开发情感智能系统具有重要价值。
### 跨语言情感研究
数据集包含俄语语音数据,可以用于跨语言情感研究。通过比较不同语言的情感表达模式,可以了解语言对情感表达的影响。这对于开发多语言情感识别系统、实现跨文化交流具有重要参考价值。
## 结尾
本数据集是一个高质量的俄罗斯情感语音对话数据集,包含1396条记录、7种情感标签的语音文件和文本转录。数据集具有情感多样、语音完整、文本配对等优点,为语音情感识别、对话系统和情感计算研究提供了丰富的数据资源。
数据集包含完整的WAV语音文件,便于进行语音特征提取和分析。用户可以根据实际需求选择合适的数据子集进行研究,也可以结合业务知识对数据进行进一步的工程处理。
如有需要,可获取更多数据集相关信息。
看了又看
验证报告
以下为卖家选择提供的数据验证报告:






