wnx

verify-tag俄罗斯情感语音对话数据集-RESD情感语音数据含1396条记录7种情感标签与文本转录支持语音情感识别与对话系统研究

情感语音RESD7种情感标签文本转录语音情感识别对话系统研究

9.9

936.94MB

数据标识:D17826990868083541

发布时间:2026/06/29

# 俄罗斯情感语音对话数据集-RESD情感语音数据含1396条记录7种情感标签与文本转录支持语音情感识别与对话系统研究

## 引言与背景

语音情感识别是人机交互领域的重要研究方向,能够使计算机理解人类的情感状态,从而提供更加智能和人性化的服务。俄罗斯情感语音对话数据集(RESD)是一个高质量的俄语情感语音数据集,包含多种情感标签和对应的文本转录,是研究语音情感识别、对话系统和情感计算的宝贵资源。

数据集包含完整的语音文件和标注信息,为深入分析俄语情感表达、开发情感识别模型提供了坚实的数据基础。

## 数据基本信息

### 数据集概览

| 项目 | 描述 |
|------|------|
| 数据类型 | 语音文件 + 文本标注 |
| 文件格式 | WAV音频 + CSV标注 |
| 覆盖内容 | 情感语音、对话文本 |
| 语言 | 俄语 |
| 总记录数 | 1396条 |
| 训练集 | 1116条 |
| 测试集 | 280条 |

### 文件结构

| 文件名 | 内容描述 |
|--------|----------|
| train/ | 训练集语音文件目录 |
| test/ | 测试集语音文件目录 |
| train.csv | 训练集标注文件 |
| test.csv | 测试集标注文件 |

### 核心字段说明

| 字段名称 | 字段类型 | 字段含义 | 数据示例 | 完整性 |
|----------|----------|----------|----------|----------|
| name | string | 文件名 | 32_happiness_enthusiasm_h_120 | 100% |
| path | string | 文件路径 | happiness_enthusiasm_32/32_happiness_enthusiasm_h_120.wav | 100% |
| emotion | string | 情感标签 | happiness | 100% |
| text | string | 文本转录 | Конечно, расскажу, обязательно. | 100% |

### 数据分布情况

#### 训练集情感分布

| 情感标签 | 记录数量 | 占比 |
|----------|----------|------|
| fear | 178 | 15.9% |
| anger | 175 | 15.7% |
| happiness | 174 | 15.6% |
| enthusiasm | 158 | 14.2% |
| neutral | 153 | 13.7% |
| disgust | 148 | 13.3% |
| sadness | 130 | 11.6% |
| 合计 | 1116 | 100.0% |

#### 测试集情感分布

| 情感标签 | 记录数量 | 占比 |
|----------|----------|------|
| fear | 45 | 16.1% |
| anger | 44 | 15.7% |
| happiness | 44 | 15.7% |
| enthusiasm | 40 | 14.3% |
| neutral | 38 | 13.6% |
| disgust | 37 | 13.2% |
| sadness | 32 | 11.4% |
| 合计 | 280 | 100.0% |

#### 数据集划分分布

| 数据集 | 记录数量 | 占比 |
|--------|----------|------|
| train | 1116 | 79.9% |
| test | 280 | 20.1% |
| 合计 | 1396 | 100.0% |

## 数据优势

| 优势特征 | 具体表现 | 应用价值 |
|----------|----------|----------|
| 情感多样 | 7种情感标签,分布均衡 | 支持多情感分类研究 |
| 语音完整 | WAV原始音频文件 | 支持语音特征提取与分析 |
| 文本配对 | 每条语音配对应文本转录 | 支持多模态情感分析 |
| 对话场景 | 对话式语音数据 | 支持对话系统研究 |
| 语言独特 | 俄语语音数据 | 支持小语种情感研究 |
| 划分合理 | 训练集80%,测试集20% | 支持模型评估 |

## 数据样例

### 情感标注样例

| name | emotion | text |
|------|---------|------|
| 32_happiness_enthusiasm_h_120 | happiness | Конечно, расскажу, обязательно. Ой, сейчас расскажу. |
| 36_disgust_happiness_d_130 | disgust | Вы ещё и профессию решили поменять. |
| 34_anger_fear_a_060 | anger | Ты знаешь, чем это для тебя закончится? |
| 27_neutral_fear_f_100 | fear | Но я же люблю свою работу, я же справляюсь со своими обязанностями. |
| 32_happiness_enthusiasm_e_060 | enthusiasm | Ну хорошо, если, например, друзьям, то что, может быть, лотерейные билеты... |
| 27_neutral_fear_n_030 | neutral | Анна Сергеевна, но мне неудобно вам говорить... |
| 33_sadness_disgust_s_080 | sadness | Уже одно то, что ты пришла — это уже праздник. |

### 文件路径样例

| name | path |
|------|------|
| 32_happiness_enthusiasm_h_120 | happiness_enthusiasm_32/32_happiness_enthusiasm_h_120.wav |
| 34_anger_fear_a_060 | anger_fear_34/34_anger_fear_a_060.wav |

## 应用场景

### 语音情感识别

基于该数据集,可以开发语音情感识别模型。通过分析语音特征和情感标签,可以训练模型自动识别语音中的情感状态。这对于提高人机交互的自然性、开发情感化服务具有重要应用价值。

### 对话系统研究

数据集包含对话式语音数据,可以用于对话系统研究。通过分析对话中的情感变化和上下文关系,可以开发更加智能和情感感知的对话系统。这对于提高用户体验、实现个性化服务具有重要意义。

### 情感计算研究

数据集支持情感计算研究。通过分析不同情感状态下的语音特征和语言表达,可以深入了解人类情感表达的规律和机制。这对于推动情感计算理论的发展、开发情感智能系统具有重要价值。

### 跨语言情感研究

数据集包含俄语语音数据,可以用于跨语言情感研究。通过比较不同语言的情感表达模式,可以了解语言对情感表达的影响。这对于开发多语言情感识别系统、实现跨文化交流具有重要参考价值。

## 结尾

本数据集是一个高质量的俄罗斯情感语音对话数据集,包含1396条记录、7种情感标签的语音文件和文本转录。数据集具有情感多样、语音完整、文本配对等优点,为语音情感识别、对话系统和情感计算研究提供了丰富的数据资源。

数据集包含完整的WAV语音文件,便于进行语音特征提取和分析。用户可以根据实际需求选择合适的数据子集进行研究,也可以结合业务知识对数据进行进一步的工程处理。

如有需要,可获取更多数据集相关信息。

看了又看

验证报告

以下为卖家选择提供的数据验证报告:

data icon
俄罗斯情感语音对话数据集-RESD情感语音数据含1396条记录7种情感标签与文本转录支持语音情感识别与对话系统研究
9.9
936.94MB
申请报告