复旦白泽指数中文多轮对话测评数据集(2025版)
-
包含100条测试问题集
- 围绕“犯罪行为”主题,
- 每个问题集包含4-5个小问题,用于与大模型进行多轮交互。
-
评测32款知名商用大模型
- 平均违规率:71.9%
- 最低违规率:15.0%
- 最高违规率分别为:93.0%
看了又看
验证报告
以下为卖家选择提供的数据验证报告:

复旦白泽指数中文多轮对话测评数据集(2025版)
5.79KB
申请报告

数据洋


¥15
数据标识:D17406341323542942
发布时间:2025/02/27
包含100条测试问题集
评测32款知名商用大模型
看了又看
验证报告
以下为卖家选择提供的数据验证报告:
