大模型数据集查看全部

天津话男性语音语料库

200 个天津方言的带注释男声句子

方言版语音识别

方言版语音识别模型,无缝识别多语言,抗噪音能力强。

英文文本海报

1100张图多场景英文图片

COIG-CQIA

开源的高质量指令微调数据集

南昌方言对话语音语料库

4 小时关于某些主题的转录南昌方言对话演讲

英文文本

10407张英文文本图片数据集

心理健康-R1蒸馏中文数据集-10k

包含 10,000 条高质量样本,适用于心理学领域的自然语言处理任务,如心理咨询、情感分析、多轮对话等。

天津方言会话语音语料库

包括 7 小时关于某些主题的转录天津方言对话演讲

CValues-Comparison 中文大模型价值观比较数据集

包含145k的价值观比较样本数据集,每个样本包含(prompt,正例回复、负例回复)。

国家标准《网络安全技术 生成式人工智能服务安全基本要求》基准测试集

包含2000+高质量测试问题数据

长沙方言会话语音语料库

包含 4.1 小时关于某些主题的转录长沙方言对话

影视资源大数据训练合集

40GB样例数据

影视资源数据集目录

16500部 400TB

Alimeeting4MUG数据集

包含 654 个录制的普通话会议,涵盖不同的主题,并在会议录音的手动记录上为 SLP 任务提供手动注释。

车辆识别13W张图像数据集

13W张道路上汽车的图像

高分数据集

武汉方言日常语音语料库

武汉方言日常语音语料库

包含5.08 小时的转录武汉方言脚本语音组成,重点关注日常使用句子,其中包含 4 位说话者提供的 5082 条话语。

中文粤语(广州)语音语料库

中文粤语(广州)语音语料库

包括 5 小时在车内转录的广州粤语脚本语音,重点关注数字、命令和查询,其中包含 10 个说话者提供的 6,219 个话语。

长沙方言会话语音语料库

长沙方言会话语音语料库

包含 4.1 小时关于某些主题的转录长沙方言对话,其中包含两个说话者之间的 6 次对话。

天津方言会话语音语料库

天津方言会话语音语料库

包括 7 小时关于某些主题的转录天津方言对话演讲,其中包含三对说话人之间的 11 次对话。

南昌方言对话语音语料库

南昌方言对话语音语料库

包括 4 小时关于某些主题的转录南昌方言对话演讲,其中包含两位说话者之间的六次对话。

中文方言语音数据

中文方言语音数据

通用类男女声方言语音数据,无背景音。包含单人朗读及双人对话、新闻播报、公开有声语料等内容。语音数据规模达500个小时以上。

动物识别数据集训练集

动物识别数据集训练集

动物识别数据集训练集,很详细,已把各动物汇总分类。包含项目工程文件以及readme详细使用说明。包含 90 个不同类别动物,总共约有5400 张动物图像。

刺梨质谱数据

刺梨质谱数据

采集了不同品种刺梨的叶片和果柄的代谢组数据,可以通过不同品种代谢物之间的比较,去挖掘导致两个品种性状差异的核心代谢通路,为相关领域育种提供重要的参考价值。

深度学习数据集查看全部

FLIR红外目标识别数据集

用于双光融合模型训练

无人机火灾烟雾检测数据集(网采)

41416张图片,可用于火灾检测模型训练

DIOR数据集

包含了20个类别,共计23463张图像。

印度近52年下雨情况

涵盖 1966 - 2017 年印度 20 个邦的降雨与农业数据,可用于分析农业与降雨之间的复杂关系,支持多维度数据查询与对比。

visdrone数据集

包含288个视频片段,由261,908帧视频和10,209幅静态图像组成,这些数据来自各类无人机摄像头,覆盖范围广泛,包括不同城市(来自中国14个不同城市,相隔数千公里)、不同环境(城市和农村)、不同物体(行人、车辆、自行车等)和不同密度(稀疏和拥挤场景)。

性格数据集(内向或外向)

包含 2900 条数据记录、8 个维度的行为特征信息,能够基于多种行为数据,对个体进行内向或外向性格分类,支持对行为与性格关系的多维度分析。

WHO 的全球 COVID-19 数据(2025 年版)

包含按国家 / 地区划分,截至 2025 年的新冠确诊病例、死亡数据,以及报告日期等关键信息,可实现全球及区域疫情数据的追踪、对比、分析与预测,为多领域研究和决策提供数据基础。

全球高中生对 AI 工具的使用数据

包含 500 名来自全球不同国家高中生在 2025 年使用 AI 工具的模拟数据,涵盖人口统计、工具使用、使用指标等多维度信息,支持可视化探索性数据分析(EDA)、市场洞察挖掘、NLP 任务处理以及 AI 使用模式分类预测等功能。

SAP-4000 学生成绩数据集

包含 4000 条匿名学生记录,整合人口统计、学习习惯、教育支持机制、期末考试结果等多维度变量。

猫脸识别数据集

共有12种猫的图片和标注数据

商品评论情感预测

包含从2011年1月1日到2014年3月31日(3年多)某电商网站的消费者购买行为,用户评分,评论和产品元数据,涵盖15个一级产品类别,987个二级产品类别,近2个百万用户,超过10万种产品和超过6,000万条评论。

黄金价格数据:2004 年至今

时间范围覆盖 2004 - 01 - 01 至今,地理空间为全球范围;数据来源为 MetaTrader 4。

人流密度预测

包含训练集2000张图片,测试集1000张图片

表格识别测试集

数据集包括18张表格的图像,包括拍照类型、截图类型的有线和无线表格。

Netflix 影片评估数据集

包含对 Netflix 影片从内容类型、题材类型、发行年份、来源国家等多维度的深入评估数据。

本周推荐

乌萨奇桌宠

乌萨奇桌宠

可爱的乌萨奇小宝在桌面陪您办公,娱乐。支持鼠标拖动,窗口移动等。

明日方舟桌宠

明日方舟桌宠

支持明日方舟角色模型作为桌宠启动,复现游戏内基建小人与敌方单位行为逻辑; 提供图形化启动器,支持模型浏览、下载、导入及参数设置; 实现平面重力场物理效果、高亮描边 / 阴影渲染、透明模式(鼠标穿透)等交互细节; 包含系统托盘菜单、开机自启动、手动控制移动 / 动作等实用功能。

线条小狗桌宠

线条小狗桌宠

让你在电脑桌面养线条小狗。

像素猫猫桌宠

像素猫猫桌宠

像素桌宠小猫,适用于windows系统,陪伴您工作、学习,缓解压力,或是作为娱乐工具,给您带来独特的桌面体验。

chiikawa桌面宠物

chiikawa桌面宠物

可爱的chiikawa三小只桌宠,包含吉伊,乌萨奇,小八的一系列表情桌宠!!1

API接口

企业基本信息

企业基本信息

查询企业的基本信息,包括工商基本信息、行业分类、所在地区等信息。

动产抵押

动产抵押

查询企业的动产抵押信息,包括动产抵押基本信息、抵押物、抵押人及变更等信息。

欠税公告

欠税公告

查询企业欠税公告信息,欠税公告信息包括纳税人信息、欠税税种、欠税金额等字段信息。

软件著作权

软件著作权

查询企业的软件著作权信息,包括登记号、名称、版本号、登记时间等信息。

经营异常

经营异常

查询企业的经营异常信息,包括列入、移除原因及日期、操作部门等信息。

热度推荐

Notion 新手磨合期必看

Notion 新手磨合期必看

你在刚使用notion时,是不是很想写点什么,但不知道能用 Notion 写什么、总想折腾更高级的用法。这篇教程带您从新手入门到熟练使用!

Notion基础功能全解析

Notion基础功能全解析

20 + 个必备基础操作,一步到位提高 Notion 图文生产力。

Notion区块特性解析

Notion区块特性解析

复刻 Notion 高级模板 & 排版效果的 10+ 个进阶使用技巧。

Notion数据库入门必学

Notion数据库入门必学

精通 Notion 前必须掌握的 10 + 个初级字段用法 。

Notion 日历视图解析

Notion 日历视图解析

自媒体博主必备,从零搭建日程管理与内容运营中心。

游戏推荐

双影奇境/Split Fiction

双影奇境/Split Fiction

Steam 国区好评率高达 98%,玩家称其 “上瘾”“物超所值”。

双人成行 It Takes Two

双人成行 It Takes Two

《双人成行》(It Takes Two)是一款由Electronic Arts与Hazelight合作开发的动作冒险游戏,于2021年3月26日发售。玩家在游戏中扮演一对争吵不休的夫妇Cody和May,他们由于被施了魔法而变成了两个玩偶,并且困在了一个奇幻的世界里,然后在爱情大师哈基姆博士的指示下接受了各种挑战。2021年12月10日,《双人成行》获得2021TGA年度最佳游戏奖、最佳多人游戏奖、最佳家庭游戏奖。

饥荒Dont Starve Together

饥荒Dont Starve Together

风格独特的异世界,处处是惊喜(惊吓)。你可以尽情的使用一切物品搭建你的城堡,从最开始简单的用树枝和草搭建的小帐篷,到后来用石头、金子打造的豪华城堡。

泰拉瑞亚

泰拉瑞亚

steam史上第一个好评破百万的好评如潮游戏 整个世界自由开放任你探索

卧龙:苍天陨落Wo Long Fallen Dynasty

卧龙:苍天陨落Wo Long Fallen Dynasty

西历184年,中国。时值东汉末年,硝烟四起,生灵涂炭。昔日睥睨天下的大汉王朝,其天命如今摇摇欲坠。在结合历史、 奇幻与动作元素的本三国动作RPG中,玩家将化身为无名义勇兵,运用融合了中华武术精髓的剑戟动作,力挑各路英雄豪杰与横行跋扈的妖魔,踏破三国乱世。

东方夜雀食堂

东方夜雀食堂

年轻的夜雀妖怪米斯蒂娅·萝蕾拉有一个梦想,成为最受欢迎的烧烤屋老板娘。内心善良的小夜雀每天努力工作,收集食材,学习新的菜谱,一天一天的辛劳,努力还债

荒野大镖客 :救赎 重制版荒野大镖客 :救赎 重制版

荒野大镖客 :救赎 重制版荒野大镖客 :救赎 重制版

僵尸恐怖衍生单机游戏,超真实画质!!

星露谷物语Stardew Valley

星露谷物语Stardew Valley

超好玩的种田游戏,超高自由度,种菜,浇水,钓鱼等;不玩则已,一玩就是一整天,特别上头

博德之门3

博德之门3

这一刻,我知道我玩到了今年最伟大的游戏,影心的信仰实际上是邪恶教会?被誉为黑夜信仰的莎尔女神究竟是什么来历

电脑工具软件查看全部

图像校正及漂白软件

图像漂白处理工具

快速解压绿色无广告版winrar

winrar解压软件,快速解压缩

番茄小说下载导出为txt工具

可以将番茄小说中的小说导出为txt文档。

图片魔法师专业版

支持图像漂白、图像调整(对比度、色阶、色相、锐化)、图像均化、颜色替换、图片白边、亮度对比度、去除噪点、灰阶、反相、棕色调等多个算法图层。

bandizip免费无广告解压缩软件

快速解压软件,智能解压,安全可靠。

摸鱼屏保

模拟Win系统电脑常见故障的屏保应用,主要用于"上班摸鱼"。

everything快速查找本地文件

everything快速查找,精准定位文件地址。

Dism++魔改版

包含系统备份还原、安装卸载更新、优化系统功能、深度清理系统等功能。

ABDownloadManager

下载加速,多线程下载。

7z压缩

压缩和存档工具,支持压缩和解压的格式包括:7z、XZ、BZIP2、GZIP、TAR、ZIP 和 WIM等;

Simple Sticky Notes

在桌面创建便签,记录临时信息、待办事项等,界面简洁、使用方便,支持颜色分类和提醒功能。

avidemux2.8.1

视频编辑,视频格式转换,提取嵌入字幕,支持多种视频格式

Anytxt Searcher

文档和文本内容搜索工具,能够搜索常见的文本文档、PDF、Word、Excel、PPT等各种格式的文件,还可进行关键字、文件类型、文件大小等高级搜索,快速定位目标文件。

Upscayl

AI对图像进行无损放大,图像清晰化工具。

图吧工具箱

硬件检测工具合集,绿色无广告,集成了硬件检测、评分工具、测试工具,常见的工具都有。

实用项目源码查看全部

自动修复错误命令行

代码修复工具

命令行版本网易云音乐

程序员使用的终端版网易云!

OCRmyPDF(一个强大的pdf转写文字的工具)

可以将pdf中不清晰的,年代久远的,精准定位转换成文字。包含项目源码以及使用说明,部署教程。

AI自动P图工具

AI自动P图工具,源码项目。

FPS游戏物理准星

准星源码,包含使用教程,可解决fps游戏中狙没有准星的缺陷。

会写作文的人工智能

包含项目源码,详细步骤,教您部署一个会写作文的人工智能

genact

显示一些多任务场景,让看到你电脑屏幕的人都误以为你在 Coding。

视频去马赛克

视频去马赛克以及视频超分辨率的项目源码。

合成大西瓜

项目源码合成大西瓜,包含开发全流程。

实时语音克隆源码项目

5秒即可克隆出您想要的声音!

IDEA 久坐提醒插件

避免长时间写代码造成的身体上的伤害而开发的项目,每40分钟进行一次提醒休息。

线描图画上色工具

图像自动处理,AI工具源码。

图片转换工具

一张图片,只要改变后缀名就变成了一首歌等格式,可用于加密。

去除纹身工具

可无痕去除纹身或者加纹身,此为项目源码,包含使用教程,可部署在本地。

图像清晰化工具(用于人脸清晰化)

图像清晰化项目源码,附使用说明。

典枢快讯

破解AI数据困局!典枢如何打造开发者首选的深度学习数据集下载平台?

破解AI数据困局!典枢如何打造开发者首选的深度学习数据集下载平台?

典枢是去中心化的深度学习数据集下载平台,通过独创数据质量评估机制和全链路安全体系,解决数据质量不透明、数据泄露等难题。平台采用先评估后购买模式,保障交易安全可信,同时整合全行业数据资源,助力需求方高效获取数据集,加速大模型研发进程。

破解图像数据集获取难题,典枢原创技术 Fidelius赋能图像数据流通

破解图像数据集获取难题,典枢原创技术 Fidelius赋能图像数据流通

典枢平台以原创Fidelius技术为核心,构建安全可信的图像数据集交易生态。通过算法生成低分辨率样本精准评估数据质量,全链路加密确保买卖双方隐私安全,结合在线关键词检索功能高效匹配需求,助力用户快速获取优质训练数据,推动计算机视觉领域创新发展。

破解中文方言语料下载难题,典枢构建去中心化可信数据合作平台

破解中文方言语料下载难题,典枢构建去中心化可信数据合作平台

典枢作为中文方言语料下载首选平台!依托开放生态与隐私加密技术,提供安全透明、高质多样的方言数据集下载服务,通过专业质量评估,助力语言研究者及AI开发者精准获取真实语料资源,破解数据鸿沟与安全困局,赋能智能交互创新。