大模型数据集查看全部

天津话男性语音语料库

200 个天津方言的带注释男声句子

方言版语音识别

方言版语音识别模型,无缝识别多语言,抗噪音能力强。

英文文本海报

1100张图多场景英文图片

COIG-CQIA

开源的高质量指令微调数据集

南昌方言对话语音语料库

4 小时关于某些主题的转录南昌方言对话演讲

英文文本

10407张英文文本图片数据集

心理健康-R1蒸馏中文数据集-10k

包含 10,000 条高质量样本,适用于心理学领域的自然语言处理任务,如心理咨询、情感分析、多轮对话等。

天津方言会话语音语料库

包括 7 小时关于某些主题的转录天津方言对话演讲

CValues-Comparison 中文大模型价值观比较数据集

包含145k的价值观比较样本数据集,每个样本包含(prompt,正例回复、负例回复)。

国家标准《网络安全技术 生成式人工智能服务安全基本要求》基准测试集

包含2000+高质量测试问题数据

长沙方言会话语音语料库

包含 4.1 小时关于某些主题的转录长沙方言对话

影视资源大数据训练合集

40GB样例数据

影视资源数据集目录

16500部 400TB

Alimeeting4MUG数据集

包含 654 个录制的普通话会议,涵盖不同的主题,并在会议录音的手动记录上为 SLP 任务提供手动注释。

车辆识别13W张图像数据集

13W张道路上汽车的图像

高分数据集

西甲比赛数据集 (2019-2025, FBref)

西甲比赛数据集 (2019-2025, FBref)

用于开发和训练比赛预测模型,借助数据提升预测准确性。可开展体育分析,深入研究球队表现和比赛态势。

心脏病综合数据集

心脏病综合数据集

含 1026 名患者数据,14 个临床和诊断属性,目标变量为是否存在冠状动脉疾病,助力更可靠的心脏病预测机器学习模型训练评估,为心脏病早期诊断和临床决策提供有力支持。

性格分类数据集(内向或外向)

性格分类数据集(内向或外向)

包含 2900 条数据记录、8 个维度的行为特征信息,能够基于多种行为数据,对个体进行内向或外向性格分类,支持对行为与性格关系的多维度分析。

全球恐龙属多维度数据集

全球恐龙属多维度数据集

本数据集全面收录了来自世界各地的 700 多个恐龙属详细信息,涵盖科学名称、常见含义、饮食类型、估计大小、重量、运动方式、地质时期、分布地区及其他分类数据。

肾结石分类和对象检测数据集

肾结石分类和对象检测数据集

本数据集为肾结石检测项目专用,包含 9416 张来自多家医院和扫描中心的超声图像,涵盖原始及处理后图像,其中正常图像 4414 张、含结石图像 5002 张,分辨率均为 512x512 像素。

深度学习数据集查看全部

电子邮件分类数据集

包含 10,000 条真实邮件样本,其中垃圾邮件(spam)约 1,500 条,正常邮件(ham)约 8,500 条。

Spotify 音乐 ML 练习数据集

包含音乐流行度(0-100 分)、音频特征(可舞性、能量、响度等)、结构特征、114 个流派哑变量(is_genre_前缀)、自定义指标(如 loudness_intensity、mood_pca)、聚类目标(mood_cluster 等)及艺术家 / 专辑相关统计量。

700+ JOBs AI & Data Fields 数据

人工智能与数据领域职位数据集。

人员检测数据集

包含源自真实世界的图像,图像中的每个人都以 YOLO 格式边界框进行标注。

亚马逊(AMZN)历史股价数据集

包含亚马逊公司(AMZN)的历史股价数据,直接源自雅虎财经,涵盖所有可用交易日的每日交易信息,包括日期、开盘价、最高价、最低价、收盘价、调整后收盘价及当日成交量。

土耳其超级联赛球员薪资数据集

包含土耳其超级联赛(2024/2025 赛季)19 支俱乐部的球员薪资信息,覆盖约 350 名职业球员的核心数据字段,总记录数与联赛实际参赛人数高度匹配。

土壤数据集

包含 350 多张四种类型的土壤图像,具体为冲积土 195 张、黑土 68 张、煤渣土 30 张、红土 75 张。

杂货货架数据集

包含 5000 + 张在不同照明条件下拍摄的杂货货架图像,涵盖各类杂货店和超市场景,每张图像均附带 XML 标注。

男性脱发图像数据集

包含 2400 + 张男性脱发(脱发症)高质量头皮图像,从 5 个角度拍摄,涵盖不同头发密度、毛囊可见性及皮肤类型。

银行客户流失预测数据集

包含 10,000 名银行客户的信息,存储为 Churn_Modelling.csv(684.86 kB),含 14 列字段。

CC0 公共领域Spotify 用户收听历史数据集

包含 149,860 条用户 Spotify 播放记录,覆盖多年收听历史,完整记录曲目元数据、播放行为及设备信息。

网络日志数据集

包含模拟的网络活动日志,字段有 Source_IP、Destination_IP、Port、Request_Type、Protocol、Payload_Size、User_Agent、Status、Intrusion(入侵标识)、Scan_Type(流量类型)等。

AI 生成的文本数据集

共 1460 条记录,其中 AI 生成文本 85 条(约 6%),人工撰写文本 1375 条(约 94%)。

墨西哥教育特征数据集

本数据集是基于墨西哥国家统计和地理研究所(INEGI)开展的 ENAPE 调查(2021 年)改编的清理版资源,聚焦墨西哥人口教育特征,涵盖教育获取、入学率、辍学原因、家庭技术资源等关键信息。

Google 股票价格

涵盖 2015 年 1 月 1 日至 2024 年 12 月 31 日的每日交易数据,共 2500 + 条记录。

外贸必读报告查看全部

中国电动自行车及三轮车东南亚市场出口分析白皮书

含东南亚三国电动白行车TOP50采购商名单

中国充电桩及储能设备出口分析及各国进口政策影响白皮书

含重点国家充电基础设施TOP50采购商

中国半导体照明及应用领域出口统计及市场发展趋势分析白皮书

涵盖传统照明、新兴技术及细分领域。

中国半导体行业出口分析及各国进口政策影响白皮书

旨在系统性剖析中国半导体产业的全球出口格局、核心驱动因素及国际政策环境的深层影响。

印度尼西亚市场贸易发展中企出海系列白皮书

聚焦中国企业在印尼市场的贸易机遇、政策环境及本土化实践进行分析。

写给外贸人的展会营销指南

关于外贸的会展营销方法。

全球化妆品市场概况及中国化妆品出口情况分析白皮书

含不同类型化妆品TOP50采购商

2024年外贸企业营销数字化发展分析报告

适用范围覆盖全行业外贸企业。

非美市场贸易开发指南

适合希望摆脱对美国市场依赖、布局全球多元化市场的中企。

2024年中国出口百大产品及贸易伙伴排名统计数据

适用于机电与电子行业,机械设备与交通运输行业,传统劳动密集型行业,高新技术行业,新能源行业等。

中国企业出海印度市场贸易发展白皮书

可为中国企业开拓印度市场提供全面指导意见。

中国企业出海越南市场贸易发展白皮书

能为中国企业提供市场分析、政策指导、风险预警等。

中国企业出海土耳其市场贸易发展白皮书

帮助企业了解市场环境、把握贸易政策、规划市场策略等。

中国企业出海泰国市场贸易发展白皮书

用于中国企业进入泰国市场做决策提供依据

中国企业出海墨西哥市场贸易发展白皮书

墨西哥市场开发指南,助力企业了解墨西哥商业环境,规避潜在风险。

外贸数据推荐

中国企业出海印度市场贸易发展白皮书

中国企业出海印度市场贸易发展白皮书

本白皮书对印度的宏观经济格局、支柱产业现状、交通运输体系等方面进行了细致剖析,同时聚焦最新贸易数据,深度挖掘贸易趋势。

中国企业出海越南市场贸易发展白皮书

中国企业出海越南市场贸易发展白皮书

本白皮书对越南的宏观经济格局、支柱产业现状、交通运输体系等方面进行了细致剖析,同时聚焦最新贸易数据,深度挖掘贸易趋势。

中国企业出海土耳其市场贸易发展白皮书

中国企业出海土耳其市场贸易发展白皮书

通过整合市场数据、政策解析、风险提示与机遇洞察,为不同主体提供了从战略决策到落地执行的全流程参考。

中国企业出海泰国市场贸易发展白皮书

中国企业出海泰国市场贸易发展白皮书

对中国企业、政府部门和行业协会等均具有重要用途,能助力企业了解市场、制定策略,为政府和协会提供决策参考与服务支撑等。

中国企业出海墨西哥市场贸易发展白皮书

中国企业出海墨西哥市场贸易发展白皮书

为中国企业提供全面的墨西哥市场开发指南,从墨西哥的经济概况、交通运输到双边贸易趋势,全方位解析墨西哥市场的潜力与挑战。

热度推荐

Catime 桌面计时器

Catime 桌面计时器

Catime 是一款极简风格的桌面时间管理工具,主打轻量化与便捷性,无需安装,双击即可使用,支持窗口位置拖拽、大小调整。

文件时间修改器

文件时间修改器

支持修改文件及目录的各项时间(精确至微秒级),可备份时间并快速恢复,还能通过任务模板批量处理。

QuickLook 文件快速预览工具

QuickLook 文件快速预览工具

用户只需选中文件并按下空格键,即可快速查看内容,无需打开对应应用程序,大幅提升文件浏览效率。

超级复制 (Super Copy)

超级复制 (Super Copy)

解决网页文字无法复制的问题。无论是通过 CSS 还是 JS 形式设置的禁止复制、右键、全选、粘贴限制,都能一键解除,轻松复制。

电子书格式转换

电子书格式转换

支持 ePub、Azw3、Mobi、Doc、PDF、TXT 等多种主流电子书格式的互转,涵盖如 epub 转 mobi、pdf 转 epub、txt 转 docx 等常见转换需求。

本周推荐

罗小黑指针

罗小黑指针

罗小黑的自定义鼠标光标套装,包含多种静态与动态指针样式,能满足用户个性化光标需求。

罗小黑小黑猫桌宠

罗小黑小黑猫桌宠

罗小黑的桌面宠物,桌面美化工具,个性化桌面设置,附带安装教程,简易上手,萌萌的罗小黑在桌面与你互动~

罗小黑键鼠桌宠

罗小黑键鼠桌宠

通过动态可视化技术实时呈现键盘、鼠标及游戏手柄的操作状态,将抽象的按键指令转化为罗小黑角色的生动反馈。适用于游戏直播,办公,日常使用等。

罗小黑快乐登场手机输入法

罗小黑快乐登场手机输入法

输入法美化工具,百度输入法皮肤,罗小黑的输入法皮肤,附带使用说明,简易安装使用,安卓,ios系统通用。

罗小黑桌宠多表情版

罗小黑桌宠多表情版

罗小黑桌面美化宠物,罗小黑人形态桌宠,桌面个性化美化工具,附带安装使用教程,简易上手,快来使用吧~~

API接口

企业基本信息

企业基本信息

查询企业的基本信息,包括工商基本信息、行业分类、所在地区等信息。

动产抵押

动产抵押

查询企业的动产抵押信息,包括动产抵押基本信息、抵押物、抵押人及变更等信息。

欠税公告

欠税公告

查询企业欠税公告信息,欠税公告信息包括纳税人信息、欠税税种、欠税金额等字段信息。

软件著作权

软件著作权

查询企业的软件著作权信息,包括登记号、名称、版本号、登记时间等信息。

经营异常

经营异常

查询企业的经营异常信息,包括列入、移除原因及日期、操作部门等信息。

电脑工具软件查看全部

图像校正及漂白软件

图像漂白处理工具

快速解压绿色无广告版winrar

winrar解压软件,快速解压缩

番茄小说下载导出为txt工具

可以将番茄小说中的小说导出为txt文档。

电脑修复软件合集

2025 最新增强版 DirectX 修复工具,解决 Windows 系统 dll 错误、游戏崩溃、程序异常问题。

酷狗kgm转MP3

将酷狗下载的 kgg 格式音乐,转换为 MP3、FLAC 等通用格式。

Catime 桌面计时器

支持窗口自定义 轻量化设计 极简桌面助手。

剪映6.0版本安装+激活

剪映破解版,安装+激活,附带安装使用教程。

图片魔法师专业版

支持图像漂白、图像调整(对比度、色阶、色相、锐化)、图像均化、颜色替换、图片白边、亮度对比度、去除噪点、灰阶、反相、棕色调等多个算法图层。

bandizip免费无广告解压缩软件

快速解压软件,智能解压,安全可靠。

数据恢复,硬盘恢复,硬盘解除锁定,格式化

数据恢复软件,支持硬盘、U 盘、SD 卡、移动盘等设备数据恢复。

datatool下载工具

支持从 YouTube、TikTok、Instagram、Facebook、Twitter 等多个平台下载视频和图片。

微信多开工具

pc端微信多开工具软件。

QQ音乐转换工具

将QQ音乐下载的格式转换成mp3格式。

文件时间修改器

支持微秒级修改 多任务并行。

摸鱼屏保

模拟Win系统电脑常见故障的屏保应用,主要用于"上班摸鱼"。

个性化美化工具

zoa与iye桌宠

zoa与iye桌宠

以权志龙的猫为形象,定制的zoa与iye桌宠,为桌面美化工具,个性化桌宠,运行简单,所占内存小,点击即可运行。附带安装使用教程。

粉红天使桌宠

粉红天使桌宠

为守望先锋游戏中粉红天使的桌宠,桌面交互工具,操作可视化鼠标和键盘操作,通过动态可视化呈现键盘、鼠标及外设操作,融合工具属性与萌系交互,打造 “实用 + 治愈” 的桌面助手。

可莉桌宠

可莉桌宠

原神中的游戏角色可莉桌宠,可以通过动态可视化呈现键盘、鼠标及外设操作,支持外接键盘、笔记本键盘、光电 / 机械鼠标,适用于游戏直播,学习娱乐场景。

海贼王Q版桌宠

海贼王Q版桌宠

包含多个不同表情,不同角色的Q版人物桌宠桌宠,个性化桌面设置,桌面美化工具,为您的工作和生活增添趣味,放松心情,且运行简单,包含安装使用说明。

罗小黑键鼠桌宠

罗小黑键鼠桌宠

通过动态可视化技术实时呈现键盘、鼠标及游戏手柄的操作状态,将抽象的按键指令转化为罗小黑角色的生动反馈。适用于游戏直播,办公,日常使用等。

输入法鼠标皮肤查看全部

乌萨奇输入法皮肤~兔-屁屁

乌萨奇扭屁股输入法皮肤。

线条小狗鼠标指针

线条小狗的自定义鼠标光标套装。

小八鼠标指针皮肤

小八的自定义鼠标光标套装,包含多种静态与动态指针样式。

罗小黑标指针(动态)桌面美化工具

罗小黑猫猫的自定义鼠标光标套装,包含多种静态与动态指针样式。

罗小黑指针

罗小黑的自定义鼠标光标套装。

zoa鼠标指针桌面美化工具

zoa的自定义鼠标光标套装,包含多种静态指针样式,能满足用户个性化光标需求。

乌萨奇输入法皮肤-哈啊

乌萨奇哈啊输入法皮肤。

小黑猫动态鼠标指针

桌面美化工具,自定义鼠标光标。

自嘲熊鼠标指针

自嘲熊的自定义鼠标光标套装,包含多种静态与动态指针样式

ckw寿喜烧输入法皮肤

搜狗输入法皮肤,输入法个性化美化。

罗小黑鼠标指针3

罗小黑猫形态的自定义鼠标光标套装。

吉伊乌萨奇小八开车输入法皮肤-动态

chiikawa输入法皮肤-三小只开车

Miku鼠标光标美化工具

自定义鼠标光标套装,动态指针。

罗小黑快乐登场手机输入法

百度输入法皮肤,安卓,ios通用。

飞鼠输入法皮肤-婴儿

飞鼠输入法皮肤。

游戏推荐

双影奇境/Split Fiction

双影奇境/Split Fiction

Steam 国区好评率高达 98%,玩家称其 “上瘾”“物超所值”,双人成行的第二部。

双人成行 It Takes Two

双人成行 It Takes Two

《双人成行》(It Takes Two)是一款由Electronic Arts与Hazelight合作开发的动作冒险游戏,于2021年3月26日发售。玩家在游戏中扮演一对争吵不休的夫妇Cody和May,他们由于被施了魔法而变成了两个玩偶,并且困在了一个奇幻的世界里,然后在爱情大师哈基姆博士的指示下接受了各种挑战。2021年12月10日,《双人成行》获得2021TGA年度最佳游戏奖、最佳多人游戏奖、最佳家庭游戏奖。

饥荒Dont Starve Together

饥荒Dont Starve Together

风格独特的异世界,处处是惊喜(惊吓)。你可以尽情的使用一切物品搭建你的城堡,从最开始简单的用树枝和草搭建的小帐篷,到后来用石头、金子打造的豪华城堡。

泰拉瑞亚

泰拉瑞亚

steam史上第一个好评破百万的好评如潮游戏 整个世界自由开放任你探索

卧龙:苍天陨落Wo Long Fallen Dynasty

卧龙:苍天陨落Wo Long Fallen Dynasty

西历184年,中国。时值东汉末年,硝烟四起,生灵涂炭。昔日睥睨天下的大汉王朝,其天命如今摇摇欲坠。在结合历史、 奇幻与动作元素的本三国动作RPG中,玩家将化身为无名义勇兵,运用融合了中华武术精髓的剑戟动作,力挑各路英雄豪杰与横行跋扈的妖魔,踏破三国乱世。

东方夜雀食堂

东方夜雀食堂

年轻的夜雀妖怪米斯蒂娅·萝蕾拉有一个梦想,成为最受欢迎的烧烤屋老板娘。内心善良的小夜雀每天努力工作,收集食材,学习新的菜谱,一天一天的辛劳,努力还债

荒野大镖客 :救赎 重制版荒野大镖客 :救赎 重制版

荒野大镖客 :救赎 重制版荒野大镖客 :救赎 重制版

僵尸恐怖衍生单机游戏,超真实画质!!

星露谷物语Stardew Valley

星露谷物语Stardew Valley

超好玩的种田游戏,超高自由度,种菜,浇水,钓鱼等;不玩则已,一玩就是一整天,特别上头

博德之门3

博德之门3

这一刻,我知道我玩到了今年最伟大的游戏,影心的信仰实际上是邪恶教会?被誉为黑夜信仰的莎尔女神究竟是什么来历

实用项目源码查看全部

自动修复错误命令行

代码修复工具

命令行版本网易云音乐

程序员使用的终端版网易云!

OCRmyPDF(一个强大的pdf转写文字的工具)

可以将pdf中不清晰的,年代久远的,精准定位转换成文字。包含项目源码以及使用说明,部署教程。

AI自动P图工具

AI自动P图工具,源码项目。

FPS游戏物理准星

准星源码,包含使用教程,可解决fps游戏中狙没有准星的缺陷。

会写作文的人工智能

包含项目源码,详细步骤,教您部署一个会写作文的人工智能

genact

显示一些多任务场景,让看到你电脑屏幕的人都误以为你在 Coding。

视频去马赛克

视频去马赛克以及视频超分辨率的项目源码。

合成大西瓜

项目源码合成大西瓜,包含开发全流程。

实时语音克隆源码项目

5秒即可克隆出您想要的声音!

IDEA 久坐提醒插件

避免长时间写代码造成的身体上的伤害而开发的项目,每40分钟进行一次提醒休息。

线描图画上色工具

图像自动处理,AI工具源码。

图片转换工具

一张图片,只要改变后缀名就变成了一首歌等格式,可用于加密。

去除纹身工具

可无痕去除纹身或者加纹身,此为项目源码,包含使用教程,可部署在本地。

图像清晰化工具(用于人脸清晰化)

图像清晰化项目源码,附使用说明。

典枢快讯

破解AI数据困局!典枢如何打造开发者首选的深度学习数据集下载平台?

破解AI数据困局!典枢如何打造开发者首选的深度学习数据集下载平台?

典枢是去中心化的深度学习数据集下载平台,通过独创数据质量评估机制和全链路安全体系,解决数据质量不透明、数据泄露等难题。平台采用先评估后购买模式,保障交易安全可信,同时整合全行业数据资源,助力需求方高效获取数据集,加速大模型研发进程。

破解图像数据集获取难题,典枢原创技术 Fidelius赋能图像数据流通

破解图像数据集获取难题,典枢原创技术 Fidelius赋能图像数据流通

典枢平台以原创Fidelius技术为核心,构建安全可信的图像数据集交易生态。通过算法生成低分辨率样本精准评估数据质量,全链路加密确保买卖双方隐私安全,结合在线关键词检索功能高效匹配需求,助力用户快速获取优质训练数据,推动计算机视觉领域创新发展。

破解中文方言语料下载难题,典枢构建去中心化可信数据合作平台

破解中文方言语料下载难题,典枢构建去中心化可信数据合作平台

典枢作为中文方言语料下载首选平台!依托开放生态与隐私加密技术,提供安全透明、高质多样的方言数据集下载服务,通过专业质量评估,助力语言研究者及AI开发者精准获取真实语料资源,破解数据鸿沟与安全困局,赋能智能交互创新。