如果说2025年是”数据要素”的概念普及年,那么2026年就是”数据交易”的制度创新年。4月,国家数据局发布高质量数据集建设征求意见稿,首次将Token交易写入政策文件;北数所推出数智引擎一站式数据集服务;工信部启动”模数共振”行动;合成数据市场进入爆发前夜。这些事件背后有一条清晰的逻辑线:数据交易正在从”卖数据包”的初级阶段,走向”卖调用、卖服务、卖能力”的新范式。本期新闻资讯聚焦这一正在发生的交易模式变革。
一、国家数据局发布高质量数据集建设征求意见稿
国家数据局发布《关于推进行业高质量数据集建设行动的实施方案(征求意见稿)》,提出到2028年底建成一批覆盖重点领域的高质量数据集,部署强基扩容、标注攻坚、提质增效、应用赋能、管理服务、价值释放六大专项行动,覆盖科学研究、工业制造、金融服务、医疗卫生、低空经济、具身智能、智能驾驶等重点领域。
这份征求意见稿的重要性在于:它是此后数月一系列数据产业政策的”母文件”。6月正式稿发布时,六项行动被完整保留并细化,Token交易、数据资产化等创新内容均在此征求意见阶段已现雏形。
来源:人民日报
二、Token交易首次进入政策视野
征求意见稿中首次提出探索以词元(Token)为基础价值体系的新型数据集交易模式,推动商业模式从基础数据包销售向API调用、模型化解决方案及全栈服务梯次跃升。
Token交易模式的意义不亚于当年SaaS从”买许可证”到”买订阅”的转变。传统的数据集交易是”一次买断”——买家付钱拿到数据包,交易结束。Token交易则是”按需付费”——按实际调用的Token量计费,交易变成了持续的服务关系。这不仅能降低买家的初始采购门槛,也为数据供应商带来了更稳定的经常性收入。长江证券研报指出,Token交易或将成为”智能经济”的新度量衡。
三、北数所推出”数智引擎”一站式数据集服务
北京国际大数据交易所推出”数智引擎”一站式AI高品质数据集服务,涵盖咨询规划、建设打造、能力评测、流通交易、场景加速五大阶段,联合国家权威机构为达标数据集出具认证证书和测评报告。北数所累计数据交付规模已达2500TB,发放数据资产登记证书800余张。
北数所的实践表明,数据交易所的角色正在从”交易撮合平台”升级为”全链条服务商”。数据集的评估认证、质量测评、资产登记等服务,本质上是为数据这一非标品建立”信任基础设施”。当数据交易从”熟人交易”走向”陌生人交易”时,这种第三方背书的价值不可替代。
来源:北京市人民政府
四、工信部与国家数据局联合启动”模数共振”行动
工信部与国家数据局联合发布通知,正式开展”模数共振”行动,将”建设高质量数据集”列为核心重点任务,打通”模型—数据—应用”正向循环。
业界预计此举将带动三个百亿级细分赛道:高质量行业数据集构建与服务、行业知识图谱与智能体知识库、合成数据生成与数据隐私保护平台。对于数据交易平台而言,这三个赛道都是可以直接参与的市场机会。
来源:新浪财经
五、合成数据市场高速增长:中国CAGR达40%
据埃森哲等机构数据,中国合成数据市场2025年已达45.1亿元,预计2030年突破220亿元(CAGR约40%)。全球AI训练数据集市场2025年达457.1亿元,预计2032年达2127.5亿元(CAGR约28%)。
合成数据的高速增长背后有三个核心驱动力:一是真实数据获取成本居高不下,特别是医疗、金融等隐私敏感领域;二是合成数据质量在快速提升,GAN+扩散模型的融合架构正在缩小与真实数据的差距;三是政策端对合成数据的认可度在提升,国家数据局方案中明确鼓励探索合成数据应用。
来源:埃森哲/新浪财经
数据星球·新闻资讯 – 典枢数据旗下AI数据行业栏目