亿条数据裤

verify-tag2006-2024新闻联播文本数据集:含 6389 条 TXT 原始全文,覆盖国家政策解读、社会舆情分析、时政热点研究,支持 NLP 模型训练、时间序列分析,适用于学术研究、大数据挖掘与 AI 算法开

60

已售 0
44.85MB

数据标识:D17737183885027180

发布时间:2026/03/17

# 有问题可以联系售后450792304@qq.com

在中文自然语言处理、检索与知识抽取等任务中,高覆盖、长时间跨度、结构稳定且可回溯的文本语料始终是最关键的基础资源之一。该数据集以“按日归档”的方式沉淀了 2006 至 2024 年期间(后续可更新,联系上面的邮件)的中文日播新闻节目文本,几乎贯穿了中国社会发展的重要转型期,包含了多个关键的历史阶段,从经济高速增长期到高质量发展阶段,从应对重大自然灾害到防控全球性疫情,从重大赛事举办到国际局势的复杂演变等,数据总量庞大且时间连续性强,完整记录了这一时期内每日重要时政信息的传播内容。
这些数据来源于对中央广播电视总台《新闻联播》节目内容的爬取。《新闻联播》作为中国最具权威性和影响力的时政新闻节目,自 1978 年开播以来,始终承担着传递国家政策、报道重大事件、反映社会动态的重要功能,其内容经过严格的筛选和审核,具有高度的官方性和公信力,是研究中国政治、经济、社会、文化等领域发展变化的重要一手资料文件命名规则稳定、时间索引明确,便于在不同年份之间进行对比研究、趋势分析和模型泛化能力评估。与仅提供索引或摘要的集合不同,本数据集直接提供可用于处理的原始文本文件,使得从清洗、分段、检索到训练与评测的完整流程能够在同一份数据上闭环完成。

从内容构成上看,数据集的核心由逐日文本文件组成,文件路径中包含年份与月份目录,文件名包含日期与序号信息,便于定位到具体日期与当日的文本条目。除原始文本外,本说明文档中的统计字段(如文件大小、字符数、行数、长度区间等)均可由全量文件计算得到,可用于质量检查、分布分析与下游建模的特征工程。由于数据以单文件形式组织,既适合小规模脚本快速处理,也能在分布式/并行环境中实现按年份、按月份、按天切片的工程化处理,从而支持科研实验与工业管线的长期维护。

## 数据基本信息

本次统计基于 20062024 目录下的全量 .txt 文件(递归扫描,过滤 macOS 元数据类文件如 ._*.DS_Store),得到如下关键规模指标:

- 时间范围:2006-2024(其中 2006 为部分年份覆盖,2024 为部分月份覆盖)
- 文件格式.txt(纯文本)
- 记录条目数(文本文件数)6389
- 总文件大小137,543,084 Bytes(约 131.2 MiB)
- 总字符数(UTF-8 忽略错误读取的统计口径)47,128,840
- 总行数130,141
- 空文本文件数0
- 命名规则匹配率100%(均符合 YYYY-MM-DD-序号.txt

### 数据字段说明(由文件与路径可直接解析/统计得到)

| 字段名称 | 字段类型 | 字段含义 | 数据示例 | 完整性(完整率) |
|---|---|---|---|---|
| year | int | 年份(来自目录与文件名) | 2018 | 100% |
| month | int | 月份(来自月份目录或文件名) | 8 | 100% |
| day | int | 日期(来自文件名) | 5 | 100% |
| index_in_day | int | 当日序号(来自文件名末尾序号) | 0 | 100% |
| relative_path | string | 相对数据根目录的文件路径 | 2018/2018-08/2018-08-05-0.txt | 100% |
| file_format | string | 文件格式/扩展名 | txt | 100% |
| file_size_bytes | int | 文件大小(字节) | 20020 | 100% |
| text_char_count | int | 文本字符数(UTF-8 读取、忽略错误) | 6828 | 100% |
| text_line_count | int | 文本行数(以换行符估算) | 1 | 100% |

说明:本数据集以原始文本文件为主,未额外提供独立的 JSON 元数据或标注文件;字段均可通过“路径解析 + 文件统计”得到,便于在导入数据库、构建检索索引或训练语料管线时统一生成。

## 数据分布情况

### 年份分布(按文件条目数统计)

| 年份 | 记录数量(文件数) | 占比 | 累计占比 |
|---|---:|---:|---:|
| 2006 | 122 | 1.9095% | 1.9095% |
| 2007 | 365 | 5.7129% | 7.6225% |
| 2008 | 366 | 5.7286% | 13.3511% |
| 2009 | 365 | 5.7129% | 19.0640% |
| 2010 | 365 | 5.7129% | 24.7770% |
| 2011 | 365 | 5.7129% | 30.4899% |
| 2012 | 366 | 5.7286% | 36.2185% |
| 2013 | 365 | 5.7129% | 41.9314% |
| 2014 | 365 | 5.7129% | 47.6444% |
| 2015 | 365 | 5.7129% | 53.3573% |
| 2016 | 366 | 5.7286% | 59.0859% |
| 2017 | 365 | 5.7129% | 64.7989% |
| 2018 | 365 | 5.7129% | 70.5118% |
| 2019 | 365 | 5.7129% | 76.2248% |
| 2020 | 366 | 5.7286% | 81.9534% |
| 2021 | 365 | 5.7129% | 87.6663% |
| 2022 | 365 | 5.7129% | 93.3792% |
| 2023 | 365 | 5.7129% | 99.0922% |
| 2024 | 58 | 0.9078% | 100.0000% |

解读:从 2007 至 2023,数据按天覆盖较为稳定(平年 365、闰年 366),有利于构建长期时间序列与跨年度对比实验;2006 与 2024 的记录数明显偏少,符合“年份边界处为部分覆盖”的特征,适合在研究中作为不完整年份单独处理或在建模时进行缺口对齐。

### 文件格式分布

| 文件格式 | 记录数量 | 占比 |
|---|---:|---:|
| .txt | 6389 | 100% |

### 文本长度分布(按字符数区间统计)

| 字符数区间 | 记录数量 | 占比 |
|---|---:|---:|
| 1-200 | 2 | 0.0313% |
| 501-1k | 4 | 0.0626% |
| 1k-2k | 8 | 0.1252% |
| 2k-5k | 237 | 3.7095% |
| 5k-1w | 5911 | 92.5184% |
| 1w-2w | 227 | 3.5530% |

同时,基于全量文本统计得到的整体描述指标如下:最小字符数 57,中位数 7228,均值 7376.56,95 分位数 9660,最大字符数 17323。该分布表明多数文本处于相对稳定的长度区间,适合训练需要固定上下文窗口或需要控制输入长度的模型与管线。

## 数据优势(面向科研与产业应用)

| 优势特征 | 具体表现 | 应用价值 |
|---|---|---|
| 时间跨度长 | 覆盖 2006-2024,且 2007-2023 按天稳定 | 适合长期趋势研究、跨年度泛化评测与时间切片训练 |
| 原始全文可用 | 全量提供 .txt 原始文本文件(非仅索引/摘要) | 支持从清洗到建模、从检索到抽取的端到端闭环 |
| 组织结构清晰 | 年份/月目录 + 规范化文件名 YYYY-MM-DD-序号.txt | 便于自动解析日期、构建数据湖分区与增量处理 |
| 规模适中易工程化 | 6389 条文本、约 131 MiB | 单机可快速处理,也易并行按年份切分 |
| 文本长度相对稳定 | 92% 以上集中在 5k-1w 字符区间 | 有利于批处理、训练时的长度裁剪策略与显存规划 |

## 数据样例(正文片段样例,展示正文内容并做合规脱敏)

说明:你要求样例展示正文内容。为满足平台审核与合规要求,以下样例展示每个文件正文开头片段(约 200 字),并对可能触发审核的专名/机构名等做了自动替换脱敏(以“【已脱敏】”表示)。数据集中仍保留完整原始文本文件,实际研究与训练请在本地读取对应 .txt 文件获得完整原文。

### 样例 1

- 年份:2006
- 相对路径:2006/2006-11/2006-11-06-0.txt
- 文件大小(Bytes):26296
- 字符数:8887
- 行数:89

text
【已脱敏】【已脱敏】今天上午在【已脱敏】主持仪式,欢迎南非共和国总统塔博·姆贝基访华。
全国人大常委会副委员长成思危、国务委员唐家璇、全国政协副主席罗豪才等出席了今天的欢迎仪式。
随同姆贝基总统访华的有:总统夫人、外交部长、贸工部长等。
姆贝基总统是应【已脱敏】主席的邀请,在出席中非合作论坛北京峰会之后对我国进行国事访问的。欢迎仪式后,【已脱敏】主席同姆贝基总统举行了会谈。双方就在平等互利、共同发展的基础上加强两国长期稳定的战略伙伴关系达成广泛共识,

### 样例 2

- 年份:2007
- 相对路径:2007/2007-08/2007-08-01-0.txt
- 文件大小(Bytes):12412
- 字符数:4332
- 行数:51

text
新闻联播(8月1日)

央国际 www.cctv.com  2007年08月01日 19:10 来源:CCTV.com庆祝中国人民【已脱敏】建军80周年暨全军英雄模范代表大会在京举行 【已脱敏】发表重要讲话

央国际 www.cctv.com  2007年08月01日 19:09 来源:CCTV.com
专题:庆祝中国人民【已脱敏】建军80周年
【已脱敏】、【已脱敏】和【已脱敏】今天在【已脱敏】隆重举行庆祝中国人民【已脱敏】建军80周年暨全军英雄模范代

### 样例 3

- 年份:2008
- 相对路径:2008/2008-06/2008-06-04-0.txt
- 文件大小(Bytes):24408
- 字符数:8517
- 行数:99

text
【已脱敏】总理【已脱敏】今天主持召开【已脱敏】常务会议,研究部署当前农业生产工作,审议并原则通过《汶川地震灾后恢复重建条例(草案)》。
会议指出,今年以来,【已脱敏】、【已脱敏】制定了一系列加强农业的政策措施,各地区、各有关部门加大工作力度,调动了农民的积极性,夏季粮油丰收在望。
会议对搞好“三夏”生产,力争全年农业丰收作出部署。一是抓好抢收抢种。保障柴油供给,确保跨区机收顺利进行;关注天气变化,突击抢收抢打,确保颗粒归仓;扩大玉米、水稻等粮食作物面积,确

### 样例 4

- 年份:2009
- 相对路径:2009/2009-07/2009-07-07-0.txt
- 文件大小(Bytes):35992
- 字符数:12366
- 行数:1

text
当地时间7月6日,【已脱敏】【已脱敏】在罗马会见意大利总理贝卢斯科尼。【已脱敏】表示,我们高兴地看到,中意全面战略伙伴关系正呈现良好发展势头。意大利是中国的全面战略伙伴,也是中国在欧盟值得信赖的朋友,中国高度重视中意关系,加强对意关系是中国坚定不移的方针。明年是中意建交40周年,我们愿同意方一道,牢牢把握双边关系前进方向,加强在重大国际和地区问题上的密切沟通和协调,扎实推进各领域互利合作,努力把中意全面战略伙伴关系提高到新水平。【已脱敏】就加强中意务

### 样例 5

- 年份:2010
- 相对路径:2010/2010-05/2010-05-29-0.txt
- 文件大小(Bytes):17793
- 字符数:6111
- 行数:1

text
nan【已脱敏】【已脱敏】今天上午在【已脱敏】会见了芬兰总统塔里娅・哈洛宁。【已脱敏】说,在中芬建交60周年之际,哈洛宁总统再次率团访华出席相关庆祝活动和上海世博会芬兰国家馆日活动,很有意义。【已脱敏】表示,新中国成立后,芬兰是最早同新中国建交的西方国家之一。建交60年来,中芬关系稳步发展。近年来,两国关系发展势头更为强劲,双方高层互访频繁,政治互信日益增强,各领域合作富有成果,在多边事务中保持密切配合。中芬贸易和投资合作成为两国关系中的一个亮点。胡

### 样例 6

- 年份:2011
- 相对路径:2011/2011-03/2011-03-31-0.txt
- 文件大小(Bytes):24202
- 字符数:8308
- 行数:1

text
我国将于4月14日在海南省三亚市举办金砖国家领导人第三次会晤,【已脱敏】主席将主持此次会晤。应【已脱敏】主席邀请,巴西总统罗塞芙、俄罗斯总统梅德韦杰夫、印度总理辛格、南非总统祖马将与会。会晤期间,金砖国家领导人将就国际形势、经济、金融、发展等问题深入交换意见,并规划金砖国家未来合作。(视频编辑:杜卓 文字编辑:孙继礼)应博鳌亚洲论坛邀请,【已脱敏】【已脱敏】将出席4月15日在海南博鳌举行的博鳌亚洲论坛2011年年会开幕式并发表主旨演讲。俄罗斯总统梅德

### 样例 7

- 年份:2012
- 相对路径:2012/2012-12/2012-12-27-0.txt
- 文件大小(Bytes):20867
- 字符数:7159
- 行数:1

text
【已脱敏】【已脱敏】【已脱敏】今天在【已脱敏】会见第67届【已脱敏】大会主席耶雷米奇。【已脱敏】指出,在即将过去的一年,世界大势总体稳定,但各种问题和挑战层出不穷。国际社会需要认真思考如何在新的一年加强合作,促进世界和平与发展。和平与发展相辅相成,发展是和平的基础,事关各国人民福祉,要更加重视发展问题。当今各国利益交融、安危与共,处理相互关系必须寻求共赢,维护和做大共同利益。要始终坚持《【已脱敏】宪章》宗旨和原则,希望【已脱敏】说公道话、办公道事。中国将一如既往

### 样例 8

- 年份:2013
- 相对路径:2013/2013-12/2013-12-27-0.txt
- 文件大小(Bytes):21976
- 字符数:7423
- 行数:1

text
【已脱敏】办公厅、【已脱敏】办公厅近日印发了《关于务实节俭做好元旦春节期间有关工作的通知》。通知说:为切实做好2014年元旦、春节期间各项工作,确保广大人民群众度过欢乐祥和的节日,经【已脱敏】、【已脱敏】同意,现将有关事项通知如下。一、深入基层做好关心群众工作。各级领导干部要结合开展党的群众路线教育实践活动,进一步改进作风,自觉深入到基层一线特别是困难地区、困难家庭、困难群众中去,开展走访慰问、专项救助、送温暖等活动,关心群众疾苦,帮助解决实际问题。

### 样例 9

- 年份:2014
- 相对路径:2014/2014-10/2014-10-04-0.txt
- 文件大小(Bytes):17582
- 字符数:6161
- 行数:1

text
从吃、穿等生存型支出,到住、行等发展型、享受型消费,65年来,中国城乡居民生活水平,实现了从温饱不足迈向全面小康的历史性跨越。这是北京五棵松篮球馆,由美国NBA选派的教练正在带领一群小学生上篮球课。就在家门口,普通市民家庭的孩子就可以接受世界一流水平的篮球培训。65年来,中国人的消费理念发生了翻天覆地的变化。根据【已脱敏】的划分标准,新中国成立之初,我国居民家庭恩格尔系数超过60%,为贫困国家;今天,居民家庭恩格尔系数已经降到30%多,实现

### 样例 10

- 年份:2015
- 相对路径:2015/2015-12/2015-12-05-0.txt
- 文件大小(Bytes):21357
- 字符数:7203
- 行数:1

text
【已脱敏】【已脱敏】当地时间4号在约翰内斯堡出席中非领导人与工商界代表高层对话会暨第五届中非企业家大会闭幕式并发表题为《携手共进,谱写中非合作新篇章》的重要讲话,强调中国真诚希望同非洲国家分享中国工业化经验,愿为非洲工业化进程提供支持。中非应该继承真诚友好的光荣传统,把互助合作精神发扬光大,共同创造中非人民的美好未来。南非总统祖马,非盟轮值主席、津巴布韦总统穆加贝,非盟委员会主席祖马,出席中非合作论坛峰会的非洲国家领导人及400余名中非企业家

### 样例 11

- 年份:2016
- 相对路径:2016/2016-05/2016-05-22-0.txt
- 文件大小(Bytes):20163
- 字符数:6896
- 行数:1

text
革命老区河北省阜平县,是我党我军历史上创建的第一个敌后抗日根据地——晋察冀边区政府所在地,因为土地贫瘠,交通不便,一直是全国重点贫困县,这个县龙泉关镇的骆驼湾和顾家台两个村,过去人均年收入才900多块钱。2013年新年前夕,【已脱敏】【已脱敏】专程来到这里看望困难群众,访农户、看真贫,并要求各级党委政府坚定信心、找准路子,想方设法、群策群力,尽快让老区的乡亲过上好日子。这之后,阜平县被确立为“燕山——太行山区域发展与扶贫攻坚试点”,从此迈进了向

### 样例 12

- 年份:2017
- 相对路径:2017/2017-02/2017-02-26-0.txt
- 文件大小(Bytes):17976
- 字符数:6183
- 行数:1

text
23、24号两天,【已脱敏】【已脱敏】在北京考察城市规划建设和北京冬奥会筹办工作,强调要立足提高治理能力抓好城市规划建设,着眼精彩、非凡、卓越筹办好北京冬奥会。【已脱敏】建设者们备受鼓舞,表示要按照【已脱敏】要求,求真务实、攻坚克难,努力开创【已脱敏】发展更加美好的明天。在北京新机场主航站楼建设工地,【已脱敏】离开快一个小时了,大家还沉浸在刚才和【已脱敏】见面时的心情当中。【已脱敏】跟这名河南籍工人握了很长时间手,聊起了家常。在【已脱敏】眼里,新机场是【已脱敏】的重大标志性工程,大

### 样例 13

- 年份:2018
- 相对路径:2018/2018-01/2018-01-14-0.txt
- 文件大小(Bytes):18202
- 字符数:6198
- 行数:1

text
【已脱敏】【已脱敏】指出,2018年是全面贯彻中共十九大精神的开局之年。中共十九大描绘了我国发展今后30多年的美好蓝图。九层之台,起于累土。要把这个蓝图变为现实,必须不驰于空想、不骛于虚声,一步一个脚印,踏踏实实干好工作。从今天开始《新闻联播》推出系列报道《在【已脱敏】新时代中国特色社会主义思想指引下》,展现各地区深入学习贯彻党的十九大精神、努力开创中国特色社会主义发展的新局面。今天,我们就一起来看一看地处高原的西藏自治区,在新时代、新征程上如何实

### 样例 14

- 年份:2019
- 相对路径:2019/2019-05/2019-05-08-0.txt
- 文件大小(Bytes):20997
- 字符数:7153
- 行数:1

text
全国【已脱敏】工作会议7日至8日在北京召开。【已脱敏】【已脱敏】、【已脱敏】、【已脱敏】主席【已脱敏】出席会议并发表重要讲话。他强调,新的历史条件下,【已脱敏】机关要坚持以新时代中国特色社会主义思想为指导,坚持总体国家安全观,坚持以人民为中心的发展思想,坚持稳中求进工作总基调,坚持政治建警、改革强警、科技兴警、从严治警,履行好党和人民赋予的新时代职责使命,努力使人民群众安全感更加充实、更有保障、更可持续,为决胜全面建成小康社会、实现“两个一百年”奋斗目标和中华民

### 样例 15

- 年份:2020
- 相对路径:2020/2020-07/2020-07-15-0.txt
- 文件大小(Bytes):25227
- 字符数:8768
- 行数:1

text
7月16日出版的第14期《求是》杂志将发表【已脱敏】【已脱敏】、【已脱敏】、【已脱敏】主席【已脱敏】的重要文章《【已脱敏】领导是中国特色社会主义最本质的特征》。 文章强调,中国特色社会主义最本质的特征是【已脱敏】领导,中国特色社会主义制度的最大优势是【已脱敏】领导,党是最高政治领导力量。【已脱敏】,东西南北中,党是领导一切的。坚持和完善党的领导,是党和国家的根本所在、命脉所在,是全国各族人民的利益所在、幸福所在。中国有了【已脱敏】执政,是中国、中国人

### 样例 16

- 年份:2021
- 相对路径:2021/2021-08/2021-08-03-0.txt
- 文件大小(Bytes):18640
- 字符数:6468
- 行数:1

text
【已脱敏】【已脱敏】强调,要坚持“绿水青山就是金山银山”的理念,坚定不移走生态优先、绿色发展之路。“十四五”开局之年,中国加快生态文明建设步伐,在着力提高生态系统自我修复能力的同时,以“减碳”为抓手加快促进经济社会全面绿色转型。增减之间,绿色成为中国经济高质量发展的鲜明底色。33亿亩!这是目前中国的森林面积,中国因此成为近20年来全球森林资源增长最多的国家。绿色多了,水也更清了。今年上半年,全国地表水考核断面水质优良比例达81.7%,同比上升1

## 应用场景

- 长周期文本趋势建模与时间序列对齐分析

该数据集按日归档且跨越多个年度,特别适合构建“以天为时间粒度”的文本时间序列研究框架。在实际使用中,可以先根据文件路径解析出日期字段,再对每日文本做标准化清洗(如去除无意义空白、统一符号、纠错或分段),随后在日级别计算多种文本统计指标,例如长度、词汇丰富度、关键短语密度、主题向量或句向量的聚合值等,并将这些指标与外部时间信息进行对齐。由于 2007-2023 覆盖稳定,你可以把数据切分为训练区间、验证区间与测试区间,进行跨年度泛化评估,检验模型在不同年份语料上的鲁棒性。对于需要长期趋势解释的任务(如主题漂移、文本风格变化、表达模式演化),该类按日文本的连续性也便于使用滑动窗口、季节性分解或断点检测等时间序列方法,将“文本变化”转化为可量化、可验证的研究结论。

- 面向检索与问答的全文索引构建与高质量语料检索

数据集中每条记录都以完整 .txt 文件形式存在,为构建全文检索系统提供了直接可用的原料。实际落地时,可以把每个文件作为一个文档单元,提取 year/month/day/index 作为结构化元数据,将正文作为倒排索引或向量索引的内容字段;同时结合文件大小、字符数等质量信号进行索引质量控制。由于命名规则固定,更新或增量导入也可按日期分区实现自动化。对于行业应用而言,这类结构清晰的文本库适合用于搭建内部知识检索、辅助写作素材检索、语料对照查询以及基于相似度的内容召回。进一步地,在检索之上可以叠加摘要生成与段落级切分策略,把长文本拆分为更细粒度的检索块,提高召回精度与回答可读性;而原始全文的可用性使得这些策略能够在同一份数据上持续迭代与评估。

- 中文 NLP 预训练/微调语料准备、清洗与质量控制基准

在训练中文语言模型或领域模型时,语料的时间跨度、文本长度稳定性与可审计性对效果和风险控制都非常重要。本数据集提供按日归档的原始全文,既可以作为追加语料,也可以作为清洗与过滤策略的评测基准:你可以在全量 6389 条文本上统一跑分段、去重、长度裁剪、异常字符处理等流程,利用字符数区间分布来设计批处理策略与最大长度阈值,并通过统计“处理前后长度变化”“异常样本比例”等指标进行可量化的质量把控。由于 92% 以上文本集中在 5k-1w 字符区间,对显存规划、批量构建样本对与滑窗切片尤为友好。在微调阶段,也可将日期作为分层采样的条件,构建跨年度的训练/验证切分,减少时间泄漏带来的评测偏差,使模型在更真实的时序泛化条件下得到验证。

- 信息抽取与结构化数据构建(实体、事件、关系、时间表达)

当你需要把长篇文本转化为结构化知识时,稳定的来源与清晰的时间索引可以显著降低工程复杂度。使用该数据集时,可以将每个文本文件视为一个“日级文档”,以日期为天然主键,进行实体识别、关键词抽取、短语归一化与关系抽取等处理,并把抽取结果写入结构化表或图数据库。由于文件名直接提供日期与序号,可以在抽取后将结构化信息与来源文件精确回链,实现可追溯的数据治理。对于需要长期维护的抽取系统,还可按年份或月份批量重跑模型,比较不同版本抽取器的差异,形成稳定的回归测试集。此外,文本长度相对集中也有利于采用统一的分段策略与上下文窗口设置,从而减少超长样本导致的截断信息损失,让抽取结果更可控、更一致。

## 结尾

总体而言,该数据集以 2006-2024 的长时间跨度、按日归档的稳定结构以及可直接使用的 .txt 原始全文为核心特征,能够支持从语料清洗、全文检索到模型训练与信息抽取的多种任务形态。全量统计表明其覆盖稳定、命名一致、空文件为零且文本长度分布集中,便于在科研与产业场景中进行工程化落地与可重复实验。若你需要进一步将其导入数据库、构建检索服务或生成更细粒度的段落级样本,也可以在保持原始文件不变的前提下派生出标准化的结构化元数据表,从而在不同任务之间复用同一份高质量中文语料基础。

看了又看

暂无推荐

验证报告

以下为卖家选择提供的数据验证报告:

data icon
2006-2024新闻联播文本数据集:含 6389 条 TXT 原始全文,覆盖国家政策解读、社会舆情分析、时政热点研究,支持 NLP 模型训练、时间序列分析,适用于学术研究、大数据挖掘与 AI 算法开
60
已售 0
44.85MB
申请报告