亿条数据裤

verify-tag2208万条执行案件裁判文书全文与结构化元数据CSV数据集-含标题案号法院日期案由法律依据-支持全文检索执行流程分析NLP训练与智能风控

599

已售 0
43.75GB

数据标识:D17739773142130042

发布时间:2026/03/20

# 售后问题请联系450792304@qq.com,原始文件解压后大小为47GB左右,请提前预留好存储空间。

## 引言与背景
执行案件文书记录了生效法律文书进入执行程序后的关键过程与裁判要点,在资产处置、履约风险识别、司法文本检索与流程分析等工作中具有重要价值。相比仅有案件编号或结果标签的数据,执行文书往往包含执行请求、财产线索、执行措施、程序节点与裁判理由等信息,适合用于长文本理解与结构化抽取。本数据集以执行案件裁判文书为核心对象,提供可用于批处理统计的结构化元数据字段(标题、案号、法院、审理程序、日期、案由、法律依据、链接等),并保留 文书内容 正文全文与 当事人 字段,支持从元数据治理到全文检索与模型训练的完整数据链路。
## 数据基本信息
该 CSV 数据集文件为 执行案件.csv,包含 22,086,245 条记录与 14 个字段,适合使用分块读取进行全量分析与大规模索引构建。数据字段同时覆盖链接、案号、法院与程序信息,并包含可用于全文理解的长文本正文内容。
### 字段说明(含完整性统计)
| 字段名称 | 字段类型 | 字段含义 | 数据示例 | 完整性(完整率) |
| --- | --- | --- | --- | --- |
| 标题 | string | 文书或案件标题 | 叶南与徐奇忠民间借贷纠纷执行裁定书 | 100.0000% |
| 审理法院 | string | 承办法院名称 | 慈溪市人民法院 | 99.9801% |
| 案件类型 | string | 案件大类(本文件为执行案件) | 执行案件 | 100.0000% |
| 网页链接 | url | 对应页面链接 | https://wenshu.court.gov.cn/website/wenshu/181107ANFZ0BXSK4/index.html?docId=c05ea4f845114e5895acf7156cbaf664 | 99.9918% |
| 案号 | string | 案件案号/文书编号 | (2010)甬慈执民字第155号 | 99.9955% |
| 审理程序 | string | 执行相关程序/环节 | | 67.4020% |
| 裁判日期 | date_string | 裁判作出日期 | 2010-03-25 | 100.0000% |
| 发布日期 | date_string | 对外发布日期 | 2016-10-20 | 99.6750% |
| 文书内容 | text | 执行文书正文全文(长文本) | (全文文本,样例区提供完整展示) | 89.4130% |
| 当事人 | text | 当事人信息(文本/结构化描述) | (样例区提供完整展示) | 94.4287% |
| 案由 | string | 执行案件案由/关联纠纷事项 | | 65.7567% |
| 法律依据 | text | 引用条文依据 | (样例区提供完整展示) | 58.3515% |
| 裁判年份 | int_string | 裁判年份 | (字段存在,本文不做分布统计) | 100.0000% |
| 裁判月份 | int_string | 裁判月份 | (字段存在,本文不做分布统计) | 100.0000% |

### 数据分布情况
#### 审理程序分布(Top 20,按数量降序)
| 审理程序 | 记录数量 | 占比 |
| --- | --- | --- |
| 执行实施 | 14397250 | 65.1865% |
| 执行审查 | 464793 | 2.1044% |
| 其他执行 | 22828 | 0.1034% |
| 司法制裁审查 | 626 | 0.0028% |
| 非诉财产保全审查 | 600 | 0.0027% |
| 行政非诉审查 | 231 | 0.0010% |
| 司法制裁复议 | 102 | 0.0005% |
| 民事一审 | 87 | 0.0004% |
| 非诉行为保全审查 | 28 | 0.0001% |
| 其他 | 7 | 0.0000% |
| 司法救助 | 4 | 0.0000% |
| 非诉证据保全审查 | 3 | 0.0000% |
| 刑事一审 | 1 | 0.0000% |
| 承认与执行申请审查 | 1 | 0.0000% |

#### 审理法院 Top 20(按数量降序)
| 审理法院 | 记录数量 | 占比 |
| --- | --- | --- |
| 深圳市宝安区人民法院 | 82532 | 0.3737% |
| 东莞市第一人民法院 | 82223 | 0.3723% |
| 佛山市禅城区人民法院 | 63859 | 0.2891% |
| 上海市浦东新区人民法院 | 63291 | 0.2866% |
| 东莞市第二人民法院 | 55243 | 0.2501% |
| 佛山市顺德区人民法院 | 52701 | 0.2386% |
| 沈阳市和平区人民法院 | 52085 | 0.2358% |
| 河南省郑州高新技术产业开发区人民法院 | 51663 | 0.2339% |
| 佛山市南海区人民法院 | 50683 | 0.2295% |
| 沈阳市沈河区人民法院 | 50622 | 0.2292% |
| 深圳市罗湖区人民法院 | 49238 | 0.2229% |
| 广东省深圳市福田区人民法院 | 47196 | 0.2137% |
| 深圳市龙岗区人民法院 | 46872 | 0.2122% |
| 义乌市人民法院 | 45264 | 0.2049% |
| 天津市滨海新区人民法院 | 44435 | 0.2012% |
| 东莞市第三人民法院 | 44330 | 0.2007% |
| 西安市未央区人民法院 | 43584 | 0.1973% |
| 大连市甘井子区人民法院 | 43452 | 0.1967% |
| 深圳市福田区人民法院 | 43417 | 0.1966% |
| 北京市海淀区人民法院 | 43168 | 0.1955% |

#### 案由 Top 20(按数量降序)
| 案由 | 记录数量 | 占比 |
| --- | --- | --- |
| 借款合同纠纷 | 2419063 | 10.9528% |
| 其他案由 | 1601772 | 7.2524% |
| 民间借贷纠纷 | 1573683 | 7.1252% |
| 买卖合同纠纷 | 1200855 | 5.4371% |
| 金融借款合同纠纷 | 815432 | 3.6920% |
| 合同纠纷 | 503092 | 2.2779% |
| 劳动争议 | 428092 | 1.9383% |
| 罚金 | 397817 | 1.8012% |
| 合同、无因管理、不当得利纠纷 | 369599 | 1.6734% |
| 劳务合同纠纷 | 318111 | 1.4403% |
| 机动车交通事故责任纠纷 | 273535 | 1.2385% |
| 追偿权纠纷 | 273285 | 1.2374% |
| 财产保全 | 263260 | 1.1920% |
| 房屋买卖合同纠纷 | 237299 | 1.0744% |
| 信用卡纠纷 | 237163 | 1.0738% |
| 合同、无因管理、不当得利 | 235565 | 1.0666% |
| 租赁合同纠纷 | 222594 | 1.0078% |
| 银行卡纠纷 | 185354 | 0.8392% |
| 婚姻家庭纠纷 | 158182 | 0.7162% |
| 建设工程合同纠纷 | 148902 | 0.6742% |

## 数据优势
| 优势特征 | 具体表现 | 应用价值 |
| --- | --- | --- |
| 超大规模全量覆盖 | 全量 22,086,245 条执行案件记录,便于构建高覆盖索引库与训练语料库 | 适合全文检索、流程挖掘、统计分析与模型训练 |
| 原始长文本内容可用 | 文书内容 提供全文正文,结合 法律依据 等字段可对齐条文依据 | 支持RAG、信息抽取、文本分类、相似文书匹配等任务 |
| 元数据字段可用于治理 | 案号、法院、程序、链接等字段有助于去重核验与分层分析 | 支撑数据治理、质量控制与特征工程 |
|
## 数据样例(原始字段完整展示,5条)
以下展示 5 条记录的关键字段与长文本字段(当事人法律依据文书内容)的完整内容。考虑到隐私保护,示例对可能出现的手机号、证件号等长数字序列进行了必要打码,但字段结构与正文文本形态保持不变;实际数据集中对应字段为原始完整文本。

### 样例 1
标题: 叶南与徐奇忠民间借贷纠纷执行裁定书

审理法院: 慈溪市人民法院案件类型: 执行案件案号: (2010)甬慈执民字第155号审理程序:裁判日期: 2010-03-25发布日期: 2016-10-20案由:网页链接: https://wenshu.court.gov.cn/website/wenshu/181107ANFZ0BXSK4/index.html?docId=c05ea4f845114e5895acf7156cbaf664当事人(原始字段内容):
text
叶南,徐奇忠
法律依据(原始字段内容):
text
《中华人民共和国民事诉讼法(2007年)》:第二百三十三条
文书内容(原始字段内容):
text
浙江省慈溪市人民法院执 行 裁 定 书(2010)甬慈执民字第155号申请执行人叶南,男,1967年1月23日出生,汉族,农民,住慈溪市。被执行人徐奇忠,男,1963年1月15日出生,汉族,农民,住慈溪市。本院在执行(2009)甬慈商初字第1473号叶南诉徐奇忠民间借贷纠纷一案中,查明被执行人徐奇忠下落不明、又无可供执行的财产,申请执行人叶南自愿申请本案终结执行。故本案目前暂无继续执行的必要,应当终结执行。被执行人尚应支付申请执行人借款12500元及相应利息、赔偿公告损失费300元,尚需承担案件受理费110元、执行费88元。依照《中华人民共和国民事诉讼法》第二百三十三条第(六)项之规定,裁定如下:本院(2010)甬慈执民字第155号案的本次执行程序终结。申请执行人发现被执行人有可供执行财产的,可以依照《中华人民共和国民事诉讼法》第二百三十条的规定请求继续执行。本裁定送达后立即生效。审判长 胡   辉审判员 岑 建 标审判员 戎 安 达二〇一〇年三月二十五日书记员 杜震(代)

### 样例 2
标题: 申请执行人杨贵松等人与被执行人李建光欠款纠纷一案执行裁定书

审理法院: 招远市人民法院案件类型: 执行案件案号: (2001)招执字第698号审理程序:裁判日期: 2010-03-01发布日期: 2015-06-01案由:网页链接: https://wenshu.court.gov.cn/website/wenshu/181107ANFZ0BXSK4/index.html?docId=02da75daefb24a41a40cfbb1a088821e当事人(原始字段内容):
text
杨贵松,李玉方,杨贵良,李玉利,李建光
法律依据(原始字段内容):
text
《中华人民共和国民事诉讼法(2007年)》:第二百三十二条第一款;《最高人民法院关于人民法院执行工作若干问题的规定(试行)》:第一百零二条
文书内容(原始字段内容):
text
山东省招远市人民法院执 行 裁 定 书(2001)招执字第698号申请执行人杨贵松,男,1963年5月13日生,汉族,山东省招远市人,农民,住招远市夏甸镇东丁家村。申请执行人李玉方,男,1951年2月17日生,汉族,山东省招远市人,农民,住址同上。申请执行人杨贵良,男,1963年7月21日生,汉族,山东省招远市人,农民,住址同上。申请执行人李玉利,男,1970年1月1日生,汉族,山东省招远市人,农民,住址同上。被执行人李建光,男,1975年3月4日生,汉族,山东省招远市人,农民,住址同上.本院在执行杨贵松、李玉方、杨贵良、李玉利与李建光欠款纠纷一案中,被执行人李建光无财产可供执行且下落不明,申请执行人亦提供不出被执行人可供执行的财产状况或线索。依照《中华人民共和国民事诉讼法》第二百三十二条第一款第(五)项和《最高人民法院关于人民法院执行工作若干问题的规定(试行)》第102条第(2)项的规定,裁定如下:中止本院的(1999)招新民初字第196号民事调解书的执行。在中止执行的情形消失后,申请执行人可以向本院申请恢复执行。本裁定书送达后即发生法律效力。审判长  宋海燕审判员  林天奇审判员  王春明二〇一〇年三月一日书记员  臧玉才

### 样例 3
标题: 王某某与杨某某民间借贷纠纷执行裁定书

审理法院: 麟游县人民法院案件类型: 执行案件案号: (2010)麟执字第5号审理程序:裁判日期: 2010-03-31发布日期: 2017-08-09案由:网页链接: https://wenshu.court.gov.cn/website/wenshu/181107ANFZ0BXSK4/index.html?docId=699139b98cf74f78ba79a7ca00c0f20c当事人(原始字段内容):
text
王某某,杨某某
法律依据(原始字段内容):
text
《中华人民共和国民事诉讼法(2007年)》:第二百二十条第一款
文书内容(原始字段内容):
text
陕西省麟游县人民法院执 行 裁 定 书(2010)麟执字第5号申请执行人王某某,男,汉族,工人。被执行人杨某某,男,汉族,现下落不明。本案在执行王某某与杨某某民间借贷纠纷一案中,因被执行人未按已经发生法律效力的判决书履行给付义务。故依照《中华人民共和国民事诉讼法》第二百二十条之规定,裁定如下:对被执行人杨某某居住、使用的位于陕西金麒麟药业有限公司院内家属楼二单元四楼南户住房一套,予以查封。本裁定书送达后立即生效。执行员  田瑞春二〇一〇年三月三十一日书记员  闫纪明

### 样例 4
标题: 周学录与杨家财劳务合同纠纷执行裁定书

审理法院: 阿克塞哈萨克族自治县人民法院案件类型: 执行案件案号: (2010)阿民执字第03号审理程序:裁判日期: 2010-03-19发布日期: 2017-02-21案由:网页链接: https://wenshu.court.gov.cn/website/wenshu/181107ANFZ0BXSK4/index.html?docId=88cadd528958466faa41a71a0097907e当事人(原始字段内容):
text
周学录,杨家财
法律依据(原始字段内容):
text
《中华人民共和国民事诉讼法(2007年)》:第二百三十三条
文书内容(原始字段内容):
text
甘肃省阿克塞哈萨克族自治县人民法院执 行 裁 定 书(2010)阿民执字第03号申请执行人周学录,男,汉族。被执行人杨家财,男,汉族。本院在执行申请执行人周学录与被执行人杨家财劳务合同纠纷一案中,因申请执行人周学录于2010年3月19日以被执行人杨家财现下落不明,也无可供执行财产为由向本院提出撤回申请执行,不再要求法院继续执行的申请。依照《中华人民共和国民事诉讼法》第二百三十三条第(六)项的规定,裁定如下:终结本院(2009)阿民初字第71号民事调解书的执行。本裁定送达后立即生效。审判员 阿尔斯坦二〇一〇年三月十九日书记员 王  超

### 样例 5
标题: 罗亚囡与宁波镇骆建筑工程有限公司民间借贷纠纷执行裁定书

审理法院: 宁波市镇海区人民法院案件类型: 执行案件案号: (2010)甬镇执民字第58号审理程序:裁判日期: 2010-03-19发布日期: 2016-12-14案由:网页链接: https://wenshu.court.gov.cn/website/wenshu/181107ANFZ0BXSK4/index.html?docId=d5d9537c8b7a4edd8903ceb673e1cce7当事人(原始字段内容):
text
罗亚囡,宁波镇骆建筑工程有限公司
法律依据(原始字段内容):
text
《中华人民共和国民事诉讼法(2007年)》:第一百四十条第一款,第二百三十三条,第二百三十四条
文书内容(原始字段内容):
text
宁波市镇海区人民法院执 行 裁 定 书(2010)甬镇执民字第58号申请执行人罗亚囡,女,1961年2月5日出生,其他,住本区。被执行人宁波镇骆建筑工程有限公司,住所地镇海区骆驼工业区,组织机构代码:*。法定代表人童兴良。本院在执行申请执行人罗亚囡与被执行人宁波镇骆建筑工程有限公司民间借贷纠纷一案中,查明被执行人宁波镇骆建筑工程有限公司暂无其他财产可供执行,申请执行人罗亚囡亦未能举证证明被执行人的下落及有可供执行的财产。现申请人罗亚囡自愿申请终结执行。依照《中华人民共和国民事诉讼法》第一百四十条第一款第(八)项、第二百三十三条第(六)项、第二百三十四条的规定,裁定如下:终结本院(2010)甬镇执民字第58号案的执行。申请执行人发现被执行人有可供执行财产的,可以依照《中华人民共和国民事诉讼法》第二百三十条的规定请求继续执行。本裁定送达后即发生法律效力。审 判 长 钱 扬 胜审 判 员 王 成 国代理审判员 李   辉二〇一〇年三月十九日书 记 员 胡波(代)

## 应用场景
### 1)执行流程与司法执行文本挖掘(面向流程分析与智能辅助)
执行案件文书通常包含执行立案、财产调查、强制措施、异议审查与终结程序等信息,适合用于流程抽取与节点识别。你可以在 文书内容 中识别关键程序触发条件、执行措施类型、财产处置结果等要素,并与 审理程序 字段结合,构建可解释的执行流程画像。工程实践中可将全文切分为段落并建立索引,支持基于证据段落的检索与对照分析,为执行策略优化、案件分流与风险提示提供数据支撑。由于本数据集提供完整正文,能够开展段落级抽取、证据定位、以及基于检索增强的自动归纳等更贴近落地的应用。
### 2)全文检索与相似执行文书匹配(面向知识库与检索系统)
执行领域的检索需求往往依赖事实细节与措施描述,仅靠标题或案由难以覆盖复杂查询。本数据集保留 文书内容 全文,便于构建倒排索引与向量索引,实现关键词与语义检索融合。你可以用法院、程序、案由作为过滤条件,以正文段落做召回与重排,从而支持相似执行措施、相似异议理由或相似财产处置路径的检索。配合 法律依据 字段还能在结果页给出条文依据解释,提高可读性与可审计性,并用于检索结果的质量评估与一致性校验。
### 3)执行文本的NLP训练与信息抽取(面向分类、抽取与RAG)
该数据集兼具大规模全文与结构化字段,可用于构建多任务训练与评测数据。典型任务包括从正文中抽取执行措施、异议/复议要点、执行标的与处置方式等信息,并将抽取结果与案由或程序字段进行一致性校验。对于生成式应用,可通过检索增强(RAG)将相关执行文书段落作为证据输入模型,输出结构化摘要、关键要点或风险提示。由于样本量大,可根据字段完整性与文本长度进行质量筛选,形成不同难度的训练集与评测集,支撑模型迭代与上线监控。
### 4)行业风控与资产处置语义分析(面向风险识别与解释)
执行案件文本与资产处置、履约风险与纠纷解决密切相关,适合用于风控与资产管理相关的语义分析。你可以利用 文书内容 中关于履行情况、财产线索、执行措施与结果的描述,构建风险标签或事件序列特征,并将 法律依据 作为解释性证据。结合链接与案号可回溯来源,便于在合规或审计场景下进行抽样核验。需要强调的是,本文样例已对敏感数字做打码,但实际数据集中保留原始完整字段,便于在受控环境下开展更精细的实体识别与规则匹配。
## 结尾
总体而言,该执行案件裁判文书数据集以千万级规模提供结构化元数据与正文全文,可同时满足大规模检索库建设、执行流程分析与NLP训练需求。尤其是 文书内容 的完整保留,使其不仅适合做元数据统计,更能直接用于全文检索、信息抽取与检索增强生成等任务。如需进一步提升可用性,可在此基础上开展字段标准化、去重校验与标签体系构建,形成可持续维护的高质量文本数据资产。

看了又看

暂无推荐

验证报告

以下为卖家选择提供的数据验证报告:

data icon
2208万条执行案件裁判文书全文与结构化元数据CSV数据集-含标题案号法院日期案由法律依据-支持全文检索执行流程分析NLP训练与智能风控
599
已售 0
43.75GB
申请报告