wnx

verify-tagIDX Partners信用风险预测数据集-2007至2014年贷款数据含借款人信息与还款状态支持风控模型开发

信用风险预测贷款数据借款人信息还款状态风控模型

9.9

235.95MB

数据标识:D17809915659534868

发布时间:2026/06/09

# IDX Partners信用风险预测数据集-2007至2014年贷款数据含借款人信息与还款状态支持风控模型开发

## 引言与背景

信用风险评估是金融机构风险管理的核心环节,准确预测贷款违约风险对于保障金融稳定和盈利能力具有重要意义。本数据集包含2007年至2014年间的贷款数据,涵盖借款人基本信息、贷款特征、信用历史和还款状态等丰富维度,是训练和验证信用风险预测模型的宝贵资源。

数据集包含贷款申请、发放和还款的完整生命周期数据,为深入分析借款人信用行为、识别违约风险因素提供了坚实的数据基础。

## 数据基本信息

### 数据集概览

| 项目 | 描述 |
|------|------|
| 时间跨度 | 2007年至2014年(8年) |
| 记录数量 | 多条贷款记录 |
| 数据格式 | CSV |
| 文件数量 | 1个主文件 + 1个数据字典 |

### 文件结构

| 文件名 | 内容描述 |
|--------|----------|
| loan_data_2007_2014.csv | 贷款数据主文件 |
| LCDataDictionary.xlsx | 数据字段说明文档 |

### 核心字段说明

| 字段名称 | 字段类型 | 字段含义 | 数据示例 | 完整性 |
|----------|----------|----------|----------|----------|
| id | int | 贷款唯一标识 | 1077501 | 100% |
| loan_amnt | int | 贷款金额 | 5000 | 100% |
| funded_amnt | int | 已发放金额 | 5000 | 100% |
| term | string | 贷款期限 | 36 months | 100% |
| int_rate | float | 利率 | 10.65 | 100% |
| installment | float | 月还款额 | 162.87 | 100% |
| grade | string | 贷款等级 | B | 100% |
| sub_grade | string | 贷款子等级 | B2 | 100% |
| emp_length | string | 工作年限 | 10+ years | 部分缺失 |
| home_ownership | string | 住房状态 | RENT | 100% |
| annual_inc | float | 年收入 | 24000.0 | 100% |
| verification_status | string | 收入验证状态 | Verified | 100% |
| issue_d | string | 发放日期 | Dec-11 | 100% |
| loan_status | string | 贷款状态 | Fully Paid | 100% |
| purpose | string | 贷款用途 | credit_card | 100% |
| dti | float | 债务收入比 | 27.65 | 100% |
| delinq_2yrs | float | 过去2年逾期次数 | 0.0 | 100% |
| open_acc | float | 开放账户数 | 3.0 | 100% |
| revol_bal | int | 循环信用余额 | 13648 | 100% |
| revol_util | float | 循环信用使用率 | 83.7 | 100% |
| total_acc | float | 总账户数 | 9.0 | 100% |

### 数据分布情况

#### 贷款状态分布

| 贷款状态 | 描述 |
|----------|------|
| Fully Paid | 已全额还清 |
| Charged Off | 冲销 |
| Current | 正常还款中 |
| Default | 违约 |

#### 贷款等级分布

| 等级 | 描述 |
|------|------|
| A | 最高信用等级 |
| B | 较高信用等级 |
| C | 中等信用等级 |
| D | 较低信用等级 |
| E | 低信用等级 |
| F | 极低信用等级 |

#### 贷款用途分布(部分)

| 用途 | 描述 |
|------|------|
| credit_card | 信用卡还款 |
| debt_consolidation | 债务合并 |
| car | 购车 |
| small_business | 小型企业 |
| home_improvement | 家居改善 |
| wedding | 婚礼 |

## 数据优势

| 优势特征 | 具体表现 | 应用价值 |
|----------|----------|----------|
| 时间跨度长 | 8年连续数据 | 支持趋势分析和时间序列建模 |
| 信息完整 | 包含借款人、贷款、信用多维度数据 | 支持全面信用评估 |
| 标签明确 | 包含贷款状态(违约/正常) | 支持监督学习模型训练 |
| 数据量大 | 多条贷款记录 | 支持大规模模型训练 |
| 来源权威 | 真实贷款业务数据 | 数据质量有保障 |

## 数据样例

### 贷款记录样例

| id | loan_amnt | term | int_rate | grade | home_ownership | annual_inc | loan_status | purpose | dti |
|----|-----------|------|----------|-------|----------------|------------|-------------|---------|-----|
| 1077501 | 5000 | 36 months | 10.65 | B | RENT | 24000 | Fully Paid | credit_card | 27.65 |
| 1077430 | 2500 | 60 months | 15.27 | C | RENT | 30000 | Charged Off | car | 1.0 |
| 1077175 | 2400 | 36 months | 15.96 | C | RENT | 12252 | Fully Paid | small_business | 8.72 |
| 1076863 | 10000 | 36 months | 13.49 | C | RENT | 49200 | Fully Paid | other | 20.0 |
| 1075358 | 3000 | 60 months | 12.69 | B | RENT | 80000 | Current | other | 17.94 |
| 1075269 | 5000 | 36 months | 7.9 | A | RENT | 36000 | Fully Paid | wedding | 11.2 |
| 1069639 | 7000 | 60 months | 15.96 | C | RENT | 47004 | Current | debt_consolidation | 23.51 |
| 1072053 | 3000 | 36 months | 18.64 | E | RENT | 48000 | Fully Paid | car | 5.35 |
| 1071795 | 5600 | 60 months | 21.28 | F | OWN | 40000 | Charged Off | small_business | 5.55 |
| 1071570 | 5375 | 60 months | 12.69 | B | RENT | 15000 | Charged Off | other | 18.08 |

## 应用场景

### 信用风险预测模型训练

数据集包含完整的贷款特征和还款状态标签,是训练信用风险预测模型的理想资源。研究人员可以利用这些数据训练逻辑回归、随机森林、梯度提升树等机器学习模型,实现贷款违约风险的精准预测。这对于金融机构的信贷决策具有重要意义,可以帮助优化贷款审批流程、降低不良贷款率。

### 信用评分体系优化

通过分析贷款等级、利率和违约率之间的关系,可以优化信用评分体系。例如,分析不同等级贷款的实际违约率,评估现有评分模型的准确性,识别评分偏差和改进空间。这对于提高信用评估的准确性和公平性具有重要价值。

### 贷款定价策略研究

数据集包含利率、贷款期限和风险等级等信息,可以用于研究贷款定价策略。通过分析不同风险等级贷款的利率水平和收益情况,可以制定更合理的贷款利率策略,平衡风险和收益。这对于金融机构的盈利能力提升具有重要意义。

### 反欺诈分析

通过分析借款人的申请信息、信用历史和行为特征,可以识别潜在的欺诈行为。例如,分析异常的收入申报、频繁的信用查询、异常的贷款用途等。这对于防范信贷欺诈、保护金融机构资产安全具有重要价值。

## 结尾

本数据集是一个高质量的信用风险预测数据集,包含2007年至2014年共8年的贷款数据,涵盖借款人基本信息、贷款特征、信用历史和还款状态等多维度信息。数据集具有时间跨度长、信息完整、标签明确等优点,为信用风险模型训练、信用评分体系优化和贷款定价策略研究提供了丰富的数据资源。

数据集以CSV格式存储,便于高效读写和处理。用户可以根据实际需求选择合适的数据子集进行分析,也可以结合业务知识对数据进行进一步的工程处理。

如有需要,可获取更多数据集相关信息。

看了又看

验证报告

以下为卖家选择提供的数据验证报告:

data icon
IDX Partners信用风险预测数据集-2007至2014年贷款数据含借款人信息与还款状态支持风控模型开发
9.9
235.95MB
申请报告