wnx

verify-tag上下文广告点击预测数据集深度分析报告-包含23万+广告曝光记录及用户浏览日志的点击率预测数据

上下文广告点击广告曝光记录用户浏览日志点击率预测

9.9

169.15MB

数据标识:D17829842072741585

发布时间:2026/07/02

# 上下文广告点击预测数据集深度分析报告

## 引言与背景

广告点击率预测是互联网广告领域的核心问题,精准的点击率预测能够显著提升广告投放效率和收益。随着移动互联网的快速发展,移动端广告成为重要的营销渠道,了解用户在移动应用中的广告点击行为对于优化广告投放策略具有重要意义。本数据集为广告点击率预测研究提供了丰富的多维度数据资源,涵盖了广告曝光记录、用户浏览行为和广告商品信息,是进行点击率预测模型训练、用户行为分析和广告投放优化的理想基础。

本数据集由六个核心文件组成,包括训练数据文件、测试数据文件、商品数据文件、浏览日志文件以及提交样本文件。训练数据记录了广告曝光的详细信息和用户点击行为,测试数据用于模型验证,商品数据描述了广告商品的属性信息,浏览日志记录了用户在应用中的浏览行为,提交样本文件定义了预测结果的格式。

## 数据基本信息

### 数据字段说明

#### 训练数据字段(train.csv)

| 字段名称 | 字段类型 | 字段含义 | 数据示例 | 完整性 |
|---------|---------|---------|---------|--------|
| impression_id | 字符串 | 曝光记录唯一标识 | c4ca4238a0b923820dcc509a6f75849b | 100% |
| impression_time | 字符串 | 曝光时间 | 2018-11-15 00:00:00 | 100% |
| user_id | 整数 | 用户唯一标识 | 87862 | 100% |
| app_code | 整数 | 应用代码 | 422 | 100% |
| os_version | 字符串 | 操作系统版本 | old | 100% |
| is_4G | 整数 | 是否4G网络 | 0 | 100% |
| is_click | 整数 | 是否点击 | 0 | 100% |

#### 商品数据字段(item_data.csv)

| 字段名称 | 字段类型 | 字段含义 | 数据示例 | 完整性 |
|---------|---------|---------|---------|--------|
| item_id | 整数 | 商品唯一标识 | 26880 | 100% |
| item_price | 整数 | 商品价格 | 4602 | 100% |
| category_1 | 整数 | 一级分类 | 11 | 100% |
| category_2 | 整数 | 二级分类 | 35 | 100% |
| category_3 | 整数 | 三级分类 | 20 | 100% |
| product_type | 整数 | 产品类型 | 3040 | 100% |

#### 浏览日志字段(view_log.csv)

| 字段名称 | 字段类型 | 字段含义 | 数据示例 | 完整性 |
|---------|---------|---------|---------|--------|
| server_time | 字符串 | 服务器时间 | 2018-10-15 08:58:00 | 100% |
| device_type | 字符串 | 设备类型 | android | 100% |
| session_id | 整数 | 会话标识 | 112333 | 100% |
| user_id | 整数 | 用户唯一标识 | 4557 | 100% |
| item_id | 整数 | 商品唯一标识 | 32970 | 100% |

#### 测试数据字段(test.csv)

| 字段名称 | 字段类型 | 字段含义 | 数据示例 | 完整性 |
|---------|---------|---------|---------|--------|
| impression_id | 字符串 | 曝光记录唯一标识 | a9e7126a585a69a32bc7414e9d0c0ada | 100% |
| impression_time | 字符串 | 曝光时间 | 2018-12-13 07:44:00 | 100% |
| user_id | 整数 | 用户唯一标识 | 44754 | 100% |
| app_code | 整数 | 应用代码 | 127 | 100% |
| os_version | 字符串 | 操作系统版本 | latest | 100% |
| is_4G | 整数 | 是否4G网络 | 1 | 100% |

### 数据分布情况

#### 操作系统版本分布

| 操作系统版本 | 记录数 | 占比 |
|------------|-------|------|
| latest | 125,623 | 52.8% |
| intermediate | 68,245 | 28.7% |
| old | 43,742 | 18.5% |
| 合计 | 237,610 | 100% |

#### 网络类型分布

| 网络类型 | 记录数 | 占比 |
|---------|-------|------|
| 4G | 145,234 | 61.1% |
| 非4G | 92,376 | 38.9% |
| 合计 | 237,610 | 100% |

#### 点击行为分布

| 是否点击 | 记录数 | 占比 |
|---------|-------|------|
| 未点击 | 218,435 | 91.9% |
| 点击 | 19,175 | 8.1% |
| 合计 | 237,610 | 100% |

#### 设备类型分布

| 设备类型 | 记录数 | 占比 |
|---------|-------|------|
| android | 大量 | 100% |
| 合计 | 大量 | 100% |

## 数据优势

| 优势特征 | 具体表现 | 应用价值 |
|---------|---------|---------|
| 大规模数据 | 训练数据约23.8万条,商品数据约13.3万条 | 支持大规模机器学习模型训练 |
| 多维度特征 | 包含用户、设备、网络、时间等多种特征 | 支持综合因素影响分析 |
| 真实业务场景 | 来自真实移动端广告投放场景 | 支持实际业务模型验证 |
| 完整浏览日志 | 包含用户浏览行为记录 | 支持用户兴趣建模 |
| 商品分类体系 | 三级分类结构,详细商品属性 | 支持商品推荐和广告匹配 |
| 时间跨度完整 | 数据覆盖多个月份 | 支持时间序列分析和季节性模式识别 |

## 数据样例

### 训练数据样例

impression_id,impression_time,user_id,app_code,os_version,is_4G,is_click
c4ca4238a0b923820dcc509a6f75849b,2018-11-15 00:00:00,87862,422,old,0,0
45c48cce2e2d7fbdea1afc51c7c6ad26,2018-11-15 00:01:00,63410,467,latest,1,1
70efdf2ec9b086079795c442636b55fb,2018-11-15 00:02:00,71748,259,intermediate,1,0
8e296a067a37563370ded05f5a3bf3ec,2018-11-15 00:02:00,69209,244,latest,1,0
182be0c5cdcd5072bb1864cdee4d3d6e,2018-11-15 00:02:00,62873,473,latest,0,0

### 商品数据样例

item_id,item_price,category_1,category_2,category_3,product_type
26880,4602,11,35,20,3040
54939,3513,12,57,85,6822
40383,825,17,8,279,1619
8777,2355,13,58,189,5264
113705,1267,17,39,151,10239

### 浏览日志样例

server_time,device_type,session_id,user_id,item_id
2018-10-15 08:58:00,android,112333,4557,32970
2018-10-15 08:58:00,android,503590,74788,7640
2018-10-15 08:58:00,android,573960,23628,128855
2018-10-15 08:58:00,android,121691,2430,12774
2018-10-15 08:58:00,android,218564,19227,28296

## 应用场景

### 广告点击率预测模型训练

本数据集可用于训练和验证广告点击率预测模型。通过分析广告曝光记录和用户点击行为,可以构建基于机器学习的点击率预测模型,实现对广告点击概率的精确预测。这种预测能力对于广告投放优化至关重要,能够帮助广告平台实现精准投放,提高广告转化率和收益。例如,通过预测用户点击概率,可以优化广告排序策略,将高潜力广告优先展示给目标用户。

### 用户行为分析与兴趣建模

基于本数据集的分析,可以深入了解用户的移动应用使用行为和购物兴趣。通过分析浏览日志和点击记录,可以构建用户兴趣模型,识别用户偏好的商品类别和价格区间。同时,结合用户的设备信息和网络类型,可以研究不同用户群体的行为差异,为个性化推荐提供依据。例如,通过分析不同操作系统版本用户的点击行为差异,可以优化广告内容和展示方式,提高广告效果。

### 广告投放策略优化

本数据集为广告投放策略优化提供了丰富的数据基础。通过分析广告曝光数据和点击记录,可以评估不同广告投放策略的效果,发现优化空间。同时,结合商品分类信息,可以研究不同类别商品的广告效果,优化广告投放组合。例如,通过分析不同价格区间商品的点击率差异,可以制定差异化的广告定价策略,提高广告收益。

### 移动应用广告平台开发

本数据集为移动应用广告平台的开发提供了坚实的数据支持。通过分析多维度数据,可以构建智能广告投放系统,实现广告与用户的精准匹配。同时,基于浏览日志数据,可以开发用户行为分析模块,为广告投放提供更精准的用户画像。例如,通过实时分析用户的浏览行为,可以在用户浏览过程中适时展示相关广告,提高广告的相关性和点击率。

## 结尾

本上下文广告点击预测数据集是一个综合性的多维度广告数据资源,具有广泛的研究和应用价值。它不仅为广告点击率预测模型的开发提供了丰富的训练数据,也为用户行为分析、广告投放策略优化和移动应用广告平台开发提供了有力支持。数据集的完整性和多样性使其成为广告领域研究人员和从业者的宝贵资源。

>获取数据请私信

看了又看

验证报告

以下为卖家选择提供的数据验证报告:

data icon
上下文广告点击预测数据集深度分析报告-包含23万+广告曝光记录及用户浏览日志的点击率预测数据
9.9
169.15MB
申请报告