# Divvy自行车共享数据集分析报告(2023年9月-2024年8月)
## 引言与背景
随着城市交通拥堵问题日益严重和环保意识的不断提升,公共自行车共享系统已成为现代城市交通体系的重要组成部分。Divvy作为芝加哥地区最大的自行车共享服务提供商,其运营数据对于理解城市居民出行模式、优化公共交通资源配置以及推动可持续交通发展具有重要价值。
本数据集包含了Divvy自行车共享系统在2023年9月至2024年8月期间的完整运营记录,总计12个CSV文件,涵盖569万余条骑行数据。数据内容丰富,包括骑行ID、车辆类型、骑行时间、站点信息、地理坐标以及用户类型等关键信息,为城市交通规划、骑行行为分析、可持续出行研究等提供了宝贵的原始数据支持。
该数据集对于科研机构研究城市交通模式、企业优化共享出行服务、政府部门制定交通政策以及算法开发者训练预测模型等都具有重要的应用价值,能够帮助各方更好地理解和利用共享自行车这一绿色交通方式。
## 数据基本信息
### 字段说明
|字段名称|字段类型|字段含义|数据示例|完整性|
|:-:|:-:|:-:|:-:|:-:|
|ride_id|object|骑行记录唯一标识符|011C1903BF4E2E28|100.00%|
|rideable_type|object|车辆类型|classic_bike|100.00%|
|started_at|object|骑行开始时间|2023-09-23 00:27:50|100.00%|
|ended_at|object|骑行结束时间|2023-09-23 00:33:27|100.00%|
|start_station_name|object|起始站点名称|Halsted St & Wrightwood Ave|83.00%|
|start_station_id|object|起始站点ID|TA1309000061|83.00%|
|end_station_name|object|结束站点名称|Sheffield Ave & Wellington Ave|82.35%|
|end_station_id|object|结束站点ID|TA1307000052|82.35%|
|start_lat|float64|起始位置纬度|41.929143|100.00%|
|start_lng|float64|起始位置经度|-87.649077|100.00%|
|end_lat|float64|结束位置纬度|41.9362534831413|99.87%|
|end_lng|float64|结束位置经度|-87.65266209840775|99.87%|
|member_casual|object|用户类型(会员/临时用户)|member|100.00%|
### 数据分布情况
#### 1. 月份分布
|月份|记录数|占比(%)|累计占比(%)|
|:-:|:-:|:-:|:-:|
|2023-09|666,371|11.69|11.69|
|2023-10|537,113|9.42|21.11|
|2023-11|362,518|6.36|27.47|
|2023-12|224,073|3.93|31.40|
|2024-01|144,873|2.54|33.94|
|2024-02|223,164|3.91|37.85|
|2024-03|301,687|5.30|43.15|
|2024-04|415,025|7.28|50.43|
|2024-05|609,493|10.70|61.13|
|2024-06|710,721|12.47|73.60|
|2024-07|748,962|13.14|86.74|
|2024-08|755,639|13.26|100.00|
#### 2. 车辆类型分布
|车辆类型|记录数|占比(%)|
|:-:|:-:|:-:|
|electric_bike|2,881,351|50.55|
|classic_bike|2,818,288|49.45|
#### 3. 用户类型分布
|用户类型|记录数|占比(%)|
|:-:|:-:|:-:|
|member|3,653,915|64.11|
|casual|2,045,724|35.89|
### 数据规模与格式
- 数据规模:12个CSV文件,总记录数5,699,639条
- 数据格式:逗号分隔值(CSV)格式
- 时间跨度:2023年9月至2024年8月(12个月)
- 数据大小:总大小约1.4GB
## 数据优势
|优势特征|具体表现|应用价值|
|:-:|:-:|:-:|
|数据量庞大|超过560万条骑行记录,涵盖12个月的完整数据|提供足够的样本量用于统计分析和模型训练|
|时间跨度完整|覆盖春夏秋冬四季,反映不同季节的骑行行为差异|有助于分析季节性因素对骑行需求的影响|
|数据维度丰富|包含车辆类型、时间、站点、地理坐标、用户类型等多维度信息|支持多维度交叉分析,深入理解骑行模式|
|地理信息精确|提供经纬度坐标,精确到小数点后6-8位|可用于空间分析、热点区域识别和路径规划研究|
|用户类型区分|明确区分会员和临时用户,便于分析不同用户群体的行为特征|支持用户细分研究,为运营策略制定提供依据|
|数据完整性高|核心字段(骑行ID、时间、经纬度等)完整率接近100%|确保分析结果的准确性和可靠性|
## 数据样例
以下是数据集的部分元数据样例(共20条):
1. 骑行ID: 011C1903BF4E2E28, 车辆类型: classic_bike, 开始时间: 2023-09-23 00:27:50, 结束时间: 2023-09-23 00:33:27, 起始站点: Halsted St & Wrightwood Ave, 结束站点: Sheffield Ave & Wellington Ave, 用户类型: member
2. 骑行ID: 87DB80E048A1BF9F, 车辆类型: classic_bike, 开始时间: 2023-09-02 09:26:43, 结束时间: 2023-09-02 09:38:19, 起始站点: Clark St & Drummond Pl, 结束站点: Racine Ave & Fullerton Ave, 用户类型: member
3. 骑行ID: 7C2EB7AF669066E3, 车辆类型: electric_bike, 开始时间: 2023-09-25 18:30:11, 结束时间: 2023-09-25 18:41:39, 起始站点: Financial Pl & Ida B Wells Dr, 结束站点: Racine Ave & 15th St, 用户类型: member
4. 骑行ID: 57D197B010269CE3, 车辆类型: classic_bike, 开始时间: 2023-09-13 15:30:49, 结束时间: 2023-09-13 15:39:18, 起始站点: Clark St & Drummond Pl, 结束站点: Racine Ave & Belmont Ave, 用户类型: member
5. 骑行ID: 8A2CEA7C8C8074D8, 车辆类型: classic_bike, 开始时间: 2023-09-18 15:58:58, 结束时间: 2023-09-18 16:05:04, 起始站点: Halsted St & Wrightwood Ave, 结束站点: Racine Ave & Fullerton Ave, 用户类型: member
6. 骑行ID: 03F7044D1304CD58, 车辆类型: electric_bike, 开始时间: 2023-09-15 20:19:25, 结束时间: 2023-09-15 20:30:27, 起始站点: Southport Ave & Wrightwood Ave, 结束站点: 缺失, 用户类型: member
7. 骑行ID: 672503E0FC0835EC, 车辆类型: electric_bike, 开始时间: 2023-09-27 16:52:18, 结束时间: 2023-09-27 17:03:22, 起始站点: Kedzie Ave & Milwaukee Ave, 结束站点: 缺失, 用户类型: member
8. 骑行ID: 1D806492F95973AC, 车辆类型: electric_bike, 开始时间: 2023-09-17 11:07:05, 结束时间: 2023-09-17 11:13:39, 起始站点: Jeffery Blvd & 71st St, 结束站点: 缺失, 用户类型: member
9. 骑行ID: 40D9EF382CC6C53D, 车辆类型: classic_bike, 开始时间: 2023-09-17 11:58:50, 结束时间: 2023-09-17 12:08:36, 起始站点: Kedzie Ave & Milwaukee Ave, 结束站点: California Ave & Milwaukee Ave, 用户类型: member
10. 骑行ID: C60CE661AF7ECC93, 车辆类型: electric_bike, 开始时间: 2023-09-07 20:52:43, 结束时间: 2023-09-07 21:06:51, 起始站点: Southport Ave & Wrightwood Ave, 结束站点: 缺失, 用户类型: member
11. 骑行ID: 3812B98E9406040E, 车辆类型: classic_bike, 开始时间: 2023-09-12 16:01:28, 结束时间: 2023-09-12 16:17:47, 起始站点: Financial Pl & Ida B Wells Dr, 结束站点: Adler Planetarium, 用户类型: member
12. 骑行ID: EBA56298CB3C803F, 车辆类型: classic_bike, 开始时间: 2023-09-24 13:17:23, 结束时间: 2023-09-24 13:50:43, 起始站点: Clark St & Schreiber Ave, 结束站点: Oakley Ave & Touhy Ave, 用户类型: member
13. 骑行ID: C6BD5AF648F11D11, 车辆类型: electric_bike, 开始时间: 2023-09-28 18:09:40, 结束时间: 2023-09-28 18:15:04, 起始站点: Halsted St & Wrightwood Ave, 结束站点: Halsted St & Roscoe St, 用户类型: member
14. 骑行ID: 585C82FA2E006DE9, 车辆类型: classic_bike, 开始时间: 2023-09-22 12:30:41, 结束时间: 2023-09-22 12:42:21, 起始站点: Halsted St & Wrightwood Ave, 结束站点: Halsted St & Roscoe St, 用户类型: member
15. 骑行ID: 95E72C49D692F822, 车辆类型: classic_bike, 开始时间: 2023-09-07 16:28:17, 结束时间: 2023-09-07 16:31:25, 起始站点: Clark St & Drummond Pl, 结束站点: Clark St & Wellington Ave, 用户类型: member
16. 骑行ID: 26094B920577B434, 车辆类型: classic_bike, 开始时间: 2023-09-04 16:53:28, 结束时间: 2023-09-04 16:56:33, 起始站点: Clark St & Drummond Pl, 结束站点: Clark St & Wellington Ave, 用户类型: member
17. 骑行ID: A13DECC07C318A6F, 车辆类型: classic_bike, 开始时间: 2023-09-14 10:37:54, 结束时间: 2023-09-14 10:40:16, 起始站点: Clark St & Drummond Pl, 结束站点: Clark St & Wellington Ave, 用户类型: member
18. 骑行ID: BE665598CC823457, 车辆类型: electric_bike, 开始时间: 2023-09-09 22:42:44, 结束时间: 2023-09-09 22:49:49, 起始站点: Halsted St & Wrightwood Ave, 结束站点: Lincoln Ave & Addison St, 用户类型: member
19. 骑行ID: 34AB2700E7062615, 车辆类型: classic_bike, 开始时间: 2023-09-30 14:04:04, 结束时间: 2023-09-30 14:04:33, 起始站点: Wabash Ave & Grand Ave, 结束站点: Wabash Ave & Grand Ave, 用户类型: member
20. 骑行ID: CAE833F56B978BB5, 车辆类型: classic_bike, 开始时间: 2023-09-30 14:08:57, 结束时间: 2023-09-30 14:09:00, 起始站点: Wabash Ave & Grand Ave, 结束站点: Wabash Ave & Grand Ave, 用户类型: member
## 应用场景
### 城市交通规划与优化
共享自行车系统作为城市公共交通的重要补充,其运营数据对于城市交通规划具有重要价值。通过分析骑行起点和终点的空间分布,可以识别出热门出行走廊和交通枢纽,为城市规划部门提供数据支持。例如,根据数据显示,夏季(6-8月)骑行量显著高于冬季,这表明在规划自行车道和停车设施时,需要考虑季节性需求变化。同时,通过分析高峰时段的骑行模式,可以优化公交、地铁等公共交通与自行车共享系统的衔接,提高整体交通效率。
### 共享出行服务运营优化
对于Divvy等共享自行车运营商来说,这些数据可以直接用于优化运营策略。首先,通过分析不同站点的使用频率和潮汐现象,可以合理安排车辆调度,确保高峰时段热门区域有足够的车辆供应。其次,根据车辆类型使用分布(电动自行车和传统自行车各占约50%),可以调整两种类型车辆的投放比例,满足不同用户群体的需求。此外,通过分析会员和临时用户的行为差异,可以制定更有针对性的营销策略,提高用户留存率和转化率。
### 可持续交通研究与政策制定
随着全球气候变化问题日益严重,推广绿色出行方式已成为各国政府的重要政策目标。Divvy数据集提供了大量关于自行车共享系统使用情况的第一手资料,为可持续交通研究提供了宝贵的数据支持。研究人员可以通过分析骑行数据,评估自行车共享系统对减少碳排放和改善空气质量的贡献。同时,政府部门可以基于这些数据制定更有效的自行车友好政策,如扩大自行车道网络、建设更多安全设施等,进一步鼓励居民选择绿色出行方式。
### 机器学习与智能交通应用开发
庞大的数据集为机器学习模型训练提供了理想的素材。开发者可以利用这些数据构建预测模型,如骑行需求预测模型、车辆调度优化模型等,提高共享自行车系统的智能化水平。例如,基于历史数据和天气、节假日等外部因素,可以预测未来某一时间段内特定区域的骑行需求,提前做好车辆调配准备。此外,通过分析骑行轨迹数据,可以开发智能导航系统,为用户推荐最优骑行路线,提高骑行体验。
## 结尾
Divvy自行车共享数据集是一份涵盖12个月完整运营记录的宝贵资源,包含超过560万条骑行数据,具有数据量庞大、时间跨度完整、维度丰富等显著优势。这些数据不仅为共享自行车运营商优化运营策略提供了直接支持,也为城市交通规划、可持续交通研究以及智能交通应用开发等领域提供了重要的数据基础。
通过深入分析这份数据集,我们可以更好地理解城市居民的骑行行为模式,识别出影响骑行需求的关键因素,为推动城市可持续交通发展提供科学依据。随着共享出行方式的不断普及,此类数据集的价值将进一步凸显,有望为构建更加高效、环保、便捷的城市交通系统做出更大贡献。
如果您对这份数据集感兴趣或需要获取更多信息,可以通过相关渠道获取完整数据文件。
看了又看
验证报告
以下为卖家选择提供的数据验证报告:






