数据描述
引言与背景
共享单车作为现代城市交通体系的重要组成部分,不仅能够有效缓解城市交通拥堵,还能减少环境污染,促进居民绿色出行。芝加哥Divvy共享单车系统作为北美最大的自行车共享系统之一,其运营数据对于理解城市出行模式、优化公共交通规划、推动可持续城市发展具有重要价值。本数据集包含了从2023年6月至2024年5月共计12个月的完整骑行记录,涵盖了超过430万条骑行数据,为研究城市居民出行行为、季节性骑行规律、站点使用模式以及用户类型差异提供了丰富的基础。
数据基本信息
数据字段说明
| 字段类型 | 字段含义 | 数据示例 | 完整性(缺失率) | |
|---|---|---|---|---|
| ride_id | object | 骑行唯一标识符 | 055E6783FCD761FD | 0.00% |
| rideable_type | object | 车辆类型 | electric_bike, classic_bike | 0.00% |
| started_at | object | 骑行开始时间 | 6/6/2023 20:58 | 0.00% |
| ended_at | object | 骑行结束时间 | 6/6/2023 21:04 | 0.00% |
| ride_length | object | 骑行时长 | 0:06:00 | 0.00% |
| day_of_week | int64 | 星期几(数字) | 3, 4 | 0.00% |
| start_station_name | object | 起始站点名称 | California Ave & Milwaukee Ave | 0.00% |
| start_station_id | object | 起始站点ID | 13084, TA1309000067 | 0.00% |
| end_station_name | object | 结束站点名称 | California Ave & Division St | 0.00% |
| end_station_id | object | 结束站点ID | 13256, TA1309000067 | 0.00% |
| start_lat | float64 | 起始位置纬度 | 41.92261767 | 0.00% |
| start_lng | float64 | 起始位置经度 | -87.69710636 | 0.00% |
| end_lat | float64 | 结束位置纬度 | 41.903029 | 0.00% |
| end_lng | float64 | 结束位置经度 | -87.697474 | 0.00% |
| member_casual | object | 用户类型(会员/非会员) | member, casual |
数据时间分布
| 记录数量 | 占比(%) | 累计占比(%) | |
|---|---|---|---|
| 2023-06 | 534,758 | 12.39 | 12.39 |
| 2023-07 | 573,958 | 13.30 | 25.70 |
| 2023-08 | 584,919 | 13.56 | 39.25 |
| 2023-09 | 506,635 | 11.74 | 50.99 |
| 2023-10 | 403,781 | 9.36 | 60.35 |
| 2023-11 | 274,798 | 6.37 | 66.72 |
| 2023-12 | 167,143 | 3.87 | 70.59 |
| 2024-01 | 113,808 | 2.64 | 73.23 |
| 2024-02 | 184,736 | 4.28 | 77.51 |
| 2024-03 | 230,278 | 5.34 | 82.85 |
| 2024-04 | 297,798 | 6.90 | 89.75 |
| 2024-05 | 442,168 | 10.25 |
骑行类型分布
| 数量 | 占比(%) | |
|---|---|---|
| classic_bike | 2,823,107 | 65.43 |
| electric_bike | 1,443,794 | 33.46 |
| docked_bike | 47,879 |
用户类型分布
| 数量 | 占比(%) | |
|---|---|---|
| member | 2,799,658 | 64.89 |
| casual | 1,515,122 |
星期分布
| 数量 | 占比(%) | |
|---|---|---|
| 周五 | 643,595 | 14.92 |
| 周六 | 629,484 | 14.59 |
| 周四 | 626,349 | 14.52 |
| 周三 | 607,265 | 14.07 |
| 周二 | 575,138 | 13.33 |
| 周一 | 556,494 |
热门起始站点Top 10
| 使用次数 | 占比(%) | |
|---|---|---|
| Streeter Dr & Grand Ave | 60,543 | 1.403 |
| DuSable Lake Shore Dr & Monroe St | 39,601 | 0.918 |
| Michigan Ave & Oak St | 34,920 | 0.809 |
| DuSable Lake Shore Dr & North Blvd | 33,838 | 0.784 |
| Clark St & Elm St | 32,779 | 0.760 |
| Kingsbury St & Kinzie St | 32,748 | 0.759 |
| Clinton St & Washington Blvd | 31,277 | 0.725 |
| Wells St & Concord Ln | 29,004 | 0.672 |
| Millennium Park | 28,072 | 0.651 |
| Theater on the Lake | 27,932 |
数据规模与特征
本数据集涵盖了2023年6月至2024年5月期间芝加哥Divvy共享单车系统的完整运营数据,总记录数超过430万条。数据格式为标准CSV文件,每个文件对应一个月的数据。数据集覆盖了1602个唯一起始站点和1624个唯一结束站点,地理范围覆盖整个芝加哥市区。骑行时长统计显示,平均骑行时长约为16.3分钟,中位数为10分钟,最长骑行时长达到24小时以上。
数据优势
| 具体表现 | 应用价值 | |
|---|---|---|
| 数据完整性极高 | 所有15个字段均无缺失值,缺失率为0% | 确保分析结果准确可靠,避免数据清洗带来的误差 |
| 时间跨度长且连续 | 涵盖12个月完整数据,包含四季变化 | 可进行季节性模式分析,识别长期趋势和周期性变化 |
| 数据规模庞大 | 超过430万条骑行记录,样本量充足 | 统计分析结果更具代表性,可支持复杂的机器学习模型训练 |
| 空间覆盖广泛 | 1600+站点,覆盖芝加哥市区主要区域 | 可进行精细的空间分析,识别热点区域和交通流模式 |
| 信息维度丰富 | 包含骑行、车辆、用户、时空等多维度信息 | 支持多视角分析,可深入挖掘用户行为和系统运行特征 |
| 实时性强 | 数据更新至2024年5月,时效性高 | 能够反映最新的骑行趋势和用户行为变化 |
| 格式规范统一 | 标准化CSV格式,字段定义清晰一致 |
数据样例
以下是从数据集中提取的多样化样例,涵盖了不同时期、不同骑行类型和用户类型的骑行记录:
1. 工作日会员经典自行车骑行
-
骑行ID: C61FEA58CF6A5F71
-
车辆类型: classic_bike
-
起止时间: 2023年8月29日 14:19 - 14:37
-
骑行时长: 18分钟
-
星期: 周三
-
起始站点: Green St & Madison St
-
结束站点: Blue Island Ave & 18th St
-
用户类型: member
2. 周末休闲用户经典自行车骑行
-
骑行ID: 6DC78687E72FBFED
-
车辆类型: classic_bike
-
起止时间: 2024年4月4日 02:37 - 02:53
-
骑行时长: 16分钟
-
星期: 周五
-
起始站点: Southport Ave & Wellington Ave
-
结束站点: Southport Ave & Irving Park Rd
-
用户类型: casual
3. 短途会员电动自行车骑行
-
骑行ID: 90D9820E82B48C80
-
车辆类型: electric_bike
-
起止时间: 2023年11月22日 22:17 - 22:35
-
骑行时长: 18分钟
-
星期: 周四
-
起始站点: Sacramento Blvd & Addison St
-
结束站点: Clark St & Bryn Mawr Ave
-
用户类型: casual
4. 极短时间同站点骑行
-
骑行ID: 22D8A323B50F1706
-
车辆类型: classic_bike
-
起止时间: 2024年5月8日 15:08 - 15:09
-
骑行时长: 1分钟
-
星期: 周四
-
起始站点: May St & Taylor St
-
结束站点: May St & Taylor St (同站点)
-
用户类型: member
应用场景
城市交通规划与优化
基于本数据集的时空分布特征,可以为城市交通规划提供重要参考。通过分析不同时段、不同区域的骑行热点,可以识别出自行车出行需求较高的区域,进而优化自行车道网络布局、增设或调整自行车停放点。例如,数据显示Streeter Dr & Grand Ave站点使用频率最高,说明该区域自行车需求旺盛,可能需要增加站点容量或优化周边交通连接。此外,通过分析季节性变化模式(夏季骑行量大,冬季骑行量小),可以为季节性交通资源配置提供依据,在高峰期增加运力,在低谷期调整服务策略。
共享单车运营管理
运营商可以利用本数据集优化车辆调度和维护策略。通过分析热门起始站点和结束站点分布,可以识别出车辆供需不平衡的区域,制定更精准的调度方案,减少无车可用或车辆堆积的情况。同时,骑行时长统计显示平均骑行时间为16.3分钟,这可以帮助运营商预估车辆周转率,优化车队规模。用户类型分析(会员占比64.89%)表明会员是主要用户群体,可以针对会员制定更有吸引力的长期订阅计划,提高用户忠诚度。此外,通过分析不同类型车辆的使用比例(经典自行车65.43%,电动自行车33.46%),可以优化车辆类型配置,满足不同用户的出行需求。
用户行为分析与个性化服务
利用本数据集可以深入分析用户骑行行为模式,为提供个性化服务奠定基础。通过分析不同用户类型(会员/非会员)的骑行时间、地点、时长等特征,可以识别出不同用户群体的出行偏好。例如,会员用户可能更倾向于工作日通勤,而非会员用户可能更多用于周末休闲出行。基于这些洞察,运营商可以开发个性化的推荐系统,如为会员推荐最优通勤路线,为休闲用户推荐风景优美的骑行路径。此外,结合地理坐标数据,可以分析用户骑行轨迹,识别热门骑行路线,为用户提供更精准的导航和路线规划服务。
城市可持续发展研究
本数据集对于研究城市可持续发展具有重要价值。通过分析共享单车的使用情况,可以评估绿色出行方式在城市交通中的渗透率和影响力。骑行量的季节性变化反映了气候因素对绿色出行的影响,可以为应对气候变化的城市规划提供参考。此外,结合其他数据源(如公共交通使用数据、私家车流量数据),可以分析共享单车与其他交通方式的互补关系,研究如何构建更高效、更可持续的综合交通体系。这些研究对于减少城市碳排放、改善空气质量、提升城市宜居性具有重要意义。
机器学习模型训练与预测分析
大数据集为机器学习模型的训练提供了丰富的样本。可以基于历史数据构建预测模型,预测不同时段、不同区域的自行车需求,帮助运营商提前做好资源配置。例如,结合天气数据、节假日信息等外部因素,可以预测未来一周的骑行量变化趋势。此外,可以利用聚类算法识别不同的骑行模式,为精细化管理提供支持。异常检测算法可以帮助识别异常骑行行为(如长时间占用车辆、可疑的车辆移动),提高系统安全性。路径规划算法可以基于历史骑行轨迹数据,为用户推荐最优骑行路线,提升用户体验。
结尾
芝加哥Divvy共享单车数据集是一个规模庞大、信息丰富、质量优良的城市出行数据集,为研究城市交通、用户行为、可持续发展等领域提供了宝贵的资源。数据集的完整性、连续性和多维度特性使其具有广泛的应用价值,可以支持从学术研究到商业应用的多种场景。
通过对超过430万条骑行记录的分析,我们可以深入了解城市居民的出行模式、季节性变化规律、站点使用特征以及用户类型差异。这些洞察不仅可以帮助共享单车运营商优化服务,也可以为城市规划者提供决策支持,促进更可持续的城市发展。
看了又看
验证报告
以下为卖家选择提供的数据验证报告:






