引言与背景
数据基本信息
字段说明
| 字段名称 | 字段类型 | 字段含义 | 数据示例 | 完整性 |
|---|---|---|---|---|
| ride_id | object | 骑行记录唯一标识符 | DD06751C6019D865 | 100% |
| rideable_type | object | 自行车类型 | electric_bike | 100% |
| started_at | object | 骑行开始时间 | 2022-01-18T14:01:59Z | 100% |
| ended_at | object | 骑行结束时间 | 2022-01-18T15:42:42Z | 100% |
| start_station_name | object | 出发站点名称 | Aberdeen St & Randolph St | 100% |
| start_station_id | object | 出发站点ID | 18062 | 100% |
| end_station_name | object | 到达站点名称 | Dearborn St & Erie St | 100% |
| end_station_id | object | 到达站点ID | 13045 | 100% |
| start_lat | float64 | 出发站点纬度 | 41.8842 | 100% |
| start_lng | float64 | 出发站点经度 | -87.6543 | 100% |
| end_lat | float64 | 到达站点纬度 | 41.894 | 100% |
| end_lng | float64 | 到达站点经度 | -87.6293 | 100% |
| member_type | object | 会员类型 | casual | 100% |
| date | object | 骑行日期 | 2022-01-18 | 100% |
| month | object | 骑行月份 | January | 100% |
| day | int64 | 骑行日 | 18 | 100% |
| year | int64 | 骑年份 | 2022 | 100% |
| day_of_week | object | 星期几 | Tuesday | 100% |
| start_hour | int64 | 开始小时 | 14 | 100% |
| ridelength | int64 | 骑行时长(秒) | 101 | 100% |
| route | object | 骑行路线(出发-到达站点) | Aberdeen St & Randolph St -- Dearborn St & Erie St | 100% |
数据分布情况
1. 自行车类型分布
| 自行车类型 | 记录数量 | 占比 |
|---|---|---|
| classic_bike | 2549379 | 55.6 |
| electric_bike | 1868664 | 40.8 |
| docked_bike | 167644 | 3.66 |
2. 会员类型分布
| 会员类型 | 记录数量 | 占比 |
|---|---|---|
| member | 3085108 | 67.3 |
| casual | 1500579 | 32.7 |
3. 月份分布
| 月份 | 记录数量 | 占比 | 累计占比 |
|---|---|---|---|
| January | 75243 | 1.64 | 1.64 |
| February | 71352 | 1.56 | 3.20 |
| March | 179192 | 3.91 | 7.11 |
| April | 328173 | 7.16 | 14.27 |
| May | 496528 | 10.83 | 25.10 |
| June | 545269 | 11.89 | 36.99 |
| July | 593209 | 12.94 | 49.93 |
| August | 610911 | 13.32 | 63.25 |
| September | 526323 | 11.48 | 74.73 |
| October | 467214 | 10.19 | 84.92 |
| November | 317979 | 6.93 | 91.85 |
| December | 374294 | 8.16 | 100.01 |
4. 年份分布
| 年份 | 记录数量 | 占比 |
|---|---|---|
| 2021 | 2357595 | 51.4 |
| 2022 | 2228092 | 48.6 |
5. 星期分布
| 星期 | 记录数量 | 占比 |
|---|---|---|
| Monday | 597377 | 13.0 |
| Tuesday | 640471 | 14.0 |
| Wednesday | 656582 | 14.3 |
| Thursday | 665242 | 14.5 |
| Friday | 683002 | 14.9 |
| Saturday | 701783 | 15.3 |
| Sunday | 641230 | 14.0 |
6. 出发小时分布
| 出发小时 | 记录数量 | 占比 |
|---|---|---|
| 0 | 120224 | 2.62 |
| 1 | 78221 | 1.71 |
| 2 | 50499 | 1.10 |
| 3 | 31790 | 0.69 |
| 4 | 25475 | 0.56 |
| 5 | 61315 | 1.34 |
| 6 | 170860 | 3.73 |
| 7 | 298029 | 6.50 |
| 8 | 449787 | 9.81 |
| 9 | 349464 | 7.62 |
| 10 | 277780 | 6.06 |
| 11 | 275449 | 6.01 |
| 12 | 288145 | 6.28 |
| 13 | 283431 | 6.18 |
| 14 | 277455 | 6.05 |
| 15 | 285774 | 6.23 |
| 16 | 340608 | 7.43 |
| 17 | 409201 | 8.92 |
| 18 | 350749 | 7.65 |
| 19 | 258109 | 5.63 |
| 20 | 197481 | 4.31 |
| 21 | 159413 | 3.48 |
| 22 | 133213 | 2.90 |
| 23 | 98838 | 2.15 |
7. 骑行时长统计
| 统计指标 | 数值 |
|---|---|
| 最小值(秒) | 60 |
| 最大值(秒) | 86399 |
| 平均值(秒) | 985 |
| 中位数(秒) | 600 |
| 标准差(秒) | 2582 |
8. 热门出发站点TOP10
| 出发站点 | 记录数量 | 占比 |
|---|---|---|
| Streeter Dr & Grand Ave | 77687 | 1.69 |
| DuSable Lake Shore Dr & North Blvd | 47411 | 1.03 |
| Michigan Ave & Oak St | 41633 | 0.91 |
| DuSable Lake Shore Dr & Monroe St | 39894 | 0.87 |
| Wells St & Concord Ln | 39665 | 0.86 |
| Millennium Park | 37294 | 0.81 |
| Clark St & Elm St | 35541 | 0.78 |
| Theater on the Lake | 34897 | 0.76 |
| Wells St & Elm St | 33144 | 0.72 |
| Kingsbury St & Kinzie St | 32855 | 0.72 |
数据优势
| 优势特征 | 具体表现 | 应用价值 |
|---|---|---|
| 数据规模庞大 | 超过450万条骑行记录,涵盖2021-2022年完整数据 | 提供足够的样本量用于统计分析和模型训练,确保结果的可靠性和代表性 |
| 数据完整性高 | 所有21个字段均无缺失值,数据完整率100% | 无需数据清洗即可直接用于分析,节省预处理时间,提高研究效率 |
| 维度丰富全面 | 包含时间、地理、用户、自行车类型等多维度信息 | 支持从多个角度进行交叉分析,揭示复杂的用户行为模式和交通规律 |
| 空间信息精确 | 提供详细的经纬度坐标和站点名称 | 可用于空间分析、热点区域识别和地理可视化,支持城市规划决策 |
| 时间粒度精细 | 记录到秒级的骑行时长和精确的时间戳 | 可分析小时级、日级、周级和月级的出行模式变化,捕捉时间序列特征 |
| 包含完整骑行路线 | 直接提供出发-到达站点的完整路线信息 | 便于分析热门路线和网络连接模式,优化站点布局和车辆调度 |
数据样例
以下是15条随机选择的骑行记录样例,涵盖不同自行车类型、会员类型和时间段:
| ride_id | rideable_type | started_at | ended_at | start_station_name | start_station_id | end_station_name | end_station_id | start_lat | start_lng | end_lat | end_lng | member_type | date | month | day | year | day_of_week | start_hour | ridelength | route |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 7EBB64BD65C7BBCF | electric_bike | 2022-01-18T14:01:59Z | 2022-01-18T15:42:42Z | Aberdeen St & Randolph St | 18062 | Dearborn St & Erie St | 13045 | 41.8842 | -87.6543 | 41.894 | -87.6293 | casual | 2022-01-18 | January | 18 | 2022 | Tuesday | 14 | 101 | Aberdeen St & Randolph St -- Dearborn St & Erie St |
| 7F3A469E15D4B8EA | classic_bike | 2021-12-07T21:09:32Z | 2021-12-07T21:14:13Z | Wells St & Evergreen Ave | TA1308000049 | Dearborn Pkwy & Delaware Pl | TA1307000128 | 41.9067 | -87.6348 | 41.899 | -87.6299 | member | 2021-12-07 | December | 7 | 2021 | Tuesday | 21 | 5 | Wells St & Evergreen Ave -- Dearborn Pkwy & Delaware Pl |
| A7E926689C70D0CF | electric_bike | 2021-12-30T03:36:27Z | 2021-12-30T03:49:38Z | Emerald Ave & 31st St | TA1309000055 | Clinton St & Roosevelt Rd | WL-008 | 41.8382 | -87.6452 | 41.8671 | -87.6411 | member | 2021-12-30 | December | 30 | 2021 | Thursday | 3 | 13 | Emerald Ave & 31st St -- Clinton St & Roosevelt Rd |
| AC38C8EAD4B9B2C9 | classic_bike | 2022-04-23T20:16:33Z | 2022-04-23T20:29:00Z | Milwaukee Ave & Grand Ave | 13033 | Damen Ave & Division St | 13136 | 41.8916 | -87.6484 | 41.9033 | -87.6784 | casual | 2022-04-23 | April | 23 | 2022 | Saturday | 20 | 12 | Milwaukee Ave & Grand Ave -- Damen Ave & Division St |
| 8E97B29EF4CE64D4 | classic_bike | 2022-02-09T07:10:43Z | 2022-02-09T07:18:26Z | Carpenter St & Huron St | 13196 | Kingsbury St & Kinzie St | KA1503000043 | 41.8946 | -87.6534 | 41.8892 | -87.6385 | casual | 2022-02-09 | February | 9 | 2022 | Wednesday | 7 | 8 | Carpenter St & Huron St -- Kingsbury St & Kinzie St |
| CA64644A90EC8EDB | electric_bike | 2021-08-21T16:05:09Z | 2021-08-21T16:14:21Z | Humboldt Blvd & Armitage Ave | 15651 | Central Park Ave & Elbridge Ave | 15644 | 41.9175 | -87.7018 | 41.9353 | -87.7169 | member | 2021-08-21 | August | 21 | 2021 | Saturday | 16 | 9 | Humboldt Blvd & Armitage Ave -- Central Park Ave & Elbridge Ave |
| 1BE6AE02C8B02546 | electric_bike | 2022-06-16T16:23:14Z | 2022-06-16T16:30:14Z | MLK Jr Dr & 63rd St | KA1503000053 | Cottage Grove Ave & 63rd St | KA1503000054 | 41.7801 | -87.6159 | 41.7806 | -87.6058 | casual | 2022-06-16 | June | 16 | 2022 | Thursday | 16 | 7 | MLK Jr Dr & 63rd St -- Cottage Grove Ave & 63rd St |
| 3315AD8392CC37B3 | classic_bike | 2021-08-14T20:47:30Z | 2021-08-14T22:03:31Z | Clark St & Elm St | TA1307000039 | Michigan Ave & Oak St | 13042 | 41.903 | -87.6313 | 41.901 | -87.6238 | casual | 2021-08-14 | August | 14 | 2021 | Saturday | 20 | 76 | Clark St & Elm St -- Michigan Ave & Oak St |
| 823C9A53812F9281 | classic_bike | 2022-04-26T15:34:52Z | 2022-04-26T15:47:38Z | Sheffield Ave & Willow St | TA1306000032 | Clark St & Wellington Ave | TA1307000136 | 41.9137 | -87.6529 | 41.9365 | -87.6475 | member | 2022-04-26 | April | 26 | 2022 | Tuesday | 15 | 13 | Sheffield Ave & Willow St -- Clark St & Wellington Ave |
| D50B8EF6E457E570 | electric_bike | 2021-11-18T08:05:33Z | 2021-11-18T08:14:27Z | Southport Ave & Wellington Ave | TA1307000006 | Halsted St & Roscoe St | TA1309000025 | 41.9357 | -87.6636 | 41.9435 | -87.6491 | casual | 2021-11-18 | November | 18 | 2021 | Thursday | 8 | 9 | Southport Ave & Wellington Ave -- Halsted St & Roscoe St |
| 92DF1BB15B54FF52 | classic_bike | 2022-01-12T20:33:19Z | 2022-01-12T20:42:59Z | University Ave & 57th St | KA1503000071 | Shore Dr & 55th St | TA1308000009 | 41.7915 | -87.5999 | 41.7952 | -87.5807 | member | 2022-01-12 | January | 12 | 2022 | Wednesday | 20 | 10 | University Ave & 57th St -- Shore Dr & 55th St |
| 7E6A05763D013F93 | classic_bike | 2021-09-08T09:21:17Z | 2021-09-08T10:00:40Z | Wabash Ave & 16th St | SL-012 | Wabash Ave & 16th St | SL-012 | 41.8604 | -87.6258 | 41.8604 | -87.6258 | casual | 2021-09-08 | September | 8 | 2021 | Wednesday | 9 | 39 | Wabash Ave & 16th St -- Wabash Ave & 16th St |
| F10E0219ADC1B992 | classic_bike | 2022-03-15T21:22:03Z | 2022-03-15T21:27:36Z | Wilton Ave & Belmont Ave | TA1307000134 | Broadway & Barry Ave | 13137 | 41.9402 | -87.653 | 41.9376 | -87.6441 | member | 2022-03-15 | March | 15 | 2022 | Tuesday | 21 | 6 | Wilton Ave & Belmont Ave -- Broadway & Barry Ave |
| EBB2DEAD033F8AF8 | classic_bike | 2022-07-25T11:12:00Z | 2022-07-25T11:19:13Z | Southport Ave & Waveland Ave | 13235 | Wilton Ave & Belmont Ave | TA1307000134 | 41.9481 | -87.6639 | 41.9402 | -87.653 | member | 2022-07-25 | July | 25 | 2022 | Monday | 11 | 7 | Southport Ave & Waveland Ave -- Wilton Ave & Belmont Ave |
| D89C55B1064EEA6C | electric_bike | 2021-08-30T08:05:17Z | 2021-08-30T08:13:43Z | Canal St & Adams St | 13011 | Racine Ave & Washington Blvd | 654 | 41.8789 | -87.6398 | 41.8832 | -87.657 | member | 2021-08-30 | August | 30 | 2021 | Monday | 8 | 8 | Canal St & Adams St -- Racine Ave & Washington Blvd |
应用场景
1. 城市交通规划与优化
共享单车数据为城市交通规划提供了丰富的微观出行信息。通过分析骑行起点终点分布,可以识别出城市中的交通热点区域和出行需求集中点,帮助规划师优化公共交通线路和站点布局。例如,数据显示Streeter Dr & Grand Ave是最热门的出发站点,规划部门可以考虑在该区域增加公共交通接驳点或扩建自行车专用道。此外,通过分析不同时间段的骑行模式,可以识别出早晚高峰的交通流量变化,为信号灯配时优化和交通管制提供科学依据。骑行数据还可以用于评估现有交通基础设施的使用效率,识别出需要改进的瓶颈区域,从而提升城市整体交通系统的运行效率。
2. 共享单车系统运营优化
运营企业可以利用这些数据优化车辆调度和站点管理策略。通过分析热门路线和站点的使用模式,企业可以预测不同区域的车辆需求,提前进行车辆调配,减少用户找不到车或还不了车的情况。例如,数据显示周末和工作日的骑行模式存在明显差异,工作日早高峰(7-9点)和晚高峰(17-19点)需求集中,而周末则在白天(10-18点)需求较高。运营企业可以根据这些规律调整车辆投放策略。此外,通过分析不同类型自行车的使用情况(经典自行车占55.6%,电动自行车占40.8%),可以优化车辆采购和维护计划,确保高需求区域有足够的车辆供应。
3. 交通需求预测与模型训练
数据科学家可以利用这些数据训练交通需求预测模型,为智能交通系统提供支持。通过整合时间、天气、节假日等外部因素,可以建立高精度的骑行需求预测模型,帮助运营企业提前做好准备。此外,这些数据还可以用于训练路径规划算法,优化骑行路线推荐,提升用户体验。骑行数据中的空间和时间信息还可以与其他交通数据(如公交、地铁)整合,建立多模式交通需求模型,为居民提供更综合的出行建议。
4. 用户行为分析与个性化服务
通过分析会员和非会员用户的骑行行为差异,可以为不同用户群体提供个性化服务。数据显示会员用户(占67.3%)主要在工作日通勤时段使用,而非会员用户(占32.7%)更多在周末和休闲时段使用。基于这些差异,企业可以设计差异化的会员权益和促销活动,例如为会员用户提供通勤时段的优先使用权,为非会员用户提供周末优惠套餐。此外,通过分析用户的骑行时长和路线偏好,可以推荐个性化的骑行路线和健康建议,提升用户粘性和满意度。
5. 城市可持续发展研究
研究者可以利用这些数据评估共享单车对城市可持续发展的影响。通过分析骑行替代传统机动化出行的潜在效应,可以估算减少的碳排放和交通拥堵。例如,假设每骑行1公里可以替代1公里的汽车出行,基于平均骑行时长和速度,可以估算每年减少的汽车行驶里程和相应的环境效益。此外,通过分析骑行热点区域与城市功能区的关系,可以评估共享单车在促进职住平衡和减少长距离通勤方面的作用,为可持续城市发展策略提供数据支持。
结尾
本数据集作为芝加哥Cyclistic共享单车系统的完整记录,包含超过450万条骑行记录,提供了丰富的时间、地理、用户和自行车类型信息,具有极高的研究价值和应用潜力。数据的完整性、维度丰富性和空间时间精确性使其成为城市交通研究、共享单车运营优化、交通模型训练以及城市可持续发展分析的理想资源。
数据集的核心优势在于其大规模、多维度和高精度的特性,不仅包含完整的元数据,还提供了精确的地理坐标和骑行路线信息。这些数据可以帮助城市规划者优化交通基础设施,帮助运营企业提升服务效率,帮助研究者深入理解城市出行模式,最终促进城市交通系统的智能化和可持续发展。
本数据集可广泛应用于科研机构的学术研究、企业的商业决策以及政府部门的政策制定。通过充分挖掘这些数据的价值,可以为建设更智能、更绿色、更高效的城市交通系统提供有力支持。
看了又看
验证报告
以下为卖家选择提供的数据验证报告:






