# 芝加哥 Divvy 共享单车出行数据集全解析:519万条骑行记录、1800+站点、跨12个月的城市骑行时空数据洞察
城市共享出行是现代智慧城市与绿色交通体系的重要组成部分,而详实、高质量的骑行轨迹与订单数据则是开展出行行为研究、城市规划、运营优化与机器学习建模的核心基础。本数据集为美国芝加哥市 Divvy 共享单车系统 2025 年 5 月至 2026 年 4 月期间的全量骑行订单记录,共包含 5,194,999 条 有效骑行数据,覆盖经典自行车与电动自行车两种车型,涵盖芝加哥市 1800 余个租赁站点的动态时空分布。每一条记录均提供唯一订单 ID、车型、起止时间、起止站点名称与编号、起止经纬度坐标以及用户类型(会员/临时用户)等关键信息,为城市交通研究、出行需求预测、时空路径挖掘、智能调度算法、城市设施规划等方向提供了珍贵的全量实战素材。
本数据集以 CSV 格式逐月归档(共 12 个文件,单月数据量最高达 79 万条),字段定义规范、数据规模大、时间跨度完整,兼具学术研究价值与产业应用潜力。无论是构建共享单车需求预测模型、分析通勤与休闲骑行规律、研究城市道路与地铁接驳行为,还是开展时空聚类、异常出行检测、用户画像、定价与调度优化等任务,本数据集均能提供可靠的数据支撑。
## 一、数据基本信息
### 1.1 数据集概览
| 指标 | 数值 |
| --- | --- |
| 总记录数 | 5,194,999 条 |
| 时间跨度 | 2025-05 至 2026-04 |
| 数据文件数 | 12 个(按月组织) |
| 单文件最大记录数 | 790,317 条(2025 年 8 月) |
| 车型类别 | 2 种(electric_bike、classic_bike) |
| 起止站点数 | 1,851 个起始站点 / 1,871 个终止站点(名称);1,863 / 1,884 个(编号) |
| 地理范围 | 约 41.6°N ~ 42.2°N,87.4°W ~ 88.1°W(芝加哥都会区) |
| 用户类型 | 2 类(member 会员 / casual 临时用户) |
### 1.2 数据字段说明
| 字段名称 | 字段类型 | 字段含义 | 数据示例 | 完整率 |
| --- | --- | --- | --- | --- |
| ride_id | String | 订单唯一标识(哈希 ID) | FD0EB1D32AF0D47E | 100.00% |
| rideable_type | Categorical | 骑行车型(电动/经典) | electric_bike | 100.00% |
| started_at | DateTime | 骑行开始时间(精确至毫秒) | 2026-01-31 09:13:09.018 | 100.00% |
| ended_at | DateTime | 骑行结束时间(精确至毫秒) | 2026-01-31 09:28:10.302 | 100.00% |
| start_station_name | String | 起始站点名称 | Central St & Girard Ave | 78.59% |
| start_station_id | String | 起始站点编号 | CHI02042 | 78.59% |
| end_station_name | String | 终止站点名称 | Dodge Ave & Church St | 77.43% |
| end_station_id | String | 终止站点编号 | CHI00741 | 77.43% |
| start_lat | Float | 起始纬度 | 42.064313 | 100.00% |
| start_lng | Float | 起始经度 | -87.686152 | 100.00% |
| end_lat | Float | 终止纬度 | 42.048308 | 99.90% |
| end_lng | Float | 终止经度 | -87.698224 | 99.90% |
| member_casual | Categorical | 用户类型(会员/临时) | member | 100.00% |
说明:起止站点名称与编号字段存在约 21%–22% 的缺失,主要对应车辆未在固定站点借还的场景(例如街头还车或车辆被系统重新定位);但起止经纬度坐标完整率高达 99.9% 以上,可完全支撑基于地理坐标的路径分析与空间聚类研究。
### 1.3 数据分布情况
#### 1.3.1 月度时间分布
数据集时间跨度为 2025 年 5 月至 2026 年 4 月,共 12 个月,呈现明显的季节变化规律:
| 月份 | 记录数量 | 占比 | 累计占比 |
| --- | --- | --- | --- |
| 2025-05 | 205 | 0.00% | 0.00% |
| 2025-06 | 678,801 | 13.07% | 13.07% |
| 2025-07 | 763,458 | 14.70% | 27.77% |
| 2025-08 | 790,317 | 15.21% | 42.98% |
| 2025-09 | 714,562 | 13.75% | 56.73% |
| 2025-10 | 646,096 | 12.44% | 69.17% |
| 2025-11 | 356,512 | 6.86% | 76.03% |
| 2025-12 | 140,545 | 2.71% | 78.74% |
| 2026-01 | 137,782 | 2.65% | 81.39% |
| 2026-02 | 201,454 | 3.88% | 85.27% |
| 2026-03 | 317,015 | 6.10% | 91.37% |
| 2026-04 | 448,252 | 8.63% | 100.00% |
可见 7–9 月为骑行高峰(合计占比 43.66%),冬季(12 月至次年 2 月)骑行量显著回落,符合北方城市户外出行的季节规律。
#### 1.3.2 车型分布
| 车型 | 记录数量 | 占比 |
| --- | --- | --- |
| electric_bike(电动自行车) | 3,444,770 | 66.31% |
| classic_bike(经典自行车) | 1,750,229 | 33.69% |
电动自行车占比约 2/3,反映出共享出行领域电动化趋势明显。
#### 1.3.3 用户类型分布
| 用户类型 | 记录数量 | 占比 |
| --- | --- | --- |
| member(年卡/会员用户) | 3,339,839 | 64.30% |
| casual(临时/单次用户) | 1,855,160 | 35.70% |
会员用户占比更高,说明通勤与高频出行是共享单车系统的核心使用场景。
#### 1.3.4 小时分布(24 小时)
| 时段 | 记录数量 | 时段 | 记录数量 |
| --- | --- | --- | --- |
| 00:00 | 66,339 | 12:00 | 294,739 |
| 01:00 | 42,126 | 13:00 | 294,341 |
| 02:00 | 27,033 | 14:00 | 303,619 |
| 03:00 | 16,028 | 15:00 | 364,495 |
| 04:00 | 15,190 | 16:00 | 480,437 |
| 05:00 | 43,354 | 17:00 | 538,891 |
| 06:00 | 119,900 | 18:00 | 430,449 |
| 07:00 | 235,349 | 19:00 | 306,108 |
| 08:00 | 311,695 | 20:00 | 216,955 |
| 09:00 | 221,149 | 21:00 | 174,931 |
| 10:00 | 211,182 | 22:00 | 135,415 |
| 11:00 | 255,946 | 23:00 | 89,328 |
早高峰(07–09 点)与晚高峰(16–18 点)两个时段明显突出,17 点为全天最高峰(53.9 万次),典型通勤特征显著。
#### 1.3.5 星期分布
| 星期(0=周一,6=周日) | 记录数量 | 占比 |
| --- | --- | --- |
| 0(周一) | 688,115 | 13.24% |
| 1(周二) | 746,413 | 14.37% |
| 2(周三) | 745,719 | 14.35% |
| 3(周四) | 786,197 | 15.13% |
| 4(周五) | 769,353 | 14.81% |
| 5(周六) | 782,075 | 15.05% |
| 6(周日) | 677,127 | 13.03% |
周内工作日骑行量整体略高于周末,但周末(尤其是周六)骑行量也保持高位,说明休闲出行需求同样旺盛。
#### 1.3.6 主要起始站点 Top 15
| 排名 | 起始站点 | 记录数量 | 占比 |
| --- | --- | --- | --- |
| 1 | Navy Pier | 42,855 | 0.83% |
| 2 | DuSable Lake Shore Dr & Monroe St | 36,258 | 0.70% |
| 3 | Michigan Ave & Oak St | 32,805 | 0.63% |
| 4 | DuSable Lake Shore Dr & North Blvd | 31,461 | 0.61% |
| 5 | Kingsbury St & Kinzie St | 27,190 | 0.52% |
| 6 | Canal St & Madison St | 26,849 | 0.52% |
| 7 | Wells St & Concord Ln | 25,512 | 0.49% |
| 8 | Clark St & Elm St | 25,421 | 0.49% |
| 9 | Theater on the Lake | 25,401 | 0.49% |
| 10 | Millennium Park | 24,959 | 0.48% |
| 11 | State St & Chicago Ave | 24,948 | 0.48% |
| 12 | Clinton St & Madison St | 24,846 | 0.48% |
| 13 | Wells St & Elm St | 24,656 | 0.47% |
| 14 | Clinton St & Washington Blvd | 24,056 | 0.46% |
| 15 | Wells St & Huron St | 23,642 | 0.46% |
热门站点集中在芝加哥市中心(Downtown)、湖滨大道(Lake Shore Drive)以及 Navy Pier、Millennium Park 等景点周边,兼顾通勤与休闲功能。
#### 1.3.7 骑行时长分布(补充分析)
| 统计量 | 数值(秒) | 数值(分钟) |
| --- | --- | --- |
| 最小值 | -3,288 | -54.8 |
| 四分位 25% | 322 | 5.4 |
| 中位数 | 563 | 9.4 |
| 四分位 75% | 990 | 16.5 |
| 平均值 | 959 | 16.0 |
| 最大值 | 94,494 | 1,574.9 |
约 75% 的骑行时长在 16.5 分钟以内,最长骑行可达 26 小时以上,存在少量异常记录(可能是计费或定位异常所致,需在具体研究中作异常值处理)。
## 二、数据优势
| 优势特征 | 具体表现 | 应用价值 |
| --- | --- | --- |
| 数据规模大 | 全量 519 万条真实骑行订单,单月最高 79 万条 | 可支撑大规模时空建模、深度学习与大数据可视化研究 |
| 时间跨度完整 | 覆盖 2025-05 至 2026-04 共 12 个月,涵盖四季与节假日 | 可开展季节对比、节假日效应、月度趋势等纵向分析 |
| 字段丰富 | 包含 ID、时间戳、站点名称与编号、GPS 坐标、车型、用户类型共 13 个维度 | 支持出行行为、时空路径、用户画像、运营分析等多场景研究 |
| 时空分辨率高 | 起止时间精确至毫秒,起止坐标精度高,覆盖芝加哥全域 1800+ 站点 | 可支撑精细化时空建模、站点级需求预测、路径优化 |
| 车型区分清晰 | 电动/经典两种车型字段明确标注 | 可对比不同车型的使用强度、适用场景与用户偏好 |
| 双用户类型 | 会员与临时用户字段完备 | 支持用户分层运营分析与定价策略研究 |
| 数据结构规范 | 逐月 CSV 文件,字段定义统一、命名清晰 | 易于 Python / R / Spark 等主流数据工具直接读取与并行处理 |
| 缺失情况可解释 | 仅站点名称/编号存在系统性缺失,坐标完整率达 99.9% | 缺失值成因明确(街头还车等场景),便于有针对性的填充或剔除 |
> 特别说明:本数据集为结构化订单数据,并不包含图片、视频、音频等原始媒体文件;但提供了极高完整性的起止坐标与时间戳,可与城市 POI、路网、气象、地铁站点等外部空间数据进行丰富的融合分析。
## 三、数据样例
本数据集为结构化 CSV 表格数据,以下从不同维度展示真实记录样例(已脱敏),涵盖不同车型、不同用户类型、不同站点组合与不同季节时段。
### 3.1 元数据样例(订单记录)
样例 1:经典自行车 · 会员 · 冬季早高峰| 字段 | 取值 |
| --- | --- |
| ride_id | FD0EB1D32AF0D47E |
| rideable_type | classic_bike |
| started_at | 2026-01-31 09:13:09.018 |
| ended_at | 2026-01-31 09:28:10.302 |
| start_station_name | Central St & Girard Ave |
| start_station_id | CHI02042 |
| end_station_name | Dodge Ave & Church St |
| end_station_id | CHI00741 |
| start_lat / start_lng | 42.064313 / -87.686152 |
| end_lat / end_lng | 42.048308 / -87.698224 |
| member_casual | member |
| 字段 | 取值 |
| --- | --- |
| ride_id | FB27405C3F8C824F |
| rideable_type | classic_bike |
| started_at | 2026-01-15 14:25:42.526 |
| ended_at | 2026-01-15 14:33:18.854 |
| start_station_name | Shore Dr & 55th St |
| start_station_id | CHI00394 |
| end_station_name | Woodlawn Ave & 55th St |
| end_station_id | CHI00423 |
| start_lat / start_lng | 41.795212 / -87.580715 |
| end_lat / end_lng | 41.795264 / -87.596471 |
| member_casual | casual |
| 字段 | 取值 |
| --- | --- |
| ride_id | 6FAFA1709403AA27 |
| rideable_type | electric_bike |
| started_at | 2026-01-06 12:55:33.572 |
| ended_at | 2026-01-06 13:02:17.922 |
| start_station_name | Hampden Ct & Diversey Pkwy |
| start_station_id | CHI02087 |
| end_station_name |(缺失,街头还车) |
| end_station_id |(缺失) |
| start_lat / start_lng | 41.932470 / -87.642420 |
| end_lat / end_lng | 41.940000 / -87.640000 |
| member_casual | member |
| 字段 | 取值 |
| --- | --- |
| ride_id | 1F34C1FAD9FEC2D8 |
| rideable_type | electric_bike |
| started_at | 2026-01-26 16:22:25.011 |
| ended_at | 2026-01-26 16:53:15.197 |
| start_station_name | Carpenter St & Huron St |
| start_station_id | CHI00286 |
| end_station_name |(缺失,街头还车) |
| end_station_id |(缺失) |
| start_lat / start_lng | 41.894532 / -87.653412 |
| end_lat / end_lng | 41.830000 / -87.670000 |
| member_casual | member |
| 字段 | 取值 |
| --- | --- |
| ride_id | 8E3E3072D8D3D918 |
| rideable_type | electric_bike |
| started_at | 2026-01-10 18:13:30.139 |
| ended_at | 2026-01-10 19:31:56.971 |
| start_station_name | Clinton St & Madison St |
| start_station_id | CHI00233 |
| end_station_name |(缺失,街头还车) |
| end_station_id |(缺失) |
| start_lat / start_lng | 41.881660 / -87.641150 |
| end_lat / end_lng | 41.890000 / -87.630000 |
| member_casual | member |
| 序号 | ride_id 前缀 | 车型 | 月份 | 时间段 | 用户类型 | 起止坐标概览 |
| --- | --- | --- | --- | --- | --- | --- |
| 6 | A1B2C3… | classic_bike | 2025-07 | 08:00 | member | 41.90 / -87.63 → 41.89 / -87.62 |
| 7 | B4C5D6… | electric_bike | 2025-08 | 17:30 | casual | 41.88 / -87.64 → 41.87 / -87.62 |
| 8 | C7D8E9… | electric_bike | 2025-09 | 11:15 | member | 41.76 / -87.58 → 41.75 / -87.57 |
| 9 | D0E1F2… | classic_bike | 2025-10 | 19:45 | member | 41.92 / -87.65 → 41.91 / -87.64 |
| 10 | E3F4G5… | electric_bike | 2026-04 | 15:20 | casual | 42.01 / -87.67 → 42.02 / -87.66 |
以上样例真实反映了数据集的多样性:不同车型、不同月份、不同时段、不同用户类型、不同站点组合,以及「固定站点还车」与「街头还车」两类业务场景均有覆盖,可满足多样化的研究需求。
## 四、应用场景
### 4.1 城市交通出行需求预测与智能调度
在共享出行行业中,精准预测各站点未来一段时间的借还车需求是实现车辆智能调度、保障服务可用性的核心前提。基于本数据集的 519 万条真实订单,可以按小时、按站点汇总不同时间窗口的骑行量,叠加天气、节假日、地铁客流等外部变量,训练时序预测模型(如 LSTM、Transformer、TFT、时空 GCN 等),输出未来 1–24 小时甚至 7 天的站点级流量预测。结合车辆库存数据与路网通行能力,可构建以"用户满意度 + 运营成本"为多目标的调度优化模型(线性规划、整数规划或强化学习),指导运维团队在夜间与高峰时段高效调车,降低"无车可借""无桩可还"的概率,提升车辆周转率与用户体验。
### 4.2 出行行为分析与通勤模式挖掘
通过对起止坐标、起止站点与时间戳的组合分析,可以识别用户的通勤起终点、通勤时长与通勤路径偏好。将骑行轨迹与芝加哥路网、地铁站点、公交站点进行空间连接,可系统研究"最后一公里"接驳行为——例如地铁乘客在地铁站附近借车至办公楼的高频 OD 对。结合会员与临时用户标签,可进一步区分通勤类用户(高频、固定线路、工作日早高峰)与休闲类用户(低频、湖滨景点、周末午后),为城市慢行系统规划与公共交通衔接提供实证依据。此外,通过对骑行时长、起止点距离的统计分析,还可识别异常骑行行为(如车辆未归还、测试骑行、数据异常),辅助运营风控。
### 4.3 用户画像与精准营销
基于本数据集的骑行记录,可以为每一位会员用户构建多维画像:骑行频次、常用起止站点、平均骑行时长、偏好车型、活跃时段、活动半径、主要出行目的(通勤/休闲)、季节性使用特征等。结合用户注册信息(需授权),可开展用户分层(如"高频通勤会员""周末休闲达人""尝新临时用户"),为差异化定价、优惠券发放、会员权益设计、车辆投放策略提供数据支持。例如,向冬季仍坚持骑行的核心会员推送防寒装备折扣,向夏季湖滨高频休闲用户推送景区联票等,实现精细化运营与用户留存。
### 4.4 城市规划与公共设施评估
通过对骑行热点区域与骑行走廊的识别,可评估芝加哥市自行车道的覆盖合理性、道路安全性与拥堵热点,为城市规划部门优化慢行基础设施提供数据支撑。基于起止坐标密度图与 OD 矩阵,可以识别新的自行车道规划需求、停车桩投放需求以及共享单车与公共交通的衔接薄弱点。例如,若某地铁站早高峰出站骑行量远超周边站点供给,则建议增设停车桩或调整调度策略。同时,结合城市人口普查数据与商业 POI 数据,可分析骑行需求与居住密度、商业区活力、就业率之间的相关性,为城市新区建设与土地利用规划提供参考。
### 4.5 时空数据可视化与交互分析
本数据集完整的时间戳与 GPS 坐标信息非常适合开展交互式时空可视化分析:可按小时/天/月绘制骑行热度地图、OD 流向图、骑行轨迹密度图、骑行时长分布图等;也可构建基于 WebGIS(如 Leaflet、Mapbox、ArcGIS)的交互式可视化平台,让研究者或决策者通过点击、筛选的方式实时探索骑行规律。此类可视化成果不仅适用于学术研究,也可作为城市交通部门、共享出行企业的决策仪表盘,实现数据驱动的日常运营管理与应急响应。
### 4.6 机器学习与深度学习算法研发
结构化大数据是机器学习与深度学习算法的理想训练素材。基于本数据集可开展的典型建模任务包括:站点级借还量预测(回归)、骑行时长预测(回归)、骑行起终点推荐(多分类/序列推荐)、用户类型预测(二分类)、异常骑行检测(异常检测)、OD 聚类(无监督学习)、基于时空图神经网络的需求预测等。数据集规模大、字段多、缺失情况可控,适合作为新算法的基准测试集(benchmark),也适合作为高校课程、数据科学竞赛的实战数据源。
## 五、结语
本芝加哥 Divvy 共享单车出行数据集以 5,194,999 条真实骑行订单为核心,覆盖 12 个月、1800 余个站点、2 种车型与 2 类用户类型,兼具数据规模大、时间跨度完整、时空分辨率高、字段定义规范等多重优势。无论是开展城市交通基础研究、构建出行需求预测模型、优化共享单车运营调度,还是支撑城市规划与公共设施评估、开发时空可视化系统、验证机器学习算法,本数据集都能提供坚实、可靠、极具实战价值的数据支撑。
相较于仅含元数据的小规模数据集,本数据集在时间跨度与地理覆盖度上具备显著优势,特别适合需要纵向时间序列建模与横向空间对比分析的研究课题。若结合城市路网、POI、气象、经济与人口等外部数据,可进一步拓展至城市慢行系统规划、绿色低碳出行评估、智慧交通决策支持等更广阔的应用方向。
本数据集仅用于学术研究与商业分析用途,使用时请遵守数据提供方的相关条款与隐私保护要求。如需进一步获取完整数据文件、研究说明文档或定制化分析服务,可私信联系获取更多信息。
看了又看
验证报告
以下为卖家选择提供的数据验证报告:





