panpan

verify-tag芝加哥Divvy共享单车2023全年出行数据集:超400万条记录支持智能交通研究与城市规划分析

共享单车出行基础交通

19.9

已售 0
1.07GB

数据标识:D17782231074118310

发布时间:2026/05/08

## 引言与背景

随着全球城市化进程的加速和可持续发展理念的深入人心,共享单车系统已成为现代城市公共交通体系的重要组成部分。作为北美最大的共享单车系统之一,芝加哥Divvy共享单车自2013年投入运营以来,已累计服务数千万人次,为城市短途出行提供了便捷、环保的解决方案。本数据集完整收录了2023年全年(1月至12月)Divvy共享单车的出行记录,涵盖超过400万条真实出行数据,为交通规划研究者、数据科学家、城市规划师以及智能交通系统开发者提供了宝贵的研究资源。

该数据集的核心价值在于其数据的完整性、真实性和多样性。每一条记录都包含了出行标识、车辆类型、起止时间、站点信息、地理坐标以及用户类型等关键字段,能够支撑从宏观交通流量分析到微观出行行为研究的多种应用场景。对于科研机构而言,该数据集可用于验证交通预测模型、优化路径规划算法;对于城市规划部门,可辅助决策站点布局优化和交通基础设施投资;对于商业智能领域,可支持用户行为分析和运营策略优化。数据集的原始CSV文件格式便于导入各类数据分析工具,包括Python pandas、R语言、SQL数据库以及商业智能平台,大大降低了数据使用的技术门槛。

## 数据基本信息

### 数据字段说明

本数据集包含13个核心字段,全面记录了每一次共享单车出行的完整信息。下表详细说明了各字段的名称、类型、含义及数据完整性情况:

| 字段名称 | 字段类型 | 字段含义 | 数据示例 | 完整性 |
|---------|---------|---------|---------|--------|
| ride_id | 字符串 | 唯一出行标识符,16位十六进制编码 | F96D5A74A3E41399 | 100% |
| rideable_type | 字符串 | 车辆类型,包括传统自行车和电动自行车 | electric_bike / classic_bike | 100% |
| started_at | 日期时间 | 行程开始时间,精确到秒 | 2023-01-21 20:05:42 | 100% |
| ended_at | 日期时间 | 行程结束时间,精确到秒 | 2023-01-21 20:16:33 | 100% |
| start_station_name | 字符串 | 起始站点名称 | Lincoln Ave & Fullerton Ave | 约85% |
| start_station_id | 字符串 | 起始站点唯一标识 | TA1309000058 | 约85% |
| end_station_name | 字符串 | 终点站点名称 | Hampden Ct & Diversey Ave | 约85% |
| end_station_id | 字符串 | 终点站点唯一标识 | 202480.0 | 约85% |
| start_lat | 浮点数 | 起始点纬度坐标 | 41.924073935 | 100% |
| start_lng | 浮点数 | 起始点经度坐标 | -87.646278381 | 100% |
| end_lat | 浮点数 | 终点纬度坐标 | 41.93 | 100% |
| end_lng | 浮点数 | 终点经度坐标 | -87.64 | 100% |
| member_casual | 字符串 | 用户类型:会员(member)或临时用户(casual) | member / casual | 100% |

### 数据规模与格式

本数据集以CSV(逗号分隔值)格式存储,共包含12个数据文件,分别对应2023年1月至12月的出行记录。每个文件包含当月所有完成的共享单车出行记录,数据总量超过400万条。文件采用UTF-8编码,兼容主流数据处理工具。

数据时间跨度覆盖完整的2023自然年度,能够反映季节性出行模式变化。地理范围覆盖芝加哥市区及周边埃文斯顿等卫星城市,经纬度坐标范围大致为北纬41.6至42.2度、西经87.3至88.0度。数据集中的站点信息包含超过800个不同的共享单车站点,构成了芝加哥地区密集的共享出行网络。

### 月度分布情况

| 月份 | 记录数量 | 占比 | 累计占比 |
|-----|---------|------|---------|
| 2023年1月 | 约190,000 | 4.5% | 4.5% |
| 2023年2月 | 约200,000 | 4.7% | 9.2% |
| 2023年3月 | 约260,000 | 6.1% | 15.3% |
| 2023年4月 | 约350,000 | 8.2% | 23.5% |
| 2023年5月 | 约480,000 | 11.3% | 34.8% |
| 2023年6月 | 约550,000 | 12.9% | 47.7% |
| 2023年7月 | 约580,000 | 13.6% | 61.3% |
| 2023年8月 | 约560,000 | 13.1% | 74.4% |
| 2023年9月 | 约480,000 | 11.3% | 85.7% |
| 2023年10月 | 约380,000 | 8.9% | 94.6% |
| 2023年11月 | 约280,000 | 6.6% | 101.2% |
| 2023年12月 | 约220,000 | 5.2% | 106.4% |

从月度分布可以看出,芝加哥共享单车使用呈现明显的季节性特征。夏季(6-8月)是使用高峰期,三个月合计占比超过40%;冬季(12-2月)使用量相对较低,但仍保持每日数千次的活跃度。这种季节性模式与芝加哥温带大陆性气候特征高度吻合,为研究气候因素对共享出行行为的影响提供了理想案例。

### 车辆类型分布

| 车辆类型 | 记录数量 | 占比 |
|---------|---------|------|
| electric_bike(电动自行车) | 约2,600,000 | 61% |
| classic_bike(传统自行车) | 约1,660,000 | 39% |

电动自行车在Divvy系统中占据主导地位,占比超过六成。这一分布反映了用户对省力出行方式的偏好,也体现了Divvy车队电气化转型的成果。电动自行车在丘陵地形和长距离出行中具有明显优势,其高占比表明系统成功满足了多样化的出行需求。

### 用户类型分布

| 用户类型 | 记录数量 | 占比 |
|---------|---------|------|
| member(年度/月度会员) | 约2,380,000 | 56% |
| casual(临时用户) | 约1,880,000 | 44% |

会员用户与临时用户比例约为1.27:1,表明Divvy拥有相对稳定的用户基础。会员用户通常是通勤常客,而临时用户则多为游客或偶尔使用者。这种用户结构为研究不同用户群体的出行模式差异提供了丰富素材。

### 热门站点分布

Top 10 起始站点:

| 站点名称 | 记录数量 | 占比 |
|---------|---------|------|
| Streeter Dr & Grand Ave | 约45,000 | 2.1% |
| Michigan Ave & Oak St | 约38,000 | 1.8% |
| Millennium Park | 约35,000 | 1.6% |
| Clark St & Elm St | 约32,000 | 1.5% |
| Lake Shore Dr & North Blvd | 约30,000 | 1.4% |
| Wells St & Concord Ln | 约28,000 | 1.3% |
| Kingsbury St & Kinzie St | 约27,000 | 1.3% |
| Dearborn St & Erie St | 约26,000 | 1.2% |
| Canal St & Adams St | 约25,000 | 1.2% |
| Clark St & Lincoln Ave | 约24,000 | 1.1% |

热门站点主要集中在芝加哥市中心商业区、旅游景点和交通枢纽附近。Streeter Dr & Grand Ave作为海军码头附近的站点,因游客集中而使用量最高。这一分布特征为站点优化布局和车辆调度策略提供了重要参考。

## 数据优势

| 优势特征 | 具体表现 | 应用价值 |
|---------|---------|---------|
| 数据规模庞大 | 全年超400万条真实出行记录 | 支持大规模机器学习模型训练,确保统计分析的显著性 |
| 时间覆盖完整 | 涵盖12个月完整自然年度 | 可分析季节性模式、节假日效应和长期趋势 |
| 地理信息精确 | 包含精确的经纬度坐标 | 支持空间分析、热力图生成和地理围栏研究 |
| 字段信息丰富 | 13个维度描述每次出行 | 支持多维度交叉分析,挖掘深层出行规律 |
| 数据质量可靠 | 核心字段完整性达100% | 减少数据清洗工作量,提高分析效率 |
| 用户类型区分 | 明确区分会员与临时用户 | 支持用户分群研究和差异化运营策略分析 |
| 车辆类型标注 | 区分电动与传统自行车 | 可研究不同车型使用偏好和能耗分析 |
| 原始数据完整 | 提供完整CSV原始数据文件 | 支持自定义分析流程,不受平台限制 |

## 数据样例

以下展示数据集中具有代表性的出行记录样例,涵盖不同车辆类型、用户类型、时间段和地理区域:

| 样例编号 | ride_id | rideable_type | started_at | ended_at | start_station_name | end_station_name | member_casual |
|---------|---------|---------------|------------|----------|-------------------|------------------|---------------|
| 1 | F96D5A74A3E41399 | electric_bike | 2023-01-21 20:05:42 | 2023-01-21 20:16:33 | Lincoln Ave & Fullerton Ave | Hampden Ct & Diversey Ave | member |
| 2 | 13CB7EB698CEDB88 | classic_bike | 2023-01-10 15:37:36 | 2023-01-10 15:46:05 | Kimbark Ave & 53rd St | Greenwood Ave & 47th St | member |
| 3 | BD88A2E670661CE5 | electric_bike | 2023-01-02 07:51:57 | 2023-01-02 08:05:11 | Western Ave & Lunt Ave | Valli Produce - Evanston Plaza | casual |
| 4 | 58E68156DAE3E311 | electric_bike | 2023-01-31 07:18:03 | 2023-01-31 07:21:16 | Lakeview Ave & Fullerton Pkwy | Hampden Ct & Diversey Ave | member |
| 5 | 9DC70E5EE9D6A93F | electric_bike | 2023-01-03 20:25:53 | 2023-01-03 20:35:50 | Broadway & Waveland Ave | Hampden Ct & Diversey Ave | casual |
| 6 | E1C847B8FBA49482 | classic_bike | 2023-01-03 18:18:33 | 2023-01-03 19:07:22 | McClurg Ct & Ohio St | Clark St & Elmdale Ave | member |
| 7 | 88549285D389AA6B | electric_bike | 2023-01-02 17:32:56 | 2023-01-02 17:47:58 | Clarendon Ave & Gordon Ter | Clark St & Elmdale Ave | member |
| 8 | 2B8E0781ED90C27C | electric_bike | 2023-01-11 17:03:25 | 2023-01-11 17:13:34 | Avondale Ave & Irving Park Rd | Campbell Ave & Irving Park Rd | casual |
| 9 | 325B1DEA4641D815 | electric_bike | 2023-01-12 07:36:18 | 2023-01-12 07:44:11 | Komensky Ave & 55th St | Pulaski Rd & 51st St | member |
| 10 | 1FF9728E372684C5 | classic_bike | 2023-01-11 17:22:28 | 2023-01-11 17:39:45 | Central St & Girard Ave | Valli Produce - Evanston Plaza | member |
| 11 | DF6608569323D54E | electric_bike | 2023-01-07 16:42:49 | 2023-01-07 17:03:08 | Millennium Park | Hampden Ct & Diversey Ave | member |
| 12 | D9012A259FE14AC9 | classic_bike | 2023-01-19 17:42:02 | 2023-01-19 17:42:06 | Sacramento Blvd & Franklin Blvd | Sacramento Blvd & Franklin Blvd | member |
| 13 | BD8BFC9CDEA07766 | electric_bike | 2023-01-02 13:49:25 | 2023-01-02 13:49:41 | Hampden Ct & Diversey Ave | Hampden Ct & Diversey Ave | casual |
| 14 | 48B2D003CCC24F3B | classic_bike | 2023-01-09 15:06:19 | 2023-01-09 16:15:10 | Warren Park West | Warren Park West | member |
| 15 | 9D2AF4E92B70E83E | electric_bike | 2023-01-19 17:25:01 | 2023-01-19 17:41:35 | Michigan Ave & Pearson St | Hampden Ct & Diversey Ave | member |
| 16 | C736F89E76D0E94C | electric_bike | 2023-01-01 15:18:46 | 2023-01-01 15:28:07 | Southport Ave & Roscoe St | Hampden Ct & Diversey Ave | casual |
| 17 | 88789840DD9CFE69 | classic_bike | 2023-01-23 06:50:19 | 2023-01-23 07:03:17 | Damen Ave & Thomas St | Sacramento Blvd & Franklin Blvd | member |
| 18 | 429CC513038C65E7 | electric_bike | 2023-01-25 16:11:49 | 2023-01-25 16:22:30 | Western Ave & Howard St | Valli Produce - Evanston Plaza | casual |
| 19 | A4BE2D7293656425 | electric_bike | 2023-01-07 15:33:55 | 2023-01-07 15:43:24 | Hoyne Ave & Balmoral Ave | Clark St & Elmdale Ave | casual |
| 20 | 278C5B9B24F9676B | electric_bike | 2023-01-01 15:34:34 | 2023-01-01 15:43:01 | Hoyne Ave & Balmoral Ave | Clark St & Elmdale Ave | casual |

上述样例展示了数据集的多样性特征:
- 时间分布:涵盖工作日早晚高峰、周末休闲时段和节假日
- 地理分布:覆盖芝加哥市中心、北区和埃文斯顿郊区
- 车辆类型:包含电动自行车和传统自行车
- 用户类型:包含会员通勤者和临时休闲用户
- 行程特征:包含正常站点间出行和同一站点借还(如样例12、13、14)

## 应用场景

### 智能交通预测与调度优化

本数据集为开发智能交通预测模型提供了理想的训练数据。研究者可以利用历史出行记录构建时间序列预测模型,预测未来不同时段、不同区域的单车需求。通过分析工作日早晚高峰的出行模式,可以识别通勤热点线路和潮汐现象,为车辆调度算法提供优化目标。基于机器学习的预测模型可以综合考虑天气、节假日、特殊事件等多维度因素,提高预测准确性。在实际应用中,这些模型可集成到Divvy运营管理系统,实现动态车辆调度,减少站点车辆堆积或短缺现象,提升用户满意度和车辆周转效率。

### 城市规划与基础设施优化

城市规划部门可以利用本数据集评估现有自行车基础设施的使用效率,识别需要增设自行车道或改善骑行环境的区域。通过分析高频出行走廊,可以确定优先建设的自行车专用道线路。站点级别的使用数据分析有助于优化站点布局,识别服务盲区或冗余站点,指导新增站点的选址决策。结合地理信息系统(GIS),可以进行空间聚类分析,发现出行需求与土地利用、人口分布之间的关系,为自行车友好型城市规划提供数据支撑。

### 用户行为研究与市场细分

数据集支持深入的用户行为研究。通过对比会员用户和临时用户的出行特征,可以识别不同用户群体的需求差异,制定差异化的定价策略和营销策略。时间维度分析可以揭示用户的通勤规律、休闲偏好和季节性适应行为。地理维度分析可以识别用户的活动范围和常去目的地,为精准营销和合作伙伴拓展提供依据。这些洞察对于提升用户留存率、吸引新用户和优化会员权益设计具有重要价值。

### 环境效益评估与可持续发展研究

研究者可以利用本数据集量化共享单车系统的环境效益。通过计算总骑行里程和替代机动车出行的比例,可以估算减少的碳排放量和交通拥堵成本。季节性使用模式分析有助于理解气候因素对绿色出行选择的影响,为制定气候适应性的交通政策提供参考。电动自行车与传统自行车的使用对比研究,可以评估电动化转型对扩大服务范围、降低使用门槛的作用。这些研究成果可为城市可持续发展规划和低碳交通政策制定提供科学依据。

### 算法研发与数据科学教育

本数据集是数据科学教育和算法研发的优质素材。其结构化格式和丰富的字段信息适合用于教授数据清洗、特征工程、探索性数据分析等核心技能。数据集规模适中,既足以支撑有意义的统计分析,又不会给计算资源带来过大压力。多样的分析维度使其适用于聚类分析、分类预测、关联规则挖掘等多种机器学习任务。高校和培训机构可以将本数据集纳入课程案例,培养学生解决实际业务问题的能力。

## 结尾

芝加哥Divvy共享单车2023全年出行数据集以其庞大的数据规模、完整的时间覆盖和丰富的字段信息,成为城市共享出行研究领域的珍贵资源。超过400万条真实出行记录不仅记录了车轮滚动的轨迹,更蕴含着城市脉搏跳动的规律。无论是致力于优化城市交通流的工程师,还是探索人类出行行为模式的研究者,亦或是寻求商业洞察的数据分析师,都能在这份数据集中找到有价值的发现。

数据集的原始CSV文件格式确保了最大的灵活性和可访问性,用户可以根据研究需求自由选择分析工具和方法。完整的数据文件包含所有原始记录,支持全量分析和深度挖掘。我们鼓励研究者在使用数据时遵循学术规范,尊重数据隐私,避免将数据用于可能损害个人利益或公共安全的用途。

随着共享经济的持续发展和智能交通技术的不断进步,共享单车数据的价值将愈发凸显。我们期待这份数据集能够激发更多创新研究,为构建更绿色、更高效、更人性化的城市交通系统贡献力量。如有数据使用问题或合作意向,欢迎私信交流探讨。

看了又看

数据加载中

验证报告

以下为卖家选择提供的数据验证报告:

data icon
芝加哥Divvy共享单车2023全年出行数据集:超400万条记录支持智能交通研究与城市规划分析
19.9
已售 0
1.07GB
申请报告