数据描述
引言与背景
自行车共享系统作为城市交通的重要组成部分,对于缓解交通拥堵、减少碳排放、促进健康出行具有重要意义。Cyclistic作为美国芝加哥地区的主要自行车共享服务提供商,其2023年全年的骑行数据集为研究城市交通模式、用户行为特征以及自行车共享系统的运营优化提供了宝贵的资源。
本数据集包含2023年1月至12月期间的5719877条骑行记录,涵盖了骑行ID、自行车类型、骑行时间、站点信息、地理位置坐标以及用户类型等核心数据字段。这些数据不仅记录了每一次骑行的基本信息,还包含了丰富的时空特征,为科研人员、城市规划师、交通运营者以及算法开发者提供了全面的分析基础。
数据基本信息
数据字段说明
| 字段名称 | 字段类型 | 字段含义 | 数据示例 | 完整性 |
|---|---|---|---|---|
| ride_id | object | 骑行记录唯一标识符 | F96D5A74A3E41399 | 100.0% |
| rideable_type | object | 自行车类型 | electric_bike | 100.0% |
| started_at | object | 骑行开始时间 | 2023-01-21 20:05:42 | 100.0% |
| ended_at | object | 骑行结束时间 | 2023-01-21 20:16:33 | 100.0% |
| start_station_name | object | 起始站点名称 | Lincoln Ave & Fullerton Ave | 84.69% |
| start_station_id | object | 起始站点ID | TA1309000058 | 84.69% |
| end_station_name | object | 结束站点名称 | Hampden Ct & Diversey Ave | 83.75% |
| end_station_id | object | 结束站点ID | 202480.0 | 83.75% |
| start_lat | float64 | 起始位置纬度 | 41.924074 | 100.0% |
| start_lng | float64 | 起始位置经度 | -87.646278 | 100.0% |
| end_lat | float64 | 结束位置纬度 | 41.93 | 99.88% |
| end_lng | float64 | 结束位置经度 | -87.64 | 99.88% |
| member_casual | object | 用户类型 | member | 100.0% |
数据分布情况
1. 时间分布(月份)
| 月份 | 记录数量 | 占比(%) | 累计占比(%) |
|---|---|---|---|
| 202301 | 190301 | 3.33 | 3.33 |
| 202302 | 190445 | 3.33 | 6.66 |
| 202303 | 258678 | 4.52 | 11.18 |
| 202304 | 426590 | 7.46 | 18.64 |
| 202305 | 604827 | 10.57 | 29.21 |
| 202306 | 719618 | 12.58 | 41.79 |
| 202307 | 767650 | 13.42 | 55.21 |
| 202308 | 771693 | 13.49 | 68.70 |
| 202309 | 666371 | 11.65 | 80.35 |
| 202310 | 537113 | 9.39 | 89.74 |
| 202311 | 362518 | 6.34 | 96.08 |
| 202312 | 224073 | 3.92 | 100.00 |
2. 自行车类型分布
| 自行车类型 | 记录数量 | 占比(%) |
|---|---|---|
| electric_bike | 2945579 | 51.50 |
| classic_bike | 2696011 | 47.13 |
| docked_bike | 78287 | 1.37 |
3. 用户类型分布
| 用户类型 | 记录数量 | 占比(%) |
|---|---|---|
| member | 3660698 | 64.00 |
| casual | 2059179 | 36.00 |
4. 主要起始站点分布(Top 10)
| 起始站点名称 | 记录数量 | 占比(%) |
|---|---|---|
| Streeter Dr & Grand Ave | 63249 | 1.11 |
| DuSable Lake Shore Dr & Monroe St | 40288 | 0.70 |
| Michigan Ave & Oak St | 37383 | 0.65 |
| DuSable Lake Shore Dr & North Blvd | 35966 | 0.63 |
| Clark St & Elm St | 35805 | 0.63 |
| Kingsbury St & Kinzie St | 34966 | 0.61 |
| Wells St & Concord Ln | 33590 | 0.59 |
| Clinton St & Washington Blvd | 32715 | 0.57 |
| Wells St & Elm St | 30407 | 0.53 |
| Millennium Park | 30156 | 0.53 |
5. 骑行时长分布
| 时长区间 | 记录数量 | 占比(%) |
|---|---|---|
| 0-5分钟 | 1263715 | 22.09 |
| 5-10分钟 | 1729108 | 30.23 |
| 10-15分钟 | 1034071 | 18.08 |
| 15-20分钟 | 583814 | 10.21 |
| 20-30分钟 | 566125 | 9.90 |
| 30-60分钟 | 400819 | 7.01 |
| 60-120分钟 | 100476 | 1.76 |
| 120分钟以上 | 40480 | 0.71 |
数据规模与特征
本数据集共包含5719877条骑行记录,覆盖2023年全年12个月份。数据类型主要包括字符串型(用于标识信息)和数值型(用于地理坐标)。所有记录均包含完整的骑行ID、自行车类型、骑行时间、地理位置坐标以及用户类型信息,其中站点名称和站点ID的完整性分别为84.69%和83.75%,结束位置坐标的完整性为99.88%。
数据呈现出明显的季节性特征,夏季月份(6-8月)的骑行记录数量显著高于冬季月份(12-2月),反映了天气因素对骑行行为的重要影响。自行车类型方面,电动自行车和经典自行车的使用比例相当,分别占51.50%和47.13%,而docked_bike的使用比例较低,仅为1.37%。用户类型上,会员用户占比64%,非会员用户占比36%,表明会员制是Cyclistic的主要运营模式。
数据优势
| 优势特征 | 具体表现 | 应用价值 |
|---|---|---|
| 数据量大且完整 | 包含572万条骑行记录,核心字段完整性达99%以上 | 为大规模数据分析和深度学习模型训练提供充足样本 |
| 时间跨度长 | 覆盖2023年全年12个月份 | 可进行季节性趋势分析和长期模式识别 |
| 时空信息丰富 | 包含精确的地理位置坐标和时间戳 | 支持时空数据分析、热点区域识别和交通流预测 |
| 用户类型区分 | 明确区分会员和非会员用户 | 便于分析不同用户群体的行为差异和需求特征 |
| 自行车类型多样 | 包含电动自行车、经典自行车等类型 | 可研究不同类型自行车的使用场景和用户偏好 |
| 站点信息详细 | 记录了大量站点名称和ID | 支持站点使用频率分析和布局优化 |
数据样例
以下为数据集的15条代表性样例,涵盖不同月份、自行车类型、用户类型和骑行时长:
| ride_id | rideable_type | started_at | ended_at | start_station_name | user_type | duration_min |
|---|---|---|---|---|---|---|
| F96D5A74A3E41399 | electric_bike | 2023-01-21 20:05:42 | 2023-01-21 20:16:33 | Lincoln Ave & Fullerton Ave | member | 10.85 |
| 13CB7EB698CEDB88 | classic_bike | 2023-01-10 15:37:36 | 2023-01-10 15:46:05 | Kimbark Ave & 53rd St | member | 8.48 |
| BD88A2E670661CE5 | electric_bike | 2023-01-02 07:51:57 | 2023-01-02 08:05:11 | Western Ave & Lunt Ave | casual | 13.23 |
| C90792D034FED968 | classic_bike | 2023-01-22 10:52:58 | 2023-01-22 11:01:44 | Kimbark Ave & 53rd St | member | 8.77 |
| 58E68156DAE3E311 | electric_bike | 2023-01-31 07:18:03 | 2023-01-31 07:21:16 | Lakeview Ave & Fullerton Pkwy | member | 3.22 |
| 2F7194B6012A98D4 | electric_bike | 2023-01-15 21:18:36 | 2023-01-15 21:32:36 | Kimbark Ave & 53rd St | member | 14.00 |
| DB1CF84154D6A049 | classic_bike | 2023-01-25 10:49:01 | 2023-01-25 10:58:22 | Kimbark Ave & 53rd St | member | 9.35 |
| 34EAB943F88C4C5D | electric_bike | 2023-01-25 20:49:47 | 2023-01-25 21:02:14 | Kimbark Ave & 53rd St | member | 12.45 |
| BC8AB1AA51DA9115 | classic_bike | 2023-01-06 16:37:19 | 2023-01-06 16:49:52 | Kimbark Ave & 53rd St | member | 12.55 |
| CBE4D3954EB194B7 | classic_bike | 2023-01-05 17:31:57 | 2023-01-05 17:41:46 | Kimbark Ave & 53rd St | member | 9.82 |
| 367CD42F84880491 | classic_bike | 2023-01-03 17:32:34 | 2023-01-03 17:41:56 | Kimbark Ave & 53rd St | member | 9.37 |
| F3344545150C3222 | electric_bike | 2023-01-09 19:11:35 | 2023-01-09 19:19:15 | Broadway & Waveland Ave | member | 7.67 |
| 9DC70E5EE9D6A93F | electric_bike | 2023-01-03 20:25:53 | 2023-01-03 20:35:50 | Broadway & Waveland Ave | casual | 9.95 |
| 0894DBBB4FA509E5 | electric_bike | 2023-01-12 22:12:32 | 2023-01-12 22:17:07 | Lincoln Park Conservatory | member | 4.58 |
| 1E27A12D6C9A7C60 | classic_bike | 2023-01-09 21:09:30 | 2023-01-09 21:16:08 | Clark St & Columbia Ave | member | 6.63 |
应用场景
1. 城市交通规划与优化
基于Cyclistic数据集的时空特征分析,城市规划师可以深入了解芝加哥地区居民的骑行行为模式,识别高频骑行路线和热点区域。通过分析不同时间段的骑行分布,可以优化城市自行车道网络布局,重点加强高峰时段和热门区域的基础设施建设。例如,数据显示Streeter Dr & Grand Ave是最繁忙的站点,规划者可以考虑在该区域增加自行车停车位和换乘设施。此外,季节性分析结果表明夏季骑行需求显著高于冬季,可据此制定季节性的交通管理策略,如在冬季增加公共交通运力补充。
2. 自行车共享系统运营管理
对于Cyclistic运营团队,该数据集提供了丰富的运营优化依据。通过分析站点使用频率和潮汐现象,可以优化自行车调度策略,确保高峰时段热门站点有足够的车辆供应。例如,数据分析显示工作日早高峰期间通勤路线的需求较大,运营者可以提前将车辆调配到这些区域。用户类型分析表明会员用户占比64%,可针对会员群体设计更具吸引力的订阅方案和增值服务。此外,自行车类型分布显示电动自行车的使用比例已超过50%,运营者可考虑增加电动自行车的投放比例,以满足不断增长的需求。
3. 交通预测与需求建模
数据集的海量时空数据为交通预测模型提供了优质的训练样本。研究人员可以基于历史骑行记录构建机器学习模型,预测未来的骑行需求分布,为交通管理和资源配置提供决策支持。例如,通过分析天气、季节、节假日等因素与骑行量的相关性,可以建立精准的需求预测模型。此外,结合实时交通数据和事件信息,可以开发动态预测系统,帮助运营者及时调整策略。这些模型不仅可以应用于自行车共享系统,还可以为城市整体交通规划提供参考。
4. 用户行为分析与个性化服务
通过深入分析用户类型、骑行时间、路线偏好等特征,可以识别不同用户群体的行为模式和需求差异。例如,会员用户通常具有更规律的骑行时间和路线,而非会员用户的骑行行为更具随机性。基于这些洞察,Cyclistic可以开发个性化的推荐服务,为会员用户提供通勤路线优化建议,为非会员用户推荐热门景点的骑行路线。此外,通过分析骑行时长和频率,可以识别高价值用户和潜在流失用户,制定针对性的营销和 retention 策略。
5. 可持续交通研究与政策制定
自行车共享系统作为可持续交通的重要组成部分,其运营数据对于研究城市交通的低碳化转型具有重要意义。通过分析Cyclistic数据集,可以评估自行车共享系统对减少碳排放的贡献,为可持续交通政策制定提供数据支持。例如,研究人员可以计算因使用自行车而减少的汽车行驶里程和相应的碳排放量,量化自行车共享系统的环境效益。此外,通过分析不同区域的骑行渗透率,可以识别可持续交通发展的不平衡之处,为政策制定者提供靶向干预的依据。
结尾
Cyclistic 2023年全年自行车共享数据集以其庞大的规模、丰富的维度和高质量的数据质量,为城市交通研究、运营管理和算法开发提供了宝贵的资源。该数据集不仅记录了572万条骑行记录的基本信息,还包含了详细的时空特征、用户类型和自行车类型等关键维度,为多视角分析和深度洞察提供了可能。
数据的核心优势在于其完整性、时间跨度和丰富的属性信息,使得研究人员和从业者能够从多个角度探索自行车共享系统的运营规律和用户行为特征。无论是用于城市规划优化、运营策略调整,还是用于交通预测模型训练和用户服务创新,该数据集都展现出极高的应用价值。
随着城市交通智能化和可持续化的发展,自行车共享系统将继续发挥重要作用。Cyclistic数据集的开放和应用,不仅有助于提升芝加哥地区自行车共享系统的运营效率和服务质量,也为全球其他城市的自行车共享系统发展提供了参考和借鉴。未来,基于该数据集的深入研究和创新应用,有望进一步推动城市交通的可持续发展和智能化升级。
看了又看
验证报告
以下为卖家选择提供的数据验证报告:






