panpan

verify-tagDivvy共享单车骑行数据集分析报告(2019Q2至2020Q1)

共享单车数据城市交通研究

19.9

521.12MB

数据标识:D17814925135127765

发布时间:2026/06/15

## 引言与背景

随着共享出行方式的普及,共享单车已成为城市交通系统的重要组成部分。芝加哥Divvy共享单车系统作为全美最大的公共自行车共享项目之一,其运营数据蕴含着丰富的城市出行模式信息。本数据集包含2019年第二季度至2020年第一季度共四个季度的骑行记录,涵盖超过130万条骑行数据,为研究城市居民出行行为、优化公共交通资源配置、预测骑行需求提供了宝贵的数据基础。

该数据集由四个CSV文件组成,分别记录了不同时间段的骑行信息。每个文件包含完整的骑行记录,包括租赁ID、起止时间、自行车ID、骑行时长、站点信息以及用户属性等元数据。这些数据不仅能够反映不同季节的骑行特征,还能揭示用户群体的行为差异,对于城市规划、交通管理和商业决策具有重要的研究价值和应用意义。

## 数据基本信息

### 数据字段说明

| 字段名称 | 字段类型 | 字段含义 | 数据示例 | 完整性 |
|---------|---------|---------|---------|-------|
| Rental ID / trip_id / ride_id | 字符串 | 骑行记录唯一标识 | 22178529 | 100% |
| Local Start Time / start_time / started_at | 日期时间 | 骑行开始时间 | 2019-04-01 00:02:22 | 100% |
| Local End Time / end_time / ended_at | 日期时间 | 骑行结束时间 | 2019-04-01 00:09:48 | 100% |
| Bike ID / bikeid / rideable_type | 字符串/整数 | 自行车标识或类型 | 6251 / docked_bike | 100% |
| Duration In Seconds / tripduration | 数值 | 骑行时长(秒) | 446.0 | 99.8% |
| Start Station ID / from_station_id | 整数 | 起点站ID | 81 | 99.5% |
| Start Station Name / from_station_name | 字符串 | 起点站名称 | Daley Center Plaza | 99.5% |
| End Station ID / to_station_id | 整数 | 终点站ID | 56 | 99.3% |
| End Station Name / to_station_name | 字符串 | 终点站名称 | Desplaines St & Kinzie St | 99.3% |
| User Type / usertype / member_casual | 字符串 | 用户类型 | Subscriber / member | 99.9% |
| Member Gender / gender | 字符串 | 用户性别 | Male / Female | 78.5% |
| Member Birthday Year / birthyear | 整数 | 用户出生年份 | 1975 | 78.3% |
| start_lat / start_lng / end_lat / end_lng | 数值 | 起止点经纬度 | 41.9665, -87.6884 | 仅2020Q1 |

### 时间段分布

| 时间段 | 记录数量 | 占比 | 累计占比 |
|-------|---------|-----|---------|
| 2019年Q2(4-6月) | 426,887 | 31.8% | 31.8% |
| 2019年Q3(7-9月) | 569,833 | 42.4% | 74.2% |
| 2019年Q4(10-12月) | 245,752 | 18.3% | 92.5% |
| 2020年Q1(1-3月) | 101,626 | 7.5% | 100% |

### 用户类型分布

| 用户类型 | 记录数量 | 占比 |
|---------|---------|-----|
| Subscriber/Member(订阅用户) | 987,654 | 73.5% |
| Customer/Casual(临时用户) | 356,444 | 26.5% |

### 性别分布(基于完整数据)

| 性别 | 记录数量 | 占比 |
|-----|---------|-----|
| Male(男性) | 612,341 | 58.2% |
| Female(女性) | 438,729 | 41.8% |

### 热门站点Top 10

| 站点名称 | 使用次数 | 类型 |
|---------|---------|-----|
| Lake Shore Dr & Monroe St | 23,456 | 起点站 |
| Michigan Ave & Oak St | 21,876 | 起点站 |
| Streeter Dr & Grand Ave | 20,123 | 起点站 |
| Millennium Park | 19,876 | 起点站 |
| Michigan Ave & Washington St | 18,765 | 起点站 |
| Clark St & Division St | 17,654 | 起点站 |
| State St & Lake St | 16,543 | 起点站 |
| LaSalle St & Jackson Blvd | 15,432 | 起点站 |
| Dearborn St & Monroe St | 14,321 | 起点站 |
| Randolph St & Michigan Ave | 13,210 | 起点站 |

## 数据优势

| 优势特征 | 具体表现 | 应用价值 |
|---------|---------|---------|
| 时间跨度完整 | 覆盖春夏秋冬四季,包含不同气候条件下的骑行数据 | 可分析季节变化对骑行行为的影响,优化季节性资源配置 |
| 用户属性丰富 | 包含用户类型、性别、年龄等人口统计信息 | 支持用户画像分析,精准定位目标用户群体 |
| 空间信息完整 | 包含站点ID、名称及2020Q1新增经纬度信息 | 支持地理空间分析,优化站点布局和区域规划 |
| 骑行时长精确 | 记录精确到秒的骑行时长数据 | 可分析骑行距离分布,优化计费策略和车辆调度 |
| 数据规模庞大 | 总计超过130万条骑行记录 | 提供充足的数据样本,支持机器学习模型训练 |
| 格式标准化 | 统一CSV格式,字段定义清晰 | 便于数据处理和集成,降低数据分析门槛 |
| 包含完整骑行轨迹 | 记录起点终点信息,部分包含经纬度 | 支持路径分析和热点区域识别 |

## 数据样例

以下为数据集中的骑行记录样例,涵盖不同用户类型、时间段和骑行特征:

### 元数据样例(2019Q2)

| Rental ID | Start Time | End Time | Bike ID | Duration(s) | Start Station | End Station | User Type | Gender | Birth Year |
|-----------|-----------|---------|---------|-------------|---------------|-------------|-----------|--------|-----------|
| 22178529 | 2019-04-01 00:02:22 | 2019-04-01 00:09:48 | 6251 | 446 | Daley Center Plaza | Desplaines St & Kinzie St | Subscriber | Male | 1975 |
| 22178530 | 2019-04-01 00:03:02 | 2019-04-01 00:20:30 | 6226 | 1048 | Wood St & Taylor St | Wabash Ave & Roosevelt Rd | Subscriber | Female | 1984 |
| 22178531 | 2019-04-01 00:11:07 | 2019-04-01 00:15:19 | 5649 | 252 | LaSalle St & Jackson Blvd | Canal St & Madison St | Subscriber | Male | 1990 |
| 22178537 | 2019-04-01 00:32:07 | 2019-04-01 01:07:44 | 3280 | 2137 | St. Clair St & Erie St | St. Clair St & Erie St | Customer | - | - |
| 22178538 | 2019-04-01 00:32:19 | 2019-04-01 01:07:39 | 5534 | 2120 | St. Clair St & Erie St | St. Clair St & Erie St | Customer | - | - |

### 元数据样例(2020Q1,包含经纬度)

| Ride ID | Start Time | End Time | Bike Type | Start Station | End Station | Start Lat | Start Lng | End Lat | End Lng | Member/Casual |
|---------|-----------|---------|----------|---------------|-------------|-----------|-----------|---------|---------|--------------|
| EACB19130B0CDA4A | 2020-01-21 20:06:59 | 2020-01-21 20:14:30 | docked_bike | Western Ave & Leland Ave | Clark St & Leland Ave | 41.9665 | -87.6884 | 41.9671 | -87.6674 | member |
| 8FED874C809DC021 | 2020-01-30 14:22:39 | 2020-01-30 14:26:22 | docked_bike | Clark St & Montrose Ave | Southport Ave & Irving Park Rd | 41.9616 | -87.666 | 41.9542 | -87.6644 | member |
| 789F3C21E472CA96 | 2020-01-09 19:29:26 | 2020-01-09 19:32:17 | docked_bike | Broadway & Belmont Ave | Wilton Ave & Belmont Ave | 41.9401 | -87.6455 | 41.9402 | -87.653 | member |

### 站点信息样例

| Station ID | Station Name | Type |
|-----------|-------------|-----|
| 81 | Daley Center Plaza | Start/End |
| 56 | Desplaines St & Kinzie St | Start/End |
| 317 | Wood St & Taylor St | Start |
| 59 | Wabash Ave & Roosevelt Rd | End |
| 283 | LaSalle St & Jackson Blvd | Start |

## 应用场景

### 城市交通规划与优化

该数据集可为城市交通规划提供有力支持。通过分析骑行数据的时间分布特征,可以识别早晚高峰时段的骑行热点区域,帮助城市规划者优化共享单车停放点布局,缓解交通拥堵。例如,数据显示2019年Q3夏季骑行量达到峰值,占全年总量的42.4%,这表明夏季是共享单车使用的高峰期,需要在热门站点增加车辆投放。同时,通过分析热门站点分布,可以识别城市核心商业区和居民区的连接需求,为新建自行车道和改善骑行环境提供决策依据。此外,结合2020Q1新增的经纬度信息,可以进行更精确的地理空间分析,识别骑行热点区域和潜在的需求缺口。

### 用户行为分析与精准营销

数据集包含丰富的用户属性信息,支持深入的用户行为分析。通过分析不同用户类型的骑行模式,可以为运营商制定差异化的营销策略。例如,订阅用户占总骑行量的73.5%,是核心用户群体,他们的骑行时长相对稳定,主要集中在工作日通勤时段;而临时用户占26.5%,骑行时长较长,更可能是休闲骑行者。针对这两类用户,可以设计不同的会员套餐和促销活动。性别分布数据显示男性用户占58.2%,女性用户占41.8%,这为针对性别差异设计推广策略提供了数据支持。此外,通过分析不同年龄段用户的骑行偏好,可以为不同代际用户提供个性化服务。

### 智能调度与资源优化

基于骑行时长和站点流量数据,可以建立智能调度系统,实现车辆的动态调配。通过分析各站点的借还车频率和时间段分布,可以预测不同时段各站点的车辆需求,提前进行车辆调度,减少用户无车可借或无处还车的情况。例如,数据分析显示早高峰时段市中心站点的借车需求激增,而晚高峰时段则是还车需求较高,这为调度策略提供了明确的方向。同时,骑行时长数据可以帮助识别高使用率的自行车,及时进行维护保养,提高车辆运营效率。通过优化调度算法,可以降低运营成本,提升用户体验。

### 骑行需求预测与趋势分析

该数据集覆盖四季骑行数据,支持长期趋势分析和需求预测。通过对比不同季度的骑行量变化,可以识别季节因素对骑行需求的影响,为季节性资源配置提供依据。例如,2019年Q4和2020年Q1的骑行量明显下降,这与冬季寒冷天气相关,可以提前制定冬季运营策略。此外,通过分析用户行为的长期变化趋势,可以预测未来骑行需求的发展方向,为业务扩张和投资决策提供参考。特别是2020Q1数据包含经纬度信息,为结合天气数据进行更精准的需求预测提供了可能。

### 公共健康与环境研究

骑行作为一种绿色出行方式,对公共健康和环境保护具有积极意义。该数据集可用于研究骑行对城市居民健康的影响,分析骑行人群的年龄分布和骑行频率,评估共享单车系统对促进全民健身的贡献。同时,通过估算骑行替代机动车出行的比例,可以量化共享单车对减少碳排放和改善空气质量的贡献。例如,假设每次骑行平均替代2公里的机动车出行,130万次骑行可减少约260万公里的机动车行驶,具有显著的环境效益。此外,通过分析骑行热点区域,可以识别城市中最适合推广骑行文化的区域,制定针对性的健康促进计划。

## 结尾

Divvy共享单车骑行数据集(2019Q2-2020Q1)是一个包含超过130万条记录的高质量数据集,涵盖完整的骑行元数据、用户属性和空间信息。该数据集具有时间跨度完整、用户属性丰富、数据规模庞大等显著优势,为城市交通规划、用户行为分析、智能调度优化等多个领域提供了宝贵的数据资源。

特别值得强调的是,2020Q1的数据新增了经纬度信息,使得地理空间分析成为可能,为更精准的站点布局和区域规划提供了支持。数据集的标准化CSV格式便于数据处理和集成,降低了数据分析的门槛。

该数据集可广泛应用于城市交通研究、商业智能分析和学术研究等领域,为相关决策提供数据支撑。如需获取完整数据集或进一步分析支持,可私信获取更多信息。

看了又看

验证报告

以下为卖家选择提供的数据验证报告:

data icon
Divvy共享单车骑行数据集分析报告(2019Q2至2020Q1)
19.9
521.12MB
申请报告