panpan

verify-tag芝加哥2019年Divvy共享单车出行数据集-380万条记录覆盖全年四季

共享单车

19.9

已售 0
501.33MB

数据标识:D17780407264554528

发布时间:2026/05/06

# 芝加哥2019年Divvy共享单车出行数据集-380万条记录覆盖全年四季

## 引言与背景

芝加哥作为美国第三大城市,其城市交通体系一直备受关注。Divvy共享单车系统作为芝加哥城市公共交通的重要组成部分,为市民和游客提供了便捷、环保的出行方式。2019年度Divvy共享单车出行数据集的发布,为城市交通研究、用户行为分析、公共服务优化等领域提供了宝贵的数据资源。该数据集完整记录了2019年全年四个季度的共享单车使用情况,涵盖了超过380万条出行记录,数据规模庞大、内容丰富,是研究城市共享交通行为的珍贵原始资料。

本数据集对于多个领域具有重要的研究价值和应用价值。首先,在城市交通规划方面,详尽的出行记录可以帮助规划部门了解城市各区域的出行需求分布,优化共享单车站点布局和车辆调度策略。其次,在用户行为研究方面,数据集中包含的用户类型、性别、年龄等属性信息,为分析不同群体使用共享服务的偏好和模式提供了基础。此外,完整的时间戳记录使得分析通勤规律、节假日出行特征等成为可能。对于机器学习算法的训练而言,该数据集可应用于出行时间预测、站点需求预测、异常检测等任务,具有广泛的应用前景。

## 数据基本信息

### 字段说明表

| 字段名称 | 字段类型 | 字段含义 | 数据示例 | 完整性 |
|---------|---------|---------|---------|--------|
| trip_id | 整数型 | 唯一出行记录标识符 | 21742443 | 100% |
| start_time | 日期时间型 | 骑行开始时间 | 2019-01-01 00:04:37 | 100% |
| end_time | 日期时间型 | 骑行结束时间 | 2019-01-01 00:11:07 | 100% |
| bikeid | 整数型 | 自行车唯一标识 | 2167 | 100% |
| tripduration | 数值型 | 骑行时长(秒) | 390.0 | 100% |
| from_station_id | 整数型 | 出发站点编号 | 199 | 100% |
| from_station_name | 字符串型 | 出发站点名称 | Wabash Ave & Grand Ave | 100% |
| to_station_id | 整数型 | 目的站点编号 | 84 | 100% |
| to_station_name | 字符串型 | 目的站点名称 | Milwaukee Ave & Grand Ave | 100% |
| usertype | 字符串型 | 用户类型 | Subscriber/Customer | 100% |
| gender | 字符串型 | 性别 | Male/Female/空值 | Subscriber用户约95%完整 |
| birthyear | 整数型 | 出生年份 | 1989 | Subscriber用户约95%完整 |

### 数据规模与覆盖范围

该数据集包含2019年全年四个季度的完整出行记录,总计约380万条数据记录,涵盖芝加哥全市范围内的共享单车出行轨迹。数据文件分布于四个季度文件中,每个文件均包含完整的出行记录信息。数据集总容量约525MB,字段结构清晰,格式统一,便于进行批量处理和深度分析。数据集覆盖了芝加哥地区数百个共享单车站点,分布于城市的各个社区和主要交通枢纽。

### 时间分布情况

| 月份 | 记录数量(估算) | 占比 | 累计占比 |
|------|----------------|------|----------|
| 1月 | 约35万 | 9.2% | 9.2% |
| 2月 | 约28万 | 7.4% | 16.6% |
| 3月 | 约37万 | 9.7% | 26.3% |
| 4月 | 约42万 | 11.1% | 37.4% |
| 5月 | 约48万 | 12.6% | 50.0% |
| 6月 | 约52万 | 13.7% | 63.7% |
| 7月 | 约55万 | 14.5% | 78.2% |
| 8月 | 约53万 | 13.9% | 92.1% |
| 9月 | 约45万 | 11.8% | 100% |
| 10月 | 约38万 | 约10.0% | - |
| 11月 | 约25万 | 约6.6% | - |
| 12月 | 约18万 | 约4.7% | - |

从时间分布来看,夏季月份(6月至8月)是共享单车使用的高峰期,占全年总出行量的约40%,这与芝加哥地区夏季气候宜人、户外活动增多密切相关。冬季月份(12月至2月)出行量明显下降,仅占全年约17%,反映出季节性因素对共享单车使用的显著影响。这种季节性波动特征对于车辆调度、站点维护等运营工作具有重要的参考价值。

### 用户类型分布

| 用户类型 | 记录数量(估算) | 占比 | 说明 |
|---------|----------------|------|------|
| Subscriber(订阅用户) | 约304万 | 约80% | 年度或月度订阅会员 |
| Customer(临时用户) | 约76万 | 约20% | 单次或短期使用者 |

订阅用户占据绝对主导地位,表明Divvy共享单车系统的主要用户群体为长期会员。这些订阅用户通常将共享单车作为日常通勤的重要交通工具,因此出行规律性较强,使用频率稳定。临时用户则主要包括游客和短期访客,他们的使用模式更加随机,通常选择热门景点周边的站点进行往返或环线骑行。

### 性别与年龄分布

| 性别 | 订阅用户中占比 | 数据完整性 |
|------|---------------|-----------|
| Male(男性) | 约68% | 约95% |
| Female(女性) | 约27% | 约95% |
| 空值(未提供) | 约5% | - |

在提供性别信息的订阅用户中,男性用户占比显著高于女性,比例约为2.5:1。年龄分布方面,订阅用户以25至45岁的中青年群体为主力军,这一年龄段的用户通常具有稳定的通勤需求和较强的消费能力。出生年份数据显示,最早的用户出生于1920年代,而最新注册用户为2000年代出生群体,覆盖年龄范围非常广泛。

### 热门站点分布(出发站TOP10)

| 排名 | 站点名称 | 区域特征 | 估算占比 |
|------|---------|---------|---------|
| 1 | Streeter Dr & Grand Ave | 海军港区 | 约2.8% |
| 2 | Michigan Ave & Washington St | 市中心核心区 | 约2.1% |
| 3 | Millennium Park | 千禧公园区 | 约1.9% |
| 4 | Lake Shore Dr & Belmont Ave | 林肯公园区 | 约1.6% |
| 5 | Wells St & Concord Ln | 林肯公园区 | 约1.5% |
| 6 | Clark St & Elm St | 黄金海岸区 | 约1.4% |
| 7 | Broadway & Cornelia Ave | 男孩镇区 | 约1.3% |
| 8 | Wilton Ave & Belmont Ave | 林肯公园区 | 约1.3% |
| 9 | Canal St & Madison St | 环状区域 | 约1.2% |
| 10 | Desplaines St & Kinzie St | 环状区域 | 约1.1% |

热门出发站点主要集中在芝加哥的旅游景区、核心商业区以及高密度住宅区。Streeter Dr & Grand Ave站点位于海军港区,靠近谢德水族馆和阿德勒天文馆等热门景点,因此使用率最高。Michigan Ave作为芝加哥的"壮丽大道",沿线的站点同样备受青睐。千禧公园区域以其文化地标地位,吸引了大量骑行出行的游客和市民。

## 数据优势

| 优势特征 | 具体表现 | 应用价值 |
|---------|---------|---------|
| 全年连续覆盖 | 四个季度完整记录,无数据断层 | 支持季节性分析和年度趋势研究 |
| 大规模样本量 | 约380万条出行记录 | 为机器学习模型提供充足训练数据 |
| 丰富的属性维度 | 包含时间、空间、用户属性等多维度信息 | 支持多角度、深层次的数据分析 |
| 站点信息完整 | 数百个站点的编号和名称完整记录 | 便于进行地理空间分析和站点网络研究 |
| 用户画像数据 | 包含用户类型、性别、年龄等属性 | 支持用户群体细分和行为画像构建 |
| 骑行时长精确记录 | 以秒为单位的精准时长数据 | 可用于出行时间预测和效率分析 |
| 时间戳精确到秒 | 记录完整的开始和结束时间 | 支持通勤规律和出行模式挖掘 |
| 数据格式标准化 | CSV格式,结构清晰 | 便于导入各类数据分析工具进行处理 |
| 地理覆盖广泛 | 覆盖芝加哥全市主要区域 | 支持城市空间结构和交通网络研究 |
| 季度对比分析可行 | Q1-Q4数据可比性强 | 支持季节性差异和趋势分析 |

## 数据样例

以下是来自数据集的多样化出行记录样例,涵盖不同用户类型、时间段、骑行时长和站点组合:

样例1:订阅用户日常工作通勤
trip_id: 21742443
start_time: 2019-01-01 00:04:37
end_time: 2019-01-01 00:11:07
bikeid: 2167
tripduration: 390秒(约6.5分钟)
from_station: Wabash Ave & Grand Ave
to_station: Milwaukee Ave & Grand Ave
usertype: Subscriber
gender: Male
birthyear: 1989
样例2:订阅用户周末休闲骑行
trip_id: 21743898
start_time: 2019-01-01 17:21:18
end_time: 2019-01-01 17:39:56
bikeid: 1948
tripduration: 1118秒(约18.6分钟)
from_station: Southport Ave & Roscoe St
to_station: Lincoln Ave & Roscoe St
usertype: Subscriber
gender: Female
birthyear: 1987
样例3:临时用户景点观光
trip_id: 21743905
start_time: 2019-01-01 17:22:33
end_time: 2019-01-01 17:53:07
bikeid: 5553
tripduration: 1834秒(约30.6分钟)
from_station: State St & Van Buren St
to_station: Michigan Ave & Lake St
usertype: Customer
gender: 空值
birthyear: 空值
样例4:早晨通勤高峰骑行
trip_id: 21860006
start_time: 2019-01-27 07:12:56
end_time: 2019-01-27 07:24:36
bikeid: 342
tripduration: 700秒(约11.7分钟)
from_station: McClurg Ct & Illinois St
to_station: Clark St & Schiller St
usertype: Subscriber
gender: Male
birthyear: 1972
样例5:午后休闲购物骑行
trip_id: 23479394
start_time: 2019-07-01 00:02:24
end_time: 2019-07-01 00:23:12
bikeid: 3770
tripduration: 1248秒(约20.8分钟)
from_station: Michigan Ave & 14th St
to_station: McCormick Place
usertype: Customer
gender: 空值
birthyear: 空值
样例6:傍晚下班通勤
trip_id: 21754473
start_time: 2019-01-03 18:07:36
end_time: 2019-01-03 18:15:47
bikeid: 5245
tripduration: 491秒(约8.2分钟)
from_station: Fairbanks Ct & Grand Ave
to_station: Canal St & Taylor St
usertype: Subscriber
gender: Male
birthyear: 1982
样例7:凌晨短途骑行
trip_id: 21744000
start_time: 2019-01-01 18:25:25
end_time: 2019-01-01 18:37:13
bikeid: 5344
tripduration: 708秒(约11.8分钟)
from_station: Hermitage Ave & Polk St
to_station: Peoria St & Jackson Blvd
usertype: Subscriber
gender: Female
birthyear: 1992
样例8:大学区域骑行
trip_id: 21860145
start_time: 2019-01-27 10:27:28
end_time: 2019-01-27 10:34:04
bikeid: 305
tripduration: 396秒(约6.6分钟)
from_station: Lake Park Ave & 56th St
to_station: University Ave & 57th St
usertype: Subscriber
gender: Male
birthyear: 1982
样例9:湖滨区域休闲骑行
trip_id: 23479396
start_time: 2019-07-01 00:02:34
end_time: 2019-07-01 00:28:57
bikeid: 2957
tripduration: 1583秒(约26.4分钟)
from_station: Michigan Ave & Washington St
to_station: Columbus Dr & Randolph St
usertype: Customer
gender: 空值
birthyear: 空值
样例10:长时间休闲骑行
trip_id: 21744005
start_time: 2019-01-01 18:28:51
end_time: 2019-01-01 20:40:33
bikeid: 5100
tripduration: 7902秒(约131.7分钟)
from_station: Millennium Park
to_station: Dearborn St & Adams St
usertype: Customer
gender: 空值
birthyear: 空值

以上样例展示了数据集的多样性特征,包括不同用户类型(订阅用户与临时用户)、不同时段(凌晨至深夜)、不同骑行时长(从几分钟到超过两小时)、不同区域(市中心、居民区、大学区、湖滨区)以及不同的出行目的(通勤、观光、休闲购物等)。

## 应用场景

### 城市交通规划与基础设施优化

该数据集为城市交通规划部门提供了详尽的共享单车使用信息,可用于优化城市慢行交通系统布局。通过分析各站点的使用频率和时空分布特征,规划部门可以识别出需求旺盛但设施不足的区域,进而规划新增站点或扩充现有站点容量。数据集中的骑行路线信息(起止站点对)可用于分析城市主要骑行廊道,为建设专用自行车道提供数据支撑。结合芝加哥城市用地规划和人口分布数据,可进一步研究共享单车与公共交通系统的衔接效率,提出改善"最后一公里"出行体验的具体方案。

### 用户出行行为分析与预测

基于约380万条出行记录,研究人员可以深入分析芝加哥市民的出行行为模式。通过挖掘不同用户群体的出行特征,如通勤时间偏好、骑行距离范围、热门路线等,可构建精准的用户画像。季节性分析显示,夏季月份骑行量显著高于冬季,这一规律可用于预测未来各时期的出行需求波动。基于历史数据的机器学习模型可应用于短期骑行需求预测,帮助运营方提前进行车辆调度和人力配置。进一步地,通过分析站点的"借出-归还"平衡性,可优化站点间的车辆流转策略,减少热门站点车辆短缺或冷门站点车辆堆积的问题。

### 城市空间结构与活力研究

共享单车出行数据是研究城市空间结构的重要窗口。起止站点的分布特征可以反映不同区域的功能定位,如商业区、居住区、旅游景区等的空间格局。通过分析站点间的骑行联系强度,可识别城市中的主要活动集聚区和次级中心。数据集中覆盖的全年时间维度,使得研究城市空间随时间变化的动态特征成为可能,例如工作日与周末的空间活力差异、节假日对特定区域的影响等。这些研究成果可为城市更新改造、商业选址决策、文化设施布局等提供数据驱动的参考。

### 公共健康与体育运动研究

共享单车骑行作为一种低碳出行方式和体育运动形式,对于城市公共健康具有积极意义。该数据集可用于评估芝加哥市民通过共享单车进行体育锻炼的水平,分析不同人群的骑行运动强度和频率。结合用户年龄、性别等属性信息,可研究共享单车使用与公共健康的关联关系,为制定鼓励骑行出行的健康政策提供依据。数据集中的骑行时长数据可直接用于计算骑行运动量,为公共卫生研究提供客观的量化指标。长期跟踪分析还可评估共享单车系统对城市肥胖率、心血管健康等指标的影响。

### 旅游景区管理与游客行为分析

芝加哥作为著名旅游城市,共享单车是游客探索城市的重要工具。数据集中包含大量往返于旅游景区的骑行记录,如海军港区、千禧公园、密歇根大道等。通过分析游客的骑行起点分布、目的地选择、停留时间等特征,景区管理部门可以优化周边交通组织和配套服务。识别游客的热门骑行路线可为开发城市骑行观光产品提供参考。此外,分析临时用户与当地居民在出行模式上的差异,有助于制定更具针对性的旅游推广策略。

### 人工智能算法训练与模型开发

该数据集为机器学习和人工智能算法的研发提供了丰富的训练素材。出行时间预测模型可利用时间、天气、起点站点等特征预测骑行时长;站点需求预测模型可帮助运营方优化车辆分配;异常检测算法可识别非正常使用行为如长期占用车辆等。超过380万条记录的数据规模足以支撑深度学习模型的训练,而多维度、高质量的属性信息则为模型提供了充分的特征工程空间。研究成果可直接应用于改善共享单车系统的运营效率和服务质量。

## 结尾

芝加哥2019年Divvy共享单车出行数据集是一项宝贵城市数据资源,其核心价值体现在以下几个方面:首先,数据规模庞大且覆盖全年四季度,为系统性研究提供了坚实的素材基础;其次,数据维度丰富,涵盖时间、空间、用户属性等多方面信息,支持多角度的深度分析;第三,数据质量较高,字段完整、格式规范,便于各类数据分析工具的处理和应用。该数据集的可应用性广泛,从城市交通规划到用户行为研究,从公共健康评估到人工智能算法开发,均可从中获得有价值的研究成果和实践启示。

该数据集为城市共享交通领域的研究者和从业者提供了难得的学习和研究机会,基于这些真实、高质量的数据,可以产生具有实际应用价值的研究成果,为创建更加高效、便捷、可持续的城市共享交通系统贡献力量。如有进一步的数据需求或研究合作意向,可通过适当渠道获取更多信息。

看了又看

数据加载中

验证报告

以下为卖家选择提供的数据验证报告:

data icon
芝加哥2019年Divvy共享单车出行数据集-380万条记录覆盖全年四季
19.9
已售 0
501.33MB
申请报告