HM

verify-tag纽约市227万+条交通事故记录数据集(2012-2025)-交通研究与安全分析必备数据资源-优化交通规划、提升道路安全、制定有效交通政策-机器学习算法训练、交通安全预测模型-深入分析城市交通事故规律

15

已售 0
455.69MB

数据标识:D17702761517263915

发布时间:2026/02/05

# 纽约市交通事故记录数据集分析报告

## 引言与背景

交通事故事件是城市交通安全管理的重要研究对象,对优化交通规划、提升道路安全、制定有效交通政策具有重要意义。本数据集包含了纽约市自2012年至2025年间的227万余条交通事故记录,涵盖了事故发生时间、地点、涉及车辆类型、事故原因、人员伤亡情况等详细信息。这些数据不仅为交通工程师、城市规划者提供了宝贵的研究素材,也为机器学习算法训练、交通安全预测模型开发提供了丰富的原始数据。数据集由两个CSV文件组成,分别是Motor_Vehicle_Collisions_Crashes.csv和NYC_Accidents.csv,合并后包含29个字段,全面记录了纽约市近十三年来的交通事故状况,为深入分析城市交通事故规律、制定针对性安全措施提供了坚实的数据基础。

## 数据基本信息

### 字段说明表

| 字段名称 | 字段类型 | 字段含义 | 数据示例 | 完整性 |
|---------|---------|---------|---------|--------|
| CRASH DATE | 日期型 | 事故发生日期 | 2021-09-11 | 100.00% |
| CRASH TIME | 时间型 | 事故发生时间 | 2:39 | 100.00% |
| BOROUGH | 文本型 | 事故发生行政区 | BROOKLYN | 69.13% |
| ZIP CODE | 文本型 | 事故发生邮政编码 | 11230 | 69.11% |
| LATITUDE | 数值型 | 事故发生纬度 | 40.62179 | 89.17% |
| LONGITUDE | 数值型 | 事故发生经度 | -73.970024 | 89.17% |
| LOCATION | 文本型 | 事故发生地理位置 | (40.62179, -73.970024) | 89.17% |
| ON STREET NAME | 文本型 | 事故发生街道名称 | WHITESTONE EXPRESSWAY | 78.17% |
| CROSS STREET NAME | 文本型 | 事故发生交叉街道名称 | 20 AVENUE | 61.34% |
| OFF STREET NAME | 文本型 | 事故发生非交叉街道名称 | 1211 LORING AVENUE | 17.76% |
| NUMBER OF PERSONS INJURED | 数值型 | 受伤人数 | 2 | 100.00% |
| NUMBER OF PERSONS KILLED | 数值型 | 死亡人数 | 0 | 100.00% |
| NUMBER OF PEDESTRIANS INJURED | 数值型 | 受伤行人数 | 0 | 100.00% |
| NUMBER OF PEDESTRIANS KILLED | 数值型 | 死亡行人数 | 0 | 100.00% |
| NUMBER OF CYCLIST INJURED | 数值型 | 受伤骑行人数 | 0 | 100.00% |
| NUMBER OF CYCLIST KILLED | 数值型 | 死亡骑行人数 | 0 | 100.00% |
| NUMBER OF MOTORIST INJURED | 数值型 | 受伤驾驶人数 | 2 | 100.00% |
| NUMBER OF MOTORIST KILLED | 数值型 | 死亡驾驶人数 | 0 | 100.00% |
| CONTRIBUTING FACTOR VEHICLE 1 | 文本型 | 主要事故原因1 | Aggressive Driving/Road Rage | 99.65% |
| CONTRIBUTING FACTOR VEHICLE 2 | 文本型 | 主要事故原因2 | Unspecified | 83.87% |
| CONTRIBUTING FACTOR VEHICLE 3 | 文本型 | 主要事故原因3 | NaN | 7.29% |
| CONTRIBUTING FACTOR VEHICLE 4 | 文本型 | 主要事故原因4 | NaN | 1.68% |
| CONTRIBUTING FACTOR VEHICLE 5 | 文本型 | 主要事故原因5 | NaN | 0.46% |
| COLLISION_ID | 数值型 | 事故唯一标识 | 4455765 | 100.00% |
| VEHICLE TYPE CODE 1 | 文本型 | 涉事车辆类型1 | Sedan | 99.28% |
| VEHICLE TYPE CODE 2 | 文本型 | 涉事车辆类型2 | Sedan | 79.81% |
| VEHICLE TYPE CODE 3 | 文本型 | 涉事车辆类型3 | NaN | 7.00% |
| VEHICLE TYPE CODE 4 | 文本型 | 涉事车辆类型4 | NaN | 1.61% |
| VEHICLE TYPE CODE 5 | 文本型 | 涉事车辆类型5 | NaN | 0.44% |

### 数据分布情况表

#### 1. 年份分布

| 年份 | 记录数量 | 占比 | 累计占比 |
|------|---------|------|---------|
| 2012 | 100545 | 4.58% | 4.58% |
| 2013 | 203742 | 9.27% | 13.85% |
| 2014 | 206046 | 9.38% | 23.23% |
| 2015 | 217704 | 9.91% | 33.14% |
| 2016 | 229831 | 10.46% | 43.60% |
| 2017 | 231007 | 10.52% | 54.12% |
| 2018 | 231564 | 10.54% | 64.66% |
| 2019 | 211486 | 9.63% | 74.29% |
| 2020 | 112917 | 5.14% | 79.43% |
| 2021 | 110557 | 5.03% | 84.46% |
| 2022 | 103886 | 4.73% | 89.19% |
| 2023 | 96606 | 4.40% | 93.59% |
| 2024 | 91303 | 4.16% | 97.75% |
| 2025 | 49560 | 2.26% | 100.01% |

#### 2. 行政区分布

| 行政区 | 记录数量 | 占比 |
|--------|---------|------|
| BROOKLYN | 503779 | 22.18% |
| QUEENS | 421807 | 18.57% |
| MANHATTAN | 344814 | 15.18% |
| BRONX | 234690 | 10.33% |
| STATEN ISLAND | 65191 | 2.87% |
| 未指定 | 701354 | 30.87% |

#### 3. 事故严重程度分布

| 受伤人数 | 记录数量 | 占比 |
|---------|---------|------|
| 0 | 1723952 | 75.89% |
| 1 | 425203 | 18.72% |
| 2 | 80019 | 3.52% |
| 3 | 26223 | 1.15% |
| 4+ | 15938 | 0.72% |

| 死亡人数 | 记录数量 | 占比 |
|---------|---------|------|
| 0 | 2268164 | 99.85% |
| 1 | 3327 | 0.15% |
| 2+ | 113 | 0.00% |

#### 4. 主要事故原因分布(前10名)

| 事故原因 | 记录数量 | 占比 |
|---------|---------|------|
| Unspecified | 756535 | 33.30% |
| Driver Inattention/Distraction | 464034 | 20.43% |
| Failure to Yield Right-of-Way | 136316 | 6.00% |
| Following Too Closely | 123177 | 5.42% |
| Backing Unsafely | 83175 | 3.66% |
| Other Vehicular | 70650 | 3.11% |
| Passing or Lane Usage Improper | 65635 | 2.89% |
| Passing Too Closely | 58353 | 2.57% |
| Turning Improperly | 55489 | 2.44% |
| Fatigued/Drowsy | 47625 | 2.10% |

#### 5. 主要车辆类型分布(前10名)

| 车辆类型 | 记录数量 | 占比 |
|---------|---------|------|
| Sedan | 665604 | 29.30% |
| Station Wagon/Sport Utility Vehicle | 522445 | 23.00% |
| PASSENGER VEHICLE | 416206 | 18.32% |
| SPORT UTILITY / STATION WAGON | 180291 | 7.94% |
| Taxi | 57903 | 2.55% |
| 4 dr sedan | 40336 | 1.78% |
| Pick-up Truck | 39503 | 1.74% |
| TAXI | 31911 | 1.40% |
| Box Truck | 27590 | 1.21% |
| VAN | 25266 | 1.11% |

#### 6. 小时分布

| 小时 | 记录数量 | 占比 |
|------|---------|------|
| 8 | 124069 | 5.46% |
| 12 | 123960 | 5.46% |
| 13 | 130171 | 5.73% |
| 14 | 150259 | 6.61% |
| 15 | 141465 | 6.23% |
| 16 | 162150 | 7.14% |
| 17 | 158721 | 6.99% |
| 18 | 139978 | 6.16% |
| 其他时段 | 1040647 | 45.80% |

## 数据优势

| 优势特征 | 具体表现 | 应用价值 |
|---------|---------|---------|
| 数据规模庞大 | 包含227万+条记录,时间跨度14年 | 支持大样本统计分析,提升模型泛化能力 |
| 字段丰富全面 | 29个字段涵盖事故时间、地点、车辆、人员伤亡等多维度信息 | 满足不同研究视角的需求,支持复杂关联分析 |
| 时间跨度长 | 从2012年到2025年,涵盖不同交通政策和外部环境变化 | 支持趋势分析,评估政策效果和外部因素影响 |
| 地理位置精确 | 包含经纬度信息,支持空间分析和热点识别 | 精确定位事故高发区域,优化交通设施布局 |
| 车辆信息详细 | 记录涉事车辆类型和数量,支持车辆安全性能分析 | 评估不同类型车辆的安全表现,指导车辆设计改进 |
| 事故原因明确 | 记录主要事故原因,支持针对性安全措施制定 | 识别关键风险因素,制定有效预防策略 |

## 数据样例

| CRASH DATE | CRASH TIME | BOROUGH | ZIP CODE | LATITUDE | LONGITUDE | LOCATION | ON STREET NAME | CROSS STREET NAME | OFF STREET NAME | NUMBER OF PERSONS INJURED | NUMBER OF PERSONS KILLED | CONTRIBUTING FACTOR VEHICLE 1 | CONTRIBUTING FACTOR VEHICLE 2 | VEHICLE TYPE CODE 1 | VEHICLE TYPE CODE 2 |
|------------|-----------|---------|---------|---------|---------|---------|---------------|-----------------|----------------|---------------------------|---------------------------|------------------------------|------------------------------|--------------------|--------------------|
| 09/11/2021 | 2:39 | NaN | NaN | NaN | NaN | NaN | WHITESTONE EXPRESSWAY | 20 AVENUE | NaN | 2 | 0 | Aggressive Driving/Road Rage | Unspecified | Sedan | Sedan |
| 03/26/2022 | 11:45 | NaN | NaN | NaN | NaN | NaN | QUEENSBORO BRIDGE UPPER | NaN | NaN | 1 | 0 | Pavement Slippery | Unspecified | Sedan | NaN |
| 11/01/2023 | 1:29 | BROOKLYN | 11230 | 40.62179 | -73.970024 | (40.62179, -73.970024) | OCEAN PARKWAY | AVENUE K | NaN | 1 | 0 | Unspecified | Unspecified | Moped | Sedan |
| 06/29/2022 | 6:55 | NaN | NaN | NaN | NaN | NaN | THROGS NECK BRIDGE | NaN | NaN | 0 | 0 | Following Too Closely | Unspecified | Sedan | Pick-up Truck |
| 09/21/2022 | 13:21 | NaN | NaN | NaN | NaN | NaN | BROOKLYN BRIDGE | NaN | NaN | 0 | 0 | Passing Too Closely | Unspecified | Station Wagon/Sport Utility Vehicle | NaN |
| 04/26/2023 | 13:30 | NaN | NaN | NaN | NaN | NaN | WEST 54 STREET | NaN | NaN | 0 | 0 | Unspecified | Unspecified | Sedan | Box Truck |
| 11/01/2023 | 7:12 | NaN | NaN | NaN | NaN | NaN | HUTCHINSON RIVER PARKWAY | NaN | NaN | 0 | 0 | Following Too Closely | Driver Inattention/Distraction | Sedan | Station Wagon/Sport Utility Vehicle |
| 11/01/2023 | 8:01 | NaN | NaN | NaN | NaN | NaN | WEST 35 STREET | HENRY HUDSON RIVER | NaN | 0 | 0 | Failure to Yield Right-of-Way | Unspecified | Sedan | NaN |
| 04/26/2023 | 22:20 | NaN | NaN | NaN | NaN | NaN | NaN | NaN | 61 Ed Koch queensborough bridge | 0 | 0 | Unspecified | Unspecified | Sedan | Pick-up Truck |
| 09/11/2021 | 9:35 | BROOKLYN | 11208 | 40.667202 | -73.8665 | (40.667202, -73.8665) | NaN | NaN | 1211 LORING AVENUE | 0 | 0 | Unspecified | Unspecified | Sedan | NaN |
| 12/14/2021 | 8:13 | BROOKLYN | 11233 | 40.683304 | -73.917274 | (40.683304, -73.917274) | SARATOGA AVENUE | DECATUR STREET | NaN | 0 | 0 | Unspecified | Unspecified | NaN | NaN |
| 04/14/2021 | 12:47 | NaN | NaN | NaN | NaN | NaN | MAJOR DEEGAN EXPRESSWAY RAMP | NaN | NaN | 0 | 0 | Unspecified | Unspecified | Dump | Sedan |
| 12/14/2021 | 17:05 | NaN | NaN | 40.709183 | -73.956825 | (40.709183, -73.956825) | BROOKLYN QUEENS EXPRESSWAY | NaN | NaN | 0 | 0 | Passing Too Closely | Unspecified | Sedan | Tractor Truck Diesel |
| 12/14/2021 | 8:17 | BRONX | 10475 | 40.86816 | -73.83148 | (40.86816, -73.83148) | NaN | NaN | 344 BAYCHESTER AVENUE | 2 | 0 | Unspecified | Unspecified | Sedan | Sedan |
| 12/14/2021 | 21:10 | BROOKLYN | 11207 | 40.67172 | -73.8971 | (40.67172, -73.8971) | NaN | NaN | 2047 PITKIN AVENUE | 0 | 0 | Driver Inexperience | Unspecified | Sedan | NaN |
| 12/14/2021 | 14:58 | MANHATTAN | 10017 | 40.75144 | -73.97397 | (40.75144, -73.97397) | 3 AVENUE | EAST 43 STREET | NaN | 0 | 0 | Passing Too Closely | Unspecified | Sedan | Station Wagon/Sport Utility Vehicle |
| 12/13/2021 | 0:34 | NaN | NaN | 40.701275 | -73.88887 | (40.701275, -73.88887) | MYRTLE AVENUE | NaN | NaN | 0 | 0 | Passing or Lane Usage Improper | Unspecified | Station Wagon/Sport Utility Vehicle | NaN |
| 12/14/2021 | 16:50 | QUEENS | 11413 | 40.675884 | -73.75577 | (40.675884, -73.75577) | SPRINGFIELD BOULEVARD | EAST GATE PLAZA | NaN | 0 | 0 | Turning Improperly | Unspecified | Sedan | Station Wagon/Sport Utility Vehicle |
| 12/14/2021 | 8:30 | NaN | NaN | NaN | NaN | NaN | broadway | west 80 street -west 81 street | NaN | 0 | 0 | Unsafe Lane Changing | Unspecified | Station Wagon/Sport Utility Vehicle | Sedan |
| 2020-08-29 | 15:40:00 | BRONX | 10466 | 40.8921 | -73.83376 | POINT (-73.83376 40.8921) | PRATT AVENUE | STRANG AVENUE | NaN | 0 | 0 | Passing Too Closely | Unspecified | Sedan | Station Wagon/Sport Utility Vehicle |

## 应用场景

### 1. 城市交通规划与优化

基于本数据集的地理位置信息和事故分布规律,可以识别纽约市交通事故高发区域和时段。通过空间分析技术,如热点地图生成,可以直观展示事故密度分布,帮助城市规划者确定需要重点关注的区域。例如,数据分析显示曼哈顿中城和布鲁克林市中心是事故高发区,这些区域可以通过增加交通信号灯、优化道路标线、设置行人安全岛等措施提升交通安全。此外,小时分布数据显示16:00-17:00是一天中事故发生率最高的时段,这为交通管理部门合理安排警力和疏导措施提供了依据。

### 2. 交通安全政策制定与评估

数据集包含了详细的事故原因和人员伤亡信息,为交通管理部门制定针对性安全政策提供了数据支持。例如,分析发现驾驶员注意力分散是导致交通事故的主要原因之一,占比超过20%,这为推广使用手机驾驶禁令和车载分心提醒系统提供了有力证据。同时,通过对比不同时间段的事故数据,可以评估现有交通政策的实施效果。例如,COVID-19疫情期间(2020年)事故数量显著下降,这为研究交通流量与事故率的关系提供了自然实验条件。

### 3. 机器学习模型训练与交通安全预测

227万+条记录的大规模数据集为机器学习模型训练提供了理想的素材。可以基于这些数据开发交通事故预测模型,预测特定时间、地点发生事故的概率。模型可以考虑多种特征,如时间、天气(可通过外部数据补充)、道路类型、车辆类型等。这样的预测模型可以帮助交通管理部门提前部署资源,采取预防措施,降低事故发生率。此外,还可以开发伤亡严重程度预测模型,为急救资源调度提供支持。

### 4. 车辆安全性能分析与改进

数据集记录了涉事车辆的类型信息,可以用于分析不同类型车辆的安全性能表现。例如,通过对比轿车、SUV、卡车等不同类型车辆在事故中的伤亡率,可以评估各类车辆的安全设计效果。这些分析结果可以反馈给汽车制造商,指导车辆安全性能改进。同时,也可以为消费者提供购车安全参考,促进市场对高安全性车辆的需求。

### 5. 保险行业风险评估与定价

保险公司可以利用本数据集进行交通事故风险评估,优化保险定价模型。通过分析不同区域、车型、驾驶员行为(通过事故原因推断)与事故发生率的关系,可以更准确地评估保险风险。例如,数据显示布鲁克林区的事故发生率高于其他区域,保险公司可以据此调整该区域的保险费率。此外,事故原因分析还可以帮助保险公司识别高风险驾驶行为,开发针对性的保险产品和风险控制措施。

## 结尾

纽约市交通事故记录数据集是一个规模庞大、内容丰富、时间跨度长的宝贵资源,为交通研究、城市规划、政策制定、机器学习等多个领域提供了重要支持。227万+条记录涵盖了2012年至2025年间纽约市的交通事故状况,包含了事故时间、地点、车辆、人员伤亡、事故原因等多维度信息。这些数据不仅可以用于识别事故高发区域和时段,制定针对性安全措施,还可以用于训练机器学习模型,预测交通事故风险。数据集的完整性和准确性为深入分析城市交通问题提供了坚实基础,对于提升城市交通安全水平、优化交通资源配置、制定有效交通政策具有重要意义。

本数据集可以直接用于科研分析和模型训练,如有需要可私信获取更多信息。使用时请注意遵守相关数据使用规定,保护个人隐私和数据安全。

看了又看

暂无推荐

验证报告

以下为卖家选择提供的数据验证报告:

data icon
纽约市227万+条交通事故记录数据集(2012-2025)-交通研究与安全分析必备数据资源-优化交通规划、提升道路安全、制定有效交通政策-机器学习算法训练、交通安全预测模型-深入分析城市交通事故规律
15
已售 0
455.69MB
申请报告