# 纽约机动车碰撞事故数据集分析报告
## 引言与背景
随着城市交通的快速发展,机动车碰撞事故已成为全球范围内关注的重要公共安全问题。准确的事故数据记录与分析对于改善交通设施、优化交通管理策略、提升道路安全水平具有至关重要的意义。本报告基于纽约市提供的机动车碰撞事故数据集,该数据集涵盖了2012年至2023年间超过200万条事故记录,包含了事故发生的时间、地点、人员伤亡情况、车辆类型以及事故原因等详细信息。这些数据不仅为交通安全研究提供了丰富的实证材料,也为智能交通系统的算法训练、事故预测模型的构建以及城市交通规划的优化提供了坚实的数据基础。通过对这些数据的深入分析,我们可以揭示事故发生的规律与趋势,为减少交通事故、保障公众出行安全提供科学依据。
## 数据基本信息
### 字段说明
| 字段名称 | 字段类型 | 字段含义 | 数据示例 | 完整性(%) |
|---------|---------|---------|---------|------------|
| CRASH DATE | object | 事故发生日期 | 09/11/2021 | 100.00 |
| CRASH TIME | object | 事故发生时间 | 2:39 | 100.00 |
| BOROUGH | object | 行政区 | BROOKLYN | 68.89 |
| ZIP CODE | object | 邮政编码 | 11208 | 68.88 |
| LATITUDE | float64 | 纬度 | 40.6672 | 88.60 |
| LONGITUDE | float64 | 经度 | -73.8665 | 88.60 |
| LOCATION | object | 地理位置坐标 | (40.667202, -73.8665) | 88.60 |
| ON STREET NAME | object | 事故发生街道名称 | WHITESTONE EXPRESSWAY | 78.99 |
| CROSS STREET NAME | object | 交叉街道名称 | 20 AVENUE | 62.64 |
| OFF STREET NAME | object | 非主干道名称 | 1211 LORING AVENUE | 16.41 |
| NUMBER OF PERSONS INJURED | float64 | 受伤人数 | 2 | 100.00 |
| NUMBER OF PERSONS KILLED | float64 | 死亡人数 | 0 | 100.00 |
| NUMBER OF PEDESTRIANS INJURED | int64 | 受伤行人数量 | 0 | 100.00 |
| NUMBER OF PEDESTRIANS KILLED | int64 | 死亡行人数量 | 0 | 100.00 |
| NUMBER OF CYCLIST INJURED | int64 | 受伤骑行者数量 | 0 | 100.00 |
| NUMBER OF CYCLIST KILLED | int64 | 死亡骑行者数量 | 0 | 100.00 |
| NUMBER OF MOTORIST INJURED | int64 | 受伤驾驶者数量 | 2 | 100.00 |
| NUMBER OF MOTORIST KILLED | int64 | 死亡驾驶者数量 | 0 | 100.00 |
| CONTRIBUTING FACTOR VEHICLE 1 | object | 主要事故原因 | Aggressive Driving/Road Rage | 99.69 |
| CONTRIBUTING FACTOR VEHICLE 2 | object | 次要事故原因 | Unspecified | 84.78 |
| CONTRIBUTING FACTOR VEHICLE 3 | object | 第三事故原因 | Unspecified | 7.08 |
| CONTRIBUTING FACTOR VEHICLE 4 | object | 第四事故原因 | Unspecified | 1.59 |
| CONTRIBUTING FACTOR VEHICLE 5 | object | 第五事故原因 | Unspecified | 0.43 |
| COLLISION_ID | int64 | 事故唯一标识 | 4455765 | 100.00 |
| VEHICLE TYPE CODE 1 | object | 主要车辆类型 | Sedan | 99.38 |
| VEHICLE TYPE CODE 2 | object | 次要车辆类型 | Sedan | 81.39 |
| VEHICLE TYPE CODE 3 | object | 第三车辆类型 | Sedan | 6.84 |
| VEHICLE TYPE CODE 4 | object | 第四车辆类型 | Station Wagon/Sport Utility Vehicle | 1.53 |
| VEHICLE TYPE CODE 5 | object | 第五车辆类型 | Station Wagon/Sport Utility Vehicle | 0.42 |
## 数据分布情况
### 年份分布
| 年份 | 记录数量 | 占比(%) |
|------|---------|---------|
| 2012 | 100,545 | 5.01 |
| 2013 | 203,737 | 10.14 |
| 2014 | 206,033 | 10.26 |
| 2015 | 217,694 | 10.84 |
| 2016 | 229,831 | 11.44 |
| 2017 | 231,007 | 11.50 |
| 2018 | 231,564 | 11.53 |
| 2019 | 211,486 | 10.53 |
| 2020 | 112,915 | 5.62 |
| 2021 | 110,548 | 5.50 |
| 2022 | 103,841 | 5.17 |
| 2023 | 49,318 | 2.46 |
### 月份分布
| 月份 | 记录数量 | 占比(%) |
|------|---------|---------|
| 1 | 156,545 | 7.79 |
| 2 | 144,669 | 7.20 |
| 3 | 161,816 | 8.06 |
| 4 | 150,202 | 7.48 |
| 5 | 172,506 | 8.59 |
| 6 | 173,513 | 8.64 |
| 7 | 178,936 | 8.91 |
| 8 | 174,291 | 8.68 |
| 9 | 174,113 | 8.67 |
| 10 | 179,847 | 8.95 |
| 11 | 170,683 | 8.50 |
| 12 | 171,398 | 8.53 |
### 星期分布
| 星期 | 记录数量 | 占比(%) |
|------|---------|---------|
| Monday | 287,053 | 14.29 |
| Tuesday | 296,045 | 14.74 |
| Wednesday | 293,925 | 14.63 |
| Thursday | 300,511 | 14.96 |
| Friday | 320,392 | 15.95 |
| Saturday | 270,224 | 13.45 |
| Sunday | 240,369 | 11.97 |
### 行政区分布
| 行政区 | 记录数量 | 占比(%) |
|-------|---------|---------|
| BROOKLYN | 438,660 | 21.84 |
| QUEENS | 370,697 | 18.46 |
| MANHATTAN | 312,088 | 15.54 |
| BRONX | 204,203 | 10.17 |
| STATEN ISLAND | 58,030 | 2.89 |
### 受伤人数分布
| 受伤人数 | 记录数量 | 占比(%) |
|---------|---------|---------|
| 0 | 1,562,865 | 77.81 |
| 1 | 345,837 | 17.22 |
| 2 | 65,105 | 3.24 |
| 3 | 21,289 | 1.06 |
| 4 | 7,915 | 0.39 |
| 5 | 3,077 | 0.15 |
| 6 | 1,270 | 0.06 |
| 7 | 548 | 0.03 |
| 8 | 239 | 0.01 |
| 9 | 118 | 0.01 |
| 10 | 79 | 0.00 |
| 10+ | 159 | 0.01 |
### 死亡人数分布
| 死亡人数 | 记录数量 | 占比(%) |
|---------|---------|---------|
| 0 | 2,005,716 | 99.86 |
| 1 | 2,684 | 0.13 |
| 2 | 71 | 0.00 |
| 3 | 12 | 0.00 |
| 4 | 3 | 0.00 |
| 5 | 1 | 0.00 |
| 8 | 1 | 0.00 |
### 主要车辆类型分布(前10种)
| 车辆类型 | 记录数量 | 占比(%) |
|---------|---------|---------|
| Sedan | 546,257 | 27.20 |
| Station Wagon/Sport Utility Vehicle | 430,319 | 21.42 |
| PASSENGER VEHICLE | 416,206 | 20.72 |
| SPORT UTILITY / STATION WAGON | 180,291 | 8.98 |
| Taxi | 49,764 | 2.48 |
| 4 dr sedan | 40,157 | 2.00 |
| Pick-up Truck | 33,143 | 1.65 |
| TAXI | 31,911 | 1.59 |
| VAN | 25,266 | 1.26 |
| Box Truck | 23,281 | 1.16 |
### 主要事故原因分布(前10种)
| 事故原因 | 记录数量 | 占比(%) |
|---------|---------|---------|
| Unspecified | 690,298 | 34.37 |
| Driver Inattention/Distraction | 398,905 | 19.86 |
| Failure to Yield Right-of-Way | 118,575 | 5.90 |
| Following Too Closely | 106,828 | 5.32 |
| Backing Unsafely | 74,761 | 3.72 |
| Other Vehicular | 62,401 | 3.11 |
| Passing or Lane Usage Improper | 55,010 | 2.74 |
| Turning Improperly | 49,701 | 2.47 |
| Passing Too Closely | 49,518 | 2.47 |
| Fatigued/Drowsy | 47,337 | 2.36 |
## 数据优势
| 优势特征 | 具体表现 | 应用价值 |
|---------|---------|---------|
| 数据量大 | 包含2012-2023年超过200万条事故记录 | 为大规模数据分析和模型训练提供充足样本,提高模型的准确性和泛化能力 |
| 时间跨度长 | 涵盖12年的历史数据 | 可用于分析长期趋势和变化规律,评估交通政策和安全措施的长期效果 |
| 信息维度丰富 | 包含时间、地点、人员伤亡、车辆类型、事故原因等29个字段 | 支持多维度交叉分析,深入揭示事故发生的复杂因素和相互关系 |
| 地理位置精确 | 提供经纬度坐标和街道信息 | 可用于空间分析和可视化,识别高风险区域,优化交通设施布局 |
| 完整性高 | 核心字段(如事故日期、时间、伤亡人数等)完整性接近100% | 确保分析结果的可靠性和准确性,减少数据缺失带来的偏差 |
| 类型多样 | 包含数值型、文本型、地理空间数据等多种类型 | 支持多种分析方法和算法应用,如统计分析、机器学习、地理信息系统等 |
## 数据样例
### 元数据样例(前10条)
| CRASH DATE | CRASH TIME | BOROUGH | ZIP CODE | LATITUDE | LONGITUDE | LOCATION | ON STREET NAME | CROSS STREET NAME | OFF STREET NAME | NUMBER OF PERSONS INJURED | NUMBER OF PERSONS KILLED |
|-----------|-----------|--------|---------|---------|----------|---------|---------------|-----------------|----------------|-------------------------|-------------------------|
| 09/11/2021 | 2:39 | | | | | | WHITESTONE EXPRESSWAY | 20 AVENUE | | 2 | 0 |
| 03/26/2022 | 11:45 | | | | | | QUEENSBORO BRIDGE UPPER | | | 1 | 0 |
| 06/29/2022 | 6:55 | | | | | | THROGS NECK BRIDGE | | | 0 | 0 |
| 09/11/2021 | 9:35 | BROOKLYN | 11208 | 40.6672 | -73.8665 | (40.667202, -73.8665) | | | 1211 LORING AVENUE | 0 | 0 |
| 12/14/2021 | 8:13 | BROOKLYN | 11233 | 40.6833 | -73.9173 | (40.683304, -73.917274) | SARATOGA AVENUE | DECATUR STREET | | 0 | 0 |
| 04/14/2021 | 12:47 | | | | | | MAJOR DEEGAN EXPRESSWAY RAMP | | | 0 | 0 |
| 12/14/2021 | 17:05 | | | 40.7092 | -73.9568 | (40.709183, -73.956825) | BROOKLYN QUEENS EXPRESSWAY | | | 0 | 0 |
| 12/14/2021 | 8:17 | BRONX | 10475 | 40.8682 | -73.8315 | (40.86816, -73.83148) | | | 344 BAYCHESTER AVENUE | 2 | 0 |
| 12/14/2021 | 21:10 | BROOKLYN | 11207 | 40.6717 | -73.8971 | (40.67172, -73.8971) | | | 2047 PITKIN AVENUE | 0 | 0 |
| 12/14/2021 | 14:58 | MANHATTAN | 10017 | 40.7514 | -73.9740 | (40.75144, -73.97397) | 3 AVENUE | EAST 43 STREET | | 0 | 0 |
## 应用场景
### 交通安全研究与政策制定
该数据集为交通安全研究提供了丰富的实证材料,研究人员可以通过分析事故发生的时间、地点、原因等因素,揭示交通事故的发生规律和影响因素。例如,通过分析不同时间段(如工作日与周末、高峰时段与非高峰时段)的事故分布,可以识别高风险时段;通过分析不同行政区和街道的事故分布,可以识别高风险区域;通过分析不同车辆类型和事故原因的关系,可以识别主要风险因素。这些研究结果可以为交通管理部门制定针对性的安全政策和措施提供科学依据,如在高风险区域增设交通信号灯、在高风险时段加强巡逻、针对主要事故原因开展驾驶员教育等。
### 智能交通系统与事故预测模型
该数据集可以用于训练智能交通系统中的事故预测模型。通过机器学习算法分析历史事故数据,可以构建基于时间、天气、交通流量等因素的事故预测模型,实现对交通事故的提前预警。这些预测模型可以集成到智能交通管理系统中,帮助交通管理部门及时采取措施,如调整信号灯配时、发布交通预警信息等,从而减少事故的发生。此外,该数据集还可以用于训练自动驾驶系统中的风险评估模型,帮助自动驾驶车辆识别潜在的事故风险,提高行驶安全性。
### 城市交通规划与基础设施优化
该数据集提供的地理位置信息可以用于城市交通规划和基础设施优化。通过空间分析和可视化,可以识别事故高发区域和路段,为交通设施的布局和改进提供依据。例如,对于事故高发的交叉路口,可以考虑增设交通信号灯、人行横道、减速带等设施;对于事故高发的高速公路路段,可以考虑改进路面状况、增设防护栏、优化车道设计等。此外,该数据集还可以用于评估现有交通规划和基础设施的效果,为未来的规划和建设提供参考。
### 保险行业与风险管理
该数据集对于保险行业的风险管理具有重要价值。保险公司可以通过分析事故数据,评估不同地区、不同车型、不同驾驶员群体的事故风险,从而制定更精准的保险费率和风险管理策略。例如,对于事故高发区域的车辆,可以适当提高保险费率;对于事故风险较低的车型和驾驶员群体,可以提供优惠的保险政策。此外,保险公司还可以利用这些数据进行欺诈检测,识别异常的事故理赔申请。
### 学术研究与教育
该数据集是学术研究和教育的重要资源。高校和研究机构可以将其用于交通工程、城市规划、公共安全等学科的教学和研究,帮助学生和研究人员掌握数据分析方法和交通安全知识。此外,该数据集还可以用于开展跨学科研究,如将交通事故数据与气象数据、人口数据等结合,分析多种因素对交通事故的综合影响。
## 结尾
纽约机动车碰撞事故数据集是一份涵盖12年历史的丰富交通安全数据资源,包含超过200万条详细的事故记录和29个信息维度。该数据集具有数据量大、时间跨度长、信息维度丰富、地理位置精确等特点,为交通安全研究、智能交通系统开发、城市交通规划以及保险风险管理等领域提供了坚实的数据基础。通过对这些数据的深入分析,可以揭示交通事故的发生规律和影响因素,为减少交通事故、保障公众出行安全提供科学依据。这份数据集不仅是科研和产业应用的宝贵资源,也是推动智能交通和智慧城市发展的重要支撑。
有需要可私信获取更多信息。
看了又看
验证报告
以下为卖家选择提供的数据验证报告:






