きゅがんせん

verify-tag芝加哥交通事故全量数据集:79.5万条记录、48维度精细标注、覆盖2013-2024年的城市道路交通安全研究与智能驾驶训练数据

交通事故智能驾驶

39.9

410.64MB

数据标识:D17816874371129459

发布时间:2026/06/17

# 芝加哥交通事故全量数据集:79.5万条记录、48维度精细标注、覆盖2013-2024年的城市道路交通安全研究与智能驾驶训练数据

## 引言与背景

在全球城市化与机动化进程持续加速的背景下,道路交通安全已成为公共健康与城市治理的核心议题之一。交通事故数据不仅是交通管理部门制定政策、部署警力、优化路网的关键依据,也是智能驾驶算法、交通预测模型、风险评估研究不可或缺的基础资源。一份覆盖时间跨度长、字段维度丰富、标注质量可靠的交通事故全量数据集,对于揭示事故发生规律、识别高风险路段、评估管控措施效果、训练自动驾驶决策模型等均具有重要的科研价值与产业意义。

本数据集完整收录了美国伊利诺伊州芝加哥市2013年至2024年间共计794,956条官方交通事故记录,是目前公开领域规模最大的城市级交通事故结构化数据集之一。数据以单行记录的形式给出,每条记录包含事故唯一标识、发生时间、地点坐标、天气与光照条件、道路环境、交通控制设施、事故类型、车辆损伤等级、人员伤情等级、以及事故主要与次要诱因等48个字段。其中,字段CRASH_DATELATITUDELONGITUDELOCATION共同构成事故的时空定位信息;WEATHER_CONDITIONLIGHTING_CONDITIONROADWAY_SURFACE_CONDALIGNMENT等字段详细刻画了事故发生时的环境上下文;PRIM_CONTRIBUTORY_CAUSESEC_CONTRIBUTORY_CAUSE提供了经警察调查后标注的事故责任原因;INJURIES_FATALINJURIES_INCAPACITATINGINJURIES_NON_INCAPACITATING等字段分级记录了事故造成的人员伤害程度。对于算法研究者而言,该数据集可用于事故风险预测、诱因挖掘、时空模式识别、驾驶行为分析等任务;对于城市管理者和交通行业而言,该数据集可支撑信号灯配时优化、黑路段治理、道路设计改进、应急资源配置等实际应用。

## 数据基本信息

### 数据字段说明

本数据集共包含48个字段,涵盖事故身份标识、时间与空间、环境条件、道路与交通设施、事故类型、车辆损伤、人员伤害、责任认定等多个维度。下表列出主要字段及其统计情况(完整性 = 1 − 缺失率)。

| 字段名称 | 字段类型 | 字段含义 | 数据示例 | 完整性 |
|---|---|---|---|---|
| CRASH_RECORD_ID | 字符串 | 事故记录唯一哈希标识 | 23a79931ef555d541… | 100.00% |
| CRASH_DATE | 日期时间 | 事故发生时间(含年/月/日/时/分) | 09/05/2023 07:05:00 PM | 100.00% |
| POSTED_SPEED_LIMIT | 整数 | 事发路段限速(英里/小时) | 30 | 100.00% |
| TRAFFIC_CONTROL_DEVICE | 分类字符串 | 交通控制设施类型 | TRAFFIC SIGNAL | 100.00% |
| DEVICE_CONDITION | 分类字符串 | 控制设施工作状态 | FUNCTIONING PROPERLY | 100.00% |
| WEATHER_CONDITION | 分类字符串 | 事发时天气状况 | CLEAR | 100.00% |
| LIGHTING_CONDITION | 分类字符串 | 事发时光照条件 | DAYLIGHT | 100.00% |
| FIRST_CRASH_TYPE | 分类字符串 | 首要碰撞类型 | REAR END | 100.00% |
| TRAFFICWAY_TYPE | 分类字符串 | 道路类型/路口形式 | FIVE POINT, OR MORE | 100.00% |
| LANE_CNT | 浮点数 | 事发路段车道数 | 2 | 25.04% |
| ALIGNMENT | 分类字符串 | 道路线形 | STRAIGHT AND LEVEL | 100.00% |
| ROADWAY_SURFACE_COND | 分类字符串 | 路面状况 | DRY | 100.00% |
| ROAD_DEFECT | 分类字符串 | 道路缺陷情况 | NO DEFECTS | 100.00% |
| REPORT_TYPE | 分类字符串 | 报告类型(现场/非现场/修订) | ON SCENE | 97.08% |
| CRASH_TYPE | 分类字符串 | 事故大类(无伤亡/伤亡或拖车) | NO INJURY / DRIVE AWAY | 100.00% |
| INTERSECTION_RELATED_I | 指示变量 | 是否与路口相关 | Y | 22.97% |
| HIT_AND_RUN_I | 指示变量 | 是否为肇事逃逸 | Y | 31.29% |
| DAMAGE | 分类字符串 | 车辆损伤金额区间 | OVER $1,500 | 100.00% |
| DATE_POLICE_NOTIFIED | 日期时间 | 警方接报时间 | 09/05/2023 07:05:00 PM | 100.00% |
| PRIM_CONTRIBUTORY_CAUSE | 分类字符串 | 事故主要责任原因 | FOLLOWING TOO CLOSELY | 100.00% |
| SEC_CONTRIBUTORY_CAUSE | 分类字符串 | 事故次要责任原因 | NOT APPLICABLE | 100.00% |
| STREET_NO | 整数 | 门牌号 | 5500 | 100.00% |
| STREET_DIRECTION | 分类字符串 | 街道方向 | S | 99.99% |
| STREET_NAME | 字符串 | 街道名称 | WENTWORTH AVE | 99.99% |
| BEAT_OF_OCCURRENCE | 浮点数 | 事发所属警务辖区 | 225 | 99.99% |
| WORK_ZONE_I / WORKERS_PRESENT_I 等 | 指示变量 | 施工区域相关信息 | Y/N | <5% |
| NUM_UNITS | 整数 | 涉及车辆/单元数 | 2 | 100.00% |
| MOST_SEVERE_INJURY | 分类字符串 | 最严重伤情等级 | INCAPACITATING INJURY | 99.78% |
| INJURIES_TOTAL | 浮点数 | 总受伤人数 | 3 | 99.78% |
| INJURIES_FATAL | 浮点数 | 死亡人数 | 0 | 99.78% |
| INJURIES_INCAPACITATING | 浮点数 | 重伤(丧失劳动能力)人数 | 1 | 99.78% |
| INJURIES_NON_INCAPACITATING | 浮点数 | 轻伤人数 | 2 | 99.78% |
| INJURIES_REPORTED_NOT_EVIDENT | 浮点数 | 报告但无明显伤情人数 | 0 | 99.78% |
| INJURIES_NO_INDICATION | 浮点数 | 无伤情指示人数 | 2 | 99.78% |
| CRASH_HOUR | 整数 | 事故发生小时(0-23) | 19 | 100.00% |
| CRASH_DAY_OF_WEEK | 整数 | 事故发生星期(1-7) | 3 | 100.00% |
| CRASH_MONTH | 整数 | 事故发生月份(1-12) | 9 | 100.00% |
| LATITUDE | 浮点数 | 纬度 | 41.854120 | 99.32% |
| LONGITUDE | 浮点数 | 经度 | -87.665902 | 99.32% |
| LOCATION | 字符串 | 地理坐标 WKT 表达 | POINT (-87.6659 41.8541) | 99.32% |

注:部分字段如 CRASH_DATE_EST_IPHOTOS_TAKEN_ISTATEMENTS_TAKEN_IDOORING_IWORK_ZONE_IWORK_ZONE_TYPEWORKERS_PRESENT_I 等在本数据集中大量缺失(缺失率普遍高于95%),通常表明该信息未被采集或对多数事故不适用,使用时需根据具体任务谨慎选择。

### 数据规模与格式

- 数据规模:总计 794,956 条事故记录
- 字段数量48 个字段
- 数据格式:单行 CSV(逗号分隔、双引号包裹字符串),文件体积约 200+ MB
- 时间跨度:2013 年 1 月 至 2024 年 12 月(共 12 年)
- 地理覆盖:美国伊利诺伊州芝加哥市全域(纬度约 41.64° – 42.02° N,经度约 87.52° – 87.94° W)
- 标注来源:芝加哥警察局(Chicago Police Department)官方事故报告
- 标注类型:结构化人工标注(天气、光照、事故类型、责任原因、伤情等级等均为人工核查后录入)

### 时间分布

| 年份 | 记录数量 | 占比 | 累计占比 |
|---|---:|---:|---:|
| 2013 | 2 | 0.00% | 0.00% |
| 2014 | 6 | 0.00% | 0.00% |
| 2015 | 9,829 | 1.24% | 1.24% |
| 2016 | 44,297 | 5.57% | 6.81% |
| 2017 | 83,786 | 10.54% | 17.35% |
| 2018 | 118,950 | 14.96% | 32.31% |
| 2019 | 117,762 | 14.81% | 47.12% |
| 2020 | 92,092 | 11.58% | 58.70% |
| 2021 | 108,763 | 13.68% | 72.38% |
| 2022 | 108,401 | 13.64% | 86.02% |
| 2023 | 110,560 | 13.91% | 99.93% |
| 2024 | 508 | 0.06% | 100.00% |

可以看到,数据自 2015 年起稳定在每年约 9 万至 12 万条的水平;2020 年因疫情导致出行量下降,事故数有明显回落;2024 年仅包含少量新增记录,属于未完整年度。

### 天气条件分布

| 天气状况 | 记录数量 | 占比 |
|---|---:|---:|
| CLEAR(晴朗) | 624,964 | 78.62% |
| RAIN(雨) | 69,694 | 8.77% |
| UNKNOWN(未知) | 43,295 | 5.45% |
| SNOW(雪) | 26,895 | 3.38% |
| CLOUDY/OVERCAST(阴) | 23,458 | 2.95% |
| FREEZING RAIN/DRIZZLE(冻雨/毛毛雨) | 1,453 | 0.18% |
| FOG/SMOKE/HAZE(雾/烟/霾) | 1,222 | 0.15% |
| SLEET/HAIL(雨夹雪/冰雹) | 948 | 0.12% |
| 其他(含 BLOWING SNOW、SAND 等) | 560 | 0.07% |
| 合计 | 794,956 | ≈100% |

### 光照条件分布

| 光照状况 | 记录数量 | 占比 |
|---|---:|---:|
| DAYLIGHT(白昼) | 509,963 | 64.15% |
| DARKNESS, LIGHTED ROAD(夜晚·有照明) | 174,983 | 22.01% |
| DARKNESS(夜晚·无照明) | 37,880 | 4.77% |
| UNKNOWN(未知) | 35,910 | 4.52% |
| DUSK(黄昏) | 22,943 | 2.89% |
| DAWN(黎明) | 13,277 | 1.67% |

### 事故严重程度分布

| 最严重伤情等级 | 记录数量 | 占比 |
|---|---:|---:|
| NO INDICATION OF INJURY(无伤害) | 684,101 | 86.06% |
| NONINCAPACITATING INJURY(轻伤) | 61,651 | 7.76% |
| REPORTED, NOT EVIDENT(报告但无明显伤情) | 33,062 | 4.16% |
| INCAPACITATING INJURY(重伤) | 13,514 | 1.70% |
| FATAL(致命) | 876 | 0.11% |

全量数据共记录 876 起致命事故13,646 起重伤事故684,101 起无明显伤害事故,其余为轻伤或报告性伤情。

### 首要碰撞类型分布

| 首要碰撞类型 | 记录数量 | 占比 |
|---|---:|---:|
| PARKED MOTOR VEHICLE(撞停放车辆) | 184,857 | 23.25% |
| REAR END(追尾) | 178,290 | 22.43% |
| SIDESWIPE SAME DIRECTION(同向擦撞) | 121,183 | 15.24% |
| TURNING(转弯事故) | 113,433 | 14.27% |
| ANGLE(角度碰撞) | 86,324 | 10.86% |
| FIXED OBJECT(固定物碰撞) | 37,331 | 4.70% |
| PEDESTRIAN(行人事故) | 18,406 | 2.32% |
| PEDALCYCLIST(骑行者事故) | 12,085 | 1.52% |
| 其他(含 HEAD ON、OVERTURNED、TRAIN 等) | 45,051 | 5.65% |

### 事故主要责任原因分布(Top 10)

| 主要责任原因 | 记录数量 | 占比 |
|---|---:|---:|
| UNABLE TO DETERMINE(无法判定) | 308,842 | 38.85% |
| FAILING TO YIELD RIGHT-OF-WAY(未按规定让行) | 87,251 | 10.98% |
| FOLLOWING TOO CLOSELY(跟车过近) | 77,622 | 9.76% |
| NOT APPLICABLE(不适用) | 42,111 | 5.30% |
| IMPROPER OVERTAKING/PASSING(不当超车) | 39,122 | 4.92% |
| FAILING TO REDUCE SPEED TO AVOID CRASH(未减速避让) | 33,626 | 4.23% |
| IMPROPER BACKING(不当倒车) | 31,430 | 3.95% |
| IMPROPER LANE USAGE(不当车道使用) | 28,577 | 3.59% |
| DRIVING SKILLS/KNOWLEDGE/EXPERIENCE(驾驶技能/经验欠缺) | 26,505 | 3.33% |
| IMPROPER TURNING/NO SIGNAL(不当转弯/未打灯) | 26,401 | 3.32% |

### 小时分布(事故发生时段)

| 小时 | 记录数量 | 占比 | | 小时 | 记录数量 | 占比 |
|---:|---:|---:|---|---:|---:|---:|
| 0 | 17,253 | 2.17% | | 12 | 46,676 | 5.87% |
| 1 | 14,790 | 1.86% | | 13 | 48,343 | 6.08% |
| 2 | 12,711 | 1.60% | | 14 | 53,285 | 6.70% |
| 3 | 10,340 | 1.30% | | 15 | 61,281 | 7.71% |
| 4 | 9,228 | 1.16% | | 16 | 60,794 | 7.65% |
| 5 | 10,928 | 1.37% | | 17 | 59,277 | 7.46% |
| 6 | 17,273 | 2.17% | | 18 | 48,845 | 6.14% |
| 7 | 33,470 | 4.21% | | 19 | 36,057 | 4.54% |
| 8 | 41,870 | 5.27% | | 20 | 29,027 | 3.65% |
| 9 | 36,418 | 4.58% | | 21 | 25,980 | 3.27% |
| 10 | 36,156 | 4.55% | | 22 | 23,897 | 3.01% |
| 11 | 40,333 | 5.07% | | 23 | 20,724 | 2.61% |

事故高发时段集中在下午 14 点至 17 点(16:00 前后达峰值 7.71%),凌晨 3-5 点为低谷。

### 星期分布

| 星期 | 记录数量 | 占比 |
|---:|---:|---:|
| 1(周日) | 98,727 | 12.42% |
| 2(周一) | 109,399 | 13.76% |
| 3(周二) | 113,351 | 14.26% |
| 4(周三) | 112,517 | 14.15% |
| 5(周四) | 114,038 | 14.35% |
| 6(周五) | 129,222 | 16.26% |
| 7(周六) | 117,702 | 14.81% |

周五事故数最高(16.26%),周日最低(12.42%),呈现典型的工作日通勤尾部高峰特征。

### 道路限速分布(主要档位)

| 限速(英里/小时) | 记录数量 | 占比 |
|---:|---:|---:|
| 30 | 584,923 | 73.58% |
| 35 | 53,296 | 6.70% |
| 25 | 50,243 | 6.32% |
| 20 | 33,134 | 4.17% |
| 15 | 28,212 | 3.55% |
| 10 | 18,491 | 2.33% |
| 40 | 7,606 | 0.96% |
| 45 | 5,284 | 0.66% |
| 50 | 225 | 0.03% |

芝加哥市内以 30 mph(约 48 km/h)的城区主干道限速为主导。

### 主要事故高发街道(Top 10)

| 街道名称 | 事故数量 |
|---|---:|
| WESTERN AVE | 21,668 |
| PULASKI RD | 19,153 |
| CICERO AVE | 17,834 |
| ASHLAND AVE | 17,261 |
| HALSTED ST | 15,445 |
| KEDZIE AVE | 13,802 |
| MICHIGAN AVE | 10,175 |
| NORTH AVE | 9,209 |
| STATE ST | 9,096 |
| CLARK ST | 8,530 |

### 主要事故高发警务辖区(Top 10)

| 警务辖区(Beat) | 事故数量 |
|---:|---:|
| 1834 | 9,709 |
| 114 | 8,150 |
| 813 | 7,972 |
| 815 | 7,568 |
| 1831 | 7,414 |
| 122 | 7,022 |
| 833 | 6,534 |
| 834 | 6,052 |
| 2413 | 5,952 |
| 2512 | 5,807 |

### 车辆损伤等级分布

| 损伤金额区间 | 记录数量 | 占比 |
|---|---:|---:|
| OVER $1,500(超过 1,500 美元) | 491,510 | 61.83% |
| $501 – $1,500(501–1,500 美元) | 212,188 | 26.69% |
| $500 OR LESS(500 美元或以下) | 91,258 | 11.48% |

### 报告类型分布

| 报告类型 | 记录数量 | 占比 |
|---|---:|---:|
| NOT ON SCENE (DESK REPORT)(非现场·桌面报告) | 436,322 | 54.89% |
| ON SCENE(现场报告) | 335,136 | 42.16% |
| AMENDED(修订) | 240 | 0.03% |

## 数据优势

| 优势特征 | 具体表现 | 应用价值 |
|---|---|---|
| 全量官方事故记录 | 覆盖芝加哥 2013–2024 共 12 年、79.5 万条警局官方事故数据 | 真实反映城市事故全貌,可作为城市交通安全研究的基准数据集 |
| 字段维度丰富 | 48 个字段,覆盖时空、环境、道路、设施、事故类型、责任原因、伤情、损伤等全链条 | 支持多维度交叉分析与建模,可同时开展时空分析、环境因素研究、责任判定等 |
| 高精度地理坐标 | 99.32% 记录含经纬度与 WKT 空间点 | 支持 GIS 可视化、路网定位、黑路段识别、空间聚类等空间分析任务 |
| 分级伤情标注 | 区分致命/重伤/轻伤/无伤害等多级伤情 | 可用于事故严重性建模、高危事故预警、交通安全成本估算 |
| 责任原因人工标注 | 由警方调查后录入主要与次要责任原因,共 30+ 类别 | 为事故诱因挖掘、保险责任判定、交通安全宣传提供可靠依据 |
| 时序分辨率精细 | 精确到分钟的事故时间,覆盖 24 小时、7 天、12 年 | 可开展日内/周内/年内多尺度时序分析、周期性模式识别 |
| 无图像/视频等大文件 | 本数据集为纯结构化数据(CSV),无原始媒体附件 | 便于下载、存储、分布式处理,开箱即用,无需解析多媒体文件 |
| 持续更新 | 官方长期维护,截至 2024 年仍有新增记录 | 具备时效性,可用于实时性要求较高的监控与预测任务 |

## 数据样例

本数据集为纯结构化 CSV 数据,不包含原始图像、视频或音频等二进制文件,因此以下示例以表格形式展示不同维度的字段取值样例。实际数据集中包含完整的 48 列 × 794,956 行结构化数据可供直接使用。以下选取涵盖不同年份、不同天气、不同事故类型、不同伤情等级、不同责任原因的 16 条记录,以展示数据的多样性。

### 元数据样例(核心字段节选)

| # | 事故时间 | 限速 | 天气 | 光照 | 首要碰撞类型 | 主要责任原因 | 最严重伤情 | 街道 | 小时 |
|---|---|---:|---|---|---|---|---|---|---:|
| 1 | 2023-09-05 19:05 | 30 | CLEAR | DUSK | ANGLE | UNABLE TO DETERMINE | INCAPACITATING INJURY | WENTWORTH AVE | 19 |
| 2 | 2023-09-22 18:45 | 50 | CLEAR | DARKNESS, LIGHTED ROAD | REAR END | FOLLOWING TOO CLOSELY | NO INDICATION OF INJURY | CHICAGO SKYWAY OB | 18 |
| 3 | 2023-07-29 14:45 | 30 | CLEAR | DAYLIGHT | PARKED MOTOR VEHICLE | FAILING TO REDUCE SPEED | NO INDICATION OF INJURY | ASHLAND AVE | 14 |
| 4 | 2023-08-09 23:00 | 30 | CLEAR | DARKNESS, LIGHTED ROAD | SIDESWIPE SAME DIRECTION | FAILING TO YIELD RIGHT-OF-WAY | NO INDICATION OF INJURY | BALMORAL AVE | 23 |
| 5 | 2023-08-18 12:50 | 15 | CLEAR | DAYLIGHT | REAR END | FOLLOWING TOO CLOSELY | NONINCAPACITATING INJURY | OHARE ST | 12 |
| 6 | 2019-11-26 08:38 | 25 | CLEAR | DAYLIGHT | PEDESTRIAN | UNABLE TO DETERMINE | FATAL | TERMINAL ST | 8 |
| 7 | 2023-02-06 17:30 | 30 | CLEAR | DARKNESS, LIGHTED ROAD | REAR END | UNABLE TO DETERMINE | NO INDICATION OF INJURY | TERMINAL ST | 17 |
| 8 | 2022-01-31 19:45 | 25 | CLEAR | DARKNESS | REAR END | NOT APPLICABLE | NO INDICATION OF INJURY | GLADYS AVE | 19 |
| 9 | 2022-01-01 16:32 | 10 | SNOW | DARKNESS, LIGHTED ROAD | ANGLE | WEATHER | NO INDICATION OF INJURY | PARKING LOT E ST | 16 |
| 10 | 2020-10-18 15:58 | 35 | RAIN | DAYLIGHT | FIXED OBJECT | WEATHER | NO INDICATION OF INJURY | 89TH ST | 15 |
| 11 | 2023-07-29 13:00 | 30 | CLEAR | DAYLIGHT | TURNING | UNABLE TO DETERMINE | NO INDICATION OF INJURY | LA SALLE DR | 13 |
| 12 | 2021-12-09 10:30 | 25 | CLEAR | DAYLIGHT | REAR END | FOLLOWING TOO CLOSELY | NO INDICATION OF INJURY | OHARE ST | 10 |
| 13 | 2023-08-13 13:30 | 35 | CLEAR | DAYLIGHT | ANGLE | IMPROPER BACKING | NO INDICATION OF INJURY | PROSPECT AVE | 13 |
| 14 | 2023-09-21 16:10 | 25 | RAIN | DAYLIGHT | REAR END | FOLLOWING TOO CLOSELY | REPORTED, NOT EVIDENT | TERMINAL ST | 16 |
| 15 | 2023-08-13 00:11 | 30 | CLEAR | DARKNESS, LIGHTED ROAD | TURNING | IMPROPER TURNING/NO SIGNAL | NO INDICATION OF INJURY | WENTWORTH AVE | 0 |
| 16 | 2018-05-24 21:20 | 30 | CLOUDY/OVERCAST | DARKNESS, LIGHTED ROAD | SIDESWIPE SAME DIRECTION | IMPROPER LANE USAGE | NO INDICATION OF INJURY | WESTERN AVE | 21 |

### 字段取值示例(单条记录的完整列)

text
CRASH_RECORD_ID          23a79931ef555d54118f64dc9be2cf2dbf59636ce253f7a1179c4a1c091442a6eeab…
CRASH_DATE               09/05/2023 07:05:00 PM
POSTED_SPEED_LIMIT       30
TRAFFIC_CONTROL_DEVICE   TRAFFIC SIGNAL
DEVICE_CONDITION         FUNCTIONING PROPERLY
WEATHER_CONDITION        CLEAR
LIGHTING_CONDITION      DUSK
FIRST_CRASH_TYPE        ANGLE
TRAFFICWAY_TYPE         FIVE POINT, OR MORE
ROADWAY_SURFACE_COND    DRY
ROAD_DEFECT             NO DEFECTS
REPORT_TYPE             ON SCENE
CRASH_TYPE              INJURY AND / OR TOW DUE TO CRASH
DAMAGE                  OVER $1,500
PRIM_CONTRIBUTORY_CAUSE UNABLE TO DETERMINE
SEC_CONTRIBUTORY_CAUSE  NOT APPLICABLE
STREET_NO / STREET_DIRECTION / STREET_NAME   5500 / S / WENTWORTH AVE
BEAT_OF_OCCURRENCE      225
NUM_UNITS               2
MOST_SEVERE_INJURY      INCAPACITATING INJURY
INJURIES_TOTAL          3.0
INJURIES_FATAL          0.0
INJURIES_INCAPACITATING 1.0
INJURIES_NON_INCAPACITATING   2.0
INJURIES_NO_INDICATION  2.0
CRASH_HOUR              19
CRASH_DAY_OF_WEEK       3
CRASH_MONTH             9
LATITUDE / LONGITUDE    41.854120 / -87.665902
LOCATION                POINT (-87.665902342962 41.854120262952)

## 应用场景

### 一、城市道路交通安全评估与黑路段识别

基于本数据集的 79.5 万条事故记录,可以对芝加哥全市道路开展系统性的安全评估。研究者可利用 LATITUDELONGITUDESTREET_NAME 字段,将事故点叠加到城市路网上,通过核密度估计、空间聚类(如 Getis-Ord Gi* 或 DBSCAN)识别事故高发的"黑路段"与"黑区域"。结合 BEAT_OF_OCCURRENCE 可按警务辖区进行事故率横向对比,辅助资源分配。进一步地,利用 CRASH_HOURCRASH_DAY_OF_WEEKCRASH_MONTH 可分析事故的日内、周内、年内周期规律,识别事故高发时段,为交警巡逻时段安排、信号灯配时优化提供数据支撑。同时,通过 INJURIES_FATALINJURIES_INCAPACITATING 可识别高严重性事故多发路段,用于 prioritizing 道路改造项目(如加装照明、增设隔离带、优化交叉口设计),评估"安全系统(Safe System)"理念下的道路改造效果。

### 二、交通事故诱因挖掘与责任判定研究

数据集中 PRIM_CONTRIBUTORY_CAUSESEC_CONTRIBUTORY_CAUSE 字段提供了警方人工核查后的事故责任原因,共覆盖 30 余种细分类型。研究者可基于该字段开展无监督/有监督的诱因挖掘:通过关联规则或 Apriori 算法分析天气、光照、道路、车型等因素与特定事故原因(如跟车过近、未按规定让行、分心驾驶)的共现关系;通过条件推断树(ctree)或 SHAP 值分析不同因素组合对事故严重性的影响权重。此外,FIRST_CRASH_TYPE(如 REAR END、ANGLE、PEDESTRIAN)可与责任原因结合,构建可解释的事故责任判定模型,为保险行业的理赔责任认定、交通安全教育的针对性宣传提供定量依据。值得注意的是,38.85% 的事故主因为 "UNABLE TO DETERMINE",这为研究者评估"原因可识别度"对模型性能的影响提供了天然的对照样本。

### 三、事故风险预测与智能驾驶决策模型训练

本数据集的高时间分辨率(精确到分钟)与 12 年的时间跨度,使其成为事故风险预测的理想训练集。研究者可将数据按时间切分,构建基于 LSTM、Transformer 或时空图神经网络(ST-GNN)的事故风险预测模型,输入包括历史事故频率、天气、光照、节假日、交通流量(可融合外部数据源)等,输出为未来短时窗(如 15 分钟、1 小时)内特定路段的事故概率。此外,字段 WEATHER_CONDITIONLIGHTING_CONDITIONROADWAY_SURFACE_CONDALIGNMENTPOSTED_SPEED_LIMIT 等可作为条件变量,用于训练自动驾驶汽车在特定环境下的决策模型(如雨天+黄昏+湿滑路面场景下的跟车距离决策),补充智能驾驶算法在极端或长尾场景下的训练样本。由于数据覆盖 79.5 万条记录,可支持深度学习模型的大规模训练,同时通过 2013-2022 年训练、2023-2024 年测试的划分方式评估模型的时序泛化能力。

### 四、时空可视化与城市规划决策支持

利用 LATITUDELONGITUDELOCATION(WKT 格式)字段,可基于 Leaflet、Mapbox、ArcGIS 或开源的 Kepler.gl 工具构建交互性事故热力地图、时空立方体(Space-Time Cube)与动画展示。结合 STREET_NAMESTREET_DIRECTION 字段,可按街道、方向聚合事故密度,识别方向性风险(例如某方向车流事故率显著更高)。城市规划者可利用该数据评估新建道路、路口改造、公交专用道、自行车道等交通基础设施对事故率的影响(DiD 或合成控制法);交通管理部门可基于时空可视化部署动态限速、可变车道、应急响应点等管控措施。此外,结合 TRAFIC_CONTROL_DEVICE(如交通信号灯、停车标志)字段,可评估不同控制设施对事故率与事故严重性的影响,为交通工程设计提供实证依据。

### 五、行人与骑行者安全专项研究

数据集中 FIRST_CRASH_TYPE 字段单独统计了 PEDESTRIAN(行人事故 18,406 起)与 PEDALCYCLIST(骑行者事故 12,085 起)两类弱势交通参与者的事故记录。研究者可筛选出此类样本,分析其在时空上的分布特征(如学校、商圈、沿河绿道附近的高风险路段),结合 LIGHTING_CONDITION(夜间事故占比)与 WEATHER_CONDITION(雨/雪天事故占比)揭示弱势交通参与者在特定环境下的脆弱性。同时,利用 MOST_SEVERE_INJURYINJURIES_FATAL 字段,可量化行人与骑行者事故的严重性(数据中行人事故的致命率远高于整体平均水平),为推行"零伤亡(Vision Zero)"战略、优化人行横道与自行车道设计、完善夜间照明与反光设施提供科学依据。该子集也可用于训练智能驾驶系统对行人与骑行者的检测与避让算法。

### 六、自动驾驶与网联交通系统测试验证

随着 L3/L4 级自动驾驶技术逐步走向实用,真实事故数据成为自动驾驶决策系统"最后一公里"验证的关键依据。本数据集覆盖了城市道路中绝大多数典型事故场景(追尾、角度碰撞、转弯事故、行人事故等),并提供了事故发生时的限速、道路线形、天气、光照、路面状况等完整上下文。研究者可以将这些事故场景作为"场景库(Scenario Library)"注入到自动驾驶仿真平台(如 CARLA、LGSVL、百度 AADS)中,复现事故发生全过程,评估自动驾驶系统在相同场景下的避让与决策能力。同时,网联交通系统(C-V2X)研究者可结合事故的时空坐标,模拟车-路-云协同条件下事故预警的触发时机与覆盖率,评估交通信号灯、路侧单元与车载终端的协同管控效果。

### 七、交通保险与风险定价模型

保险公司可利用本数据集中的车辆损伤等级(DAMAGE)、人员伤害等级(INJURIES_FATALINJURIES_INCAPACITATING 等)、事故责任原因与碰撞类型,构建精细化的车险风险定价模型。通过对特定路段(街道、警务辖区)、特定时段(高峰/夜间)、特定环境(雨/雪/夜间无照明)的事故频率与严重性进行建模,可为不同区域、时段的车险定价提供定量依据;同时,基于责任原因字段,可分析不同责任类型(如跟车过近 vs 分心驾驶)对应的赔付分布,辅助保险公司优化理赔流程与反欺诈策略。

## 结尾

综上所述,本芝加哥交通事故全量数据集以其 79.5 万条官方事故记录、48 个结构化字段、12 年连续时间跨度、高精度地理坐标、人工分级标注 等核心特征,成为交通科学、智能驾驶、城市规划、保险精算等多学科领域的宝贵数据资源。数据集既具备宏观的时间、空间、环境覆盖性,也具备微观的伤情、责任、损伤分级标注精度,能够支持从描述性分析、归因研究到预测建模、仿真验证等多层次的研究任务。

需要说明的是,本数据集为纯结构化 CSV,不包含事故现场的图像、视频等原始多媒体文件,因此在应用于计算机视觉或多模态学习任务时需结合外部数据源。部分字段(如施工区域、照片、陈述等)缺失率较高,使用时应根据具体研究目标审慎筛选。数据中的"UNABLE TO DETERMINE"责任原因样本约占 38.85%,提示研究者在进行诱因建模时需注意未观测混杂因素的影响。

数据集以 CSV 形式分发,无需特殊申请即可用于科研与产业研究。有需要获取更多字段扩展、配套路网数据或进行定制化数据处理的研究者,可私信交流具体需求。希望本数据集能够为推动城市交通安全研究、支撑智能交通系统落地、助力"零伤亡"交通愿景的实现贡献一份力量。

看了又看

验证报告

以下为卖家选择提供的数据验证报告:

data icon
芝加哥交通事故全量数据集:79.5万条记录、48维度精细标注、覆盖2013-2024年的城市道路交通安全研究与智能驾驶训练数据
39.9
410.64MB
申请报告