# 纽约市犯罪数据集分析报告
## 引言与背景
纽约市作为全球最重要的城市之一,其犯罪数据对于城市管理、公共安全研究和社会科学分析具有极高的价值。本数据集包含了2006年至2019年间纽约市警察局记录的超过388万条逮捕记录,涵盖了犯罪类型、时间、地点、嫌疑人特征等多维度信息。这些数据不仅为研究城市犯罪模式提供了丰富的素材,也为机器学习模型训练、犯罪预测算法研发以及公共政策制定提供了坚实的数据基础。
数据集包含完整的结构化数据,包括逮捕编号、逮捕日期、犯罪描述、法律条款、嫌疑人年龄组、性别、种族、地理位置等元数据信息。这些数据来自纽约市警察局的官方记录,具有较高的权威性和准确性,是进行犯罪学研究、城市安全分析和智能警务系统开发的宝贵资源。
---
## 数据基本信息
### 字段说明
| 字段名称 | 字段类型 | 字段含义 | 数据示例 | 完整性 |
|---------|---------|---------|---------|--------|
| Unnamed: 0 | int64 | 记录索引 | 0 | 100.00% |
| arrest_key | int64 | 逮捕记录唯一标识 | 192799737 | 100.00% |
| arrest_date | object | 逮捕日期 | 2019-01-26 | 100.00% |
| pd_desc | object | 警方描述 | SEXUAL ABUSE | 100.00% |
| ofns_desc | object | 犯罪类别描述 | SEX CRIMES | 100.00% |
| law_code | object | 法律条款编码 | PL 1306503 | 100.00% |
| law_cat_cd | object | 法律类别(轻罪/重罪/违规) | F | 99.66% |
| age_group | object | 年龄组 | 45-64 | 100.00% |
| perp_sex | object | 嫌疑人性别 | M | 100.00% |
| perp_race | object | 嫌疑人种族 | BLACK | 100.00% |
| latitude | float64 | 纬度 | 40.8007 | 100.00% |
| longitude | float64 | 经度 | -73.9411 | 100.00% |
| arrest_boro | object | 逮捕行政区 | M | 100.00% |
| arrest_precinct | int64 | 警区编号 | 25 | 100.00% |
| jurisdiction_code | float64 | 管辖代码 | 0.0 | 100.00% |
| @computed_region_f5dn_yrer | float64 | 计算区域1 | 7.0 | 99.85% |
| @computed_region_yeji_bk3q | float64 | 计算区域2 | 4.0 | 99.85% |
| @computed_region_92fq_4b7q | float64 | 计算区域3 | 36.0 | 99.85% |
| @computed_region_sbqj_enih | float64 | 计算区域4 | 16.0 | 99.85% |
### 时间分布
| 年份 | 记录数量 | 占比 | 累计占比 |
|-----|---------|------|---------|
| 2006 | 287,856 | 7.42% | 7.42% |
| 2007 | 313,739 | 8.08% | 15.50% |
| 2008 | 319,502 | 8.23% | 23.73% |
| 2009 | 323,116 | 8.32% | 32.05% |
| 2010 | 323,694 | 8.34% | 40.39% |
| 2011 | 325,670 | 8.39% | 48.78% |
| 2012 | 303,697 | 7.82% | 56.60% |
| 2013 | 298,305 | 7.68% | 64.28% |
| 2014 | 304,175 | 7.84% | 72.12% |
| 2015 | 259,333 | 6.68% | 78.80% |
| 2016 | 250,745 | 6.46% | 85.26% |
| 2017 | 225,419 | 5.81% | 91.07% |
| 2018 | 184,860 | 4.76% | 95.83% |
| 2019 | 161,878 | 4.17% | 100.00% |
### 犯罪类别分布(Top 10)
| 犯罪类别 | 记录数量 | 占比 |
|---------|---------|------|
| DANGEROUS DRUGS | 835,598 | 21.52% |
| ASSAULT 3 & RELATED OFFENSES | 380,510 | 9.80% |
| OTHER OFFENSES RELATED TO THEFT | 235,898 | 6.08% |
| OTHER STATE LAWS | 187,193 | 4.82% |
| PETIT LARCENY | 162,330 | 4.18% |
| VEHICLE AND TRAFFIC LAWS | 154,971 | 3.99% |
| CRIMINAL TRESPASS | 154,807 | 3.99% |
| FELONY ASSAULT | 152,031 | 3.92% |
| DANGEROUS WEAPONS | 148,065 | 3.81% |
| MISCELLANEOUS PENAL LAW | 136,695 | 3.52% |
### 年龄组分布
| 年龄组 | 记录数量 | 占比 |
|-------|---------|------|
| 25-44 | 1,793,692 | 46.21% |
| 18-24 | 1,020,415 | 26.29% |
| 45-64 | 715,855 | 18.44% |
| <18 | 319,615 | 8.23% |
| 65+ | 32,412 | 0.83% |
### 性别分布
| 性别 | 记录数量 | 占比 |
|-----|---------|------|
| M(男) | 3,230,948 | 83.23% |
| F(女) | 651,041 | 16.77% |
### 种族分布
| 种族 | 记录数量 | 占比 |
|-----|---------|------|
| BLACK | 1,884,329 | 48.54% |
| WHITE HISPANIC | 1,009,318 | 26.00% |
| WHITE | 468,705 | 12.07% |
| BLACK HISPANIC | 312,226 | 8.04% |
| ASIAN / PACIFIC ISLANDER | 158,798 | 4.09% |
| UNKNOWN | 39,032 | 1.01% |
| AMERICAN INDIAN/ALASKAN NATIVE | 8,542 | 0.22% |
| OTHER | 1,039 | 0.03% |
### 行政区分布
| 行政区 | 记录数量 | 占比 |
|-------|---------|------|
| K(布鲁克林) | 1,078,923 | 27.80% |
| M(曼哈顿) | 1,051,074 | 27.08% |
| B(布朗克斯) | 887,621 | 22.87% |
| Q(皇后区) | 728,183 | 18.76% |
| S(史泰登岛) | 136,188 | 3.51% |
### 法律类别分布
| 法律类别 | 记录数量 | 占比 |
|---------|---------|------|
| M(轻罪) | 2,585,027 | 66.59% |
| F(重罪) | 1,036,276 | 26.70% |
| V(违规) | 227,082 | 5.85% |
| I(违规传讯) | 20,244 | 0.52% |
---
## 数据优势
| 优势特征 | 具体表现 | 应用价值 |
|---------|---------|---------|
| 数据规模庞大 | 包含超过388万条记录,覆盖14年时间跨度 | 支持大规模机器学习模型训练和长期趋势分析 |
| 完整性高 | 核心字段缺失率均低于0.5%,地理位置信息完整 | 保证分析结果的可靠性和准确性 |
| 维度丰富 | 包含时间、空间、人口统计学等多维度数据 | 支持多维度交叉分析和综合研究 |
| 地理位置精确 | 每条记录包含精确的经纬度坐标 | 支持空间分析、热点地图生成和地理信息系统应用 |
| 时间跨度长 | 覆盖2006-2019年,共14年数据 | 支持长期趋势分析和周期性模式研究 |
| 官方数据源 | 来自纽约市警察局官方记录 | 数据权威性高,适合学术研究和政策分析 |
---
## 数据样例
以下为10条代表性数据样例,展示数据集的多样性特征:
| 索引 | 逮捕日期 | 犯罪类别 | 法律类别 | 年龄组 | 性别 | 种族 | 行政区 | 警区 |
|-----|---------|---------|---------|-------|-----|-----|-------|-----|
| 0 | 2019-01-26 | SEX CRIMES | F | 45-64 | M | BLACK | M | 25 |
| 1 | 2019-02-06 | CONTROLLED SUBSTANCES OFFENSES | F | 25-44 | M | UNKNOWN | M | 14 |
| 2 | 2016-01-06 | RAPE | F | 25-44 | M | BLACK | K | 67 |
| 3 | 2018-11-15 | RAPE | F | 25-44 | M | BLACK | K | 77 |
| 4 | 2006-09-13 | CRIMINAL TRESPASS | M | 45-64 | M | BLACK | K | 77 |
| 5 | 2018-10-24 | RAPE | F | 45-64 | M | WHITE HISPANIC | M | 5 |
| 6 | 2019-04-23 | RAPE | F | 45-64 | M | BLACK HISPANIC | K | 77 |
| 7 | 2019-05-04 | SEX CRIMES | M | 25-44 | M | BLACK | B | 50 |
| 8 | 2019-05-23 | SEX CRIMES | M | 45-64 | F | BLACK | M | 26 |
| 9 | 2018-10-23 | ASSAULT 3 & RELATED OFFENSES | M | 25-44 | M | WHITE HISPANIC | M | 18 |
---
## 应用场景
### 犯罪预测与预警系统开发
该数据集可用于训练犯罪预测模型,通过分析历史犯罪数据中的时间、地点、犯罪类型等特征,预测未来犯罪发生的可能性和热点区域。这种预测能力对于警方资源优化配置、巡逻路线规划具有重要意义。例如,可以利用机器学习算法识别高犯罪风险区域,提前部署警力;或者根据时间模式预测特定时段的犯罪高发类型,采取针对性预防措施。
### 城市安全政策评估
决策者可以利用该数据集评估不同时期、不同区域的犯罪趋势,分析政策干预的效果。例如,通过对比某一区域在实施新治安措施前后的犯罪数据变化,可以量化评估政策的有效性。此外,数据集还可以帮助识别犯罪率较高的区域,为资源分配和社区安全计划提供数据支持。
### 犯罪学与社会学研究
研究人员可以利用该数据集进行深入的犯罪学研究,分析不同人口群体的犯罪模式、犯罪类型的时间分布特征、区域犯罪差异等。例如,可以研究不同年龄段、性别、种族群体在犯罪行为上的差异,为制定针对性的社会干预措施提供依据。
### 地理信息系统(GIS)分析
由于每条记录都包含精确的地理坐标,可以将犯罪数据与地理信息系统结合,生成犯罪热点地图、密度分布图等可视化产品。这些可视化工具可以帮助警方和城市管理者直观地了解犯罪空间分布特征,识别高风险区域,优化警务资源布局。
### 智能警务系统开发
该数据集可以作为智能警务系统的基础数据,支持多种应用场景,如:犯罪模式识别、异常行为检测、嫌疑人画像分析等。通过对大量历史数据的挖掘,可以发现隐藏的犯罪规律和关联模式,提升警务工作的智能化水平。
---
## 结尾
纽约市犯罪数据集是一个规模庞大、维度丰富、质量可靠的公共安全数据资源。其超过388万条记录涵盖了14年的时间跨度,包含了犯罪类型、时间、地点、嫌疑人特征等多维度信息,为犯罪学研究、政策分析和智能警务系统开发提供了坚实的数据基础。
该数据集的核心优势在于其完整性和权威性,所有数据均来自纽约市警察局的官方记录,保证了数据的可信度和准确性。同时,地理位置信息的完整性使得空间分析成为可能,为城市安全管理提供了有力的支持。
无论是学术研究、政策制定还是商业应用,该数据集都具有很高的价值。研究人员可以利用这些数据深入了解犯罪行为模式,政策制定者可以基于数据做出科学决策,技术开发者可以构建更智能的安全系统。
如需获取更多关于数据集的详细信息或进行定制化分析,欢迎私信联系。
看了又看
验证报告
以下为卖家选择提供的数据验证报告:






