## 引言与背景
纽约市警察局(NYPD)历史投诉数据集是一份极具价值的犯罪记录数据资源,涵盖了2008年纽约市五个行政区的犯罪投诉信息。该数据集不仅包含完整的犯罪事件元数据,还提供了丰富的地理坐标信息、人口统计特征以及犯罪类型分类数据,为犯罪学研究、城市安全分析、警务资源优化配置等领域提供了宝贵的数据支撑。
数据集包含35个字段,涵盖投诉编号、时间信息、地点信息、犯罪类型、涉案人员特征等多个维度。完整的数据构成包括:投诉的时间范围(开始日期、开始时间、结束日期、结束时间)、犯罪地点描述(行政区、具体位置、场所类型)、犯罪分类信息(犯罪代码、犯罪描述、法律类别)、涉案人员信息(嫌疑人和受害者的年龄组、种族、性别)以及精确的地理坐标数据(经度、纬度)。这些数据对于研究犯罪模式、分析犯罪热点区域、评估警务策略效果具有重要意义。
## 数据基本信息
### 数据字段说明
| 字段名称 | 字段类型 | 字段含义 | 数据示例 | 完整性 |
| :--- | :--- | :--- | :--- | :--- |
| CMPLNT_NUM | 数值型 | 投诉编号 | 39468181 | 完整 |
| CMPLNT_FR_DT | 日期型 | 投诉开始日期 | 02/20/2008 | 完整 |
| CMPLNT_FR_TM | 时间型 | 投诉开始时间 | 07:00:00 | 完整 |
| CMPLNT_TO_DT | 日期型 | 投诉结束日期 | 02/23/2008 | 部分缺失 |
| CMPLNT_TO_TM | 时间型 | 投诉结束时间 | 08:00:00 | 部分缺失 |
| ADDR_PCT_CD | 数值型 | 辖区代码 | 88 | 完整 |
| RPT_DT | 日期型 | 报告日期 | 02/23/2008 | 完整 |
| KY_CD | 数值型 | 犯罪代码 | 107 | 完整 |
| OFNS_DESC | 文本型 | 犯罪描述 | BURGLARY | 完整 |
| PD_CD | 数值型 | 警察部门代码 | 221 | 完整 |
| PD_DESC | 文本型 | 警察部门描述 | BURGLARY,RESIDENCE,DAY | 完整 |
| CRM_ATPT_CPTD_CD | 文本型 | 犯罪完成状态 | COMPLETED | 完整 |
| LAW_CAT_CD | 文本型 | 法律类别 | FELONY | 完整 |
| BORO_NM | 文本型 | 行政区名称 | BROOKLYN | 完整 |
| LOC_OF_OCCUR_DESC | 文本型 | 发生地点描述 | INSIDE | 部分缺失 |
| PREM_TYP_DESC | 文本型 | 场所类型描述 | RESIDENCE - APT. HOUSE | 完整 |
| JURIS_DESC | 文本型 | 管辖权描述 | N.Y. POLICE DEPT | 完整 |
| JURISDICTION_CODE | 数值型 | 管辖权代码 | 0 | 完整 |
| Latitude | 数值型 | 纬度 | 40.692464 | 完整 |
| Longitude | 数值型 | 经度 | -73.972708 | 完整 |
| SUSP_AGE_GROUP | 文本型 | 嫌疑人年龄组 | <18 | 部分缺失 |
| SUSP_RACE | 文本型 | 嫌疑人种族 | BLACK | 部分缺失 |
| SUSP_SEX | 文本型 | 嫌疑人性别 | M | 部分缺失 |
| VIC_AGE_GROUP | 文本型 | 受害者年龄组 | 25-44 | 部分缺失 |
| VIC_RACE | 文本型 | 受害者种族 | WHITE | 完整 |
| VIC_SEX | 文本型 | 受害者性别 | F | 完整 |
### 法律类别分布
| 法律类别 | 记录数量 | 占比 |
| :--- | :--- | :--- |
| FELONY | 4 | 44.44% |
| MISDEMEANOR | 5 | 55.56% |
### 行政区分布
| 行政区 | 记录数量 | 占比 |
| :--- | :--- | :--- |
| BROOKLYN | 5 | 55.56% |
| MANHATTAN | 4 | 44.44% |
### 犯罪类型分布(Top 10)
| 犯罪描述 | 记录数量 | 占比 |
| :--- | :--- | :--- |
| BURGLARY | 1 | 11.11% |
| GRAND LARCENY | 1 | 11.11% |
| FELONY ASSAULT | 1 | 11.11% |
| PETIT LARCENY | 1 | 11.11% |
| ROBBERY | 1 | 11.11% |
| OFFENSES AGAINST THE PERSON | 1 | 11.11% |
| ASSAULT 3 & RELATED OFFENSES | 1 | 11.11% |
| INTOXICATED & IMPAIRED DRIVING | 1 | 11.11% |
| CRIMINAL TRESPASS | 1 | 11.11% |
### 场所类型分布
| 场所类型 | 记录数量 | 占比 |
| :--- | :--- | :--- |
| STREET | 4 | 44.44% |
| RESIDENCE - APT. HOUSE | 2 | 22.22% |
| RESIDENCE - PUBLIC HOUSING | 1 | 11.11% |
| BAR/NIGHT CLUB | 1 | 11.11% |
## 数据优势
| 优势特征 | 具体表现 | 应用价值 |
| :--- | :--- | :--- |
| 地理信息完整 | 每条记录包含精确的经纬度坐标 | 支持犯罪热点地图分析、空间分布研究 |
| 时间维度丰富 | 包含开始和结束的日期时间信息 | 支持时间序列分析、犯罪高峰期识别 |
| 人口统计信息全面 | 包含嫌疑人和受害者的年龄、种族、性别数据 | 支持人口统计学分析、犯罪关联性研究 |
| 犯罪分类详细 | 包含多种犯罪代码和描述字段 | 支持犯罪类型分析、模式识别 |
| 管辖信息明确 | 包含辖区代码、巡逻区、管辖权等信息 | 支持警务资源配置优化 |
## 数据样例
### 元数据样例
以下为数据集中的10条完整记录样例,涵盖不同犯罪类型、行政区和时间分布:
1. 编号: 39468181 | 日期: 2008-02-20 | 类型: BURGLARY | 行政区: BROOKLYN | 场所: RESIDENCE - APT. HOUSE | 法律类别: FELONY | 受害者: 25-44岁白人女性
2. 编号: 50539499 | 日期: 2008-08-21 | 类型: GRAND LARCENY | 行政区: MANHATTAN | 场所: BAR/NIGHT CLUB | 法律类别: FELONY | 受害者: 45-64岁西班牙裔女性
3. 编号: 45223390 | 日期: 2008-04-03 | 类型: FELONY ASSAULT | 行政区: BROOKLYN | 场所: RESIDENCE - PUBLIC HOUSING | 法律类别: FELONY | 受害者: 25-44岁黑人女性
4. 编号: 50594658 | 日期: 2008-08-19 | 类型: PETIT LARCENY | 行政区: MANHATTAN | 场所: STREET | 法律类别: MISDEMEANOR | 受害者: 未知
5. 编号: 44451016 | 日期: 2008-03-10 | 类型: ROBBERY | 行政区: BROOKLYN | 场所: STREET | 法律类别: FELONY | 受害者: 25-44岁黑人男性
6. 编号: 49918184 | 日期: 2008-08-08 | 类型: OFFENSES AGAINST THE PERSON | 行政区: MANHATTAN | 场所: STREET | 法律类别: MISDEMEANOR | 受害者: 未知
7. 编号: 55066472 | 日期: 2008-12-21 | 类型: ASSAULT 3 & RELATED OFFENSES | 行政区: BROOKLYN | 场所: STREET | 法律类别: MISDEMEANOR | 受害者: 25-44岁白人男性
8. 编号: 55244936 | 日期: 2008-12-27 | 类型: INTOXICATED & IMPAIRED DRIVING | 行政区: MANHATTAN | 场所: STREET | 法律类别: MISDEMEANOR | 受害者: 未知
9. 编号: 47391386 | 日期: 2008-06-19 | 类型: CRIMINAL TRESPASS | 行政区: BROOKLYN | 场所: RESIDENCE - APT. HOUSE | 法律类别: MISDEMEANOR | 受害者: 18-24岁西班牙裔女性
## 应用场景
### 犯罪热点区域分析
基于数据集中的地理坐标信息,可以进行犯罪热点区域的识别和分析。通过地理信息系统(GIS)技术,将犯罪事件映射到地图上,可以直观地展示不同区域的犯罪密度分布。这对于警务资源的合理配置具有重要指导意义,能够帮助警方在犯罪高发区域增加巡逻警力,提高犯罪预防效果。同时,犯罪热点分析也为城市规划提供参考,帮助城市管理者了解哪些区域需要加强安全设施建设。
### 犯罪时间模式研究
数据集包含详细的时间信息,可以深入分析犯罪事件的时间分布规律。通过分析不同时间段的犯罪频率,可以识别犯罪高峰期,为警务巡逻时间安排提供依据。例如,某些类型的犯罪可能在夜间高发,而其他类型的犯罪可能在白天更为常见。这种时间模式分析有助于优化警力调度,提高警务工作效率。
### 人口统计学与犯罪关联性分析
数据集中包含嫌疑人和受害者的人口统计信息,为研究犯罪与人口特征之间的关系提供了数据基础。可以分析不同年龄组、种族和性别的人群在犯罪事件中的角色分布,探讨社会经济因素与犯罪行为之间的关联。这类研究对于制定针对性的犯罪预防策略具有重要参考价值。
### 犯罪类型趋势预测
通过对历史犯罪数据的分析,可以建立犯罪类型趋势预测模型。利用机器学习算法,可以预测未来不同类型犯罪的发生概率,为警方提前部署防范措施提供支持。同时,犯罪类型分析也有助于理解犯罪模式的演变规律,为刑事政策的制定提供数据支撑。
## 结尾
NYPD历史投诉数据集是一份综合性的犯罪记录数据资源,具有广泛的研究和应用价值。数据集的核心优势在于其丰富的地理信息、详细的时间维度和全面的人口统计特征,为多维度的犯罪分析提供了坚实的数据基础。
该数据集可广泛应用于犯罪学研究、城市安全管理、警务资源优化等多个领域。通过深入分析,可以揭示犯罪模式、识别犯罪热点、预测犯罪趋势,为构建更安全的城市环境提供数据驱动的决策支持。
如需获取更多关于数据集的详细信息或完整数据文件,可私信联系获取。
看了又看
验证报告
以下为卖家选择提供的数据验证报告:






