HM_1

verify-tag芝加哥2001-2023年犯罪数据全量分析:784万+条记录涵盖22年犯罪类型、地理分布与时间趋势,支持城市安全研究、犯罪预测模型训练与公共政策制定的开放数据集

10

已售 0
425.92MB

数据标识:D17682074046572152

发布时间:2026/01/12

数据描述

芝加哥2001-2023年犯罪数据全量分析:784万+条记录涵盖22年犯罪类型、地理分布与时间趋势,支持城市安全研究、犯罪预测模型训练与公共政策制定的开放数据集

芝加哥犯罪数据集:22年城市安全态势的全景记录

芝加哥作为美国第三大城市,其犯罪数据对于城市安全研究、公共政策制定、犯罪预测模型训练具有重要价值。这份涵盖2001年至2023年的芝加哥犯罪数据集,包含了超过784万条犯罪记录,是研究城市犯罪模式、时间趋势和地理分布的宝贵资源。数据集不仅记录了犯罪的基本信息,如类型、时间、地点,还包含了详细的地理坐标、逮捕情况、家庭暴力标识等多维度数据,为研究者和政策制定者提供了全面了解城市安全态势的基础。

数据基本信息

字段说明表格

字段名称 字段类型 字段含义 数据示例 完整性
ID 数值型 记录唯一标识符 11646166 100.00%
Case Number 文本型 案件编号 JC213529 100.00%
Date 日期时间型 犯罪发生时间 09/01/2018 12:01:00 AM 100.00%
Block 文本型 犯罪发生街区 082XX S INGLESIDE AVE 100.00%
IUCR 文本型 伊利诺伊州统一犯罪报告代码 0810 100.00%
Primary Type 文本型 犯罪主要类型 THEFT 100.00%
Description 文本型 犯罪详细描述 OVER $500 100.00%
Location Description 文本型 犯罪发生地点描述 RESIDENCE 99.86%
Arrest 布尔型 是否逮捕 False 100.00%
Domestic 布尔型 是否家庭暴力 True 100.00%
Beat 数值型 警察巡逻区 631 100.00%
District 数值型 警察分局 6 100.00%
Ward 数值型 市议员选区 8 92.16%
Community Area 数值型 社区区域 44 92.18%
FBI Code 文本型 FBI犯罪分类代码 06 100.00%
X Coordinate 数值型 犯罪地点X坐标 1184667.0 98.88%
Y Coordinate 数值型 犯罪地点Y坐标 1875669.0 98.88%
Year 数值型 犯罪发生年份 2018 100.00%
Updated On 日期时间型 记录更新时间 04/06/2019 04:04:43 PM 100.00%
Latitude 数值型 犯罪地点纬度 41.81399924 98.88%
Longitude 数值型 犯罪地点经度 -87.598137918 98.88%
Location 文本型 犯罪地点经纬度 (41.81399924, -87.598137918) 98.88%

数据分布情况表格

时间/年份分布

年份 记录数量 占比 累计占比
2001 485,885 6.20% 6.20%
2002 486,805 6.21% 12.40%
2003 475,983 6.07% 18.47%
2004 469,421 5.99% 24.46%
2005 453,772 5.79% 30.24%
2006 448,178 5.71% 35.96%
2007 437,087 5.57% 41.53%
2008 427,169 5.45% 46.98%
2009 392,825 5.01% 51.98%
2010 370,504 4.72% 56.71%
2011 351,974 4.49% 61.20%
2012 336,273 4.29% 65.48%
2013 307,476 3.92% 69.40%
2014 275,742 3.52% 72.92%
2015 264,774 3.38% 76.30%
2016 269,807 3.44% 79.74%
2017 269,093 3.43% 83.17%
2018 268,809 3.43% 86.59%
2019 261,291 3.33% 89.93%
2020 212,166 2.71% 92.63%
2021 208,716 2.66% 95.29%
2022 238,694 3.04% 98.34%
2023 130,493 1.66% 100.00%

犯罪类型分布(前10名)

犯罪类型 记录数量 占比
THEFT 1,654,618 21.10%
BATTERY 1,433,129 18.27%
CRIMINAL DAMAGE 894,068 11.40%
NARCOTICS 748,690 9.55%
ASSAULT 512,441 6.53%
OTHER OFFENSE 486,983 6.21%
BURGLARY 426,001 5.43%
MOTOR VEHICLE THEFT 381,815 4.87%
DECEPTIVE PRACTICE 348,897 4.45%
ROBBERY 294,451 3.75%

犯罪地点类型分布(前10名)

地点类型 记录数量 占比
STREET 2,044,066 26.06%
RESIDENCE 1,313,014 16.74%
APARTMENT 890,253 11.35%
SIDEWALK 731,893 9.33%
OTHER 270,017 3.44%
PARKING LOT/GARAGE(NON.RESID.) 202,985 2.59%
ALLEY 174,299 2.22%
SMALL RETAIL STORE 148,772 1.90%
SCHOOL, PUBLIC, BUILDING 146,387 1.87%
RESIDENCE-GARAGE 135,543 1.73%

逮捕与家庭暴力情况统计

类别 记录数量 占比
未逮捕 5,801,095 73.97%
已逮捕 2,041,842 26.03%
非家庭暴力 6,756,304 86.15%
家庭暴力 1,086,633 13.85%

数据规模与类型

  • 数据规模:7,842,937条记录,涵盖2001年至2023年22年时间跨度

  • 数据类型:结构化数据,包含数值型、文本型、日期时间型和布尔型字段

  • 覆盖领域:城市犯罪、公共安全、地理空间分析

  • 地理范围:美国芝加哥市全境

数据优势

优势特征 具体表现 应用价值
时间跨度长 涵盖2001-2023年22年犯罪记录,记录了城市犯罪模式的长期变化趋势 支持长期犯罪趋势分析、社会经济因素与犯罪关联研究、政策干预效果评估
数据维度全面 包含犯罪类型、时间、地点、逮捕情况、家庭暴力标识、地理坐标等22个字段 支持多维度交叉分析,如犯罪类型与地点的关联、时间与犯罪率的关系、地理分布特征等
地理信息精准 98.88%的记录包含精确地理坐标,支持空间分析和可视化 可用于犯罪热点地图绘制、巡逻路线优化、资源分配决策
数据质量高 核心字段(如犯罪类型、时间、地点)缺失率低于1%,数据完整性好 确保分析结果的准确性和可靠性,提高模型训练的效果
记录数量庞大 超过784万条记录,样本量充足 支持高精度的统计分析和机器学习模型训练,提高预测准确性
分类体系完善 包含IUCR和FBI双重犯罪分类代码,便于跨地区比较和标准化分析 支持与其他城市犯罪数据的对比研究,促进犯罪学理论的验证和发展

数据样例

以下是数据集的20条元数据样例,涵盖了不同犯罪类型、时间和地点的多样性特征:

ID Case Number Date Block Primary Type Description Location Description Arrest Domestic Year Latitude Longitude
11646166 JC213529 09/01/2018 082XX S INGLESIDE AVE THEFT OVER $500 RESIDENCE False True 2018 - -
11645836 JC212333 05/01/2016 055XX S ROCKWELL ST DECEPTIVE PRACTICE FINANCIAL IDENTITY THEFT OVER $ 300 - False False 2016 - -
11449702 JB373031 07/31/2018 009XX E HYDE PARK BLVD NARCOTICS POSS: HEROIN(WHITE) STREET True False 2018 - -
11643334 JC209972 12/19/2018 056XX W WELLINGTON AVE CRIMINAL DAMAGE TO VEHICLE STREET False False 2018 - -
11645527 JC212744 02/02/2015 069XX W ARCHER AVE DECEPTIVE PRACTICE FINANCIAL IDENTITY THEFT OVER $ 300 OTHER False False 2015 - -
11034701 JA366925 01/01/2001 016XX E 86TH PL DECEPTIVE PRACTICE FINANCIAL IDENTITY THEFT OVER $ 300 RESIDENCE False False 2001 - -
10224881 HY411873 09/03/2015 044XX S UNIVERSITY AVE CRIMINAL DAMAGE TO PROPERTY RESIDENCE False False 2015 41.8140 -87.5981
11230640 JB152083 12/04/2017 035XX S MICHIGAN AVE OTHER OFFENSE SEX OFFENDER: FAIL TO REGISTER GOVERNMENT BUILDING/PROPERTY True False 2017 - -
11645648 JC212959 01/01/2018 024XX N MONITOR AVE DECEPTIVE PRACTICE FINANCIAL IDENTITY THEFT OVER $ 300 RESIDENCE False False 2018 - -
11645959 JC211511 12/20/2018 045XX N ALBANY AVE OTHER OFFENSE TELEPHONE THREAT RESIDENCE False False 2018 - -
11645557 JC212685 04/01/2018 080XX S VERNON AVE DECEPTIVE PRACTICE FINANCIAL IDENTITY THEFT OVER $ 300 RESIDENCE False False 2018 - -
10225155 HY412177 09/05/2015 007XX W IRVING PARK RD PUBLIC PEACE VIOLATION RECKLESS CONDUCT STREET True False 2015 41.9546 -87.6484
11223717 JB141803 02/04/2018 044XX W WASHINGTON BLVD DECEPTIVE PRACTICE FINANCIAL IDENTITY THEFT OVER $ 300 - False False 2018 - -
11160773 JA515078 11/17/2017 033XX W FILLMORE ST NARCOTICS POSS: CANNABIS MORE THAN 30GMS POLICE FACILITY/VEH PARKING LOT True False 2017 - -
11645601 JC212935 06/01/2014 087XX S SANGAMON ST DECEPTIVE PRACTICE FINANCIAL IDENTITY THEFT OVER $ 300 RESIDENCE False False 2014 - -
10225206 HY412253 09/06/2015 047XX S STATE ST BATTERY AGGRAVATED: HANDGUN VACANT LOT/LAND False False 2015 41.8085 -87.6261
11646293 JC213749 12/20/2018 023XX N LOCKWOOD AVE DECEPTIVE PRACTICE FINANCIAL IDENTITY THEFT $300 AND UNDER APARTMENT False False 2018 - -
10225234 HY412306 09/06/2015 002XX N ST LOUIS AVE BATTERY AGGRAVATED:KNIFE/CUTTING INSTR SIDEWALK False False 2015 41.8858 -87.7136
11645833 JC213044 05/05/2012 057XX W OHIO ST DECEPTIVE PRACTICE FINANCIAL IDENTITY THEFT OVER $ 300 - False False 2012 - -
11227287 JB147188 10/08/2017 092XX S RACINE AVE CRIM SEXUAL ASSAULT NON-AGGRAVATED RESIDENCE False False 2017 - -

注:样本中部分记录的地理坐标为缺失状态,实际数据集中98.88%的记录包含完整地理坐标信息。

应用场景

城市安全研究与犯罪学理论验证

这份数据集为城市安全研究提供了丰富的素材。研究者可以通过分析不同犯罪类型的时间趋势,探索社会经济因素、政策变化与犯罪率之间的关系。例如,2020年犯罪率的显著下降可能与COVID-19疫情期间的社会限制措施有关,通过对比疫情前后的犯罪模式,可以验证相关理论假设。此外,数据集还支持犯罪空间分布研究,通过热点分析识别高犯罪区域,为理解犯罪的地理聚集特征提供实证依据。这些研究结果不仅可以丰富犯罪学理论,还可以为城市规划和公共安全政策提供科学支持。

犯罪预测模型训练与智能 policing

基于大数据和机器学习的犯罪预测已成为现代 policing 的重要工具。这份数据集包含的784万条记录为训练高精度预测模型提供了充足的样本。研究者可以利用时间序列分析预测未来犯罪趋势,或者基于地理空间数据开发热点预测模型,帮助警方提前部署资源。例如,通过分析历史上特定区域在特定时间的犯罪模式,可以预测未来类似条件下的犯罪风险,实现精准巡逻和预防干预。此外,数据集还可以用于开发异常检测模型,识别异常的犯罪模式,如新型犯罪手法或突发犯罪事件,提高警方的响应速度和效率。

公共政策制定与资源分配决策

政府和公共部门可以利用这份数据集制定更加科学合理的公共安全政策。通过分析不同犯罪类型的分布特征,可以针对性地制定预防措施,如在盗窃高发区域加强监控设施建设,在家庭暴力高发社区开展宣传教育活动。此外,数据集还可以用于评估现有政策的效果,如某一区域实施社区警务计划后犯罪率的变化情况。资源分配方面,警方可以根据犯罪地理分布调整巡逻力量配置,将有限的资源集中在高犯罪风险区域,提高警务效率。城市规划部门也可以利用这些数据优化城市空间布局,如在犯罪高发的公共空间增加照明设施或设计更安全的街道布局。

社区参与与犯罪预防

开放的犯罪数据可以促进社区参与和犯罪预防。社区组织可以利用这些数据了解本地区的犯罪情况,针对性地开展邻里守望、社区巡逻等预防活动。居民也可以通过分析周边的犯罪模式,提高自我保护意识,如在盗窃高发时间段加强家庭安全措施。此外,透明的犯罪数据可以增强公众对警方工作的监督,促进警民合作,共同维护社区安全。例如,社区可以根据犯罪数据与警方合作制定针对性的预防计划,提高犯罪预防的效果和可持续性。

结语

芝加哥2001-2023年犯罪数据集是一份具有重要价值的公共安全资源,其时间跨度长、数据维度全面、地理信息精准、记录数量庞大等优势使其成为城市安全研究、犯罪预测模型训练、公共政策制定和社区参与的理想数据来源。这份数据集不仅记录了芝加哥市22年的犯罪历史,也为理解城市犯罪模式、制定有效预防策略、提高公共安全水平提供了科学依据。

作为一份开放数据集,它为研究者、政策制定者、执法机构和社区组织提供了共同的基础,促进了跨领域合作和创新应用。随着数据分析技术的不断发展,这份数据集的价值将进一步凸显,为建设更安全、更宜居的城市做出更大贡献。

如需获取完整数据集或有进一步的合作需求,欢迎通过适当渠道联系相关机构。

看了又看

暂无推荐

验证报告

以下为卖家选择提供的数据验证报告:

data icon
芝加哥2001-2023年犯罪数据全量分析:784万+条记录涵盖22年犯罪类型、地理分布与时间趋势,支持城市安全研究、犯罪预测模型训练与公共政策制定的开放数据集
10
已售 0
425.92MB
申请报告