数据描述
芝加哥犯罪数据集:22年城市安全态势的全景记录
芝加哥作为美国第三大城市,其犯罪数据对于城市安全研究、公共政策制定、犯罪预测模型训练具有重要价值。这份涵盖2001年至2023年的芝加哥犯罪数据集,包含了超过784万条犯罪记录,是研究城市犯罪模式、时间趋势和地理分布的宝贵资源。数据集不仅记录了犯罪的基本信息,如类型、时间、地点,还包含了详细的地理坐标、逮捕情况、家庭暴力标识等多维度数据,为研究者和政策制定者提供了全面了解城市安全态势的基础。
数据基本信息
字段说明表格
| 字段名称 | 字段类型 | 字段含义 | 数据示例 | 完整性 |
|---|---|---|---|---|
| ID | 数值型 | 记录唯一标识符 | 11646166 | 100.00% |
| Case Number | 文本型 | 案件编号 | JC213529 | 100.00% |
| Date | 日期时间型 | 犯罪发生时间 | 09/01/2018 12:01:00 AM | 100.00% |
| Block | 文本型 | 犯罪发生街区 | 082XX S INGLESIDE AVE | 100.00% |
| IUCR | 文本型 | 伊利诺伊州统一犯罪报告代码 | 0810 | 100.00% |
| Primary Type | 文本型 | 犯罪主要类型 | THEFT | 100.00% |
| Description | 文本型 | 犯罪详细描述 | OVER $500 | 100.00% |
| Location Description | 文本型 | 犯罪发生地点描述 | RESIDENCE | 99.86% |
| Arrest | 布尔型 | 是否逮捕 | False | 100.00% |
| Domestic | 布尔型 | 是否家庭暴力 | True | 100.00% |
| Beat | 数值型 | 警察巡逻区 | 631 | 100.00% |
| District | 数值型 | 警察分局 | 6 | 100.00% |
| Ward | 数值型 | 市议员选区 | 8 | 92.16% |
| Community Area | 数值型 | 社区区域 | 44 | 92.18% |
| FBI Code | 文本型 | FBI犯罪分类代码 | 06 | 100.00% |
| X Coordinate | 数值型 | 犯罪地点X坐标 | 1184667.0 | 98.88% |
| Y Coordinate | 数值型 | 犯罪地点Y坐标 | 1875669.0 | 98.88% |
| Year | 数值型 | 犯罪发生年份 | 2018 | 100.00% |
| Updated On | 日期时间型 | 记录更新时间 | 04/06/2019 04:04:43 PM | 100.00% |
| Latitude | 数值型 | 犯罪地点纬度 | 41.81399924 | 98.88% |
| Longitude | 数值型 | 犯罪地点经度 | -87.598137918 | 98.88% |
| Location | 文本型 | 犯罪地点经纬度 | (41.81399924, -87.598137918) | 98.88% |
数据分布情况表格
时间/年份分布
| 年份 | 记录数量 | 占比 | 累计占比 |
|---|---|---|---|
| 2001 | 485,885 | 6.20% | 6.20% |
| 2002 | 486,805 | 6.21% | 12.40% |
| 2003 | 475,983 | 6.07% | 18.47% |
| 2004 | 469,421 | 5.99% | 24.46% |
| 2005 | 453,772 | 5.79% | 30.24% |
| 2006 | 448,178 | 5.71% | 35.96% |
| 2007 | 437,087 | 5.57% | 41.53% |
| 2008 | 427,169 | 5.45% | 46.98% |
| 2009 | 392,825 | 5.01% | 51.98% |
| 2010 | 370,504 | 4.72% | 56.71% |
| 2011 | 351,974 | 4.49% | 61.20% |
| 2012 | 336,273 | 4.29% | 65.48% |
| 2013 | 307,476 | 3.92% | 69.40% |
| 2014 | 275,742 | 3.52% | 72.92% |
| 2015 | 264,774 | 3.38% | 76.30% |
| 2016 | 269,807 | 3.44% | 79.74% |
| 2017 | 269,093 | 3.43% | 83.17% |
| 2018 | 268,809 | 3.43% | 86.59% |
| 2019 | 261,291 | 3.33% | 89.93% |
| 2020 | 212,166 | 2.71% | 92.63% |
| 2021 | 208,716 | 2.66% | 95.29% |
| 2022 | 238,694 | 3.04% | 98.34% |
| 2023 | 130,493 | 1.66% | 100.00% |
犯罪类型分布(前10名)
| 犯罪类型 | 记录数量 | 占比 |
|---|---|---|
| THEFT | 1,654,618 | 21.10% |
| BATTERY | 1,433,129 | 18.27% |
| CRIMINAL DAMAGE | 894,068 | 11.40% |
| NARCOTICS | 748,690 | 9.55% |
| ASSAULT | 512,441 | 6.53% |
| OTHER OFFENSE | 486,983 | 6.21% |
| BURGLARY | 426,001 | 5.43% |
| MOTOR VEHICLE THEFT | 381,815 | 4.87% |
| DECEPTIVE PRACTICE | 348,897 | 4.45% |
| ROBBERY | 294,451 | 3.75% |
犯罪地点类型分布(前10名)
| 地点类型 | 记录数量 | 占比 |
|---|---|---|
| STREET | 2,044,066 | 26.06% |
| RESIDENCE | 1,313,014 | 16.74% |
| APARTMENT | 890,253 | 11.35% |
| SIDEWALK | 731,893 | 9.33% |
| OTHER | 270,017 | 3.44% |
| PARKING LOT/GARAGE(NON.RESID.) | 202,985 | 2.59% |
| ALLEY | 174,299 | 2.22% |
| SMALL RETAIL STORE | 148,772 | 1.90% |
| SCHOOL, PUBLIC, BUILDING | 146,387 | 1.87% |
| RESIDENCE-GARAGE | 135,543 | 1.73% |
逮捕与家庭暴力情况统计
| 类别 | 记录数量 | 占比 |
|---|---|---|
| 未逮捕 | 5,801,095 | 73.97% |
| 已逮捕 | 2,041,842 | 26.03% |
| 非家庭暴力 | 6,756,304 | 86.15% |
| 家庭暴力 | 1,086,633 | 13.85% |
数据规模与类型
-
数据规模:7,842,937条记录,涵盖2001年至2023年22年时间跨度
-
数据类型:结构化数据,包含数值型、文本型、日期时间型和布尔型字段
-
覆盖领域:城市犯罪、公共安全、地理空间分析
-
地理范围:美国芝加哥市全境
数据优势
| 优势特征 | 具体表现 | 应用价值 |
|---|---|---|
| 时间跨度长 | 涵盖2001-2023年22年犯罪记录,记录了城市犯罪模式的长期变化趋势 | 支持长期犯罪趋势分析、社会经济因素与犯罪关联研究、政策干预效果评估 |
| 数据维度全面 | 包含犯罪类型、时间、地点、逮捕情况、家庭暴力标识、地理坐标等22个字段 | 支持多维度交叉分析,如犯罪类型与地点的关联、时间与犯罪率的关系、地理分布特征等 |
| 地理信息精准 | 98.88%的记录包含精确地理坐标,支持空间分析和可视化 | 可用于犯罪热点地图绘制、巡逻路线优化、资源分配决策 |
| 数据质量高 | 核心字段(如犯罪类型、时间、地点)缺失率低于1%,数据完整性好 | 确保分析结果的准确性和可靠性,提高模型训练的效果 |
| 记录数量庞大 | 超过784万条记录,样本量充足 | 支持高精度的统计分析和机器学习模型训练,提高预测准确性 |
| 分类体系完善 | 包含IUCR和FBI双重犯罪分类代码,便于跨地区比较和标准化分析 | 支持与其他城市犯罪数据的对比研究,促进犯罪学理论的验证和发展 |
数据样例
以下是数据集的20条元数据样例,涵盖了不同犯罪类型、时间和地点的多样性特征:
| ID | Case Number | Date | Block | Primary Type | Description | Location Description | Arrest | Domestic | Year | Latitude | Longitude |
|---|---|---|---|---|---|---|---|---|---|---|---|
| 11646166 | JC213529 | 09/01/2018 | 082XX S INGLESIDE AVE | THEFT | OVER $500 | RESIDENCE | False | True | 2018 | - | - |
| 11645836 | JC212333 | 05/01/2016 | 055XX S ROCKWELL ST | DECEPTIVE PRACTICE | FINANCIAL IDENTITY THEFT OVER $ 300 | - | False | False | 2016 | - | - |
| 11449702 | JB373031 | 07/31/2018 | 009XX E HYDE PARK BLVD | NARCOTICS | POSS: HEROIN(WHITE) | STREET | True | False | 2018 | - | - |
| 11643334 | JC209972 | 12/19/2018 | 056XX W WELLINGTON AVE | CRIMINAL DAMAGE | TO VEHICLE | STREET | False | False | 2018 | - | - |
| 11645527 | JC212744 | 02/02/2015 | 069XX W ARCHER AVE | DECEPTIVE PRACTICE | FINANCIAL IDENTITY THEFT OVER $ 300 | OTHER | False | False | 2015 | - | - |
| 11034701 | JA366925 | 01/01/2001 | 016XX E 86TH PL | DECEPTIVE PRACTICE | FINANCIAL IDENTITY THEFT OVER $ 300 | RESIDENCE | False | False | 2001 | - | - |
| 10224881 | HY411873 | 09/03/2015 | 044XX S UNIVERSITY AVE | CRIMINAL DAMAGE | TO PROPERTY | RESIDENCE | False | False | 2015 | 41.8140 | -87.5981 |
| 11230640 | JB152083 | 12/04/2017 | 035XX S MICHIGAN AVE | OTHER OFFENSE | SEX OFFENDER: FAIL TO REGISTER | GOVERNMENT BUILDING/PROPERTY | True | False | 2017 | - | - |
| 11645648 | JC212959 | 01/01/2018 | 024XX N MONITOR AVE | DECEPTIVE PRACTICE | FINANCIAL IDENTITY THEFT OVER $ 300 | RESIDENCE | False | False | 2018 | - | - |
| 11645959 | JC211511 | 12/20/2018 | 045XX N ALBANY AVE | OTHER OFFENSE | TELEPHONE THREAT | RESIDENCE | False | False | 2018 | - | - |
| 11645557 | JC212685 | 04/01/2018 | 080XX S VERNON AVE | DECEPTIVE PRACTICE | FINANCIAL IDENTITY THEFT OVER $ 300 | RESIDENCE | False | False | 2018 | - | - |
| 10225155 | HY412177 | 09/05/2015 | 007XX W IRVING PARK RD | PUBLIC PEACE VIOLATION | RECKLESS CONDUCT | STREET | True | False | 2015 | 41.9546 | -87.6484 |
| 11223717 | JB141803 | 02/04/2018 | 044XX W WASHINGTON BLVD | DECEPTIVE PRACTICE | FINANCIAL IDENTITY THEFT OVER $ 300 | - | False | False | 2018 | - | - |
| 11160773 | JA515078 | 11/17/2017 | 033XX W FILLMORE ST | NARCOTICS | POSS: CANNABIS MORE THAN 30GMS | POLICE FACILITY/VEH PARKING LOT | True | False | 2017 | - | - |
| 11645601 | JC212935 | 06/01/2014 | 087XX S SANGAMON ST | DECEPTIVE PRACTICE | FINANCIAL IDENTITY THEFT OVER $ 300 | RESIDENCE | False | False | 2014 | - | - |
| 10225206 | HY412253 | 09/06/2015 | 047XX S STATE ST | BATTERY | AGGRAVATED: HANDGUN | VACANT LOT/LAND | False | False | 2015 | 41.8085 | -87.6261 |
| 11646293 | JC213749 | 12/20/2018 | 023XX N LOCKWOOD AVE | DECEPTIVE PRACTICE | FINANCIAL IDENTITY THEFT $300 AND UNDER | APARTMENT | False | False | 2018 | - | - |
| 10225234 | HY412306 | 09/06/2015 | 002XX N ST LOUIS AVE | BATTERY | AGGRAVATED:KNIFE/CUTTING INSTR | SIDEWALK | False | False | 2015 | 41.8858 | -87.7136 |
| 11645833 | JC213044 | 05/05/2012 | 057XX W OHIO ST | DECEPTIVE PRACTICE | FINANCIAL IDENTITY THEFT OVER $ 300 | - | False | False | 2012 | - | - |
| 11227287 | JB147188 | 10/08/2017 | 092XX S RACINE AVE | CRIM SEXUAL ASSAULT | NON-AGGRAVATED | RESIDENCE | False | False | 2017 | - | - |
注:样本中部分记录的地理坐标为缺失状态,实际数据集中98.88%的记录包含完整地理坐标信息。
应用场景
城市安全研究与犯罪学理论验证
这份数据集为城市安全研究提供了丰富的素材。研究者可以通过分析不同犯罪类型的时间趋势,探索社会经济因素、政策变化与犯罪率之间的关系。例如,2020年犯罪率的显著下降可能与COVID-19疫情期间的社会限制措施有关,通过对比疫情前后的犯罪模式,可以验证相关理论假设。此外,数据集还支持犯罪空间分布研究,通过热点分析识别高犯罪区域,为理解犯罪的地理聚集特征提供实证依据。这些研究结果不仅可以丰富犯罪学理论,还可以为城市规划和公共安全政策提供科学支持。
犯罪预测模型训练与智能 policing
基于大数据和机器学习的犯罪预测已成为现代 policing 的重要工具。这份数据集包含的784万条记录为训练高精度预测模型提供了充足的样本。研究者可以利用时间序列分析预测未来犯罪趋势,或者基于地理空间数据开发热点预测模型,帮助警方提前部署资源。例如,通过分析历史上特定区域在特定时间的犯罪模式,可以预测未来类似条件下的犯罪风险,实现精准巡逻和预防干预。此外,数据集还可以用于开发异常检测模型,识别异常的犯罪模式,如新型犯罪手法或突发犯罪事件,提高警方的响应速度和效率。
公共政策制定与资源分配决策
政府和公共部门可以利用这份数据集制定更加科学合理的公共安全政策。通过分析不同犯罪类型的分布特征,可以针对性地制定预防措施,如在盗窃高发区域加强监控设施建设,在家庭暴力高发社区开展宣传教育活动。此外,数据集还可以用于评估现有政策的效果,如某一区域实施社区警务计划后犯罪率的变化情况。资源分配方面,警方可以根据犯罪地理分布调整巡逻力量配置,将有限的资源集中在高犯罪风险区域,提高警务效率。城市规划部门也可以利用这些数据优化城市空间布局,如在犯罪高发的公共空间增加照明设施或设计更安全的街道布局。
社区参与与犯罪预防
开放的犯罪数据可以促进社区参与和犯罪预防。社区组织可以利用这些数据了解本地区的犯罪情况,针对性地开展邻里守望、社区巡逻等预防活动。居民也可以通过分析周边的犯罪模式,提高自我保护意识,如在盗窃高发时间段加强家庭安全措施。此外,透明的犯罪数据可以增强公众对警方工作的监督,促进警民合作,共同维护社区安全。例如,社区可以根据犯罪数据与警方合作制定针对性的预防计划,提高犯罪预防的效果和可持续性。
结语
芝加哥2001-2023年犯罪数据集是一份具有重要价值的公共安全资源,其时间跨度长、数据维度全面、地理信息精准、记录数量庞大等优势使其成为城市安全研究、犯罪预测模型训练、公共政策制定和社区参与的理想数据来源。这份数据集不仅记录了芝加哥市22年的犯罪历史,也为理解城市犯罪模式、制定有效预防策略、提高公共安全水平提供了科学依据。
作为一份开放数据集,它为研究者、政策制定者、执法机构和社区组织提供了共同的基础,促进了跨领域合作和创新应用。随着数据分析技术的不断发展,这份数据集的价值将进一步凸显,为建设更安全、更宜居的城市做出更大贡献。
看了又看
验证报告
以下为卖家选择提供的数据验证报告:






