数据描述
引言与背景
COVID-19疫情对全球公共卫生系统造成了前所未有的冲击,意大利作为欧洲疫情的重灾区之一,其疫情数据具有重要的研究价值和历史意义。本数据集由意大利民事保护部(Dipartimento della Protezione Civile, DPC)提供,包含了从2020年疫情爆发初期至2025年的完整疫情监测数据,覆盖国家级、地区级和省级三个行政层级。
对于公共卫生研究人员而言,该数据集可用于分析疫情的时空传播模式、评估防控措施的效果;对于数据科学家而言,可用于训练疫情预测模型、开发可视化工具;对于政策制定者而言,可用于制定针对性的防控策略和资源分配方案。
数据基本信息
本数据集包含意大利全国范围内的COVID-19疫情监测数据,时间跨度从2020-02-24至2025-01-08,总记录数超过301,989条。数据集涵盖国家级、地区级和省级三个行政层级,并提供多种格式的数据文件以便于使用。
数据字段说明
| 字段名称 | 字段类型 | 字段含义 | 数据示例 | 完整性 |
|---|---|---|---|---|
| data | 日期时间 | 记录时间 | 2025-01-08T17:00:00 | 100% |
| stato | 字符串 | 国家代码 | ITA | 100% |
| codice_regione | 整数 | 地区代码 | 13 | 100% |
| denominazione_regione | 字符串 | 地区名称 | Abruzzo | 100% |
| codice_provincia | 整数 | 省份代码 | 66 | 99.9% |
| denominazione_provincia | 字符串 | 省份名称 | L'Aquila | 99.9% |
| sigla_provincia | 字符串 | 省份缩写 | AQ | 99.9% |
| lat | 浮点数 | 纬度 | 42.3512 | 100% |
| long | 浮点数 | 经度 | 13.3984 | 100% |
| ricoverati_con_sintomi | 整数 | 有症状住院人数 | 31 | 99.5% |
| terapia_intensiva | 整数 | 重症监护人数 | 1 | 99.5% |
| totale_ospedalizzati | 整数 | 总住院人数 | 32 | 99.5% |
| isolamento_domiciliare | 整数 | 居家隔离人数 | 2990 | 99.5% |
| totale_positivi | 整数 | 总阳性人数 | 3022 | 99.5% |
| variazione_totale_positivi | 整数 | 阳性人数变化 | 5 | 99.5% |
| nuovi_positivi | 整数 | 新增阳性人数 | 9 | 99.5% |
| dimessi_guariti | 整数 | 治愈人数 | 687170 | 99.5% |
| deceduti | 整数 | 死亡人数 | 4115 | 99.5% |
| totale_casi | 整数 | 总病例数 | 694307 | 99.5% |
| tamponi | 整数 | 检测次数 | 7756229 | 99.5% |
| codice_nuts_1 | 字符串 | NUTS1代码 | ITF | 95% |
| codice_nuts_2 | 字符串 | NUTS2代码 | ITF1 | 95% |
| codice_nuts_3 | 字符串 | NUTS3代码 | ITF11 | 95% |
数据分布情况
时间分布
| 数据层级 | 起始日期 | 结束日期 | 记录数量 | 时间跨度(天) |
|---|---|---|---|---|
| 国家级 | 2020-02-24 | 2025-01-08 | 1,781 | 超过1,700天 |
| 地区级 | 2020-02-24 | 2025-01-08 | 37,401 | 超过1,700天 |
| 省级 | 2020-02-24 | 2025-01-08 | 262,807 | 超过1,700天 |
地理分布
| 行政层级 | 覆盖数量 | 占比 |
|---|---|---|
| 地区 | 21 | 100% (覆盖意大利所有地区) |
| 省份 | 109 | 100% (覆盖意大利所有省份) |
文件格式分布
| 文件格式 | 数量 | 占比 |
|---|---|---|
| .csv | 5,356 | 72.8% |
| 1,945 | 26.4% | |
| .json | 14 | 0.2% |
| .md | 11 | 0.1% |
| .xml | 6 | 0.1% |
| .shx | 4 | 0.1% |
| .shp | 4 | 0.1% |
| .prj | 4 | 0.1% |
| .dbf | 4 | 0.1% |
| .png | 3 | 0.0% |
| 其他格式 | 3 | 0.0% |
数据优势
| 优势特征 | 具体表现 | 应用价值 |
|---|---|---|
| 时间跨度长 | 覆盖2020年至2025年,超过1,700天的连续监测数据 | 可用于分析疫情的长期趋势、季节性变化和演化规律 |
| 空间分辨率高 | 提供国家级、地区级、省级三个行政层级的数据 | 支持疫情的精细化空间分析和区域比较研究 |
| 指标全面 | 包含确诊病例、住院人数、重症人数、死亡人数、检测次数等20+核心指标 | 为疫情评估和模型构建提供丰富的变量 |
| 格式多样 | 提供CSV、JSON、GeoJSON、SHP等多种格式 | 满足不同领域用户的使用需求,便于数据导入和分析 |
| 实时更新 | 每日定时更新,确保数据的时效性 | 支持疫情的动态监测和及时响应 |
| 开放获取 | 采用CC-BY-4.0开源协议,免费开放获取 | 促进学术研究和创新应用的广泛开展 |
| 地理空间数据 | 包含GeoJSON和SHP格式的地理边界数据 | 支持疫情的空间可视化和地理信息系统(GIS)分析 |
| 数据质量高 | 由意大利民事保护部权威发布,经过严格的质量控制 | 确保研究结果的可靠性和准确性 |
数据样例
地区级数据样例
{
"data": "2020-02-24T18:00:00",
"stato": "ITA",
"codice_regione": 13,
"denominazione_regione": "Abruzzo",
"lat": 42.35122196,
"long": 13.39843823,
"ricoverati_con_sintomi": 0,
"terapia_intensiva": 0,
"totale_ospedalizzati": 0,
"isolamento_domiciliare": 0,
"totale_positivi": 0,
"variazione_totale_positivi": 0,
"nuovi_positivi": 0,
"dimessi_guariti": 0,
"deceduti": 0,
"casi_da_sospetto_diagnostico": null,
"casi_da_screening": null,
"totale_casi": 0,
"tamponi": 5,
"casi_testati": null,
"note": null,
"ingressi_terapia_intensiva": null,
"note_test": null,
"note_casi": null,
"totale_positivi_test_molecolare": null,
"totale_positivi_test_antigenico_rapido": null,
"tamponi_test_molecolare": null,
"tamponi_test_antigenico_rapido": null,
"codice_nuts_1": null,
"codice_nuts_2": null
}
省级数据样例
{
"data": "2020-02-24T18:00:00",
"stato": "ITA",
"codice_regione": 13,
"denominazione_regione": "Abruzzo",
"codice_provincia": 66,
"denominazione_provincia": "L'Aquila",
"sigla_provincia": "AQ",
"lat": 42.35122196,
"long": 13.39843823,
"totale_casi": 0,
"note": null,
"codice_nuts_1": null,
"codice_nuts_2": null,
"codice_nuts_3": null
}
应用场景
疫情趋势分析
研究人员可以利用该数据集分析意大利COVID-19疫情的长期趋势和季节性变化。通过对每日新增病例、住院人数、死亡人数等指标的时间序列分析,可以识别疫情的高峰期、低谷期和波动规律。同时,结合不同地区的数据,可以比较各地区疫情的严重程度和发展轨迹,为制定差异化的防控策略提供依据。
政策效果评估
政府部门和研究机构可以利用该数据集评估疫情防控政策的效果。例如,通过对比政策实施前后的疫情数据,可以分析封锁措施、疫苗接种、社交距离等干预措施对疫情传播的影响。数据的高时间分辨率和空间分辨率使得研究人员能够精确评估不同政策在不同地区的实施效果,为政策优化提供科学依据。
疫情预测模型开发
数据科学家可以利用该数据集开发和训练疫情预测模型。通过整合历史疫情数据、人口统计数据和环境因素,可以构建机器学习模型预测未来疫情的发展趋势。高质量的时间序列数据和丰富的指标为模型提供了充足的训练样本,有助于提高预测的准确性和可靠性。这些预测模型可以为公共卫生决策提供重要参考。
空间传播模式研究
利用数据集提供的地理空间数据,可以研究COVID-19疫情的空间传播模式。通过地理信息系统(GIS)技术,可以可视化疫情的空间分布,识别高风险地区和传播热点。结合人口流动数据和交通网络信息,可以分析疫情的传播路径和影响因素,为制定区域联防联控策略提供支持。
资源分配优化
医疗机构和政府部门可以利用该数据集优化医疗资源的分配。通过分析不同地区的住院人数、重症监护人数和死亡人数,可以预测医疗资源的需求情况,提前做好医疗物资的储备和调配。同时,通过对历史数据的分析,可以识别医疗资源紧张的地区和时间段,为紧急救援和资源倾斜提供依据。
结尾
意大利COVID-19数据集是一个全面、高质量的疫情监测数据库,包含超过300万条记录,时间跨度超过1,700天,覆盖国家级、地区级和省级三个行政层级。数据集提供了丰富的疫情指标和多种数据格式,为疫情研究、政策制定和公共卫生实践提供了重要支持。
该数据集的核心优势在于其时间跨度长、空间分辨率高、指标全面且数据质量可靠。通过开放获取的方式,数据集促进了全球范围内的学术研究和创新应用。未来,随着数据的持续更新和完善,该数据集将继续为COVID-19疫情的长期研究和公共卫生应急管理提供宝贵的资源。
看了又看
验证报告
以下为卖家选择提供的数据验证报告:






