きゅがんせん

verify-tagIGDB 20万条电子游戏评分与元数据库:覆盖 1947-2025 年、含 6 大分级系统与全量公司关联、适用于游戏推荐与AI训练的大规模结构化数据集

电子游戏游戏结构化数据

99

169.58MB

数据标识:D17824648636784361

发布时间:2026/06/26

# IGDB 20万条电子游戏评分与元数据库:覆盖 1947-2025 年、含 6 大分级系统与全量公司关联、适用于游戏推荐与AI训练的大规模结构化数据集

> 覆盖 20 万条游戏、49 个主字段、9 张关联表、7 大发行平台、33 种类型、6 大分级系统
> 数据规模:约 201,812 条游戏条目(主表 data_200K.csv)
> 典型用途:游戏推荐系统、用户画像、评分预测、游戏内容理解、行业市场分析

---

## 一、引言与背景

电子游戏产业已成为当代数字经济的重要组成部分。根据市场研究机构的公开数据,全球游戏市场规模已突破千亿美元,覆盖主机、PC、移动端等多种形态,涉及动作、角色扮演、模拟、策略等数十种玩法品类。在这一背景下,高质量、大规模、多维度的游戏结构化数据,对于支撑推荐系统、用户画像、内容理解、产业研究以及人工智能模型训练,具有十分重要的价值。

本数据集基于知名开放游戏数据库 IGDB(Internet Game Database)的公开接口整理而成,核心主表收录了 201,812 条电子游戏条目的完整元数据与评分信息,并辅以 9 张主题关联表,包括公司信息表(41,593 家公司)、分级表(67,072 条分级记录)、分级内容描述表(90,659 条内容标签)、涉及公司表(134,682 条关系)、平台表(195 个平台)、类型表(23 种)、主题表(22 种)、玩家视角表(7 种)与类型映射表。主表共包含 49 个字段,覆盖游戏名称、类型、主题、平台、发行年份、评分、聚合评分、分级信息、制作发行公司、截图、视频、标签、相似游戏、游戏模式、玩家视角、剧情简介等关键维度。

数据集采用 CSV 与 XLSX 两种通用格式存储,便于 Python(Pandas)、R、SPSS、SQL 等多种工具直接加载使用。在科研场景下,该数据集可用于构建评分预测模型、研究游戏品类演进轨迹、分析玩家评分分布规律;在产业场景下,可用于开发个性化游戏推荐引擎、评估游戏市场热度、洞察不同地区分级合规差异。由于数据覆盖时间跨度超过 70 年(1947–2025 年),并具备多平台、多类型、多角度的交叉标签,该数据集为纵向研究与横向对比均提供了扎实的数据基础。

需要说明的是,本数据集以元数据与结构化标签为核心构成,并未随附游戏本体文件或原始媒体文件(如截图原图、视频文件、可执行程序等)。所有截图、视频等资源仅以引用 ID 的形式存储,实际图像与视频资源需通过合法渠道另行获取或访问原始数据源。这一设计使得数据集便于在受限网络或离线环境下进行快速处理、分析与建模,同时保障了版权合规性。

---

## 二、数据基本信息

### 2.1 数据规模与构成

| 项目 | 数量 |
| --- | --- |
| 主游戏条目数 | 201,812 |
| 主表字段数 | 49 |
| 关联表数量 | 9 |
| 公司记录数 | 41,593 |
| 分级记录数 | 67,072 |
| 分级内容描述记录数 | 90,659 |
| 游戏-公司关系记录数 | 134,682 |
| 平台类型数 | 195 |
| 游戏类型数 | 23 |
| 游戏主题数 | 22 |
| 玩家视角数 | 7 |
| 类型映射数 | 13 |
| 时间跨度 | 1947–2025 年 |

### 2.2 主表字段说明

下表列出主表 data_200K.csv 的核心字段(共 49 列)及其数据完整性情况。

| 字段名称 | 字段类型 | 字段含义 | 数据示例 | 完整率 |
| --- | --- | --- | --- | --- |
| id | 整数 | IGDB 游戏唯一 ID | 1020 | 100.00% |
| category | 整数 | 游戏分类(0 主游戏、1 DLC、2 扩展、3 合集等) | 0 | 100.00% |
| status | 浮点 | 游戏状态(0 已发行、2 开发中、4 下线、5 取消等) | 4.0 | 5.86% |
| name | 字符串 | 游戏名称 | Grand Theft Auto V | 100.00% |
| slug | 字符串 | URL 友好名称 | grand-theft-auto-v | 99.95% |
| url | 字符串 | IGDB 原始页面 URL | https://www.igdb.com/games/... | 100.00% |
| summary | 字符串 | 游戏简介(平均 291.5 字符) | A vast open world game... | 82.94% |
| storyline | 字符串 | 剧情长简介 | Detailed story of the... | 8.07% |
| first_release_date | 浮点 | 首发时间(Unix 时间戳,秒) | 1379376000.0 | 57.44% |
| created_at | 浮点 | 记录创建时间戳 | 1495739021.0 | 100.00% |
| updated_at | 浮点 | 记录更新时间戳 | 1633305600.0 | 100.00% |
| genres | 列表(字符串存储) | 类型 ID 列表 | [15, 32] | 77.65% |
| themes | 列表(字符串存储) | 主题 ID 列表 | [1, 18] | 51.10% |
| platforms | 列表(字符串存储) | 平台 ID 列表 | [3, 6, 130] | 59.82% |
| game_modes | 列表(字符串存储) | 游戏模式 ID 列表 | [1, 2] | 78.08% |
| player_perspectives | 列表(字符串存储) | 玩家视角 ID 列表 | [1, 3] | 75.14% |
| age_ratings | 列表(字符串存储) | 分级 ID 列表 | [22474] | 21.69% |
| involved_companies | 列表(字符串存储) | 关联公司 ID 列表 | [14486, 1250] | 41.38% |
| screenshots | 列表(字符串存储) | 截图资源 ID 列表(平均 3.9 张/游戏) | [58357, 58358] | 67.31% |
| videos | 列表(字符串存储) | 视频资源 ID 列表(平均 0.3 条/游戏) | [1203, 1204] | 20.93% |
| tags | 列表(字符串存储) | 标签 ID 列表(平均 2.3 个/游戏) | [1, 268435471] | 80.88% |
| similar_games | 列表(字符串存储) | 相似游戏 ID 列表 | [25311, 25640] | 80.86% |
| rating | 浮点 | 用户评分(0-100,基于 IGDB 用户打分) | 90.15 | 14.07% |
| rating_count | 浮点 | 用户评分人数 | 3541 | 14.07% |
| total_rating | 浮点 | 综合评分(含多来源) | 89.14 | 16.49% |
| total_rating_count | 浮点 | 综合评分人数 | 3578 | 16.49% |
| aggregated_rating | 浮点 | 外部聚合评分(MetaCritic 等) | 88.14 | 7.03% |
| aggregated_rating_count | 浮点 | 外部聚合评分人数 | 100 | 7.03% |
| hypes | 浮点 | 期待热度指数 | 3.89 | 4.22% |
| multiplayer_modes | 列表 | 多人模式列表 | [...] | - |
| version_parent | 浮点 | 父版本 ID | 1020 | - |
| franchises | 列表 | 所属系列 ID 列表 | [...] | - |
| game_engines | 列表 | 使用的游戏引擎 ID 列表 | [...] | - |

说明:完整率 = 非空(非 NaN)记录数 / 总记录数(201,812)。列表类字段以字符串形式存储 JSON 数组,解析后可得到对应 ID 集合,再通过关联表映射为可读名称。

### 2.3 分类(Category)分布

根据 category_mapping.csv 的定义,各类别分布如下:

| 分类编号 | 含义 | 记录数量 | 占比 | 累计占比 |
| --- | --- | --- | --- | --- |
| 0 | main_game(主游戏) | 179,613 | 88.99% | 88.99% |
| 1 | dlc_addon(DLC/附加内容) | 11,185 | 5.54% | 94.53% |
| 11 | port(移植版) | 2,728 | 1.35% | 95.88% |
| 3 | bundle(合集) | 2,546 | 1.26% | 97.14% |
| 5 | mod(修改版) | 1,549 | 0.77% | 97.91% |
| 2 | expansion(扩展包) | 1,104 | 0.55% | 98.46% |
| 10 | expanded_game(扩展游戏) | 871 | 0.43% | 98.89% |
| 8 | remake(重制版) | 618 | 0.31% | 99.20% |
| 9 | remaster(复刻版) | 585 | 0.29% | 99.49% |
| 6 | episode(章节) | 462 | 0.23% | 99.72% |
| 4 | standalone_expansion(独立扩展) | 255 | 0.13% | 99.85% |
| 7 | season(季票) | 251 | 0.12% | 99.97% |
| 12 | fork(派生版本) | 45 | 0.03% | 100.00% |

### 2.4 游戏类型(Genre)分布

按游戏条目出现频次从高到低排序,一条游戏可归属多个类型:

| 类型 | 出现次数(次) | 占比 |
| --- | --- | --- |
| Indie(独立游戏) | 63,273 | 35.15% |
| Adventure(冒险) | 51,118 | 28.42% |
| Simulator(模拟) | 28,130 | 15.62% |
| Strategy(策略) | 26,729 | 14.84% |
| Role-playing (RPG)(角色扮演) | 19,784 | 10.99% |
| Puzzle(益智) | 16,142 | 8.97% |
| Shooter(射击) | 14,553 | 8.09% |
| Platform(平台跳跃) | 12,328 | 6.84% |
| Arcade(街机) | 12,219 | 6.78% |
| Sport(体育) | 11,738 | 6.51% |
| Racing(竞速) | 7,843 | 4.36% |
| Visual Novel(视觉小说) | 5,266 | 2.92% |
| Fighting(格斗) | 4,402 | 2.44% |
| Turn-based strategy(回合策略) | 3,267 | 1.81% |
| Hack and slash/Beat 'em up(动作清关) | 3,105 | 1.72% |
| Point-and-click(点击冒险) | 2,841 | 1.58% |
| Music(音乐) | 2,394 | 1.33% |
| Real Time Strategy(即时策略) | 2,218 | 1.23% |
| Tactical(战术) | 2,211 | 1.23% |
| Card & Board Game(卡牌与桌游) | 2,151 | 1.19% |

注:占比以所有(游戏-类型)配对总数 180,000+ 为分母,故单项占比加和超过 100%。

### 2.5 游戏主题(Theme)分布

| 主题 | 出现次数(次) | 占比 |
| --- | --- | --- |
| Action(动作) | 67,930 | 65.87% |
| Fantasy(奇幻) | 14,935 | 14.49% |
| Science fiction(科幻) | 13,145 | 12.77% |
| Horror(恐怖) | 6,935 | 6.73% |
| Comedy(喜剧) | 6,781 | 6.59% |
| Historical(历史) | 4,326 | 4.20% |
| Erotic(情欲) | 3,987 | 3.87% |
| Survival(生存) | 3,382 | 3.28% |
| Educational(教育) | 3,286 | 3.19% |
| Mystery(悬疑) | 3,065 | 2.97% |
| Warfare(战争) | 2,988 | 2.90% |
| Open world(开放世界) | 2,489 | 2.41% |
| Sandbox(沙盒) | 2,427 | 2.36% |
| Romance(恋爱) | 2,246 | 2.18% |
| Party(派对) | 2,113 | 2.05% |
| Drama(剧情) | 2,041 | 1.98% |
| Kids(儿童) | 1,923 | 1.87% |

### 2.6 发行平台(Platform)分布

| 平台 | 条目数 | 占比 |
| --- | --- | --- |
| PC (Microsoft Windows) | 67,672 | 55.97% |
| Mac | 15,126 | 12.51% |
| iOS | 10,516 | 8.71% |
| PlayStation 4 | 9,951 | 8.23% |
| Nintendo Switch | 9,758 | 8.07% |
| Linux | 8,817 | 7.30% |
| Xbox One | 8,032 | 6.64% |
| Android | 7,282 | 6.03% |
| PlayStation 3 | 3,700 | 3.06% |
| Web browser(网页游戏) | 3,632 | 3.01% |
| PlayStation 2 | 3,340 | 2.76% |
| Arcade(街机) | 3,258 | 2.69% |
| Xbox 360 | 3,096 | 2.56% |
| DOS | 3,078 | 2.55% |
| PlayStation | 2,822 | 2.33% |
| Wii | 2,696 | 2.23% |
| Commodore C64/128/MAX | 2,452 | 2.03% |
| Amiga | 2,156 | 1.79% |
| Nintendo DS | 2,113 | 1.75% |
| PlayStation 5 | 2,101 | 1.74% |

### 2.7 玩家视角(Player Perspective)分布

| 玩家视角 | 出现次数(次) | 占比 |
| --- | --- | --- |
| Bird view / Isometric(俯视角/等距) | 17,184 | 34.08% |
| Third person(第三人称) | 16,209 | 32.14% |
| Side view(横版) | 16,162 | 32.05% |
| First person(第一人称) | 13,352 | 26.50% |
| Text(文字) | 4,397 | 8.73% |
| Virtual Reality(虚拟现实) | 1,923 | 3.82% |
| Auditory(听觉) | 495 | 0.98% |

### 2.8 游戏模式(Game Mode)分布

| 游戏模式 | 出现次数(次) | 占比 |
| --- | --- | --- |
| Single-player(单人) | 91,369 | 80.99% |
| Multi-player(多人) | 22,870 | 20.28% |
| Co-operative(合作) | 8,948 | 7.93% |
| Split-screen(分屏) | 3,180 | 2.82% |
| LAN(局域网) | 3,024 | 2.68% |
| Asynchronous Multiplayer(异步多人) | 371 | 0.33% |

### 2.9 发行年份分布

基于有首发时间记录的 115,916 条游戏(占 57.44%),近十年发行趋势如下:

| 年份 | 记录数 | 占比(相对有记录子集) | 累计占比 |
| --- | --- | --- | --- |
| 2010 及以前 | 46,507 | 40.12% | 40.12% |
| 2011 | 2,604 | 2.25% | 42.37% |
| 2012 | 2,684 | 2.32% | 44.69% |
| 2013 | 2,973 | 2.56% | 47.25% |
| 2014 | 3,900 | 3.36% | 50.61% |
| 2015 | 5,288 | 4.56% | 55.17% |
| 2016 | 7,608 | 6.56% | 61.73% |
| 2017 | 10,172 | 8.77% | 70.50% |
| 2018 | 8,746 | 7.54% | 78.04% |
| 2019 | 7,541 | 6.50% | 84.54% |
| 2020 | 8,170 | 7.05% | 91.59% |
| 2021 | 10,329 | 8.91% | 100.50% |
| 2022 | 5,825 | 5.03% | 95.53% |
| 2023 | 347 | 0.30% | 95.83% |
| 2024–2030 | 29 | 0.02% | 100.00% |

可以看出,2016–2021 年是游戏条目最密集的时段,反映了独立游戏大潮与新一代主机(PS4/Xbox One/Switch)生命周期的叠加效应;2017 年2021 年为两个高峰,分别对应 Switch 首发年与新冠疫情居家游戏潮。

### 2.10 分级系统(Age Rating)分布

分级表 age_ratings.csv 共包含 67,072 条分级记录,覆盖 7 大国际分级体系:

| 分级系统 | 记录数 | 占比 |
| --- | --- | --- |
| ESRB(北美) | 40,018 | 59.67% |
| PEGI(欧洲) | 19,915 | 29.69% |
| CERO(日本) | 3,422 | 5.10% |
| GRAC(韩国) | 1,777 | 2.65% |
| CLASS_IND(印度) | 707 | 1.05% |
| ACB(澳大利亚) | 618 | 0.92% |
| USK(德国) | 615 | 0.92% |

分级内容描述覆盖 30 种以上具体标签(age_rating_content_descriptions.csv),其中前 10 位依次为:暴力(Violence,19,590 条)、血腥(Blood,5,840)、幻想暴力(Fantasy Violence,5,126)、轻度语言(Mild Language,3,460)、血腥与恐怖(Blood and Gore,3,454)、暗示性主题(Suggestive Themes,3,241)、强烈语言(Strong Language,3,183)、语言(Language,3,127)、不良语言(Bad Language,2,981)、轻度幻想暴力(Mild Fantasy Violence,2,663)。此类标签对于未成年保护、内容审核、区域合规研究具有极高的研究价值。

### 2.11 主要制作与发行公司(Top N)

按开发游戏数量前 10 位(开发者):

| 公司 | 开发游戏数 |
| --- | --- |
| Konami(科乐美) | 661 |
| Capcom(卡普空) | 503 |
| Nintendo(任天堂) | 440 |
| Tiger Electronics | 425 |
| Sega(世嘉) | 354 |
| Hudson Soft | 309 |
| Square Enix(史克威尔艾尼克斯) | 266 |
| Namco(南梦宫) | 223 |
| Ubisoft Montreal(育碧蒙特利尔) | 222 |
| Taito(太东) | 204 |

按发行游戏数量前 10 位(发行商):

| 公司 | 发行游戏数 |
| --- | --- |
| Nintendo(任天堂) | 1,847 |
| Sega(世嘉) | 1,470 |
| Konami(科乐美) | 1,126 |
| Electronic Arts(Electronic Arts) | 1,116 |
| Activision(动视) | 829 |
| Capcom(卡普空) | 774 |
| Square Enix(史克威尔艾尼克斯) | 728 |
| THQ | 543 |
| Bandai Namco Entertainment(万代南梦宫) | 499 |
| Atari(雅达利) | 472 |

### 2.12 核心评分统计

| 指标 | 均值 | 中位数 | 标准差 | 最小值 | 最大值 | 有效记录数 |
| --- | --- | --- | --- | --- | --- | --- |
| rating(用户评分) | 66.55 | 70.00 | 14.43 | 10.00 | 100.00 | 28,407 |
| total_rating(综合评分) | 66.35 | 70.00 | 14.73 | 0.00 | 100.00 | 33,274 |
| aggregated_rating(外部聚合评分) | 68.88 | 71.00 | 16.15 | 0.00 | 100.00 | 14,197 |
| rating_count(评分人数) | 20.23 | 1.00 | 99.29 | 0 | 3,541 | 28,407 |
| aggregated_rating_count(聚合评分人数) | 3.68 | 2.00 | 4.12 | 0 | 59 | 14,197 |

评分呈现明显的右偏分布:多数长尾游戏评分人数极少(中位数仅 1–2 人),头部爆款游戏(如 Grand Theft Auto V、The Witcher 3、Skyrim 等)的评分人数则突破 2,000–3,500 量级。这种典型的"长尾效应"分布对于推荐算法的冷启动处理、热门度建模与马太效应研究都具有重要意义。

---

## 三、数据优势

| 优势特征 | 具体表现 | 应用价值 |
| --- | --- | --- |
| 大规模全量覆盖 | 20 万条游戏条目,覆盖 1947–2025 年 78 年历史,9 大关联表合计 40 万+ 条记录 | 支持纵向时间序列分析、品类演进研究、跨时代游戏对比 |
| 多维度标签体系 | 含 23 种类型、22 种主题、7 种视角、6 种模式、7 大分级系统、30 种分级内容描述 | 为多标签分类、推荐系统、内容理解提供丰富监督信号 |
| 多平台与多版本关联 | 195 个平台 ID、13 种版本分类(含 DLC/Mod/重制版/复刻版/移植版) | 支持跨平台发布研究、版本演进追踪、移植策略分析 |
| 双评分体系 | 同时包含站内用户评分(rating/total_rating)与外部聚合评分(aggregated_rating),并附评分人数 | 可用于双源评分对齐、评分可信度研究、热门度校正 |
| 公司关系网络 | 41,593 家公司 + 134,682 条游戏-公司关系,区分开发者/发行商/移植商/服务商四种角色 | 构建游戏产业知识图谱、研究开发商-发行商协作模式 |
| 高质量结构化 | 主表 49 字段 + 关联表 20+ 字段,采用 CSV/JSON 数组标准格式,可直接载入 Pandas/SQL | 降低数据清洗成本,适合科研教学与快速原型开发 |
| 多国分级合规信息 | 覆盖 ESRB/PEGI/CERO/GRAC/USK/ACB/CLASS_IND 七大体系,含具体内容描述标签 | 适合未成年保护、区域合规、内容审核研究场景 |
| 长尾与头部兼顾 | 评分人数呈典型长尾分布(中位数 1、最大 3541),既含独立小众作品也含 3A 级大作 | 可用于马太效应研究、推荐系统冷启动、长尾游戏挖掘 |
| 与开源生态兼容 | 基于 IGDB 公开数据构建,与 IGDB API 字段完全兼容,便于增量更新 | 可扩展为动态数据集,对接实时游戏行业数据 |

---

## 四、数据样例

以下展示本数据集的典型条目样例,涵盖不同年代、不同类型、不同平台、不同评分层级与不同状态的游戏。所有样例均摘自主表 data_200K.csv,字段中的 ID 列表(如 genres、platforms、age_ratings 等)可通过关联表进一步解析为可读名称。

注意: 本数据集为元数据与结构化标签数据集,不包含游戏本体、截图原图、视频文件等二进制原始文件。用户如需实际图像或视频资源,应通过合法渠道(如 IGDB 官方接口、游戏发行商官方平台等)另行获取。以下样例中的 screenshots、videos 字段仅保存资源 ID,而非资源本体。

### 样例 1:高评分 3A 级开放世界代表作

- ID: 1020
- 名称: Grand Theft Auto V
- 用户评分: 90.15 / 综合评分: 89.14 / 聚合评分: 88.14(评分人数 3,541)
- 首发年份: 2013
- 类型: Shooter(射击)、Adventure(冒险)
- 主题: Action(动作)、Comedy(喜剧)、Sandbox(沙盒)、Open world(开放世界)
- 平台: PC、PS3、Xbox 360、PS4、Xbox One、PS5、Xbox Series X|S
- 玩家视角: First person、Third person
- 简介: A vast open world game set in Los Santos, a sprawling sun-soaked metropolis struggling to stay afloat in an era of economic uncertainty...

### 样例 2:高评分 RPG 代表作

- ID: 1942
- 名称: The Witcher 3: Wild Hunt
- 用户评分: 94.86 / 聚合评分: 91.72(评分人数 3,160)
- 首发年份: 2015
- 类型: Role-playing (RPG)、Adventure
- 主题: Action、Fantasy(奇幻)、Open world
- 平台: PC、PS4、Xbox One、Nintendo Switch
- 玩家视角: Third person
- 简介: RPG and sequel to The Witcher 2 (2011), The Witcher 3 follows witcher Geralt of Rivia...

### 样例 3:经典第一人称解谜

- ID: 72
- 名称: Portal 2
- 用户评分: 91.73 / 聚合评分: 92.44(评分人数 2,677)
- 首发年份: 2011
- 类型: Shooter、Platform、Puzzle、Adventure
- 主题: Action、Science fiction(科幻)、Comedy
- 平台: Linux、PC、PS3、Xbox 360、Mac
- 玩家视角: First person
- 简介: Sequel to the acclaimed Portal (2007), Portal 2 pits the protagonist Chell and robot friend Wheatley...

### 样例 4:中世纪开放世界 RPG

- ID: 472
- 名称: The Elder Scrolls V: Skyrim
- 用户评分: 87.53 / 聚合评分: 96.11(评分人数 2,680)
- 首发年份: 2011
- 类型: Role-playing (RPG)、Adventure
- 主题: Action、Fantasy、Stealth(潜行)、Sandbox、Open world
- 平台: PC、PS3、Xbox 360
- 玩家视角: First person、Third person

### 样例 5:经典 FPS

- ID: 233
- 名称: Half-Life 2
- 用户评分: 90.76 / 聚合评分: 91.00(评分人数 2,172)
- 首发年份: 2004
- 类型: Shooter
- 主题: Action、Science fiction、Horror
- 平台: Linux、PC、PS3、Xbox、Xbox 360、Mac、Android
- 玩家视角: First person

### 样例 6:潜行动作代表作

- ID: 127
- 名称: Assassin's Creed II
- 用户评分: 87.13 / 聚合评分: 90.25(评分人数 2,016)
- 首发年份: 2009
- 类型: Platform、Adventure
- 主题: Action、Fantasy、Science fiction、Historical(历史)、Stealth、Sandbox、Open world
- 平台: PC、PS3、Xbox 360、Mac、iOS
- 玩家视角: Third person

### 样例 7:末日生存题材

- ID: 1009
- 名称: The Last of Us
- 用户评分: 93.42 / 聚合评分: 91.54(评分人数 2,247)
- 首发年份: 2013
- 类型: Shooter、Adventure
- 主题: Action、Horror(恐怖)、Survival(生存)、Stealth
- 平台: PS3
- 玩家视角: Third person

### 样例 8:生存建造独立游戏

- ID: 104967
- 名称: Valheim
- 用户评分: 85.89 / 聚合评分: 90.00(评分人数 76)
- 首发年份: 2021
- 类型: RPG、Adventure、Indie
- 主题: Action、Survival
- 平台: Linux、PC、Xbox One、Xbox Series X|S
- 玩家视角: Third person

### 样例 9:复古平台射击

- ID: 9766
- 名称: Rocket Knight Adventures
- 用户评分: 79.03(评分人数 35)
- 首发年份: 1993
- 类型: Shooter、Platform
- 主题: Action、Comedy、Kids(儿童)
- 平台: Sega Mega Drive/Genesis
- 玩家视角: Side view(横版)

### 样例 10:早期 8-bit 益智游戏

- ID: 13540
- 名称: Cylu
- 首发年份: 1985
- 类型: Puzzle(益智)
- 主题: Action、Science fiction
- 平台: Commodore C64/128/MAX、Amstrad CPC、ZX Spectrum
- 玩家视角: Third person、Bird view / Isometric

### 样例 11:PS2 经典 RPG

- ID: 11988
- 名称: .hack//G.U. Vol. 2: Reminisce
- 用户评分: 79.37 / 聚合评分: 55.00(评分人数 5)
- 首发年份: 2006
- 类型: Role-playing (RPG)
- 主题: Fantasy、Science fiction
- 平台: PS2
- 玩家视角: First person、Third person

### 样例 12:MOD/扩展类条目

- ID: 210537
- 名称: Stardew Valley Expanded
- 分类: Indie(独立),category=0
- 首发年份: 2019
- 类型: Indie
- 主题: 未标注
- 平台: PC
- 玩家视角: Bird view / Isometric

---

## 五、应用场景

### 5.1 游戏推荐系统与用户画像建模

本数据集的多维度标签体系(类型、主题、平台、玩家视角、游戏模式、分级)以及双评分体系(站内评分 + 外部聚合评分),是构建个性化游戏推荐系统的核心基础。在实际应用中,研究者可基于该数据集训练基于内容的推荐模型(Content-Based Filtering),为每位用户推荐与其历史偏好类型相近、主题相似或视角一致的游戏;也可利用评分矩阵训练协同过滤模型(Collaborative Filtering)与矩阵分解模型(Matrix Factorization),挖掘隐性的用户偏好关联。更进一步,研究者还可将类型、主题、平台等标签作为辅助特征,构建基于图神经网络(GNN)或 Transformer 的多模态推荐模型。由于数据覆盖 78 年历史,推荐系统不仅能适用于当前热门游戏,还能为长尾复古游戏精准匹配怀旧用户,从而提升推荐系统的新颖性与惊喜度。

### 5.2 电子游戏产业演进与市场研究

数据集长达 78 年的时间跨度(1947–2025 年)为研究游戏产业的纵向演进规律提供了可能。研究者可以按年份统计各类型游戏的发行数量与平均评分,分析从街机时代到主机时代再到移动端时代的品类兴衰;也可以按平台维度分析游戏在不同硬件代际之间的迁移规律(例如 2016 年后 Nintendo Switch 平台条目数的激增);还可以基于公司关系网络,研究全球 Top 10 发行商(Nintendo、Sega、Konami、Electronic Arts 等)的战略布局变化。此类研究成果可应用于游戏投资决策、开发商战略规划、游戏发行档期选择等产业场景。

### 5.3 游戏内容理解与 AI 生成训练

数据集提供了 167,394 条游戏简介(summary 字段,平均 291.5 字符)、16,282 条剧情长简介(storyline 字段)、23 种类型标签、22 种主题标签以及玩家视角等细粒度信息。这些结构化与非结构化数据的组合,可用于训练游戏内容理解模型——例如给定一段游戏介绍,预测其最可能的类型与主题;或基于游戏简介生成合规的分级内容描述。此外,summary 文本还可作为训练语料,用于生成式 AI(如游戏文案生成、Steam 商店简介自动化等)的微调数据集。由于数据覆盖大量独立游戏与小众作品,该数据集对于缓解 AI 训练数据偏向头部 3A 游戏的偏差具有独特价值。

### 5.4 分级合规与未成年保护研究

本数据集整合了 7 大国际分级系统(ESRB、PEGI、CERO、GRAC、USK、ACB、CLASS_IND)以及 30 种具体的分级内容描述标签(暴力、血腥、语言、暗示性主题、毒品引用等),构成了一个跨国分级对比研究的宝贵资源。研究者可对比同一款游戏在不同国家获得的分级差异(例如 ESBR 评为 E10+ 的游戏在 PEGI 体系下可能评为 12+),分析文化背景与监管政策对分级结果的影响;亦可研究暴力、血腥、语言等标签在不同类型游戏中的出现频率与相关性,为内容审核算法提供参考依据。在未成年保护场景下,该数据集可辅助开发家长工具,为不同年龄段未成年人筛选合适的游戏内容。

### 5.5 评分预测与游戏成功因素分析

基于数据集提供的双评分体系(rating/total_rating/aggregated_rating)与丰富的元数据特征,研究者可以训练游戏评分预测模型,探索哪些特征与游戏的市场成功显著相关——例如发行平台数量、玩家视角、是否为续作、发行年份等因素与评分高低的关联。此外,评分人数(rating_count)与聚合评分人数(aggregated_rating_count)构成的"热门度"指标,可用于研究游戏从发布到口碑发酵的时间动力学。此类研究对于游戏发行商评估新产品线、投资人筛选潜力项目具有实际参考价值。

### 5.6 构建游戏产业知识图谱

通过公司关联表(134,682 条关系)、游戏-公司关系(区分开发者/发行商/移植商/服务商)、公司所在国家(companies.csv 的 country 字段)以及游戏的类型/平台/主题等标签,可以构建一个多维度的游戏产业知识图谱。图谱中的节点包括游戏、公司、平台、类型、主题、玩家视角、分级系统等,边则表示开发、发行、移植、归属等关系。基于该图谱,可进行游戏推荐、公司竞争分析、品类关系挖掘等图计算任务。

### 5.7 游戏评论情感分析与 NLP 任务

虽然本数据集本身未包含用户评论正文,但其 167,394 条游戏简介(summary)与 16,282 条剧情长简介(storyline)可作为训练游戏领域专有语言模型(Domain-Specific Language Model)的预训练语料。结合外部获取的游戏评论数据,研究者可微调游戏评论情感分析模型、游戏新闻摘要生成模型、游戏舆情检测模型等。由于游戏文本中大量使用行业术语与玩家黑话,具有预训练语料的支持将显著提升模型在垂直领域的表现。

---

## 六、结尾

本数据集以 20 万条游戏条目 + 40 万条关联记录 + 78 年历史跨度 + 7 大国际分级体系的综合规模,构建了目前公开可获取的游戏元数据领域中规模最大、维度最全的结构化数据集之一。其核心价值体现在三个方面:一是规模大——覆盖从 1947 年最早的电子游戏到 2025 年最新作品,横跨 78 年历史长河;二是维度全——从类型、主题、平台、视角、模式、分级、公司、评分等 9 大维度对每一款游戏进行全面标注;三是结构新——采用多表关联、JSON 数组存储、双评分体系等设计,兼顾灵活性与可扩展性。

特别需要再次强调的是:本数据集不包含任何游戏本体、截图原图或视频文件,仅以资源 ID 的形式提供引用。这一设计既保障了数据的合法合规性,也显著压缩了数据集体积,使其便于在普通个人电脑上快速加载与处理。用户如需实际游戏文件或媒体资源,应通过 IGDB 官方接口或游戏发行商的合法渠道另行获取。

总体而言,本数据集在游戏推荐、产业研究、内容理解、分级合规、评分预测、知识图谱构建等多个科研与产业场景中均具备独特的应用潜力,有望成为游戏数据挖掘与人工智能领域的重要基础资源。若有需要进一步了解字段含义、获取清洗后的衍生特征或获取配套的分析代码,可私信获取更多信息。

看了又看

验证报告

以下为卖家选择提供的数据验证报告:

data icon
IGDB 20万条电子游戏评分与元数据库:覆盖 1947-2025 年、含 6 大分级系统与全量公司关联、适用于游戏推荐与AI训练的大规模结构化数据集
99
169.58MB
申请报告