# MyAnimeList动画数据集 - 4400万条用户评分记录含2.2万部动画信息
## 引言与背景
动画推荐系统和用户行为分析是当前大数据和机器学习领域的热门研究方向。本数据集包含来自MyAnimeList平台的4400万条用户评分记录,涵盖2.2万部动画作品和1.8万个用户,是研究动画推荐、用户行为分析和内容分类的宝贵资源。
数据集包含动画基本信息(标题、类型、工作室、简介等)、用户评分记录、类型标签等多维度数据,为构建推荐系统、分析用户偏好和研究动画市场趋势提供了丰富的数据基础。
## 数据基本信息
### 数据集概览
| 项目 | 描述 |
|------|------|
| 数据规模 | 44,379,880 条评分记录 |
| 动画数量 | 22,563 部 |
| 用户数量 | 18,145 个 |
| 文件数量 | 4个CSV文件 |
| 格式 | CSV |
### 文件结构
| 文件名 | 记录数 | 内容描述 |
|--------|--------|----------|
| anime_titles.csv | 22,590 | 动画基本信息 |
| anime_user_ratings.csv | 44,379,880 | 用户评分记录 |
| anime_genres.csv | 22,590 | 动画类型标签 |
| username_list_full.csv | 73,276 | 用户名列表 |
### 核心字段说明
#### anime_titles.csv
| 字段名称 | 字段类型 | 字段含义 | 数据示例 | 完整性 |
|----------|----------|----------|----------|----------|
| anime_id | int | 动画唯一标识 | 1 | 100% |
| title | string | 动画标题 | Cowboy Bebop | 100% |
| mean | float | 平均评分 | 8.75 | 100% |
| genres | string | 类型标签 | Action, Sci-Fi, Space | 100% |
| studios | string | 制作工作室 | Sunrise | 部分 |
| synopsis | string | 剧情简介 | 文本描述 | 部分 |
| media_type | string | 媒体类型 | tv | 100% |
| num_episodes | int | 集数 | 26 | 100% |
#### anime_user_ratings.csv
| 字段名称 | 字段类型 | 字段含义 | 数据示例 | 完整性 |
|----------|----------|----------|----------|----------|
| user_id | string | 用户标识 | NCU | 100% |
| anime_id | int | 动画标识 | 6675 | 100% |
| title | string | 动画标题 | Redline | 100% |
| user_status | string | 观看状态 | completed | 100% |
| user_score | int | 用户评分 | 7 | 100% |
| user_eps_watched | int | 观看集数 | 1 | 100% |
| user_rewatch | bool | 是否重看 | False | 100% |
| updated_at | datetime | 更新时间 | 2023-11-06 | 100% |
### 数据分布情况
#### 媒体类型分布
| 类型 | 数量 | 占比 |
|------|------|------|
| tv | 7,292 | 32.28% |
| ova | 3,944 | 17.46% |
| movie | 3,929 | 17.40% |
| ona | 3,063 | 13.56% |
| special | 2,406 | 10.65% |
| music | 1,945 | 8.61% |
#### 用户评分分布
| 评分 | 数量 | 占比 |
|------|------|------|
| 7 | 11,612,021 | 26.17% |
| 8 | 9,655,430 | 21.76% |
| 6 | 7,049,774 | 15.89% |
| 5 | 3,978,057 | 8.96% |
| 9 | 4,758,624 | 10.72% |
| 10 | 3,446,531 | 7.77% |
#### 用户观看状态分布
| 状态 | 数量 | 占比 |
|------|------|------|
| completed | 41,519,317 | 93.55% |
| dropped | 1,421,802 | 3.20% |
| watching | 964,100 | 2.17% |
| on_hold | 474,661 | 1.07% |
## 数据优势
| 优势特征 | 具体表现 | 应用价值 |
|----------|----------|----------|
| 数据规模大 | 4400万条评分记录 | 支持大规模推荐系统训练 |
| 用户覆盖广 | 1.8万用户 | 多样化用户偏好分析 |
| 内容丰富 | 2.2万部动画 | 涵盖多种类型和风格 |
| 信息完整 | 包含标题、类型、简介等 | 支持内容分析和分类 |
| 时间跨度长 | 更新记录完整 | 支持时序分析 |
| 标签体系完善 | 详细类型标签 | 支持内容推荐和分类 |
## 数据样例
### 动画信息样例
| anime_id | title | mean | genres | media_type | num_episodes |
|----------|-------|------|--------|------------|--------------|
| 1 | Cowboy Bebop | 8.75 | Action, Adult Cast, Sci-Fi, Space | tv | 26 |
| 5 | Cowboy Bebop: Tengoku no Tobira | 8.38 | Action, Adult Cast, Sci-Fi, Space | movie | 1 |
| 6 | Trigun | 8.21 | Action, Adult Cast, Adventure, Sci-Fi, Shounen | tv | 26 |
| 7 | Witch Hunter Robin | 7.25 | Action, Detective, Drama, Mystery, Supernatural | tv | 26 |
| 8 | Bouken Ou Beet | 6.94 | Adventure, Fantasy, Shounen, Supernatural | tv | 52 |
### 用户评分样例
| user_id | anime_id | title | user_status | user_score | user_eps_watched |
|---------|----------|-------|-------------|------------|------------------|
| NCU | 6675 | Redline | completed | 7 | 1 |
| Interim | 6675 | Redline | completed | 7 | 1 |
| JackWard7 | 6675 | Redline | completed | 7 | 1 |
| noktah | 6675 | Redline | completed | 7 | 1 |
| Critical_Aid | 6675 | Redline | completed | 7 | 1 |
## 应用场景
### 推荐系统开发
基于4400万条用户评分记录,可以训练高精度的协同过滤推荐模型。通过分析用户的评分模式和偏好,系统可以为每个用户推荐个性化的动画作品。这对于提升用户体验、增加平台粘性具有重要意义。同时,大规模的数据支持深度学习模型的训练,提高推荐的准确性和多样性。
### 用户行为分析
通过分析用户的观看状态分布和评分模式,可以深入了解用户的观看习惯和偏好。例如,分析哪些类型的动画更受欢迎,用户完成率最高的动画特征,以及用户弃番的原因。这些分析结果可以为平台运营和内容采购提供数据支持。
### 内容分类与标签体系优化
数据集包含详细的类型标签信息,可以用于训练内容分类模型。通过分析动画的类型分布和用户评分,可以优化标签体系,提高内容发现的效率。同时,还可以发现潜在的类型组合和新兴趋势,为内容创作提供参考。
### 市场趋势分析
通过分析不同时间段的评分数据和用户行为,可以追踪动画市场的发展趋势。例如,分析不同类型动画的受欢迎程度变化,热门工作室的表现,以及新上映作品的市场反应。这对于动画产业的投资决策和内容规划具有重要参考价值。
## 结尾
本数据集是一个高质量的动画用户评分数据集,包含4400万条评分记录和2.2万部动画信息。数据集具有数据规模大、用户覆盖广、信息完整等优点,为推荐系统开发、用户行为分析和内容分类研究提供了丰富的数据资源。
数据集以CSV格式存储,便于高效读写和处理。用户可以根据实际需求选择合适的数据子集进行分析,也可以结合业务知识对数据进行进一步的工程处理。
如有需要,可获取更多数据集相关信息。
看了又看
验证报告
以下为卖家选择提供的数据验证报告:






