wnx

verify-tag烂番茄电影数据集-10000部电影信息含观众评分与影评数据支持电影推荐系统开发与情感分析研究

烂番茄电影数据集电影信息观众评分影评数据电影推荐系统情感分析

9.9

408.26MB

数据标识:D17804772213080576

发布时间:2026/06/03

# 烂番茄电影数据集 - 10000+部电影信息含观众评分与影评数据支持电影推荐系统开发与情感分析研究

## 引言与背景

电影数据是娱乐行业分析和推荐系统开发的重要资源。本数据集包含来自烂番茄(Rotten Tomatoes)平台的10000+部电影信息及其相关评论数据,涵盖电影基本信息、观众评分、专业影评等关键内容,是研究电影推荐算法、分析用户观影偏好和开发个性化影视推荐系统的宝贵资源。

数据集包含两个核心文件:rotten_tomatoes_movies.csv提供电影元数据,rotten_tomatoes_movie_reviews.csv包含用户影评信息。这些数据为构建精准的电影推荐模型和深入理解观众电影偏好提供了坚实的数据基础。

## 数据基本信息

### 数据集概览

| 项目 | 描述 |
|------|------|
| 电影数量 | 10000+部 |
| 评论数量 | 多条 |
| 数据格式 | CSV |
| 文件数量 | 2个 |

### 文件结构

| 文件名 | 内容描述 |
|--------|----------|
| rotten_tomatoes_movies.csv | 电影元数据 |
| rotten_tomatoes_movie_reviews.csv | 用户影评数据 |

### 核心字段说明

#### rotten_tomatoes_movies.csv

| 字段名称 | 字段类型 | 字段含义 | 数据示例 | 完整性 |
|----------|----------|----------|----------|----------|
| id | string | 电影唯一标识 | space-zombie-bingo | 100% |
| title | string | 电影标题 | Space Zombie Bingo! | 100% |
| audienceScore | int | 观众评分(0-100) | 50 | 部分缺失 |
| tomatoMeter | int | 烂番茄新鲜度(0-100) | 69 | 部分缺失 |
| rating | string | 分级 | PG-13 | 部分缺失 |
| runtimeMinutes | int | 时长(分钟) | 75 | 部分缺失 |
| genre | string | 类型 | Comedy, Horror, Sci-fi | 部分缺失 |
| originalLanguage | string | 原始语言 | English | 部分缺失 |
| director | string | 导演 | George Ormrod | 部分缺失 |
| writer | string | 编剧 | George Ormrod,John Sabotta | 部分缺失 |
| boxOffice | string | 票房 | $31.4M | 部分缺失 |
| distributor | string | 发行商 | STX Films | 部分缺失 |

### 数据分布情况

#### 电影类型分布(部分)

| 类型 | 描述 |
|------|------|
| Drama | 剧情片 |
| Comedy | 喜剧片 |
| Horror | 恐怖片 |
| Adventure | 冒险片 |
| Action | 动作片 |
| Romance | 爱情片 |

#### 评分分布(部分)

| 评分范围 | 描述 |
|----------|------|
| 0-40 | 差评 |
| 41-60 | 中等 |
| 61-80 | 好评 |
| 81-100 | 高分 |

## 数据优势

| 优势特征 | 具体表现 | 应用价值 |
|----------|----------|----------|
| 数据规模大 | 10000+部电影 | 支持大规模推荐系统训练 |
| 信息完整 | 包含评分、类型、导演、编剧等 | 支持多维度分析 |
| 来源权威 | 来自烂番茄平台 | 数据质量有保障 |
| 格式规范 | CSV格式存储 | 便于数据处理和分析 |
| 多语言支持 | 包含多种语言电影 | 支持国际化研究 |

## 数据样例

### 电影元数据样例

| id | title | audienceScore | tomatoMeter | rating | runtimeMinutes | genre | originalLanguage |
|----|-------|---------------|-------------|--------|-----------------|-------|------------------|
| space-zombie-bingo | Space Zombie Bingo! | 50 | | | 75 | Comedy, Horror, Sci-fi | English |
| adrift_2018 | Adrift | 65 | 69 | PG-13 | 120 | Adventure, Drama, Romance | English |
| 1035316-born_to_kill | Born to Kill | 74 | 83 | | 92 | Crime, Drama | English |
| margarita_happy_hour | Margarita Happy Hour | | 76 | | 98 | Drama | English |
| leap_of_faith_2019 | Leap of Faith: William Friedkin on The Exorcist | 86 | 93 | | 104 | Documentary, Mystery & thriller | English |

### 电影类型示例

| 类型组合 | 示例电影 |
|----------|----------|
| Comedy, Horror, Sci-fi | Space Zombie Bingo! |
| Adventure, Drama, Romance | Adrift |
| Documentary, Mystery & thriller | Leap of Faith |
| Fantasy, Adventure, Animation | Dinosaur Island |

## 应用场景

### 电影推荐系统开发

基于10000+部电影的元数据和评分信息,可以开发和优化电影推荐系统。通过分析用户的观影历史和评分偏好,可以构建协同过滤推荐模型,为用户推荐个性化的电影内容。大规模的数据支持深度学习模型的训练,提高推荐的准确性和多样性,提升用户体验。

### 电影情感分析

通过分析影评数据,可以深入了解观众对不同电影的情感倾向。例如,分析正面评价和负面评价的特征,识别电影成功或失败的关键因素。这些分析结果可以为电影制作和营销提供数据支持,帮助制作方更好地满足观众需求。

### 电影市场分析

数据集包含丰富的电影元数据,可以用于分析电影市场的趋势和规律。例如,分析不同类型电影的票房表现、观众评分与票房的关系、不同语言电影的受欢迎程度等。这些分析可以为电影投资和发行决策提供参考。

### 内容分类与标签体系优化

通过分析电影的类型、导演、演员等信息,可以优化电影内容的分类体系和标签系统。这对于提高内容发现的效率和准确性具有重要意义,帮助用户更快地找到感兴趣的电影。

## 结尾

本数据集是一个高质量的烂番茄电影数据集,包含10000+部电影的元数据和相关影评信息。数据集具有数据规模大、信息完整、来源权威等优点,为电影推荐系统开发、情感分析和电影市场研究提供了丰富的数据资源。

数据集以CSV格式存储,便于高效读写和处理。用户可以根据实际需求选择合适的数据子集进行分析,也可以结合业务知识对数据进行进一步的工程处理。

如有需要,可获取更多数据集相关信息。

看了又看

验证报告

以下为卖家选择提供的数据验证报告:

data icon
烂番茄电影数据集-10000部电影信息含观众评分与影评数据支持电影推荐系统开发与情感分析研究
9.9
408.26MB
申请报告