# 印度餐饮行业全量数据集深度分析报告
## 引言与背景
随着全球餐饮行业数字化转型的加速,大数据分析在餐饮运营、用户洞察和商业决策中的作用日益凸显。本数据集包含印度餐饮行业的全量数据,涵盖148,541家餐厅、100,000名用户、371,561种菜品、1,179,936条菜单记录和150,281笔订单交易,构成了一个完整的餐饮生态数据体系。
该数据集不仅包含基础元数据信息,还涵盖了丰富的业务维度,包括餐厅的地理位置、菜系分类、评分信息、价格定位,用户的人口统计学特征如年龄、性别、职业、收入水平,以及完整的订单交易记录。这些数据为餐饮行业研究、算法训练和商业智能应用提供了坚实的数据基础。
在学术研究领域,该数据集可用于分析餐饮消费行为模式、用户偏好挖掘、市场竞争格局等课题;在产业应用方面,可支撑智能推荐系统开发、动态定价策略优化、供应链管理等实际业务场景。
## 数据基本信息
### 数据字段说明
| 字段名称 | 字段类型 | 字段含义 | 数据示例 | 完整性 |
|---------|---------|---------|---------|--------|
| id | 整数 | 餐厅唯一标识 | 567335 | 100% |
| name | 字符串 | 餐厅名称 | AB FOODS POINT | 100% |
| city | 字符串 | 所在城市 | Abohar | 100% |
| rating | 字符串/浮点 | 用户评分 | 4.4 | 99.8% |
| rating_count | 字符串 | 评分数量 | 50+ ratings | 99.8% |
| cost | 字符串 | 人均消费 | ₹ 200 | 100% |
| cuisine | 字符串 | 菜系分类 | Beverages,Pizzas | 100% |
| user_id | 整数 | 用户唯一标识 | 49226 | 100% |
| Age | 整数 | 用户年龄 | 24 | 100% |
| Gender | 字符串 | 用户性别 | Male | 100% |
| Occupation | 字符串 | 职业类型 | Student | 100% |
| Monthly Income | 字符串 | 月收入水平 | 25001 to 50000 | 100% |
| f_id | 字符串 | 菜品唯一标识 | fd0 | 100% |
| item | 字符串 | 菜品名称 | Aloo Tikki Burger | 100% |
| veg_or_non_veg | 字符串 | 荤素分类 | Veg | 100% |
| order_date | 日期 | 订单日期 | 2018-05-08 | 100% |
| sales_amount | 整数 | 订单金额 | 41241 | 100% |
### 数据规模概览
| 数据类型 | 记录数量 | 核心特征 |
|---------|---------|---------|
| 餐厅数据 | 148,541 | 覆盖821个城市,2,132种菜系 |
| 用户数据 | 100,000 | 年龄18-33岁,涵盖多职业群体 |
| 食物数据 | 371,561 | 素食占72.9%,非素食占27.1% |
| 菜单数据 | 1,179,936 | 关联餐厅与菜品的多对多关系 |
| 订单数据 | 150,281 | 时间跨度2017-2020年,总销售额9.87亿INR |
### 城市分布(Top 10)
| 城市 | 餐厅数量 | 占比 |
|-----|---------|-----|
| Bikaner | 1,666 | 1.12% |
| Noida-1 | 1,428 | 0.96% |
| Indirapuram,Delhi | 1,279 | 0.86% |
| BTM,Bangalore | 1,161 | 0.78% |
| Rohini,Delhi | 1,136 | 0.76% |
| Kothrud,Pune | 1,089 | 0.73% |
| Indiranagar,Bangalore | 1,080 | 0.73% |
| Electronic City,Bangalore | 1,039 | 0.70% |
| Greater Kailash 2,Delhi | 1,038 | 0.70% |
| Vashi,Mumbai | 1,022 | 0.69% |
### 用户性别分布
| 性别 | 用户数量 | 占比 |
|-----|---------|-----|
| Male | 57,218 | 57.22% |
| Female | 42,782 | 42.78% |
### 用户职业分布
| 职业 | 用户数量 | 占比 |
|-----|---------|-----|
| Student | 53,357 | 53.36% |
| Employee | 30,408 | 30.41% |
| Self Employeed | 13,913 | 13.91% |
| House wife | 2,322 | 2.32% |
### 用户收入分布
| 收入区间 | 用户数量 | 占比 |
|---------|---------|-----|
| No Income | 48,204 | 48.20% |
| 25001 to 50000 | 17,779 | 17.78% |
| More than 50000 | 15,976 | 15.98% |
| 10001 to 25000 | 11,599 | 11.60% |
| Below Rs.10000 | 6,442 | 6.44% |
### 年度订单销售趋势
| 年份 | 销售额(INR) | 占比 |
|-----|------------|-----|
| 2017 | 93,568,402 | 9.48% |
| 2018 | 414,308,941 | 41.99% |
| 2019 | 336,452,114 | 34.10% |
| 2020 | 142,235,559 | 14.42% |
## 数据优势
| 优势特征 | 具体表现 | 应用价值 |
|---------|---------|---------|
| 数据规模庞大 | 餐厅14.8万+、用户10万+、订单15万+ | 支持大规模算法训练和统计分析 |
| 覆盖范围广泛 | 涵盖821个城市、2,132种菜系 | 适合地域分析和市场研究 |
| 维度丰富完整 | 包含餐厅、用户、菜品、菜单、订单五大数据表 | 支持多维度交叉分析 |
| 时间跨度合理 | 订单数据覆盖2017-2020年 | 可进行趋势分析和季节性研究 |
| 用户画像清晰 | 包含年龄、性别、职业、收入等人口统计学特征 | 支持精准营销和个性化推荐 |
| 交易数据完整 | 包含订单金额、数量、时间等关键字段 | 适合消费行为分析和预测建模 |
## 数据样例
### 餐厅数据样例
| id | name | city | rating | cost | cuisine |
|---|------|------|--------|------|---------|
| 567335 | AB FOODS POINT | Abohar | -- | ₹ 200 | Beverages,Pizzas |
| 531342 | Janta Sweet House | Abohar | 4.4 | ₹ 200 | Sweets,Bakery |
| 158203 | theka coffee desi | Abohar | 3.8 | ₹ 100 | Beverages |
| 187912 | Singh Hut | Abohar | 3.7 | ₹ 250 | Fast Food,Indian |
### 用户数据样例
| user_id | name | Age | Gender | Occupation | Monthly Income |
|---------|------|-----|--------|-----------|---------------|
| 1 | Claire Ferguson | 20 | Female | Student | No Income |
| 2 | Jennifer Young | 24 | Female | Student | Below Rs.10000 |
| 3 | Jermaine Roberson | 22 | Male | Student | Below Rs.10000 |
| 4 | Rachel Carpenter | 22 | Female | Student | No Income |
### 食物数据样例
| f_id | item | veg_or_non_veg |
|------|------|----------------|
| fd0 | Aloo Tikki Burger | Veg |
| fd1 | Veg Creamy Burger | Veg |
| fd2 | Cheese Burst Burger | Veg |
| fd3 | Paneer Creamy Burger | Veg |
### 订单数据样例
| order_date | sales_qty | sales_amount | currency | user_id |
|------------|-----------|--------------|----------|---------|
| 2017-10-10 | 100 | 41241 | INR | 49226 |
| 2018-05-08 | 3 | -1 | INR | 77359 |
| 2018-04-06 | 1 | 875 | INR | 5321 |
| 2018-04-11 | 1 | 583 | INR | 21343 |
## 应用场景
### 智能推荐系统开发
基于该数据集,可以构建精准的餐饮推荐系统。通过分析用户的历史订单记录、偏好菜系、消费金额等数据,结合餐厅的地理位置、评分、价格等特征,开发个性化推荐算法。系统可以根据用户的实时位置推荐附近餐厅,根据消费历史推荐相似菜品,还可以基于用户画像进行跨餐厅的菜品推荐。例如,针对学生群体可以推荐性价比高的快餐和饮料,针对高收入人群可以推荐高端餐厅和特色菜品。
### 餐饮市场竞争分析
该数据集提供了印度821个城市的餐厅分布数据,可以用于深入分析不同城市的餐饮市场竞争格局。通过分析各城市的餐厅数量、菜系分布、价格区间等指标,可以帮助餐饮企业识别市场机会和竞争热点。例如,可以发现哪些城市的餐厅密度较低存在市场空白,哪些菜系在特定地区更受欢迎,从而为新餐厅选址和菜单设计提供决策支持。
### 用户消费行为研究
基于10万用户的人口统计学数据和15万订单记录,可以开展深入的消费行为研究。分析不同年龄、性别、职业和收入群体的消费习惯差异,探索消费行为的时间规律和季节性变化。例如,学生群体更倾向于低价快餐,高收入人群更注重餐厅品质和就餐环境;周末和节假日的消费高峰特征等。这些洞察可以帮助餐饮企业优化运营策略和营销活动。
### 动态定价策略优化
通过分析历史订单数据和用户支付意愿,可以开发动态定价模型。根据不同时间段、不同用户群体、不同菜品的需求弹性,制定差异化的定价策略。例如,在午餐和晚餐高峰期可以适当提高热门菜品价格,在非高峰时段推出优惠活动吸引顾客。同时,结合菜品的成本数据和销售数据,可以优化菜单结构,淘汰低毛利菜品,推广高利润产品。
### 供应链管理优化
该数据集包含丰富的菜品信息和销售数据,可以用于优化餐饮供应链管理。通过分析菜品的销售频率和数量,预测食材需求量,优化库存管理,降低食材浪费。同时,可以根据不同地区的菜品偏好,优化食材采购和配送路线,提高供应链效率。例如,针对素食占比高的地区,可以增加蔬菜和豆制品的采购量;针对海鲜餐厅集中的区域,可以优化海鲜供应链。
## 结尾
本数据集是印度餐饮行业的宝贵资源,包含148,541家餐厅、100,000名用户、371,561种菜品和150,281笔订单的完整信息。其数据规模庞大、维度丰富、覆盖范围广泛,为餐饮行业研究和商业应用提供了坚实的基础。
该数据集的核心价值在于其完整性和关联性,五大数据表相互关联,构成了完整的餐饮生态系统数据。研究人员和企业可以基于这些数据开展智能推荐、市场分析、消费行为研究、动态定价和供应链优化等多个领域的应用。
无论是学术研究还是商业应用,该数据集都具有重要的参考价值。通过深入挖掘数据背后的规律和趋势,可以为餐饮行业的数字化转型和智能化升级提供有力支撑。
看了又看
验证报告
以下为卖家选择提供的数据验证报告:






