# 全球用户生活方式画像数据集:47万条记录覆盖21国12类生活方式,助力营销推荐与行为建模研究
## 引言与背景
在数字经济高度发达的今天,理解用户的生活方式、消费偏好和行为特征,是企业开展精细化营销、科研机构开展行为科学研究以及算法工程师构建推荐与画像模型的核心基础。然而,兼具规模性、多样性与丰富标签的高质量用户行为数据集长期处于稀缺状态。本数据集正是在此背景下构建的一份典型的"用户画像"类结构化数据,覆盖全球 21 个国家、12 种生活方式类型,累计达 475,688 条用户记录。每条记录包含 31 个字段,涵盖人口统计信息(性别、年龄、姓名、城市、国家)、地理信息(国家/州/城市多级行政划分)、行为指标(月度娱乐消费、网购频次、慈善捐赠、运动时长、投资组合等)、心理与态度评分(健康意识、环境意识、技术接受度、压力管理等)以及最终的生活方式类别标签。
该数据集以结构化 CSV 格式提供,所有字段均为高质量完整数据(缺失率为 0%),可直接用于机器学习建模、用户画像聚类、推荐算法训练、消费行为预测、跨文化对比研究等多种任务。由于同时具备宏观地理覆盖(21 国)与微观行为细节(20+ 个量化维度),该数据集在社会科学、商业分析、人工智能等多个领域均具备重要的研究价值与应用价值。
## 数据基本信息
### 数据规模与总体构成
| 指标 | 数值 |
| --- | --- |
| 记录总数 | 475,688 条 |
| 字段总数 | 31 个 |
| 覆盖国家 | 21 个 |
| 覆盖州/省 | 664 个 |
| 覆盖城市 | 13,634 个 |
| 生活方式类别 | 12 类 |
| 姓名唯一数 | 1,4217(名)+ 20,265(姓) |
| 数据格式 | CSV 结构化文本 |
| 缺失率 | 0%(全字段完整) |
### 数据字段说明
| 字段名称 | 字段类型 | 字段含义 | 数据示例 | 完整性 |
| --- | --- | --- | --- | --- |
| Gender | 分类 | 用户性别 | male / female | 100% |
| First Name | 文本 | 用户名 | Stephen, Sofia | 100% |
| Last Name | 文本 | 用户姓 | Graham, Mitchell | 100% |
| City | 文本 | 所在城市 | Melbourne, Imatra | 100% |
| State | 文本 | 所在州/省/自治区 | Tasmania, Lapland | 100% |
| Country | 分类 | 所在国家 | Australia, Finland | 100% |
| Age | 整数 | 用户年龄(19–100) | 49, 37 | 100% |
| Annual Vacation Days | 浮点 | 年度休假天数 | 20.46, 15.06 | 100% |
| Average Monthly Spend on Entertainment | 浮点 | 月均娱乐消费(美元) | 40.48, 7.98 | 100% |
| Number of Online Purchases in Last Month | 浮点 | 近一月网购次数 | 97.22, 163.58 | 100% |
| Number of Charity Donations in Last Year | 浮点 | 近一年慈善捐赠次数 | 0.89, 0.25 | 100% |
| Average Weekly Exercise Hours | 浮点 | 每周平均运动时长(小时) | 0.05, 0.68 | 100% |
| Investment Portfolio Value | 浮点 | 投资组合价值(千美元) | 294.48, 217.29 | 100% |
| Health Consciousness Rating | 浮点 | 健康意识评分(0–13) | 0.69, 5.53 | 100% |
| Education Level | 浮点 | 教育水平指数 | 7.94, 11.80 | 100% |
| Average Daily Screen Time | 浮点 | 日均屏幕使用时长(小时) | 6.69, 4.39 | 100% |
| Environmental Awareness Rating | 浮点 | 环境意识评分(0–15) | 3.43, 0.59 | 100% |
| Social Media Influence Score | 浮点 | 社交媒体影响力评分(0–45) | 5.45, 2.41 | 100% |
| Risk Tolerance in Investments | 浮点 | 投资风险承受度(0–49) | 9.73, 6.70 | 100% |
| Number of Professional Trainings Attended | 浮点 | 参加职业培训次数 | 4.39, 3.41 | 100% |
| Tech-Savviness Score | 浮点 | 技术精通度评分(0–39) | 12.24, 13.99 | 100% |
| Financial Wellness Index | 浮点 | 财务健康指数 | 96.47, 90.39 | 100% |
| Lifestyle Balance Score | 浮点 | 生活平衡评分(0–61) | 26.62, 17.26 | 100% |
| Entertainment Engagement Factor | 浮点 | 娱乐参与度因子 | 2.31, 1.85 | 100% |
| Social Responsibility Index | 浮点 | 社会责任指数 | 0.00, 0.04 | 100% |
| Work-Life Balance Indicator | 浮点 | 工作生活平衡指标 | 0.01, 0.01 | 100% |
| Investment Risk Appetite | 浮点 | 投资风险偏好(0–9) | 7.26, 0.00 | 100% |
| Eco-Consciousness Metric | 浮点 | 生态意识度量(0–3) | 0.02, 0.00 | 100% |
| Stress Management Score | 浮点 | 压力管理评分(0–10) | 5.13, 3.03 | 100% |
| Time Management Skill | 浮点 | 时间管理技能(0–122) | 89.38, 31.96 | 100% |
| Lifestyle Choice | 分类 | 生活方式类别(12 类) | Eco-Friendly, Tech-Savvy | 100% |
### 性别分布
| 性别 | 记录数量 | 占比 |
| --- | --- | --- |
| male(男性) | 238,119 | 50.06% |
| female(女性) | 237,569 | 49.94% |
### 年龄分布
| 年龄段 | 记录数量 | 占比 | 累计占比 |
| --- | --- | --- | --- |
| 19–25 岁 | 89,734 | 18.86% | 18.86% |
| 26–35 岁 | 153,665 | 32.30% | 51.16% |
| 36–45 岁 | 129,428 | 27.21% | 78.37% |
| 46–55 岁 | 70,653 | 14.85% | 93.22% |
| 56–65 岁 | 25,328 | 5.32% | 98.54% |
| 65 岁以上 | 6,880 | 1.45% | 99.99% |
注:数据集中年龄最小值为 19 岁,因此不存在 0–18 岁记录。整体用户以 26–45 岁的青壮年为主,累计占比达 59.51%。
### 国家/地区分布(按记录数量降序)
| 国家 | 记录数量 | 占比 |
| --- | --- | --- |
| United Kingdom(英国) | 22,882 | 4.81% |
| Ukraine(乌克兰) | 22,811 | 4.80% |
| New Zealand(新西兰) | 22,799 | 4.79% |
| Norway(挪威) | 22,737 | 4.78% |
| Spain(西班牙) | 22,725 | 4.78% |
| India(印度) | 22,718 | 4.78% |
| Serbia(塞尔维亚) | 22,696 | 4.77% |
| Germany(德国) | 22,678 | 4.77% |
| Canada(加拿大) | 22,677 | 4.77% |
| Finland(芬兰) | 22,670 | 4.77% |
| Denmark(丹麦) | 22,647 | 4.76% |
| Ireland(爱尔兰) | 22,640 | 4.76% |
| Iran(伊朗) | 22,619 | 4.76% |
| Mexico(墨西哥) | 22,617 | 4.75% |
| Netherlands(荷兰) | 22,609 | 4.75% |
| United States(美国) | 22,588 | 4.75% |
| Turkey(土耳其) | 22,578 | 4.75% |
| Australia(澳大利亚) | 22,533 | 4.74% |
| Switzerland(瑞士) | 22,529 | 4.74% |
| France(法国) | 22,482 | 4.73% |
| Brazil(巴西) | 22,453 | 4.72% |
注:21 个国家分布较为均衡,单国占比集中在 4.72%–4.81% 区间,体现出良好的跨文化代表性。
### 生活方式类别分布(按占比降序)
| 生活方式类别 | 记录数量 | 占比 |
| --- | --- | --- |
| Health-Conscious(健康关注型) | 39,947 | 8.40% |
| Urban Professional(都市职业型) | 39,814 | 8.37% |
| Budget-Conscious(预算敏感型) | 39,791 | 8.36% |
| Digital Nomad(数字游民型) | 39,776 | 8.36% |
| Social Media Influencer(社交媒体影响型) | 39,708 | 8.35% |
| Adventure Seeker(冒险探索型) | 39,658 | 8.34% |
| Investor(投资者型) | 39,637 | 8.33% |
| Travel Enthusiast(旅行爱好者型) | 39,544 | 8.31% |
| Sustainable Investor(可持续投资者型) | 39,531 | 8.31% |
| Eco-Friendly(环保型) | 39,504 | 8.30% |
| Tech-Savvy(技术达人型) | 39,398 | 8.28% |
| Fitness Enthusiast(健身爱好者型) | 39,380 | 8.28% |
12 类生活方式分布较为均衡,单类占比在 8.28%–8.40% 之间,为分类算法训练提供了天然的多类别平衡样本。
### 核心数值字段统计摘要
| 指标 | 年龄 | 年休假(天) | 月娱乐消费 | 网购次数 | 投资组合价值 | 健康意识 | 屏幕时长 | 财务健康 | 生活平衡 | 时间管理 |
| --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- |
| 均值 | 36.57 | 19.90 | 25.38 | 135.54 | 34.70 | 1.02 | 4.58 | 107.22 | 20.68 | 36.88 |
| 标准差 | 11.52 | 11.63 | 19.52 | 30.24 | 70.75 | 0.92 | 2.11 | 53.04 | 12.44 | 30.72 |
| 最小值 | 19 | 0 | 0 | 20.31 | 0 | 0 | 0 | 0 | 0 | 0 |
| 25 分位 | 27 | 10.96 | 8.84 | 114.65 | 5.49 | 0.66 | 3.05 | 93.77 | 10.80 | 11.31 |
| 中位数 | 35 | 19.34 | 18.18 | 134.55 | 11.22 | 0.74 | 4.51 | 99.64 | 20.59 | 28.95 |
| 75 分位 | 44 | 27.44 | 40.75 | 155.73 | 18.82 | 0.87 | 5.99 | 107.33 | 29.38 | 54.64 |
| 最大值 | 100 | 129.75 | 191.21 | 270.59 | 1095.64 | 13.43 | 15.24 | 593.80 | 60.71 | 121.64 |
## 数据优势
| 优势特征 | 具体表现 | 应用价值 |
| --- | --- | --- |
| 规模宏大且分布均衡 | 47.5 万条记录,12 类生活方式占比均衡(单类约 8.3%),男女比例接近 1:1 | 适合训练大规模多分类模型,避免类别不平衡偏误 |
| 地理覆盖广泛 | 覆盖 21 个国家、664 个州/省、1.3 万余个城市 | 可用于跨文化、跨地域的消费行为对比研究 |
| 字段丰富且维度多维 | 31 个字段同时包含人口属性、地理、消费、心理、投资、健康、技术等维度 | 支持多维度画像建模与联合分析 |
| 数据完整性 100% | 全量 47.5 万条记录所有字段均无缺失 | 无需补全处理,可直接用于建模,提升算法训练效率 |
| 标签明确可用于监督学习 | 每条记录均含"生活方式"类别标签 | 可直接用于监督式分类、半监督学习与验证 |
| 数值字段多样性良好 | 消费、投资、屏幕时长等字段覆盖 0 值到高值的完整区间 | 支持回归、聚类、异常检测等多种算法范式 |
| 同时含原始文件(CSV) | 用户可直接读取原始 CSV 文件进行二次加工 | 灵活对接 pandas、Spark、SQL 等多种数据处理工具 |
| 连续年份与年龄段 | 年龄覆盖 19–100 岁完整区间 | 适合人群分层、代际差异研究 |
## 数据样例
由于本数据集为结构化 CSV 文件,无法在文章中完整展示全部 47.5 万条原始记录。下方样例覆盖了数据集在性别、国家、年龄段、生活方式等维度的多样性特征,实际使用时可直接获取完整 CSV 文件进行分析。
### 样例 1:Eco-Friendly(环保型)生活方式(澳大利亚,49 岁男性)
| 字段 | 取值 |
| --- | --- |
| Gender | male |
| First / Last Name | Stephen Graham |
| City / State / Country | Melbourne / Tasmania / Australia |
| Age | 49 |
| Annual Vacation Days | 20.4558 |
| Average Monthly Spend on Entertainment | 40.4767 |
| Number of Online Purchases | 97.2243 |
| Investment Portfolio Value | 294.4833 |
| Health Consciousness Rating | 0.6917 |
| Tech-Savviness Score | 12.2436 |
| Financial Wellness Index | 96.4670 |
| Lifestyle Balance Score | 26.6161 |
| Lifestyle Choice | Eco-Friendly |
### 样例 2:Adventure Seeker(冒险探索型)生活方式(芬兰,43 岁男性)
| 字段 | 取值 |
| --- | --- |
| Gender | male |
| City / Country | Imatra / Finland |
| Age | 43 |
| Investment Portfolio Value | 19.7512 |
| Health Consciousness Rating | 5.5313 |
| Education Level | 11.7970 |
| Financial Wellness Index | 111.1809 |
| Time Management Skill | 100.6926 |
| Lifestyle Choice | Adventure Seeker |
### 样例 3:Urban Professional(都市职业型)生活方式(加拿大,37 岁女性)
| 字段 | 取值 |
| --- | --- |
| Gender | female |
| City / Country | Hudson / Canada |
| Age | 37 |
| Number of Online Purchases | 163.5799 |
| Investment Portfolio Value | 217.2924 |
| Education Level | 0.8247 |
| Financial Wellness Index | 90.3916 |
| Lifestyle Balance Score | 17.2615 |
| Lifestyle Choice | Urban Professional |
### 样例 4:Budget-Conscious(预算敏感型)生活方式(荷兰,22 岁男性)
| 字段 | 取值 |
| --- | --- |
| Gender | male |
| City / Country | Borne / Netherlands |
| Age | 22 |
| Investment Portfolio Value | 2.3693 |
| Education Level | 12.8065 |
| Financial Wellness Index | 57.1976 |
| Lifestyle Balance Score | 3.7736 |
| Time Management Skill | 32.1793 |
| Lifestyle Choice | Budget-Conscious |
### 样例 5:Health-Conscious(健康关注型)生活方式(澳大利亚,38 岁男性)
| 字段 | 取值 |
| --- | --- |
| Gender | male |
| City / Country | Sunshine Coast / Australia |
| Age | 38 |
| Average Weekly Exercise Hours | 0.0000 |
| Financial Wellness Index | 149.7087 |
| Eco-Consciousness Metric | 0.4293 |
| Lifestyle Choice | Health-Conscious |
### 样例 6:Tech-Savvy(技术达人型)生活方式(瑞士,31 岁男性)
| 字段 | 取值 |
| --- | --- |
| Gender | male |
| City / Country | Pontresina / Switzerland |
| Age | 31 |
| Investment Portfolio Value | 15.0297 |
| Tech-Savviness Score | 24.0709 |
| Financial Wellness Index | 99.6379 |
| Time Management Skill | 23.5819 |
| Lifestyle Choice | Tech-Savvy |
### 样例 7:Social Media Influencer(社交媒体影响型)生活方式(芬兰,41 岁男性)
| 字段 | 取值 |
| --- | --- |
| Gender | male |
| City / Country | Akaa / Finland |
| Age | 41 |
| Annual Vacation Days | 44.1953 |
| Tech-Savviness Score | 19.2734 |
| Lifestyle Balance Score | 47.8463 |
| Time Management Skill | 35.7314 |
| Lifestyle Choice | Social Media Influencer |
### 样例 8:Sustainable Investor(可持续投资者型)生活方式(美国,84 岁女性)
| 字段 | 取值 |
| --- | --- |
| Gender | female |
| City / Country | Hampton / United States |
| Age | 84 |
| Investment Portfolio Value | 2.8148 |
| Financial Wellness Index | 265.3100 |
| Stress Management Score | 2.5902 |
| Lifestyle Choice | Sustainable Investor |
### 样例 9:Digital Nomad(数字游民型)生活方式(芬兰,36 岁女性)
| 字段 | 取值 |
| --- | --- |
| Gender | female |
| City / Country | Ulvila / Finland |
| Age | 36 |
| Investment Portfolio Value | 12.3576 |
| Financial Wellness Index | 102.0236 |
| Time Management Skill | 33.7304 |
| Lifestyle Choice | Digital Nomad |
### 样例 10:Travel Enthusiast(旅行爱好者型)生活方式(荷兰,23 岁男性)
| 字段 | 取值 |
| --- | --- |
| Gender | male |
| City / Country | Scheemda / Netherlands |
| Age | 23 |
| Annual Vacation Days | 34.2521 |
| Average Monthly Spend on Entertainment | 80.6456 |
| Investment Portfolio Value | 221.2290 |
| Lifestyle Choice | Travel Enthusiast |
### 样例 11:Fitness Enthusiast(健身爱好者型)生活方式(西班牙,48 岁女性)
| 字段 | 取值 |
| --- | --- |
| Gender | female |
| City / Country | San Sebastián / Spain |
| Age | 48 |
| Annual Vacation Days | 32.8211 |
| Financial Wellness Index | 98.5426 |
| Lifestyle Balance Score | 40.5648 |
| Investment Risk Appetite | 0.9611 |
| Lifestyle Choice | Fitness Enthusiast |
### 样例 12:Investor(投资者型)生活方式(墨西哥,38 岁男性)
| 字段 | 取值 |
| --- | --- |
| Gender | male |
| City / Country | Comoapan / Mexico |
| Age | 38 |
| Average Monthly Spend on Entertainment | 42.2567 |
| Investment Portfolio Value | 32.7276 |
| Financial Wellness Index | 134.7668 |
| Time Management Skill | 54.7336 |
| Lifestyle Choice | Investor |
## 应用场景
### 用户画像与精准营销
在数字化营销领域,用户画像系统的核心任务是基于多维度数据为每个用户构建可计算、可检索的"数字画像",从而为精准投放、千人千面推荐提供依据。本数据集以 47.5 万条带标签记录、12 类生活方式类别、20+ 个量化行为指标的组合,为构建此类系统提供了理想的训练语料。企业可以利用该数据集中的消费指标(月娱乐消费、网购次数)、心理评分(健康意识、环境意识)、技术接受度(技术精通度)与最终生活方式标签之间的关联,训练分类模型对新用户进行画像归类。例如,当一个用户月均娱乐消费较高、社交媒体影响力评分高、技术精通度高时,其被判定为"社交媒体影响型"的概率就显著上升。画像结果可支持广告投放、内容推荐、会员分层、精准触达等多种营销动作,将投放效率和 ROI 显著提升。
### 生活方式分类算法与监督式学习
在人工智能研究领域,生活方式分类是多标签分类、聚类分析、迁移学习等任务的经典应用场景。本数据集提供了 12 类经过标注的生活方式类别,且各类别占比均衡(约 8.3%–8.4%),非常适合训练多分类模型。研究者可以使用随机森林、XGBoost、LightGBM、深度神经网络、Transformer 表格模型等多种算法,对 31 个特征进行特征工程与模型训练,对比不同算法在多分类任务上的准确率、F1-score、混淆矩阵表现。此外,由于数据集同时包含人口属性与地理信息,还可进行"多任务学习"研究——在预测生活方式的同时,共同预测消费倾向、投资风险承受度等下游任务,探索不同特征对多任务的贡献度。
### 消费者行为与消费预测
在商业分析与消费研究领域,预测用户的消费倾向、投资意愿、屏幕使用时长等行为具有直接的业务价值。本数据集提供了多个可作为预测目标的连续变量:月均娱乐消费、网购次数、投资组合价值、年休假天数、慈善捐赠次数等,这些指标与性别、年龄、教育水平、技术精通度、财务健康指数等特征存在显著的统计关联。研究者和算法工程师可基于该数据集构建回归模型、时序预测模型、分位数回归模型等,定量分析不同人群的消费能力差异,识别高价值客户群体。例如,结合国家与生活方式标签,可以构建"国家级-生活方式"二维交叉分析,识别英国的"都市职业型"用户与印度的"数字游民型"用户在消费习惯上的显著差异,为跨国品牌的本地化运营提供数据支撑。
### 推荐系统与协同过滤研究
推荐系统依赖于高质量的用户画像与行为数据。本数据集中的"生活方式"标签可直接作为用户侧的"粗粒度画像",而消费、投资、娱乐参与度等字段则提供了"细粒度偏好"信号。研究者可基于该数据集开展基于内容的推荐、基于协同过滤的推荐、基于知识图谱的推荐等多种推荐算法的对比实验。例如,可以将用户的"娱乐参与度因子"与"生活平衡评分"结合,预测用户对不同类型内容的接受程度,从而提升内容推荐的点击率与停留时长。此外,跨 21 个国家的地理信息也使得"跨域推荐"研究成为可能——即在一个国家采集的用户数据训练模型,迁移到另一个国家进行推荐,研究模型的跨文化泛化能力。
### 跨文化与人群对比研究
本数据集覆盖 21 个国家、664 个州/省、1.3 万余个城市,为跨文化比较研究提供了罕见的多中心样本。社会学、人类学、市场营销等领域的研究者可基于该数据集,比较不同国家人群在平均娱乐消费、屏幕使用时长、环境意识、健康意识、投资风险偏好等维度的差异。例如,可以使用独立样本 t 检验、方差分析、非参数检验等方法,对比北欧国家(芬兰、瑞典、挪威)与南欧国家(西班牙、法国、意大利)在"环境意识"评分上的差异;也可以使用回归模型分析"年龄"与"风险承受度"的曲线关系,检验是否存在代际差异。此类研究结果对于制定全球化品牌策略、文化本地化方案具有重要的参考价值。
### 金融科技与风险评估
数据集中的投资组合价值、风险承受度、投资风险偏好、财务健康指数等字段,使其在金融科技与个人风险评估领域具备直接应用价值。金融机构与金融科技公司可利用该数据集训练信用评分模型、风险分级模型、投资组合推荐模型等。例如,结合"生活方式"标签与"风险承受度"字段,可以训练模型识别不同类型用户的投资倾向——"投资者型"和"可持续投资者型"用户的风险偏好显著高于"预算敏感型"和"健身爱好者型"用户。此类模型可应用于客户画像、产品推荐、合规风控等多个环节,提升金融机构的精细化运营水平。
## 结尾
综上所述,本数据集以 47.5 万条结构化记录、31 个多维度字段、12 类生活方式标签、21 国地理覆盖与 100% 数据完整性的综合优势,成为用户画像、行为建模、推荐系统、跨文化研究、金融风控等领域的高质量研究素材。数据集同时以 CSV 格式提供完整原始文件,可直接对接 Pandas、Spark、SQL、TensorFlow、PyTorch 等主流数据处理与机器学习工具,大幅降低研究与工程应用的启动成本。
无论您是在构建用户画像系统、开展消费行为研究、训练多分类算法,还是探索跨文化比较或金融风控建模,本数据集都能提供强有力的数据支撑。我们鼓励研究者与工程师充分利用其规模性、多样性与完整性特点,在算法创新、模型优化与行业应用方面产出高价值成果。
有需要可私信获取更多信息。
看了又看
验证报告
以下为卖家选择提供的数据验证报告:





