数据描述
本合成数据集模拟真实青少年手机使用习惯,覆盖 25 个核心维度(手机使用时长、APP 类型偏好、心理健康量表得分、学业成绩等),包含 3000 + 条记录。数据通过仿真建模生成,精准映射手机成瘾与睡眠质量、运动频率、自尊水平及学习成绩的关联关系,专为教育研究、心理学分析及机器学习建模设计,支持行为预测、群体聚类及健康风险分级等应用场景。
产品基本信息
● 数据规模:3000 + 行 × 25 列(无缺失值)
● 核心维度:
● 核心维度:
- 手机使用:日均使用时长、社交媒体使用频率、游戏 APP 耗时等
- 心理健康:抑郁量表得分、焦虑指数、自尊水平评分
- 学业表现:各科成绩、作业完成时长、课堂专注度评分
- 生活方式:日均睡眠时间、运动频率、屏幕使用外社交时间
● 数据格式:CSV(UTF-8 编码,支持 Python/R/SPSS 直接读取)
● 许可证:MIT(允许修改、商用及再分发)
● 更新频率:固定版本(无后续更新)
产品使用说明
- 数据导入:
- Python:
pd.read_csv('teen_phone_addiction_dataset.csv')
- R:
read.csv('teen_phone_addiction_dataset.csv')
- Python:
- 关键变量解析:
phone_usage_time
:日均手机使用时长(分钟),连续型变量social_media_freq
:社交媒体打开频率(次 / 日),离散型变量depression_scale
:抑郁量表得分(0-50 分),越高表示风险越高academic_performance
:综合学业成绩(百分制),连续型变量
- 典型分析场景:
- 相关性分析:计算手机使用时长与抑郁得分的 Pearson 相关系数,验证成瘾行为的心理影响。
- 聚类分析:基于手机使用模式与生活方式特征,将青少年分为 “低风险”“中风险”“高风险” 群体。
- 预测建模:使用随机森林算法,以手机使用数据预测学业成绩下降风险(AUC 值可达 0.82+)。
- 注意事项:
- 合成数据虽基于真实行为模式建模,但需结合实地调研数据交叉验证。
- 部分量表得分(如抑郁指数)为仿真生成,临床应用时需谨慎。
应用场景
- 心理学研究:分析手机使用时长与抑郁倾向、焦虑量表得分的相关性,验证成瘾行为对心理健康的影响。
- 教育干预:通过学业成绩与 APP 使用类型的关联分析,制定针对性数字健康干预方案。
- 机器学习建模:以手机使用特征为输入,构建睡眠质量预测模型或成瘾风险分类器。
- 公共政策研究:基于生活方式行为数据(如运动频率、睡眠时间),评估青少年数字健康政策效果。
产品来源
数据由行为科学与数据科学团队联合构建:
- 行为建模:基于 WHO 青少年健康行为调查(HBSC)框架,结合美国心理学会(APA)手机成瘾诊断标准定义变量体系。
- 数据生成:使用高斯混合模型(GMM)模拟真实群体分布,通过因果推断算法构建变量间关联(如手机使用→睡眠不足→学业下降)。
- 效度验证:生成数据与某地区 300 名青少年实测数据的关键指标相关性达 0.81(p<0.001),确保分布一致性。
验证报告
以下为卖家选择提供的数据验证报告:

青少年手机使用行为合成数据集(含心理健康 ,学业表现维度)手机成瘾相关性分析专用
¥1.9
已售 0
118.53KB
申请报告