数据描述
引言与背景
高等教育机构的薪资透明度一直是学术界、政策制定者和公众关注的焦点。薪资数据的公开不仅有助于促进教育机构的财务透明度和问责制,更为研究教育行业薪资公平性、性别差异、职位晋升路径以及不同学科领域的薪酬结构提供了宝贵的数据基础。本数据集完整收录了美国俄亥俄州13所主要公立高等教育机构在2011年至2022年期间所有员工的薪资信息,涵盖从基层员工到高级管理人员的全职位层级,为深入理解高等教育行业的人力资源结构和薪资分配模式提供了全面而详实的数据支撑。
本数据集以结构化CSV格式呈现,包含员工姓名、所属学校、职位描述、部门信息、年度收入以及数据年份等六个核心字段。数据来源于俄亥俄州政府公开的薪资记录,经过系统化整理和标准化处理,确保了数据的一致性和可用性。数据集不仅记录了超过93万条员工薪资记录,还涵盖了近4万种不同的职位类型和超过9000个不同的部门单位,充分展现了高等教育机构复杂而多样化的组织架构。这些数据对于进行跨年度薪资趋势分析、跨机构薪资对比研究、职位层级与收入关系探索、以及教育公平性评估等研究具有不可替代的价值。
对于科研工作者而言,本数据集为经济学、社会学、教育学和公共政策等领域的实证研究提供了大规模、高质量的观测数据。研究者可以利用这些数据探讨教育行业中的薪资性别差异、种族差异、学科差异等敏感而重要的社会议题,为制定更加公平的薪酬政策提供数据支持。对于算法开发者而言,本数据集可用于训练薪资预测模型、职位推荐系统、异常薪资检测算法等机器学习应用。对于人力资源从业者和政策制定者而言,这些数据可以帮助他们了解行业薪资基准、制定合理的薪酬策略、识别潜在的薪资不公问题,从而推动教育机构的人力资源管理更加科学化和透明化。
数据基本信息
数据规模与覆盖范围
本数据集共包含934,348条员工薪资记录,时间跨度从2011年至2022年,涵盖12个完整年度。数据覆盖俄亥俄州13所主要公立高等教育机构,包括俄亥俄州立大学、托莱多大学、辛辛那提大学、肯特州立大学等知名学府。数据集记录了38,679种不同的职位类型和9,352个不同的部门单位,充分展现了高等教育机构组织结构的复杂性和多样性。
数据字段说明
| 字段名称 | 字段类型 | 字段含义 | 数据示例 | 完整性 |
|---|---|---|---|---|
| Name | 文本型 | 员工姓名 | Don Potter, Emily Potter | 100.00% |
| School | 文本型 | 所属学校名称 | The Ohio State University, University of Akron | 100.00% |
| Job Description | 文本型 | 职位描述/职务名称 | Assistant Lecturer, Associate Professor-Clinical | 97.15% |
| Department | 文本型 | 所属部门或学院 | Social Work, Pediatrics, Athletics | 93.53% |
| Earnings | 数值型 | 年度收入(美元) | 2472.0, 48538.02, 182512.15 | 98.96% |
| Year | 整数型 | 数据记录年份 | 2011, 2012, ..., 2022 | 100.00% |
年份分布情况
| 年份 | 记录数量 | 占比 | 累计占比 |
|---|---|---|---|
| 2011 | 26,983 | 2.89% | 2.89% |
| 2012 | 46,200 | 4.94% | 7.83% |
| 2013 | 83,146 | 8.90% | 16.73% |
| 2014 | 81,076 | 8.68% | 25.41% |
| 2015 | 83,755 | 8.96% | 34.37% |
| 2016 | 87,301 | 9.34% | 43.72% |
| 2017 | 89,105 | 9.54% | 53.25% |
| 2018 | 87,629 | 9.38% | 62.63% |
| 2019 | 84,669 | 9.06% | 71.69% |
| 2020 | 86,292 | 9.24% | 80.93% |
| 2021 | 87,205 | 9.33% | 90.26% |
| 2022 | 90,987 | 9.74% | 100.00% |
从年份分布可以看出,数据在2013年之后趋于稳定,每年记录数量在8万至9万条之间,反映了各高等教育机构员工规模的相对稳定性。2022年的记录数量达到峰值,可能与数据收集的完整性提升有关。
学校分布情况(Top 13)
| 学校名称 | 记录数量 | 占比 |
|---|---|---|
| The Ohio State University | 424,050 | 45.38% |
| University of Toledo | 79,777 | 8.54% |
| University Of Cincinnati | 79,021 | 8.46% |
| Kent State University | 68,338 | 7.31% |
| Ohio University | 59,852 | 6.41% |
| Miami University | 58,712 | 6.28% |
| Wright State University | 40,215 | 4.30% |
| Youngstown State University | 32,891 | 3.52% |
| Bowling Green State University | 31,119 | 3.33% |
| University of Akron | 24,101 | 2.58% |
| Cleveland State University | 20,876 | 2.23% |
| Shawnee State University | 8,362 | 0.89% |
| Central State University | 7,034 | 0.75% |
俄亥俄州立大学作为该州最大的公立大学,其记录数量占数据集总量的45.38%,体现了其在州内高等教育体系中的主导地位。其他12所大学的记录分布相对均衡,共同构成了俄亥俄州公立高等教育系统的完整图景。
职位类型分布情况(Top 20)
| 职位类型 | 记录数量 | 占比 |
|---|---|---|
| Professor | 28,204 | 3.02% |
| Associate Professor | 24,831 | 2.66% |
| Assistant Professor | 18,684 | 2.00% |
| Staff Nurse-B | 18,399 | 1.97% |
| Lecturer | 15,439 | 1.65% |
| Patient Care Associate | 12,923 | 1.38% |
| Faculty Part-Time -Semester | 11,835 | 1.27% |
| Clinical Inst HS | 10,813 | 1.16% |
| Custodial Worker | 10,807 | 1.16% |
| Special Events Assistant 1 | 9,737 | 1.04% |
| Assistant Professor-Clinical | 8,027 | 0.86% |
| Staff Nurse | 6,782 | 0.73% |
| Office Associate | 6,575 | 0.70% |
| Adjunct Instructor | 6,573 | 0.70% |
| Patient Revenue Cycle Spclst | 6,532 | 0.70% |
| Adjunct | 6,428 | 0.69% |
| Visiting Faculty | 5,994 | 0.64% |
| Senior Lecturer | 5,897 | 0.63% |
| Tenure Track Faculty 9 Month | 5,821 | 0.62% |
| Program Coordinator | 5,778 | 0.62% |
职位分布展现了高等教育机构人员构成的多样性,从学术职位(教授、副教授、助理教授)到行政职位(项目协调员、办公室助理),从医疗相关职位(护士、患者护理助理)到支持性职位(保管员、特殊活动助理),全面覆盖了大学运营的各个层面。
部门分布情况(Top 20)
| 部门名称 | 记录数量 | 占比 |
|---|---|---|
| University Hospitals | 45,255 | 4.84% |
| Cancer Hosp & Research Instit | 33,112 | 3.54% |
| University | 23,493 | 2.51% |
| Health System | 19,683 | 2.11% |
| Athletics | 13,085 | 1.40% |
| Shared Services | 12,762 | 1.37% |
| University Hospitals East | 12,040 | 1.29% |
| Internal Medicine | 9,282 | 0.99% |
| Ross Heart Hospital | 8,016 | 0.86% |
| English | 6,764 | 0.72% |
| Comprehensive Cancer Center RU | 6,185 | 0.66% |
| Special Duty | 5,982 | 0.64% |
| OSUE County Operations | 5,250 | 0.56% |
| Arts & Science Admin | 5,091 | 0.54% |
| Pediatrics | 5,013 | 0.54% |
| Psychology | 4,611 | 0.49% |
| Assoc VP Housing,Dining,Rec,Bus Svc | 4,149 | 0.44% |
| Schottenstein Hourly | 4,051 | 0.43% |
| College of Nursing | 3,741 | 0.40% |
| University Libraries | 3,727 | 0.40% |
部门分布反映了现代大学作为综合性机构的特征,医疗系统(医院、癌症中心、心脏医院)占据了相当大的比重,体现了大学附属医疗中心在高等教育机构中的重要地位。同时,传统的学术部门(英语、心理学、护理学院)和行政支持部门(共享服务、体育部门)也都有充分的代表性。
收入分布情况
收入统计摘要:
- 最低收入:$0.02
- 最高收入:$8,021,376.56
- 平均收入:$54,659.13
- 中位数收入:$44,525.01
- 标准差:$61,373.98
收入区间分布:
| 收入区间 | 记录数量 | 占比 |
|---|---|---|
| <$30K | 307,066 | 32.86% |
| $30K-$50K | 209,692 | 22.44% |
| $50K-$75K | 200,378 | 21.45% |
| $75K-$100K | 99,578 | 10.66% |
| $100K-$150K | 69,688 | 7.46% |
| $150K-$200K | 18,186 | 1.95% |
| >$200K | 20,085 | 2.15% |
收入分布呈现出典型的右偏分布特征,约55%的员工年收入低于5万美元,这主要反映了大量兼职教师、辅助人员和初级职位的存在。同时,高收入群体(超过15万美元)占比约4%,主要包括高级教授、医院医生和高级管理人员,体现了高等教育机构中薪资结构的层次性。
数据优势
| 优势特征 | 具体表现 | 应用价值 |
|---|---|---|
| 数据规模大 | 包含934,348条完整记录,覆盖12个年度 | 支持大规模统计分析和机器学习模型训练,确保研究结论的统计显著性和泛化能力 |
| 时间跨度长 | 2011-2022年连续12年数据 | 支持长期趋势分析、薪资增长轨迹追踪、经济周期影响研究等时间序列分析 |
| 覆盖范围广 | 涵盖13所主要公立大学,38,679种职位,9,352个部门 | 支持跨机构对比研究、职位层级分析、学科差异研究等多维度分析 |
| 数据完整性高 | 核心字段完整率均超过93%,姓名和学校字段完整率100% | 减少数据清洗工作量,提高分析效率和结果可靠性 |
| 真实官方数据 | 来源于俄亥俄州政府公开的薪资记录 | 数据权威可靠,适合用于政策研究、公平性评估等严肃学术研究 |
| 结构化格式 | 标准CSV格式,字段清晰明确 | 便于直接导入数据分析工具,支持快速数据探索和可视化 |
| 职位信息详细 | 包含具体职位描述和部门信息 | 支持精细化的职位分类研究、部门薪资差异分析、职业发展路径探索 |
| 收入数据精确 | 精确到美分的收入数值 | 支持高精度的薪资计算、统计分析、异常检测等应用 |
| 跨年度可追踪 | 同一员工可能在不同年份出现 | 支持个人职业发展轨迹分析、薪资增长模式研究、员工流动分析 |
数据样例
以下是本数据集中具有代表性的15条数据样例,涵盖了不同的年份、学校、职位类型、部门以及收入水平,充分展现了数据集的多样性和丰富性:
| 姓名 | 学校 | 职位描述 | 部门 | 收入(美元) | 年份 |
|---|---|---|---|---|---|
| Yesenia Rivera | The Ohio State University | Custodial Worker 2 | Stu Life Environmental Svcs | 26,344.43 | 2019 |
| Maryssa Kick | The Ohio State University | Research Technician 3 | FAES | Center for Food Animal Health | 35,678.66 | 2022 |
| Myron A. Bodman | Kent State University | Faculty PT Professional -12 Mo | CPM Podiatric Medicine | 40,319.00 | 2013 |
| Virnette House-Browning | Cleveland State University | Associate Director (Admin)-10 | ATH ADMIN | 121,431.60 | 2012 |
| Thomas E. Leary | Youngstown State University | Associate Professor | History | 75,675.81 | 2015 |
| Coumba Sam | The Ohio State University | Unit Clerical Associate (HS) | Health System | 704.63 | 2021 |
| Jennifer Lynn Parks | The Ohio State University | Office Associate | Cancer Hosp & Research Instit | 37,913.18 | 2018 |
| Bradley Leigh | Bowling Green State University | Executive Director | Business Operations | 157,482.00 | 2018 |
| Louise M. Ditchey | Kent State University | Academic Program Dir | Graduate Programs Office | 72,774.18 | 2018 |
| Blair Hayes | The Ohio State University | Assistant Professor - Clinical | University | 363,842.35 | 2021 |
| Linda Pierce | University of Toledo | Professor | College of Nursing Instruction | 141,229.92 | 2018 |
| Shana Whitney | The Ohio State University | Advanced Practice Provider 3 | Ambulatory Services | Ambulatory Advanced Practice | 81,190.92 | 2022 |
| Suliman Ahmed Dregia | The Ohio State University | Associate Professor | Materials Sci Engineering | 97,404.00 | 2016 |
| Rodney Fausnaugh | University of Toledo | Lead Pc Lan Tech | IT Personnel | 64,867.42 | 2022 |
| Kathryn Virginia Wahlke | University Of Cincinnati | Asst Dir Food Services | nan | 60,000.00 | 2018 |
这些样例展现了数据集的多个维度:从基础支持职位(保管员、办公室助理)到高级学术职位(教授、副教授),从行政管理人员到医疗专业人员,从低收入的兼职职位到高收入的临床教授职位。收入范围从数百美元到数十万美元,充分反映了高等教育机构中不同职位层级的薪资差异。部分记录的部门信息可能为空(如最后一条样例),这反映了数据集中约6.47%的部门字段缺失率,但在进行统计分析时可以通过适当的缺失值处理方法来应对。
应用场景
薪资公平性与性别差异研究
本数据集为深入研究高等教育机构中的薪资公平性问题提供了丰富的数据基础。研究者可以基于员工姓名推断性别(通过姓名数据库匹配),分析不同性别在相同职位、相同部门或相同学校中的薪资差异。通过控制职位级别、工作年限、部门类型等变量,可以识别出潜在的性别薪资差距,并探讨这种差距在不同学科领域、不同学校规模、不同职位层级中的表现差异。这种研究不仅具有重要的学术价值,更能为制定更加公平的薪酬政策提供实证依据。研究者还可以结合时间维度,分析性别薪资差距在2011-2022年期间的变化趋势,评估相关政策措施的效果。此外,通过对比不同学校的性别薪资差异,可以识别出在促进性别平等方面表现较好的机构,为其他机构提供参考模式。
跨机构薪资基准与竞争力分析
人力资源从业者和大学管理者可以利用本数据集进行跨机构的薪资基准分析,了解不同职位在行业中的薪资水平,从而制定具有竞争力的薪酬策略。通过对比13所大学在相同职位上的薪资水平,可以识别出薪资领先的机构和需要调整的机构。这种分析对于招聘和人才保留至关重要,特别是在竞争激烈的学术人才市场中。管理者可以针对关键职位(如教授、系主任、高级管理人员)进行详细的薪资对比,了解本校在人才市场上的定位。同时,通过分析不同收入区间的员工分布,可以评估本校的薪资结构是否合理,是否存在过度集中或过度分散的问题。这种基准分析还可以帮助预算规划,预测不同职位层级的薪资成本,为长期财务规划提供数据支持。
职位层级与职业发展路径分析
数据集包含近4万种不同的职位类型,为研究高等教育机构中的职位层级结构和职业发展路径提供了独特的机会。研究者可以基于职位描述和薪资水平,构建职位层级体系,识别从初级职位到高级职位的晋升路径。通过分析同一员工在不同年份的记录(如果存在),可以追踪个人的职业发展轨迹,了解典型的晋升时间、薪资增长幅度、跨部门流动模式等。这种分析对于职业规划、人才发展项目设计、以及理解学术职业的流动性都具有重要价值。同时,通过对比不同学科领域的职业发展路径,可以识别出某些领域的"快速通道"或"瓶颈职位",为职业发展咨询提供数据支持。对于学生和早期职业研究者而言,这些信息可以帮助他们更好地规划学术生涯。
学科差异与跨领域薪资对比研究
高等教育机构中不同学科领域的薪资差异一直是学术界关注的话题。本数据集通过部门信息可以识别出不同的学科领域(如英语、心理学、材料科学工程、护理等),从而支持跨学科的薪资对比研究。研究者可以分析STEM领域(科学、技术、工程、数学)与非STEM领域的薪资差异,探讨这种差异是否反映了市场供需关系、研究经费差异、或其他结构性因素。同时,可以对比基础学科与应用学科的薪资水平,分析临床职位(如临床教授、医疗专业人员)与纯学术职位的薪资差异。这种研究不仅有助于理解学术劳动力市场的运作机制,还能为学科发展战略、资源配置决策提供参考。对于政策制定者而言,了解不同学科的薪资差异有助于制定更加平衡的学科发展政策,避免某些重要但薪资较低的学科出现人才流失。
机器学习模型训练与薪资预测系统开发
本数据集的大规模和高完整性使其成为训练机器学习模型的理想数据源。算法开发者可以利用这些数据训练薪资预测模型,根据职位、部门、学校、年份等特征预测员工的薪资水平。这种模型可以用于多种应用场景:人力资源系统可以基于职位描述自动估算合理的薪资范围,帮助招聘团队制定薪资方案;求职者可以使用这种模型了解不同职位和学校的预期薪资,做出更明智的职业选择;管理者可以利用模型识别异常薪资,检测可能存在的不公平或错误。除了薪资预测,还可以开发其他机器学习应用,如职位推荐系统(基于薪资期望和技能匹配推荐合适职位)、异常检测系统(识别异常高或异常低的薪资记录)、以及薪资公平性评估工具(自动检测潜在的歧视性薪资模式)。数据集的时间跨度还支持时间序列模型的训练,可以预测薪资趋势,为长期规划提供支持。
经济周期与政策影响评估研究
数据集覆盖2011-2022年期间,这一时期包含了经济复苏、政策变化等多个重要阶段,为研究外部因素对高等教育薪资的影响提供了机会。研究者可以分析薪资水平与经济指标(如GDP增长率、失业率)的关系,探讨高等教育机构是否在经济波动中保持薪资稳定,或者是否受到经济周期的影响。同时,可以评估特定政策(如教育经费变化、医疗改革、最低工资调整等)对大学员工薪资的影响。通过对比不同学校、不同职位类型、不同部门对经济变化的响应,可以识别出哪些领域更加脆弱或更具韧性。这种研究对于理解高等教育机构的财务可持续性、制定应对经济波动的策略、以及评估政策效果都具有重要价值。对于政策制定者而言,这些研究可以帮助他们更好地预测政策变化对教育机构人力资源成本的影响。
组织架构与部门效率分析
数据集包含超过9000个不同的部门单位,为研究高等教育机构的组织架构和部门效率提供了丰富的数据。研究者可以分析不同部门的平均薪资、薪资分布、职位构成等,识别出高效运作的部门和可能存在问题的部门。通过对比相似功能的部门在不同学校中的表现,可以识别出最佳实践和组织模式。这种分析对于组织优化、资源配置、以及提高运营效率都具有重要价值。同时,可以研究部门规模与薪资水平的关系,探讨是否存在规模经济或规模不经济的问题。对于管理者而言,这种分析可以帮助他们识别需要重组或优化的部门,制定更加合理的组织架构。此外,通过分析医疗部门、学术部门、行政部门的薪资结构差异,可以更好地理解现代大学作为综合性机构的复杂性,为跨部门协作和资源整合提供参考。
结尾
本数据集以其大规模、高质量、长时间跨度的特点,为高等教育薪资研究、人力资源分析、政策评估以及机器学习应用提供了不可多得的数据资源。934,348条完整记录覆盖了俄亥俄州13所主要公立大学在2011-2022年期间的员工薪资信息,不仅记录了近4万种职位类型和超过9000个部门单位,更通过精确的收入数据和详细的职位描述,为多维度、深层次的数据分析奠定了坚实基础。
数据集的核心价值在于其真实性和完整性。作为来源于政府公开记录的官方数据,本数据集具有高度的权威性和可靠性,适合用于严肃的学术研究和政策分析。同时,数据的高完整率(核心字段完整率均超过93%)和结构化格式,使得研究者可以快速上手,将更多精力投入到深度分析而非数据清洗工作中。12年的连续时间跨度使得长期趋势分析和时间序列研究成为可能,而跨机构、跨职位、跨部门的广泛覆盖则为对比研究和多维度分析提供了丰富的可能性。
特别值得强调的是,本数据集不仅包含了元数据信息(姓名、职位、部门等),更重要的是包含了完整的原始薪资数值,这使得基于实际收入水平的精确分析成为可能。研究者可以直接进行薪资计算、统计分析、模型训练等操作,无需额外的数据补充或估算。这种完整性使得本数据集在薪资预测、公平性评估、基准分析等应用中具有独特的优势。
无论是进行学术研究、开发算法模型、制定人力资源策略,还是评估政策效果,本数据集都能提供强有力的数据支撑。随着数据科学和人工智能技术的不断发展,这类大规模、高质量的公开数据集将发挥越来越重要的作用,推动教育公平、组织优化和科学决策的进步。有需要可私信获取更多信息。
看了又看
验证报告
以下为卖家选择提供的数据验证报告:




