Li

verify-tag2025年南卡罗来纳州房地产数据 listings 数据集(含 8 大核心维度)房价预测 类型分类 投资分析

南卡罗来纳州房产数据2025 年房地产 listings房产特征数据集房价预测建模房产类型分类市场细分分析投资机会识别5000 + 条记录

1.99

已售 0
43.48KB

数据标识:D17519592608571887

发布时间:2025/07/08

数据描述

本数据集涵盖 2025 年南卡罗来纳州 5000 + 处房产的详细信息,通过 Apify API 从Realtor.com公开 listings 中合规采集,包含 8 大核心维度:房产主类型(独栋住宅 / 公寓 / 地块等)、子类型、面积(平方英尺)、浴室数量(含半浴室)、卧室数量、楼层数、建造年份及挂牌价(美元)。数据适用于构建房价预测模型(随机森林 / XGBoost 等)、房产类型分类器、市场细分聚类分析及投资机会识别,严格遵循 ODC-By 许可证规范,仅限教育、学术研究及数据科学学习使用。

产品基本信息

● 数据规模:5000 + 条记录 × 8 列(无缺失值,格式规范)
● 核心字段说明
  • type:主类型(single_family/condos/land/townhomes/multi_family/farm)
  • sub_type:子类型(condo/townhouse/co_op 等,补充主类型细节)
  • sqft:房屋面积(平方英尺,连续型变量,用于计算单价)
  • baths:浴室数量(含小数,如 2.5 表示 2 个全浴室 + 1 个半浴室)
  • beds:卧室数量(整数,影响家庭居住需求匹配)
  • stories:楼层数(整数,反映房屋结构特征)
  • year_built:建造年份(整数,用于评估房龄对价格的影响)
  • listPrice:挂牌价(美元,目标变量,用于预测模型)
    ● 数据格式:CSV(兼容 Excel、Python pandas、R 等工具)
    ● 许可证:ODC Attribution License(需标注来源,禁止商业使用)
    ● 更新频率:每年更新一次(反映最新市场动态)

产品使用说明

  1. 数据导入
    • Python:import pandas as pd; df = pd.read_csv('realestate_data_southcarolina_2025.csv')
    • R:df <- read.csv('realestate_data_southcarolina_2025.csv')
  2. 特征工程建议
    • 衍生指标:计算 “每平方英尺单价”(listPrice/sqft)、“浴室 - 卧室比”(baths/beds),增强模型解释力。
    • 数据清洗:对sqft为 0 或异常值(如 > 10000 平方英尺)进行过滤,对year_built缺失值用区域均值填充。
  3. 典型分析流程
    • 房价影响因素分析
      1. 绘制sqftlistPrice的散点图,观察面积与价格的正相关性。
      2. 用 ANOVA 分析不同type的房价差异(如独栋住宅 vs 公寓的均价对比)。
    • 聚类市场细分
      1. 选择sqftlistPriceyear_built作为特征,用 K-means(k=3)分为低 / 中 / 高价位市场。
      2. 统计各聚类的卧室 / 浴室数量分布,定位目标客群(如刚需市场多为 2-3 卧室)。
  4. 使用限制
    • 数据为 2025 年快照,不反映实时价格波动,需结合区域经济数据交叉验证。
    • 禁止商业用途(如房产中介定价工具、投资决策系统),使用时需标注数据来源为Realtor.com

应用场景

  1. 房价预测建模:以面积(sqft)、卧室 / 浴室数量、建造年份为特征,训练回归模型预测挂牌价,分析各因素对房价的影响权重。
  2. 房产类型分类:基于物理特征(如楼层数、面积)开发多类分类器,自动区分独栋住宅、公寓、联排别墅等类型。
  3. 市场细分分析:用 K-means 算法按面积、价格、房龄聚类,识别高端 / 中端 / 刚需房产市场,定位价格区间分布。
  4. 投资机会识别:通过异常检测模型(如 DBSCAN)找出 “低单价高面积”“房龄新但价格低于均值” 的低估房产。
  5. 时间趋势研究:分析不同建造年份的房产数量分布,预测区域开发热点(如新建住宅集中区)。

相似数据

美国运通校园挑战数据集(含 55 列全维度)产品赛道建模 行为分析 转化计算适配

 IPL 2020 球员表现数据集(击球手专项)梦幻球队优化核心指标含 14 维数据维度

青少年手机使用行为合成数据集(含心理健康 ,学业表现维度)手机成瘾相关性分析专用

产品来源

数据通过以下流程合规获取:

  1. 数据源Realtor.com公开的南卡罗来纳州房产 listings(非付费内容)。
  2. 采集方式:使用 Apify API 按 robots.txt 规则爬取,设置合理请求间隔(>1 秒 / 次),避免服务器负载。
  3. 数据清洗:去除重复 listings(按type+sqft+listPrice去重),标准化字段格式(如baths统一保留 1 位小数)。
  4. 合规性验证:通过 ODC-By 许可证审核,确保数据仅含公开信息,不涉及个人隐私(如业主信息已脱敏)。
 
 

验证报告

以下为卖家选择提供的数据验证报告:

data icon
2025年南卡罗来纳州房地产数据 listings 数据集(含 8 大核心维度)房价预测 类型分类 投资分析
1.99
已售 0
43.48KB
申请报告