きゅがんせん

verify-tag2001-2020年美国康涅狄格州房地产销售数据集:大规模多维度房地产交易全记录

房地产销售数据美国

39.9

105.28MB

数据标识:D17816866013157324

发布时间:2026/06/17

# 2001-2020年美国康涅狄格州房地产销售数据集:大规模多维度房地产交易全记录

## 引言与背景

房地产市场数据是研究城市发展规律、居民经济行为与区域经济趋势的核心基础资源。美国康涅狄格州(Connecticut)作为美国东北部重要的经济与人口密集区域,其房地产市场长期受到学术界与产业界的高度关注。本数据集整合了康涅狄格州从2001年至2020年长达二十年的房地产交易全量记录,共计包含997,213条交易数据,覆盖全州170个城镇,为房地产研究、城市规划、金融风控、AI模型训练等多个领域提供了极具价值的数据支撑。

该数据集完整地记录了每笔房地产交易的序列号、挂牌年份、交易日期、所在城镇、详细地址、物业评估价值、实际成交金额、销售比率、物业类型、住宅类型、特殊用途代码、评估师备注、OPM备注以及地理坐标位置等多维度信息。其中,地理位置字段包含经纬度坐标数据,可用于地理空间分析与地图可视化。数据集涵盖独户住宅、联排公寓、多家庭住宅、商业物业、工业物业、公寓楼、空地及公用事业等多种物业类型,时间跨度完整覆盖2001年至2020年的完整市场周期,包括2008年金融危机前后的市场波动期以及近年的复苏增长期。

对于科研机构而言,该数据集可用于研究房地产价格时空演变规律、评估市场有效性、分析物业特征对成交价格的影响因素;对于金融机构而言,可用于抵押风险评估、资产估值模型训练与投资策略优化;对于政府部门而言,可辅助城市规划与土地政策制定;对于AI与机器学习领域,大规模高质量的结构化房地产数据更是训练价格预测模型、市场趋势分析模型的理想训练素材。

## 数据基本信息

### 数据字段说明

本数据集共包含14个字段,各字段详细说明如下:

| 字段名称 | 字段类型 | 字段含义 | 数据示例 | 完整性 |
|---------|---------|---------|---------|--------|
| Serial Number | 整数型 | 交易记录唯一序列号 | 2020348 | 100.00% |
| List Year | 整数型 | 挂牌年份(2001-2020) | 2020 | 100.00% |
| Date Recorded | 字符串 | 交易记录日期(MM/DD/YYYY格式) | 09/13/2021 | 99.99% |
| Town | 字符串 | 所在城镇名称 | Ansonia | 100.00% |
| Address | 字符串 | 物业详细地址 | 230 WAKELEE AVE | 99.99% |
| Assessed Value | 浮点型 | 物业评估价值(美元) | 150500.00 | 100.00% |
| Sale Amount | 浮点型 | 实际成交金额(美元) | 325000.00 | 100.00% |
| Sales Ratio | 浮点型 | 销售比率(成交价/评估价) | 0.463 | 100.00% |
| Property Type | 字符串 | 物业类型(住宅/商业/工业等) | Commercial | 61.65% |
| Residential Type | 字符串 | 住宅细分类型(独户/公寓等) | Single Family | 61.06% |
| Non Use Code | 字符串 | 特殊用途代码(交易性质分类) | 25 - Other | 29.05% |
| Assessor Remarks | 字符串 | 评估师备注信息 | WATERFRONT/COTTAGE ONLY | 15.03% |
| OPM remarks | 字符串 | 产权与抵押记录备注 | GOOD SALE PER MLS | 1.00% |
| Location | 字符串 | 地理坐标(WKT格式经纬度) | POINT (-73.18 41.64) | 19.82% |

### 数据规模与格式

本数据集以CSV格式存储,文件大小约为485.2 MB。数据集共包含997,213条交易记录,覆盖康涅狄格州全境170个城镇。数值型字段包括物业评估价值、实际成交金额和销售比率;分类字段包括物业类型、住宅类型、特殊用途代码;文本字段包括地址、各类备注信息;地理字段以WKT格式存储经纬度坐标。

### 数据分布情况

#### 挂牌年份分布

| 挂牌年份 | 记录数量 | 占比 | 累计占比 |
|---------|---------|------|---------|
| 2001 | 59,584 | 5.98% | 5.98% |
| 2002 | 59,682 | 5.98% | 11.96% |
| 2003 | 64,239 | 6.44% | 18.40% |
| 2004 | 84,056 | 8.43% | 26.83% |
| 2005 | 61,602 | 6.18% | 33.01% |
| 2006 | 48,785 | 4.89% | 37.90% |
| 2007 | 35,617 | 3.57% | 41.47% |
| 2008 | 32,735 | 3.28% | 44.75% |
| 2009 | 42,508 | 4.26% | 49.02% |
| 2010 | 33,491 | 3.36% | 52.38% |
| 2011 | 31,065 | 3.12% | 55.49% |
| 2012 | 35,973 | 3.61% | 59.10% |
| 2013 | 39,943 | 4.01% | 63.10% |
| 2014 | 49,563 | 4.97% | 68.07% |
| 2015 | 46,651 | 4.68% | 72.75% |
| 2016 | 49,773 | 4.99% | 77.74% |
| 2017 | 45,691 | 4.58% | 82.33% |
| 2018 | 50,709 | 5.09% | 87.41% |
| 2019 | 58,954 | 5.91% | 93.32% |
| 2020 | 66,592 | 6.68% | 100.00% |

#### 物业类型分布

| 物业类型 | 记录数量 | 占比 |
|---------|---------|------|
| Single Family(独户住宅) | 401,612 | 40.27% |
| Condo(联排公寓) | 105,420 | 10.57% |
| Residential(住宅-未细分) | 60,728 | 6.09% |
| Two Family(双家庭住宅) | 26,408 | 2.65% |
| Three Family(三家庭住宅) | 12,586 | 1.26% |
| Vacant Land(空地) | 3,163 | 0.32% |
| Four Family(四家庭住宅) | 2,150 | 0.22% |
| Commercial(商业物业) | 1,981 | 0.20% |
| Apartments(公寓楼) | 486 | 0.05% |
| Industrial(工业物业) | 228 | 0.02% |
| Public Utility(公用事业) | 5 | 0.00% |
| 未标注 | 382,446 | 38.35% |

#### 住宅类型分布

| 住宅类型 | 记录数量 | 占比 |
|---------|---------|------|
| Single Family(独户住宅) | 445,016 | 44.63% |
| Condo(联排公寓) | 117,780 | 11.81% |
| Two Family(双家庭住宅) | 29,609 | 2.97% |
| Three Family(三家庭住宅) | 14,081 | 1.41% |
| Four Family(四家庭住宅) | 2,418 | 0.24% |
| 未标注 | 388,309 | 38.94% |

#### 主要城镇分布(Top 15)

| 城镇名称 | 记录数量 | 占比 |
|---------|---------|------|
| Bridgeport(布里奇波特) | 34,201 | 3.43% |
| Stamford(斯坦福德) | 32,529 | 3.26% |
| Waterbury(沃特伯里) | 28,506 | 2.86% |
| Norwalk(诺沃克) | 23,960 | 2.40% |
| New Haven(纽黑文) | 21,346 | 2.14% |
| Danbury(丹伯里) | 20,350 | 2.04% |
| West Hartford(西哈特福德) | 19,854 | 1.99% |
| Hartford(哈特福德) | 18,810 | 1.89% |
| Milford(米尔福德) | 17,749 | 1.78% |
| Meriden(梅里登) | 17,502 | 1.76% |
| Greenwich(格林威治) | 17,390 | 1.74% |
| Bristol(布里斯托尔) | 16,915 | 1.70% |
| Stratford(斯特拉特福德) | 16,688 | 1.67% |
| New Britain(新不列颠) | 16,405 | 1.65% |
| Manchester(曼彻斯特) | 16,380 | 1.64% |

#### 特殊用途代码分布(主要类型)

| 特殊用途代码 | 记录数量 | 占比 |
|-------------|---------|------|
| 25 - Other(其他) | 59,916 | 6.01% |
| 14 - Foreclosure(止赎) | 52,445 | 5.26% |
| 07 - Change in Property(物业变更) | 34,248 | 3.43% |
| 08 - Part Interest(部分权益) | 15,496 | 1.55% |
| 01 - Family(家庭转让) | 13,097 | 1.31% |
| 10 - A Will(遗嘱) | 5,134 | 0.51% |
| 06 - Portion of Property(部分物业) | 4,378 | 0.44% |
| 28 - Use Assessment(使用评估) | 4,358 | 0.44% |
| 18 - In Lieu Of Foreclosure(替代止赎) | 3,677 | 0.37% |
| 15 - Government Agency(政府机构) | 3,364 | 0.34% |

#### 价格统计信息

| 统计指标 | 物业评估价值(美元) | 实际成交金额(美元) | 销售比率 |
|---------|-------------------|-------------------|---------|
| 有效值数量 | 997,213 | 997,213 | 997,213 |
| 最小值 | 0 | 0 | 0.0000 |
| 10分位数 | — | 75,000 | — |
| 25分位数 | — | 140,000 | — |
| 中位数 | 138,390 | 225,000 | 0.6246 |
| 75分位数 | — | 365,000 | — |
| 90分位数 | — | 630,000 | — |
| 95分位数 | — | 975,000 | — |
| 99分位数 | — | 2,858,937 | — |
| 最大值 | 881,510,000 | 5,000,000,000 | 1,226,420.0000 |
| 均值 | 279,144 | 391,151 | 10.45 |
| 标准差 | — | 5,347,270 | — |

#### 各物业类型平均成交金额

| 物业类型 | 交易数量 | 平均成交金额(美元) |
|---------|---------|-------------------|
| Apartments(公寓楼) | 486 | 12,834,307 |
| Industrial(工业物业) | 228 | 2,004,287 |
| Commercial(商业物业) | 1,981 | 1,788,884 |
| Public Utility(公用事业) | 5 | 369,709 |
| Residential(住宅-未细分) | 60,728 | 479,356 |
| Single Family(独户住宅) | 401,612 | 388,514 |
| Four Family(四家庭住宅) | 2,150 | 314,291 |
| Vacant Land(空地) | 3,163 | 295,702 |
| Condo(联排公寓) | 105,420 | 260,211 |
| Two Family(双家庭住宅) | 26,408 | 199,045 |
| Three Family(三家庭住宅) | 12,586 | 179,845 |

## 数据优势

| 优势特征 | 具体表现 | 应用价值 |
|---------|---------|---------|
| 超大规模数据量 | 近100万条交易记录,覆盖20年完整市场周期 | 支持深度学习模型训练,避免小样本偏差,保证统计分析的显著性 |
| 长时间跨度 | 2001-2020年完整覆盖,包括繁荣期、危机期与复苏期 | 可进行周期性市场研究,分析政策与经济事件对房地产市场的长期影响 |
| 地理覆盖全面 | 覆盖康涅狄格州170个城镇,包含城市中心与郊区 | 支持区域对比分析、空间价格建模、城市规划研究 |
| 丰富的物业类型 | 涵盖住宅、商业、工业、公寓、空地等11种物业类型 | 可进行跨物业类型对比研究,满足多元化产业需求 |
| 高精度价格数据 | 包含评估价、成交价与销售比率三重价格信息 | 支持价格偏离度分析、市场泡沫检测、评估模型校准 |
| 地理坐标信息 | 约20万条记录带有WKT格式经纬度坐标 | 可进行地理信息系统(GIS)空间分析、地图可视化、位置价值建模 |
| 特殊交易标注 | 50余种交易性质代码(止赎、遗嘱、家庭转让等) | 可筛选正常市场交易,排除异常交易干扰,提升分析准确性 |
| 标准化数据格式 | CSV格式,字段命名清晰,数据类型规范 | 便于与Python、R、SQL等主流分析工具无缝对接,降低使用门槛 |

## 数据样例

本数据集以CSV文本格式存储,不包含二进制文件或图像、视频等多媒体资源。以下展示数据集的代表性元数据样例,涵盖不同年份、不同物业类型、不同城镇的交易记录,以全面呈现数据多样性特征。

### 独户住宅样例

| 序列号 | 年份 | 城镇 | 地址 | 评估价 | 成交价 | 销售比率 |
|-------|------|------|------|--------|--------|---------|
| 160369 | 2016 | Trumbull | 16 EASTWOOD RD | $246,050 | $380,000 | 0.6475 |
| 160106 | 2016 | Thomaston | 196 HUMISTON CIR | $119,280 | $150,000 | 0.7952 |
| 60174 | 2006 | East Haddam | 21 WOODMONT CIR | $183,150 | $360,000 | 0.5088 |
| 20002 | 2020 | Ashford | 390 TURNPIKE RD | $253,000 | $430,000 | 0.5883 |
| 200243 | 2020 | Avon | 111 NORTHINGTON DR | $619,290 | $890,000 | 0.6958 |

### 联排公寓样例

| 序列号 | 年份 | 城镇 | 地址 | 评估价 | 成交价 | 销售比率 |
|-------|------|------|------|--------|--------|---------|
| 60228 | 2006 | Bethel | 10 HUNTINGTON COURT | $120,960 | $250,000 | 0.4838 |
| 60075 | 2006 | Essex | 7 PRATT ST | $143,400 | $339,500 | 0.4224 |
| 60416 | 2006 | Newington | 29 STERLING DR | $221,970 | $340,000 | 0.6529 |
| 200212 | 2020 | Avon | 5 CHESTNUT DRIVE | $130,400 | $179,900 | 0.7248 |
| 2000381 | 2020 | Bloomfield | 9 SADDLE RIDGE | $163,730 | $250,000 | 0.6549 |

### 双家庭住宅样例

| 序列号 | 年份 | 城镇 | 地址 | 评估价 | 成交价 | 销售比率 |
|-------|------|------|------|--------|--------|---------|
| 60215 | 2006 | Norwich | 135 CLIFF ST | $66,000 | $110,000 | 0.6000 |
| 170378 | 2017 | Windsor | 399 BROAD ST | $168,700 | $285,000 | 0.5919 |
| 60324 | 2006 | Hamden | 167 WOODIN ST | $140,210 | $259,000 | 0.5414 |
| 200180 | 2020 | Berlin | 1539 FARMINGTON AVE | $234,200 | $130,000 | 1.8015 |
| 200527 | 2020 | Bristol | 25 WARD ST | $85,680 | $183,000 | 0.4681 |

### 商业物业样例

| 序列号 | 年份 | 城镇 | 地址 | 评估价 | 成交价 | 销售比率 |
|-------|------|------|------|--------|--------|---------|
| 2020348 | 2020 | Ansonia | 230 WAKELEE AVE | $150,500 | $325,000 | 0.4630 |
| 200097 | 2020 | Bethany | 23 AMITY RD | $511,000 | $795,000 | 0.6427 |
| 200804 | 2020 | Branford | 119 MONTOWESE ST | $455,100 | $650,000 | 0.7001 |
| 200195 | 2020 | Cromwell | 34 SHUNPIKE ROAD | $3,360,000 | $5,214,750 | 0.6443 |
| 201186 | 2020 | Danbury | 28 MAIN ST | $695,500 | $3,200,000 | 0.2173 |

### 公寓楼与工业物业样例

| 序列号 | 年份 | 类型 | 城镇 | 地址 | 评估价 | 成交价 |
|-------|------|------|------|------|--------|--------|
| 20899 | 2020 | Apartments | Hartford | 159 RUSS ST | $137,270 | $278,500 |
| 200230 | 2020 | Apartments | Killingly | 152 NORTH ST | $143,220 | $150,000 |
| 20761 | 2020 | Apartments | New Britain | 150 GOLD ST | $212,310 | $450,000 |
| 200568 | 2020 | Industrial | Branford | 226 NO MAIN ST | $235,500 | $520,000 |
| 200000254 | 2020 | Industrial | Brookfield | 1087 FEDERAL RD | $157,150 | $620,000 |

### 空地样例

| 序列号 | 年份 | 城镇 | 地址 | 评估价 | 成交价 | 销售比率 |
|-------|------|------|------|--------|--------|---------|
| 200268 | 2020 | Colchester | 347 CABIN RD | $104,000 | $350,000 | 0.2971 |
| 200024 | 2020 | Columbia | WEBSTER LANE | $60,300 | $75,000 | 0.8040 |
| 200039 | 2020 | Coventry | 2075 MAIN ST | $43,700 | $25,000 | 1.7480 |
| 200077 | 2020 | Cromwell | 60 NORTH RD | $174,650 | $259,000 | 0.6743 |
| 200215 | 2020 | East Haddam | SHANAGHAN RD | $51,690 | $65,000 | 0.7952 |

### 带地理坐标样例

| 序列号 | 年份 | 城镇 | 地址 | 成交价 | 坐标位置 |
|-------|------|------|------|--------|---------|
| 200086 | 2020 | Bethlehem | 39 WOODLAND RD | $352,000 | POINT (-73.18197 41.64672) |
| 200568 | 2020 | Branford | 226 NO MAIN ST | $520,000 | POINT (-72.82277 41.27773) |
| 200000254 | 2020 | Brookfield | 1087 FEDERAL RD | $620,000 | POINT (-73.41748 41.50045) |
| 2000374 | 2020 | Bloomfield | 77 OLD WINDSOR RD | $200,000 | POINT (-72.69468 41.86088) |
| 200804 | 2020 | Branford | 119 MONTOWESE ST | $650,000 | 坐标缺失 |

## 应用场景

### 房地产价格预测与AI模型训练

本数据集近100万条的规模、丰富的特征维度与20年的时间跨度,使其成为训练深度学习房地产价格预测模型的理想数据源。研究者可以利用物业类型、城镇位置、评估价值、历史成交记录等特征变量,构建基于XGBoost、随机森林、深度神经网络等算法的价格预测系统。约20万条记录包含的地理坐标信息,可进一步支持基于地理加权回归(GWR)或空间图神经网络(SGNN)的位置感知价格模型训练。该数据集覆盖2008年金融危机前后的完整周期,使模型能够学习市场过热与回调的规律,提升预测在极端行情下的鲁棒性。在实际应用中,此类模型可被房产估价平台用于自动估价服务(AVM),为买家、卖家、经纪人提供即时的市场参考价,也可被金融机构用于抵押贷款的自动化审批流程。

### 房地产市场趋势与周期性研究

本数据集的20年时间跨度(2001-2020)完整覆盖了美国房地产市场的一个完整大周期:2001-2006年的繁荣增长期、2007-2011年的金融危机与市场调整期、2012-2020年的复苏与增长期。研究者可以利用该数据集分析不同物业类型、不同城镇在各阶段的表现差异,探索哪些区域对经济周期更为敏感,哪些物业类型具有更强的抗跌性。通过销售比率字段(成交价/评估价)的时间序列分析,可以监测市场是否存在泡沫风险。例如,当销售比率持续低于0.5时,可能意味着市场存在下行压力;当比率持续高于1.0时,可能预示着市场过热。此外,特殊用途代码字段可用于筛选止赎交易、短售交易等特殊交易类型,分析这些交易在市场周期中的占比变化,为政策制定者提供市场风险预警的量化依据。

### 地理空间分析与城市规划研究

康涅狄格州170个城镇的完整覆盖加上约20万条记录的地理坐标信息,使本数据集成为地理空间分析的优质素材。研究者可以利用GIS工具进行房价热力图绘制、房价等值线分析、空间自相关分析(Moran's I指数)、特征价格模型(Hedonic Price Model)等多种空间分析方法。通过地理加权回归可以量化不同位置因素(如靠近市中心、靠近交通枢纽、周边学区质量等)对房价的边际贡献。在城市规划方面,该数据可辅助评估不同区域的土地价值潜力,为 zoning 规划( zoning 是指土地使用分区管制)、公共交通线路规划、市政服务设施布局提供数据支撑。例如,通过分析不同距离城镇中心的房价梯度,可以评估城市蔓延程度与土地集约化利用水平;通过分析靠近海岸线、公园绿地等区域的房价溢价,可以量化环境设施对房地产价值的影响。

### 金融风控与抵押估值

对于银行、保险公司等金融机构而言,本数据集可用于开发和验证抵押风险评估模型。评估价值字段与成交金额字段的对比,可以帮助金融机构评估自身评估模型的准确性和偏差。销售比率分布的分析可以帮助识别高风险交易——例如比率异常高(可能意味着评估过高)或异常低(可能存在交易纠纷或低估风险)。止赎数据(代码14)可以用于构建违约风险预测模型,分析哪些物业特征与交易主体特征与更高的违约概率相关。约39万条的缺失物业类型记录也可作为一个研究方向,探讨数据缺失的系统性原因——是特定年份的数据收集规范变化,还是特定物业类型的申报要求不同——从而改进数据采集与清洗策略。

### 房地产推荐与投资决策支持

基于本数据集的历史交易数据,可以构建房地产推荐系统,根据用户的偏好(预算、位置、物业类型等)推荐符合条件的物业。通过分析相似物业的历史成交价格,可以为投资者提供合理的出价参考。此外,通过跟踪特定物业地址的历史交易记录(同一物业可能在20年内多次交易),可以分析物业的增值轨迹与换手率,识别具有增值潜力的区域和物业类型。例如,Bridgeport、Stamford、Norwalk等交易活跃的城镇,其物业换手率高、市场流动性好,可能是投资的热点区域;而一些偏远城镇交易稀少,市场流动性较差,投资风险相对较高。

## 结尾

本数据集以近100万条交易记录、20年时间跨度、170个城镇覆盖的规模优势,结合14个维度的丰富特征信息,为房地产领域的研究与应用提供了难得的高质量数据资源。其核心价值在于:一是时间跨度的完整性,覆盖了美国房地产市场从繁荣到危机再到复苏的完整周期,便于进行周期性规律研究;二是地理覆盖的全面性,包含全州170个城镇的交易记录,可支撑区域对比与空间分析;三是价格信息的多层次性,评估价、成交价、销售比率三重价格指标互为验证,提升分析的准确性。

数据集包含的约20万条地理坐标信息为空间分析和地图可视化提供了基础条件,50余种特殊用途代码则为交易性质的精准识别提供了标注支持。无论是用于AI模型训练、市场趋势研究、地理空间分析还是金融风控应用,该数据集均展现出广泛的适用性与研究潜力。数据集以标准CSV格式提供,可直接导入Python、R、SQL等主流分析工具,有效降低了研究与应用的技术门槛。

有需要可私信获取更多信息。

看了又看

验证报告

以下为卖家选择提供的数据验证报告:

data icon
2001-2020年美国康涅狄格州房地产销售数据集:大规模多维度房地产交易全记录
39.9
105.28MB
申请报告