panpan

verify-tag美国上市公司股票日线数据集

股票日线数据金融数据分析美国股票

19.9

645.76MB

数据标识:D17827869783721691

发布时间:2026/06/30

## 引言与背景

美国股票市场作为全球最具影响力的资本市场,其历史数据蕴含着丰富的经济信息和投资价值。本数据集收录了959家美国上市公司的日线交易数据,覆盖从1980年12月至2025年3月的完整时间序列,总计约670万条交易记录。这些数据不仅记录了苹果、微软、谷歌、亚马逊等科技巨头的成长轨迹,也包含了传统行业领军企业的经营历程,为金融研究、算法训练和投资决策提供了坚实的数据基础。

数据集以CSV文件格式存储,每家公司独立一个文件,包含日期、开盘价、最高价、最低价、收盘价、成交量、股息和股票分割等9个核心字段。完整的原始交易数据使得研究者能够深入分析股价波动规律、构建量化交易策略、评估投资组合表现。无论是学术研究还是实际应用,这套数据集都具有不可替代的价值。

## 数据基本信息

### 数据字段说明

| 字段名称 | 字段类型 | 字段含义 | 数据示例 | 完整性 |
| --- | --- | --- | --- | --- |
| Date | 日期型 | 交易日期 | 2025-03-18 | 100% |
| Open | 浮点型 | 开盘价格 | 214.139999 | 100% |
| High | 浮点型 | 最高价格 | 215.149994 | 100% |
| Low | 浮点型 | 最低价格 | 212.949997 | 100% |
| Close | 浮点型 | 收盘价格 | 214.580002 | 100% |
| Volume | 整数型 | 成交量 | 10366335 | 100% |
| Dividends | 浮点型 | 每股股息 | 0.0 | 100% |
| Stock Splits | 浮点型 | 股票分割比例 | 0.0 | 100% |

### 数据规模概览

- 公司数量:959家
- 总记录数:约670万条
- 时间跨度:1980年12月至2025年3月(约45年)
- 文件格式:CSV(逗号分隔值)
- 数据覆盖:涵盖科技、金融、医疗、消费、能源等20+行业

### 时间分布情况

根据数据样本分析,各年代的数据分布如下:

| 年代 | 记录数量(估算) | 占比 | 累计占比 |
| --- | --- | --- | --- |
| 1980年代 | 约30万条 | 4.5% | 4.5% |
| 1990年代 | 约100万条 | 14.9% | 19.4% |
| 2000年代 | 约130万条 | 19.4% | 38.8% |
| 2010年代 | 约170万条 | 25.4% | 64.2% |
| 2020年代 | 约240万条 | 35.8% | 100% |

### 主要公司记录数分布

| 公司名称 | 记录数 | 上市年份 | 行业分类 |
| --- | --- | --- | --- |
| Apple(苹果) | 11156 | 1980 | 科技 |
| Microsoft(微软) | 约9800 | 1986 | 科技 |
| Berkshire Hathaway(伯克希尔) | 约10500 | 1967 | 金融 |
| Exxon Mobil(埃克森美孚) | 约10000 | 1972 | 能源 |
| Alphabet (Google)(谷歌) | 5178 | 2004 | 科技 |
| Amazon(亚马逊) | 约7500 | 1997 | 电商 |
| Coca-Cola(可口可乐) | 约10500 | 1919 | 消费 |
| IBM(国际商业机器) | 约11000 | 1916 | 科技 |
| Walmart(沃尔玛) | 约9500 | 1972 | 零售 |
| Goldman Sachs(高盛) | 约6500 | 1999 | 金融 |

## 数据优势

| 优势特征 | 具体表现 | 应用价值 |
| --- | --- | --- |
| 时间跨度长 | 覆盖1980年至2025年,约45年完整交易日数据 | 支持长期趋势分析、周期性研究、跨市场比较 |
| 公司覆盖面广 | 包含959家美国上市公司,覆盖20+行业 | 支持行业对比分析、投资组合构建、市场整体研究 |
| 数据字段完整 | 包含开盘价、最高价、最低价、收盘价、成交量、股息、股票分割等9个字段 | 支持技术分析、基本面分析、量化策略开发 |
| 数据质量高 | 所有字段完整率100%,无缺失值 | 确保模型训练和回测结果的准确性和可靠性 |
| 格式标准化 | 统一CSV格式,字段结构一致 | 便于数据清洗、批量处理和跨平台使用 |
| 包含完整原始文件 | 每家公司独立CSV文件,包含全部历史交易数据 | 支持基于完整内容的应用,如图表绘制、模式识别、全文检索 |
| 涵盖重大事件 | 包含互联网泡沫、金融危机、新冠疫情等重大事件期间数据 | 支持压力测试、极端市场环境分析、风险管理研究 |
| 适用场景多样 | 数据可用于学术研究、商业分析、算法开发等多个领域 | 满足不同用户的多样化需求,具有广泛的应用价值 |

## 数据样例

以下为部分公司的股票日线数据样例,展示了数据的多样性和完整性:

### Apple(苹果)数据样例

| 序号 | 日期 | 开盘价 | 最高价 | 最低价 | 收盘价 | 成交量 | 股息 | 股票分割 |
| --- | --- | --- | --- | --- | --- | --- | --- | --- |
| 1 | 1980-12-12 | 0.0987 | 0.0992 | 0.0987 | 0.0987 | 469033600 | 0.0 | 0.0 |
| 2 | 1980-12-15 | 0.0940 | 0.0940 | 0.0936 | 0.0936 | 175884800 | 0.0 | 0.0 |
| 3 | 2025-03-17 | 213.31 | 215.22 | 209.97 | 214.00 | 48042800 | 0.0 | 0.0 |
| 4 | 2025-03-18 | 214.14 | 215.15 | 212.95 | 214.58 | 10366335 | 0.0 | 0.0 |

### Microsoft(微软)数据样例

| 序号 | 日期 | 开盘价 | 最高价 | 最低价 | 收盘价 | 成交量 | 股息 | 股票分割 |
| --- | --- | --- | --- | --- | --- | --- | --- | --- |
| 1 | 1986-03-13 | 0.0544 | 0.0624 | 0.0544 | 0.0597 | 1031788800 | 0.0 | 0.0 |
| 2 | 1986-03-14 | 0.0597 | 0.0629 | 0.0597 | 0.0618 | 308160000 | 0.0 | 0.0 |

### Alphabet (Google)数据样例

| 序号 | 日期 | 开盘价 | 最高价 | 最低价 | 收盘价 | 成交量 | 股息 | 股票分割 |
| --- | --- | --- | --- | --- | --- | --- | --- | --- |
| 1 | 2025-03-14 | 165.32 | 168.25 | 164.51 | 167.62 | 18611100 | 0.0 | 0.0 |
| 2 | 2025-03-18 | 165.96 | 166.44 | 158.84 | 158.87 | 8263982 | 0.0 | 0.0 |

### 部分公司文件列表样例

1. 3M.csv
2. Adobe.csv
3. Amazon.csv
4. American Express.csv
5. Bank of America.csv
6. Berkshire Hathaway.csv
7. Boeing.csv
8. Caterpillar.csv
9. Chevron.csv
10. Cisco.csv
11. Citigroup.csv
12. Coca-Cola.csv
13. Costco.csv
14. Disney.csv
15. Dow.csv
16. Exxon Mobil.csv
17. Facebook (Meta).csv
18. Ford.csv
19. Goldman Sachs.csv
20. Intel.csv

## 应用场景

### 金融数据分析与研究

本数据集为金融数据分析提供了丰富的素材。研究者可以利用这些数据进行股价走势分析、波动率研究、收益率分布分析等。通过对不同行业、不同规模公司的对比分析,可以揭示市场运行规律和行业发展趋势。例如,通过分析科技股与传统行业股票在不同经济周期的表现差异,可以为资产配置提供参考依据。此外,数据集还包含股息和股票分割信息,可用于研究上市公司的分红政策和资本运作策略对股价的影响。

### 股票预测模型训练

机器学习和深度学习算法在股票预测领域的应用日益广泛,而高质量的历史数据是训练有效模型的基础。本数据集提供了45年的完整日线数据,包含多种技术指标相关字段,可以用于训练股价预测模型。研究者可以利用开盘价、最高价、最低价、收盘价等价格信息,结合成交量数据,构建特征工程,训练回归模型或时序模型来预测未来股价走势。同时,数据集涵盖了多个重大市场事件期间的数据,有助于模型学习极端市场环境下的模式,提高模型的鲁棒性和泛化能力。

### 量化交易策略回测

量化交易策略的开发和验证离不开历史数据回测。本数据集的长时间跨度和高质量数据使得研究者能够对各种量化策略进行充分的回测验证。例如,基于移动平均线交叉的趋势跟踪策略、基于相对强弱指标的动量策略、基于布林带的突破策略等,都可以在这套数据上进行测试。通过回测,可以评估策略的收益率、风险调整后收益、最大回撤等关键指标,优化策略参数,为实盘交易提供参考。此外,数据集包含股息信息,支持对分红再投资策略的回测分析。

### 投资组合管理与风险评估

投资组合管理需要考虑资产配置、风险控制和绩效评估等多个方面。本数据集涵盖959家上市公司,覆盖多个行业和市值规模,可以用于构建多样化的投资组合。通过分析不同股票之间的相关性,可以优化资产配置比例,降低组合风险。同时,数据集支持对投资组合的历史表现进行回溯分析,评估组合的收益率、波动率、夏普比率等指标。对于风险管理研究,数据集包含多个市场危机期间的数据,可以用于测试投资组合在极端市场环境下的表现,评估VaR(在险价值)等风险度量指标的有效性。

## 结尾

本数据集作为美国股票市场历史数据的重要资源,具有时间跨度长、公司覆盖面广、数据质量高等显著优势。约670万条记录涵盖了959家上市公司从1980年至2025年的完整交易历史,为金融研究、算法训练和投资决策提供了坚实的数据支撑。

数据集包含完整的原始CSV文件,每家公司独立存储,便于灵活使用。无论是学术研究、商业分析还是量化策略开发,这套数据集都能够满足多样化的需求。研究者可以基于完整的原始数据进行深入分析,挖掘市场规律,构建有效模型,为金融市场的理解和应用做出贡献。

如有需要,可私信获取更多关于数据集使用的技术支持和分析建议。

看了又看

验证报告

以下为卖家选择提供的数据验证报告:

data icon
美国上市公司股票日线数据集
19.9
645.76MB
申请报告