DS数据代找

verify-tag2025 年至今加密货币与股票市场数据集:支撑金融时序分析与资产联动研究

加密货币与股票市场数据集金融时序分析资产联动研究数据集模型训练

2.9

已售 0
2.59MB

数据标识:D17581885296310489

发布时间:2025/09/18

数据描述

2025 年至今加密货币与股票市场数据集:小时级高频数据,支撑金融时序分析与资产联动研究

一、引言与背景

在全球金融市场高度数字化与互联互通的今天,加密货币与传统股票作为两类核心资产,其价格波动与联动关系不仅是投资者决策的关键依据,也是金融监管与学术研究的重点方向。加密货币以其高波动性、24 小时交易的特性,与受地域和时间限制的股票市场形成鲜明对比,两者的相关性演变既反映了市场风险偏好的变化,也暗藏着跨资产套利的机会。

 

然而,金融数据的获取与标准化始终是研究与实践的痛点:传统股票数据多分散于券商终端,加密货币数据则散落于各类交易所平台,且两者在更新频率、指标定义上存在差异,难以直接进行跨资产对比分析。本次介绍的 “2025 年至今加密货币与股票市场数据集” 通过自动化数据管道整合了两类资产的高频数据,填补了跨资产数据标准化的缺口,为金融分析、建模与管道工程实践提供了高质量资源。

二、数据基本信息

1. 数据规模与格式

数据集包含两个核心 CSV 文件:cryptocurrency.csv(6.88 MB)与stocks.csv,合计 17.17 MB,记录始于 2025 年 3 月 17 日,截至 2025 年 9 月 18 日,累计覆盖超 8.5 万条加密货币记录与对应股票数据。数据采用小时级更新频率,通过自动化管道确保每日同步最新市场动态,可用性评分达 10.00 分,适配 Python、SQL 等各类数据分析工具,支持实时监控与历史回溯双重场景。

2. 核心字段与数据维度

以加密货币数据为例,数据集设计 9 个核心字段,全面覆盖资产的 “标识 - 价格 - 交易量 - 市值” 关键维度,具体如下:

 

  • 基础标识与时间:精确到秒的时间戳(timestamp,如 2025-09-18 02:05:12)、加密货币名称(name,如 Bitcoin、Ethereum)、股票代码(symbol,如 BTC、ETH);
  • 价格与波动指标:美元价格(price_usd,BTC 达 116762.50 美元,USDC 接近 1 美元)、24 小时价格变化率(chg_24h)、7 天价格变化率(chg_7d);
  • 交易量与市值:24 小时交易量(vol_24h,Tether 达 1493 亿美元)、市场总成交量(total_vol)、市值(market_cap,BTC 达 2.32 万亿美元)。

 

股票数据虽未详细列示字段,但基于数据集定位可推断其包含类似维度(股票名称、代码、价格、涨跌幅、成交量等),与加密货币数据形成跨资产对比框架。

3. 内容特征与分布

从加密货币数据来看,资产覆盖度极高,除 BTC、ETH 等头部币种外,还包含 Stellar(XLM)、Hedera(HBAR)等中长尾币种,其中头部币种贡献主要交易量 ——Tether(USDT)24 小时交易量占比达 81.60%,BTC 占比 33.14%,呈现显著的 “头部集中” 特征。价格波动方面,多数币种 24 小时涨跌幅集中在 ±0.01% 区间(占比 94%),但部分币种如 Dogecoin(DOGE)7 天涨幅达 15.24%,反映出加密货币市场的结构性波动差异。时间分布上,各时间段记录量相对均衡(约 4400 条 / 周期),仅 9 月上旬增至 5238 条,可能与市场活跃度上升相关。

三、数据优势

  1. 高频且实时的更新机制:采用 “Google AppScript 抓取 - Python 脚本迁移 - Kaggle 定时发布” 的自动化 ETL 管道,实现小时级数据更新,突破传统金融数据集 “日度延迟” 的局限,可捕捉日内短期波动规律。
  2. 跨资产标准化对比框架:统一整合加密货币与股票两类资产数据,采用相同的时间粒度与指标定义(如涨跌幅、交易量计算规则一致),解决了跨市场数据不可比的核心痛点,支撑资产联动性研究。
  3. 指标体系全面且精准:同时包含即时价格、短期波动(24h)、中期趋势(7d)三类价格指标,搭配交易量与市值数据,构建起 “价格 - 量能 - 市值” 三维分析模型,完整反映资产的市场表现。
  4. 双重价值:分析与工程实践:不仅为金融分析提供数据素材,更通过公开数据管道架构(抓取 - 迁移 - 发布全流程),为数据工程师提供真实的 ETL 工程案例,兼具学术研究与技术实践价值。

四、应用场景

1. 金融市场分析与投资决策支持

数据集为投资者与分析师提供了剖析市场规律的精准工具,可开展多维度分析。在跨资产相关性研究中,通过计算 BTC 与标普 500 指数(股票数据)的价格相关性,可判断风险偏好变化 —— 当相关性为正时,说明两类资产同涨同跌,市场风险偏好一致;当相关性为负时,可能存在 “避险资金迁移” 现象。

 

在加密货币内部分析中,可挖掘 “价格 - 交易量 - 市值” 的联动规律:例如 BTC 市值与 24 小时交易量的相关性达 0.87,说明市值越高的币种流动性越强;而 USDC 等稳定币虽市值高(736.2 亿美元),但波动极小(7 天涨跌幅 0.03%),印证其 “价值锚定” 功能。此外,通过时间序列分析可识别异常波动点,如某币种 24 小时跌幅超 10% 时,结合同期股票市场动态,可判断波动是源于资产自身因素还是系统性风险。

2. 时序建模与数据工程实践

数据集的高频时序特征使其成为建模与工程实践的理想素材。在时间序列预测中,可基于小时级价格数据构建 ARIMA、LSTM 等模型,预测未来 24 小时价格走势 —— 例如利用 BTC 过去 30 天的 price_usd 与 vol_24h 数据训练模型,预测次日开盘价,为短线交易提供参考。

 

在数据工程领域,该数据集的管道架构可作为实践案例:学习者可复现 “AppScript 网页抓取 - BigQuery 云存储 - Kaggle 发布” 的全流程,掌握数据自动化采集、存储与共享的关键技术;同时可练习 SQL 查询优化,如筛选 “市值超 100 亿美元且 24 小时涨幅超 5%” 的币种,提升数据提取效率。此外,通过处理时间戳格式、缺失值填补等问题,可积累金融数据清洗的实战经验。

五、结尾

2025 年加密货币与股票市场数据集以 “高频更新、跨资产对比、指标全面、工程赋能” 为核心优势,不仅解决了金融数据分散、标准不一的痛点,更构建起 “分析 + 工程” 双重价值体系。其小时级高频数据既捕捉了金融市场的短期波动细节,跨资产框架又支撑了宏观联动规律的挖掘,适用人群覆盖投资者、分析师、数据工程师与研究者。
无论是构建资产价格预测模型、分析跨市场风险传导路径,还是复现自动化数据管道,该数据集都能提供坚实支撑。随着时间推移,其历史数据积累将进一步提升统计显著性,为金融市场的深度研究与实践应用提供持续价值,成为连接金融理论与市场动态的重要桥梁。

验证报告

以下为卖家选择提供的数据验证报告:

data icon
2025 年至今加密货币与股票市场数据集:支撑金融时序分析与资产联动研究
2.9
已售 0
2.59MB
申请报告