Li

verify-tag入侵检测日志(正常、僵尸程序、扫描) 合成网络日志数据集 含正常 恶意活动记录 时间序列与非时间序列双版本 支持入侵检测

网络日志数据集入侵检测数据异常检测数据集时间序列网络数据网络安全建模数据合成网络活动日志

1.99

已售 0
348.92KB

数据标识:D17525598564625135

发布时间:2025/07/15

数据描述

本数据集包含真实的合成网络日志,模拟一周内的正常与恶意网络活动,提供两个版本:带时间戳的时间序列版本(适用于顺序建模、入侵跟踪和时间异常检测)和无时间戳的非时间序列版本(适用于标准分类或异常检测管道)。数据可用性达 10.00,采用 MIT 许可,预期永不更新。涵盖源 IP、目的 IP、端口、请求类型、协议、有效载荷大小、用户代理、状态等字段,标签包括二进制入侵标识(0 = 正常,1 = 攻击)和流量类型(Normal、PortScan、BotAttack),为研究人员、学生和 ML 工程师提供构建和基准测试入侵检测系统的实用资源,解决实际网络入侵日志私有限制的问题。

产品基本信息

  • 数据内容:包含模拟的网络活动日志,字段有 Source_IP、Destination_IP、Port、Request_Type、Protocol、Payload_Size、User_Agent、Status、Intrusion(入侵标识)、Scan_Type(流量类型)等。
  • 数据版本:分为时间序列版本(含时间戳)和非时间序列版本(无时间戳)。
  • 标签信息:Intrusion 为二进制目标(0 = 正常,1 = 攻击);Scan_Type 包括 Normal、PortScan、BotAttack 等流量类型。
  • 许可证:MIT 许可。
  • 预期更新频率:从不更新。
  • 适用场景:适用于入侵检测系统构建、异常检测模型训练、时间序列分析等网络安全相关任务。

产品使用说明

  1. 版本选择:根据研究目标选择版本,进行时间关联分析(如入侵行为的时序模式)选用时间序列版本;开展常规分类任务(如区分正常与攻击流量)选用非时间序列版本。
  2. 数据预处理:对分类字段(如 Protocol、Request_Type)进行编码,对数值字段(如 Payload_Size)进行标准化;处理 IP 地址、端口等特征,可提取网段、端口类型(如知名端口、动态端口)等衍生特征。
  3. 模型训练:针对 Intrusion 标签,使用非时间序列版本数据训练二分类模型(如随机森林、XGBoost),识别攻击行为;利用时间序列版本数据训练 LSTM 等序列模型,检测时间维度上的异常模式(如短时间内大量来自同一源 IP 的端口扫描)。
  4. 多类分类实践:基于 Scan_Type 标签,训练多类分类模型,区分 Normal、PortScan、BotAttack 等流量类型,优化对不同恶意活动的识别精度。
  5. 模型评估:通过准确率、召回率、F1 值等指标评估模型性能,重点关注对攻击行为的召回率(减少漏报),同时控制误报率(避免正常流量被误判为攻击)。

应用场景

  1. 网络安全产品研发:网络安全企业可基于数据集开发入侵检测系统,通过训练模型识别异常网络行为(如端口扫描、机器人攻击),集成到防火墙或安全监控平台中,提升网络防御能力。
  2. 网络安全教学:高校计算机或网络安全专业可将数据集作为教学案例,用于入侵检测算法、异常检测技术等课程的实践教学,帮助学生掌握网络日志分析、特征工程和模型训练技能,理解网络攻击的典型特征。
  3. 学术研究:研究人员可利用数据集探索新型入侵检测方法,如结合时间序列模型捕捉攻击行为的时序特征,或通过无监督学习发现未知类型的恶意活动,为网络安全技术创新提供实验数据。

相似产品


产品来源

该数据集为合成网络日志,模拟真实网络环境中的正常与恶意活动,旨在为网络安全领域的研究和应用提供可访问的入侵检测系统训练数据。数据集通过合理构建网络活动特征和标签,还原网络攻击的典型模式,使用需遵守 MIT 许可,相关详情可参考数据集附带的说明文件。

验证报告

以下为卖家选择提供的数据验证报告:

data icon
入侵检测日志(正常、僵尸程序、扫描) 合成网络日志数据集 含正常 恶意活动记录 时间序列与非时间序列双版本 支持入侵检测
1.99
已售 0
348.92KB
申请报告