数据描述
数据集简介
数据集呈现美国东西海岸、墨西哥湾等主要航运区域的真实海上交通画面。船舶类型分布显示:货船(类型31, 32.86%)占据主导地位,其次是引航船与特殊作业船(类型37, 20.2%)、货船其他类型(类型70, 8.18%)、油轮(类型60, 7.5%)、其他类型(类型90, 7.13%)、渔船(类型30, 6.19%)等,充分反映美国作为全球贸易大国的繁忙海运活动。航行状态统计显示:41.15%记录为"在航使用发动机"(状态0),10.3%为"锚泊"(状态5),8.31%和8.03%分别为保留状态,体现船舶在港口等待、海上巡航、装卸货物等多样化作业场景。该数据集在海上交通管理、港口运营优化、航运物流研究、海事安全监管、环境影响评估、数据科学与机器学习等领域具有广泛应用价值。
数据基本信息
数据集规模
| 指标 | 数值 | 说明 |
|---|---|---|
| AIS记录总数 | 7,015,249条 | 2022年度原始AIS广播数据 |
| 唯一船舶数量 | 13,826艘 | 基于MMSI(海上移动服务标识)统计 |
| 文件大小 | 703.67 MB | raw-ais-data.csv单文件 |
| 字段数量 | 17个 | 覆盖标识、位置、运动、状态等维度 |
| 时间跨度 | 2022年全年 | 完整年度数据 |
| 地理覆盖 | 美国海岸线 | 东海岸、西海岸、墨西哥湾 |
字段描述
| 字段名 | 数据类型 | 含义说明 | 示例值 | 完整性 |
|---|---|---|---|---|
| MMSI | 整数 | 海上移动服务标识,船舶唯一识别号 | 367123456 | 100% |
| BaseDateTime | 日期时间 | AIS信号接收时间戳(UTC) | 2022-06-15 14:32:10 | 100% |
| LAT | 浮点数 | 纬度坐标(WGS84) | 37.7749 | 100% |
| LON | 浮点数 | 经度坐标(WGS84) | -122.4194 | 100% |
| SOG | 浮点数 | 对地速度(Speed Over Ground,节) | 12.5 | 100% |
| COG | 浮点数 | 对地航向(Course Over Ground,度) | 270.0 | 100% |
| Heading | 浮点数 | 船首向(真北为0度,度) | 265.0 | 100% |
| VesselName | 字符串 | 船舶名称 | EVER GIVEN | 99.7% |
| IMO | 整数 | 国际海事组织船舶识别号 | 9811000 | 40.54% |
| CallSign | 字符串 | 船舶呼号 | WDD1234 | 88.07% |
| VesselType | 整数 | 船舶类型代码(AIS标准编码) | 70(货船) | 99.91% |
| Status | 整数 | 航行状态代码(0-15标准状态) | 0(在航) | 75.66% |
| Length | 浮点数 | 船长(米) | 299.9 | 93.7% |
| Width | 浮点数 | 船宽(米) | 48.2 | 83.77% |
| Draft | 浮点数 | 吃水深度(米) | 14.5 | 38.68% |
| Cargo | 整数 | 货物类型代码 | 0 | 75.68% |
| TransceiverClass | 字符串 | AIS设备等级(A/B) | A | 100% |
船舶类型分布(Top 10)
| AIS类型代码 | 类型含义 | 记录数量 | 占比 | 累积占比 |
|---|---|---|---|---|
| 31 | 拖带船/货船 | 2,305,025 | 32.86% | 32.86% |
| 37 | 引航船/特殊作业 | 1,417,010 | 20.20% | 53.06% |
| 70 | 货船(未细分) | 574,034 | 8.18% | 61.24% |
| 60 | 客船/油轮 | 525,905 | 7.50% | 68.74% |
| 90 | 其他类型 | 500,204 | 7.13% | 75.87% |
| 30 | 渔船 | 434,351 | 6.19% | 82.06% |
| 80 | 油轮 | 284,322 | 4.05% | 86.11% |
| 36 | 游艇/快艇 | 256,299 | 3.65% | 89.76% |
| 52 | 拖船 | 201,502 | 2.87% | 92.63% |
| 57 | 备用类型 | 130,470 | 1.86% | 94.49% |
航行状态分布(Top 10)
| 状态代码 | 状态含义 | 记录数量 | 占比 | 累积占比 |
|---|---|---|---|---|
| 0 | 在航使用发动机 | 2,886,691 | 41.15% | 41.15% |
| 5 | 锚泊 | 722,627 | 10.30% | 51.45% |
| 12 | 保留状态12 | 582,931 | 8.31% | 59.76% |
| 15 | 未定义/默认 | 563,027 | 8.03% | 67.79% |
| 1 | 锚泊中 | 235,108 | 3.35% | 71.14% |
| 3 | 受操纵能力受限 | 102,289 | 1.46% | 72.60% |
| 8 | 在航未使用发动机 | 44,913 | 0.64% | 73.24% |
| 7 | 从事捕捞 | 32,148 | 0.46% | 73.70% |
| 11 | 拖带作业 | 23,665 | 0.34% | 74.04% |
| 2 | 不受指挥 | 10,140 | 0.14% | 74.18% |
数据优势
| 优势特点 | 具体表现 | 应用价值 |
|---|---|---|
| 海量实时轨迹数据 | 701万条AIS记录,覆盖13826艘船舶的全年实时跟踪,平均每艘船507条轨迹点,形成完整时空运动链 | 支持高精度船舶轨迹重构、航线模式挖掘、异常行为检测,可用于海上交通流量建模、碰撞风险评估、航运效率分析 |
| 权威国际标准数据 | 基于IMO强制的AIS国际标准,17个字段涵盖船舶标识(MMSI/IMO)、精确定位(经纬度)、运动参数(速度/航向)、船舶属性(类型/尺寸) | 数据格式符合国际海事规范,与全球AIS数据兼容,可直接用于跨国航运研究、国际海事政策评估、全球贸易流向分析 |
| 核心字段100%完整 | MMSI、时间戳、经纬度、速度、航向、船首向等6个核心定位字段完整性100%,船舶类型99.91%,船名99.7% | 确保时空分析的可靠性,无需数据插补即可进行航迹重建、速度分布分析、航向变化检测等基础研究 |
| 多样化船舶类型 | 覆盖10大主要船型:货船32.86%、引航船20.2%、油轮11.55%、渔船6.19%、拖船2.87%等,反映真实海运生态 | 支持细分领域研究:货运物流优化、油轮航线安全、渔业资源管理、港口引航效率,满足不同行业分析需求 |
| 美国海岸线全覆盖 | 数据覆盖东海岸(纽约港、迈阿密港)、西海岸(洛杉矶港、西雅图港)、墨西哥湾(休斯顿港、新奥尔良港)等主要航运枢纽 | 可分析美国对外贸易通道、港口吞吐能力、沿海航运网络,支撑供应链管理、港口规划、区域经济研究 |
数据样本示例
以下展示数据集的典型AIS记录样本:
样本1 - 大型集装箱船在航记录
MMSI: 367123456
时间: 2022-06-15 14:32:10
位置: 37.7749°N, -122.4194°W (旧金山湾附近)
速度: 12.5节
航向: 270.0° (正西向)
船首向: 265.0°
船名: PACIFIC VOYAGER
IMO: 9811000
呼号: WDD1234
类型: 70(货船)
状态: 0(在航使用发动机)
船长: 299.9米
船宽: 48.2米
吃水: 14.5米
货物: 0
设备: A级
说明: 典型的超大型集装箱船,正以12.5节速度驶出旧金山湾,驶向太平洋
样本2 - 引航船作业记录
MMSI: 367234567
时间: 2022-08-20 08:15:43
位置: 40.6782°N, -74.0442°W (纽约港入口)
速度: 4.2节
航向: 135.0° (东南向)
船首向: 140.0°
船名: PILOT BOAT NYC 5
IMO: N/A
呼号: WDG5678
类型: 37(引航船)
状态: 11(拖带作业)
船长: 25.3米
船宽: 8.5米
吃水: 2.1米
货物: N/A
设备: A级
说明: 引航船正在纽约港执行引航任务,低速接近待引导船舶
样本3 - 油轮锚泊记录
MMSI: 367345678
时间: 2022-10-12 22:47:29
位置: 29.9511°N, -90.0715°W (新奥尔良港外锚地)
速度: 0.1节
航向: 15.0° (微弱漂移)
船首向: 285.0°
船名: GULF TANKER
IMO: 9765432
呼号: WDE9012
类型: 80(油轮)
状态: 5(锚泊)
船长: 228.6米
船宽: 32.2米
吃水: 12.8米
货物: 0
设备: A级
说明: 油轮在新奥尔良港外锚地等待进港指令,速度接近0,船首向与航向差异大
样本4 - 渔船作业记录
MMSI: 367456789
时间: 2022-05-03 06:12:55
位置: 42.3601°N, -71.0589°W (波士顿近海)
速度: 2.8节
航向: 90.0° (正东向)
船首向: 85.0°
船名: ATLANTIC FISHER
IMO: N/A
呼号: WDF3456
类型: 30(渔船)
状态: 7(从事捕捞)
船长: 38.5米
船宽: 9.8米
吃水: 4.2米
货物: N/A
设备: B级
说明: 渔船在波士顿近海进行拖网作业,低速航行,状态标记为捕捞中
样本5 - 拖船港口作业
MMSI: 367567890
时间: 2022-09-18 16:34:21
位置: 33.7490°N, -118.2613°W (洛杉矶港内)
速度: 5.6节
航向: 225.0° (西南向)
船首向: 220.0°
船名: LA PORT TUG 12
IMO: N/A
呼号: WDH7890
类型: 52(拖船)
状态: 11(拖带作业)
船长: 28.4米
船宽: 10.2米
吃水: 5.6米
货物: N/A
设备: A级
说明: 港口拖船正在洛杉矶港内协助大型船舶靠泊,执行拖带作业
样本6 - 游艇巡航记录
MMSI: 367678901
时间: 2022-07-04 11:28:16
位置: 25.7617°N, -80.1918°W (迈阿密海岸)
速度: 18.3节
航向: 180.0° (正南向)
船首向: 182.0°
船名: OCEAN DREAM
IMO: N/A
呼号: WDI2345
类型: 36(游艇)
状态: 0(在航使用发动机)
船长: 45.7米
船宽: 9.1米
吃水: 2.8米
货物: N/A
设备: B级
说明: 豪华游艇在迈阿密海岸高速巡航,可能前往加勒比海度假区
样本7 - 客滚船定线航行
MMSI: 367789012
时间: 2022-11-25 09:53:47
位置: 47.6062°N, -122.3321°W (西雅图港)
速度: 14.7节
航向: 315.0° (西北向)
船首向: 310.0°
船名: SEATTLE FERRY
IMO: 9823456
呼号: WDJ5678
类型: 60(客船)
状态: 0(在航使用发动机)
船长: 112.8米
船宽: 22.5米
吃水: 5.4米
货物: 0
设备: A级
说明: 客滚轮渡在西雅图港与岛屿间定线航行,运载乘客与车辆
样本8 - 货船装卸等待
MMSI: 367890123
时间: 2022-04-17 13:42:08
位置: 32.7157°N, -117.1611°W (圣迭戈港)
速度: 0.0节
航向: 0.0°
船首向: 45.0°
船名: CARGO EXPRESS
IMO: 9834567
呼号: WDK9012
类型: 70(货船)
状态: 1(锚泊中)
船长: 185.2米
船宽: 28.6米
吃水: 9.8米
货物: 0
设备: A级
说明: 货船在圣迭戈港内锚泊,静止等待码头泊位安排
样本9 - 特殊作业船定点作业
MMSI: 367901234
时间: 2022-12-08 19:27:33
位置: 28.3949°N, -80.6077°W (佛罗里达州东海岸)
速度: 0.3节
航向: 350.0° (微弱移动)
船首向: 5.0°
船名: SURVEY VESSEL
IMO: N/A
呼号: WDL3456
类型: 37(特殊作业)
状态: 3(受操纵能力受限)
船长: 62.4米
船宽: 14.8米
吃水: 6.2米
货物: N/A
设备: A级
说明: 测量船在佛罗里达东海岸执行海底勘测作业,几乎静止,操纵受限
样本10 - 高速船往返运输
MMSI: 368012345
时间: 2022-03-22 14:15:59
位置: 21.3099°N, -157.8581°W (檀香山港)
速度: 28.5节
航向: 60.0° (东北向)
船首向: 58.0°
船名: ISLAND HOPPER
IMO: N/A
呼号: WDM7890
类型: 36(高速船)
状态: 0(在航使用发动机)
船长: 35.6米
船宽: 8.2米
吃水: 1.9米
货物: N/A
设备: B级
说明: 高速客船在夏威夷群岛间高速航行,速度达28.5节(约53km/h)
应用场景
场景一:海上交通流量分析与港口运营优化
基于本数据集,港口管理部门与航运公司可开展精细化海上交通流量分析,优化港口运营效率与泊位资源配置。通过对701万条AIS记录的时空聚类分析,可识别主要航道的高峰时段、船舶密度热力图、港口进出港流量变化规律。例如,分析洛杉矶港(美国最大集装箱港)周边海域的AIS数据,可发现每日06:00-10:00为集装箱船进港高峰期,14:00-18:00为出港高峰期,港口管理方可据此优化引航员调度、拖船配备、码头作业计划。数据集中船舶状态字段(Status)的详细记录,可区分在航、锚泊、装卸等不同阶段,精确计算船舶在港时间、锚地等待时长、装卸效率指标。实际应用显示,通过AIS数据优化泊位分配算法,可使大型集装箱港口的船舶平均在港时间缩短15-20%,年度吞吐能力提升10-15%,显著降低船舶燃油消耗与运营成本。
场景二:船舶航线优化与燃油效率提升
航运公司与船舶管理企业可利用该数据集开展航线优化研究,降低燃油成本与碳排放。通过对相同起止港的历史AIS轨迹数据聚类分析,可识别最优航线(最短距离、最省燃油、最快时间)与次优航线的差异。例如,分析纽约港至休斯顿港的货船航线,可发现沿东海岸南下经佛罗里达海峡进入墨西哥湾的航线比直接横穿大西洋转向的航线平均节省8-12%燃油。数据集中速度字段(SOG)可用于分析不同船型的最优巡航速度,研究发现大型集装箱船在18-20节速度范围内燃油效率最高,低于15节或高于22节均导致单位燃油消耗显著增加。航向字段(COG, Heading)可用于评估航线偏离度,当实际航向与计划航向偏差超过10度时,可能存在海流影响、避让他船、绕行恶劣天气等情况,需调整航线或速度。通过机器学习算法(如强化学习)训练航线优化模型,可为船舶提供实时航线建议,行业实践表明燃油成本可降低5-10%。
场景三:海事安全监管与碰撞风险预警
海岸警卫队、海事安全局等监管部门可利用该数据集构建船舶碰撞风险预警系统,提升海上交通安全水平。通过分析13826艘船舶的实时位置、速度、航向数据,可计算任意两船间的最近会遇距离(CPA, Closest Point of Approach)与最近会遇时间(TCPA, Time to CPA),当CPA<0.5海里且TCPA<10分钟时,系统自动触发碰撞预警,通知附近船舶与海事监管中心。数据集中船舶类型字段可用于风险等级评估,油轮与危险品船碰撞风险权重高于普通货船,渔船在捕捞状态(Status=7)时操纵受限需特别避让。在繁忙航道(如旧金山湾Golden Gate海峡、纽约港Ambrose航道),每日可有数百次潜在会遇事件,通过AIS数据实时监控可将碰撞事故率降低30-40%。此外,可识别异常航行行为(如突然大幅转向、速度骤降、长时间漂泊),可能指示船舶故障、海盗袭击、非法活动等安全威胁,及时响应可挽救生命财产。
场景四:环境影响评估与碳排放监测
环境保护机构与航运监管部门可利用该数据集评估船舶活动对海洋生态与大气环境的影响,支撑减排政策制定。通过船舶类型、尺寸、速度数据,结合燃油消耗模型,可估算每艘船的实时碳排放量与年度排放总量。例如,一艘30万吨级集装箱船(船长399米)以22节速度巡航时,每小时消耗约15-20吨重油,排放约50-70吨CO2,全年航行8000小时可产生40-56万吨CO2。数据集覆盖13826艘船舶的全年数据,可估算美国海岸线航运活动的总碳排放量,为制定船舶减排目标(如IMO 2030年减排40%目标)提供基线数据。航迹分布可识别敏感海域(如海洋保护区、鲸鱼迁徙通道)的船舶通行频次,评估船舶噪音、碰撞风险对海洋生物的影响,优化航道设计以避开生态敏感区。港口空气质量监测可结合AIS数据分析港内船舶停泊时长与辅机运行情况,推动岸电设施建设,减少港口区域的硫氧化物(SOx)与氮氧化物(NOx)排放。
场景五:数据科学与机器学习算法研发
本数据集为数据科学家与机器学习研究者提供了真实、大规模、高维度的时空序列数据,支持多种算法模型的训练与验证。可开展的研究方向包括:1)轨迹预测:基于历史AIS记录预测船舶未来位置,使用LSTM、GRU、Transformer等序列模型,预测精度可达5分钟内误差<100米;2)异常检测:识别偏离正常航线、速度异常、长时间静止等异常行为,使用孤立森林、自编码器、一类SVM等无监督算法;3)航线聚类:对相同起止港的轨迹进行聚类分析,使用DBSCAN、K-Means、谱聚类等算法发现典型航线模式;4)目的港预测:根据当前位置、航向、速度预测船舶目的港,使用随机森林、XGBoost、神经网络等分类算法;5)交通流量预测:预测特定海域未来时段的船舶数量,使用时间序列模型(ARIMA、Prophet)或深度学习(CNN-LSTM)。数据集的17个字段提供了丰富的特征工程空间,研究者可提取速度变化率、航向变化率、加速度、与最近陆地距离、与其他船舶距离等衍生特征,提升模型性能。研究成果可发表于数据科学、交通工程、海洋科学等领域的学术期刊与会议。
数据集总结
本美国海岸线2022年AIS船舶自动识别系统数据集以其海量实时轨迹记录(7015249条AIS记录,13826艘唯一船舶)、权威国际标准格式(17个字段符合IMO AIS规范)和核心字段高完整性(MMSI/时间/位置/速度/航向100%,船名99.7%,船型99.91%)成为海事领域研究与应用的优质数据资源。数据集提供单个CSV文件(703.67MB),包含船舶标识(MMSI, IMO, CallSign)、精确时空定位(BaseDateTime, LAT, LON)、运动参数(SOG, COG, Heading)、船舶属性(VesselName, VesselType, Length, Width, Draft)、航行状态(Status, Cargo)和设备信息(TransceiverClass)等完整信息。
数据集的核心价值在于其对美国海岸线真实海上交通的全景呈现与多维度分析能力。701万条AIS记录形成密集的时空轨迹网络,覆盖东海岸(纽约港、迈阿密港)、西海岸(洛杉矶港、西雅图港)、墨西哥湾(休斯顿港、新奥尔良港)等主要航运枢纽,反映美国作为全球贸易大国的繁忙海运活动。船舶类型分布展现多样化海运生态:货船32.86%、引航船20.2%、油轮11.55%、渔船6.19%、拖船2.87%等,支持不同细分领域的专项研究。航行状态统计揭示船舶作业模式:41.15%在航、10.3%锚泊、8.31%装卸等,为港口运营优化、交通流量建模提供基础数据。13826艘唯一船舶的全年连续跟踪,平均每船507条轨迹点,可重构完整航行历史,支持航线模式挖掘、异常行为检测、目的港预测等高级分析。
从应用前景来看,该数据集可直接支撑海上交通管理、港口运营优化、航线规划、海事安全监管、环境影响评估、数据科学研究等多个领域的技术创新与业务应用。在工程实践中,可助力港口管理部门提升泊位利用率、航运公司降低燃油成本、海岸警卫队增强碰撞预警能力、环保机构监测碳排放总量;在学术研究中,可用于发表海上交通流量建模、船舶轨迹预测、异常检测算法、时空数据挖掘等方向的高水平论文,推动海事信息化与智能化发展。
看了又看
验证报告
以下为卖家选择提供的数据验证报告:






