DS数据代找

verify-tag唇读数据集

数据分析模型训练深度学习机器学习

6,000

已售 0
11GB

数据标识:D17344110887435013

发布时间:2024/12/17

数据描述

数据介绍:

数据集包含 250,000 个公开的黑森州议会发言人面部视频,这些视频使用自动管道进行了单词级唇读处理。其格式类似于英语自然唇读(LRW)数据集,每个 H264 压缩的 MPEG-4 视频在 1.16 秒的上下文中编码一个单词。选择基于自然环境中自然口语的视频材料可以确保在实际应用中获得比人工生成的数据集更可靠的结果,并且噪音尽可能小。500 个不同的口语单词长度在 4-18 个字符之间,每个单词有 500 个实例和单独的 MPEG-4 音频和文本元数据文件,源自 1018 场议会会议。

此外,还包括包含这些会议分段信息的完整 TextGrid 文件。

以下是部分数据预览:

 

 

验证报告

以下为卖家选择提供的数据验证报告:

data icon
唇读数据集
6,000
已售 0
11GB
申请报告