1. 首页
  2. 人工智能
  3. 深度学习
  4. 基于美学和技术视角的用户生成视频质量评估数据库及其方法研究

基于美学和技术视角的用户生成视频质量评估数据库及其方法研究

上传者: 2025-01-09 22:48:27上传 PDF文件 2.09MB 热度 24次

用户生成内容(UGC)的视频质量评估是近年来的研究热点,尤其在美学和技术两个维度上对人类质量感知的影响。为了解决这一问题,构建了一个大规模的主观数据库DIVIDE-3k,包含从美学和技术两个视角收集的质量评估数据。该数据库为多角度视频质量评估提供了重要的基础数据支持,推动了UGC视频质量感知研究的进展。

提出了DOVER(解耦客观视频质量评估器)模型,旨在从美学和技术两个视角独立地对视频质量进行预测。该模型由两个分支组成,每个分支分别负责处理视频的美学质量和技术质量。这一解耦设计能够更精确地捕捉到影响视频质量的多重因素。进一步优化后的DOVER++模型能够在单一视角下仍提供可靠的质量评估,适用于不同场景下的质量分析需求。

实验结果表明,DOVER和DOVER++在多个UGC视频质量评估数据集上均表现出色,尤其是在复杂多样的应用场景下具有较强的适应能力。例如,在视频分享平台的内容推荐和摄像头系统的技术测试中,能够快速、准确地评估大规模视频内容的质量,从而有效提升平台的用户体验和内容筛选效率。

DIVIDE-3k数据库的构建方法、主观实验的设计及实施过程,以及DOVER和DOVER++的具体架构与训练细节都有详细说明。与现有方法的对比评测也展示了本研究方法在准确性和可靠性上的优势,为UGC视频质量评估领域的后续研究和实际应用提供了有力的支持。

下载地址
用户评论