1. 首页
  2. 音视频
  3. 图像处理
  4. 基于蔡徐坤视频的文本到视频生成技术

基于蔡徐坤视频的文本到视频生成技术

上传者: 2023-06-14 05:04:17上传 PDF文件 30.01MB 热度 18次

本文探讨了一种新的文本到视频(T2V)生成技术,该技术利用蔡徐坤的视频进行训练,并基于大规模图像数据预训练的最先进的文本到图像(T2I)扩散模型构建。该模型可以将一个文本与一个视频相匹配。为了让视频的内容表现出惊人的一致性,研究人员采用了Tune-A-Video技术,其中包括一个定制的时空注意机制和一个高效的单次调谐策略。该技术在各种应用中都具有很强的潜力。

下载地址
用户评论