在数字内容创作、影视制作、游戏开发以及虚拟现实(VR)和增强现实(AR)等应用领域,对图像和视频进行风格化迁移的需求日益增长。这种需求不仅限于静态图像,更扩展到了实时、连续的视频流处理,旨在为用户提供更加丰富、沉浸式的视觉体验。然而,现有的计算机视觉技术在实现高质量、实时且稳定的风格化迁移方面仍面临诸多挑战。特别是在需要高度统一风格、保持连续无闪烁、处理高分辨率视频流以及符合真实物理材质表达等方面,现有技术难以满足实际需求。因此,本技术需求旨在解决这些问题,推动计算机视觉技术在实时风格化迁移领域的应用与发展。
本技术需求要求实现一种能够根据参考风格对原输入内容进行连续且稳定的实时风格化迁移的计算机视觉技术。关键技术问题包括:
本技术需求实现后,将显著提升计算机视觉技术在实时风格化迁移领域的性能与效果。具体而言,将实现以下效益与竞争优势:
根据参考风格对原输入内容进行连续且稳定的实时风格化迁移;风格上需要保证和参考风格高度统一,连续一直无闪烁;性能上处理效率需要大于30fps,分辨率大于2560*1440;材质上要符合PBR或指定材质系统的真实物理表达,例如遵循金属度和反射率;输出上需要支持大于16bit的深度,提供更大的动态范围。 难点:硬件上现今显卡算力不足(达不到预期1%),同时软件缺少连续性算法,扩散性算法内容生成随机,无法做到连续稳定生成。
