近日,我院陈燚雷博士以唯一作者身份在国际高水平学术期刊《Knowledge-Based Systems》上发表题为“ZRENet: A 3D-guided generative framework for zero-shot restoration of highly compressed talking face videos”的研究论文。

本研究针对超低码率条件下说话人脸视频严重压缩失真问题,提出了一种零样本恢复的三维引导生成框架ZRENet。该方法将视频恢复建模为结合几何先验与生成建模的优化过程,在无需额外训练适配的情况下,有效利用压缩视频中的残余空间与身份信息,从而提升重建质量与身份一致性。此外,本文设计了两阶段恢复机制:首先构建3D引导的空间一致性先验网络,利用三维人脸模型生成姿态自适应的身份先验;随后通过生成式动态纹理增强网络,结合多尺度自适应注意力机制融合压缩特征与生成先验,重点增强高频面部细节,从而显著提升恢复结果的空间一致性与真实感。(撰写:陈燚雷 审核:李睿恒)

