腾讯 AI 实验室在姿势引导人物图像合成方面获取新突破

发布时间：2023-11-04 15:04:02 所属栏目：动态来源：

导读：最近，腾讯的人工智能研究部门推出了一种名为渐进条件扩散模型的技术（Pcdms）来提高虚拟人员形象的逼真度。这项技术的应用可以更加有效和真实地生成角色姿势。

PCDMs 在 DeepFashion 和 Market1501 数据集上的各

最近，腾讯的人工智能研究部门推出了一种名为渐进条件扩散模型的技术（Pcdms）来提高虚拟人员形象的逼真度。这项技术的应用可以更加有效和真实地生成角色姿势。

PCDMs 在 DeepFashion 和 Market1501 数据集上的各项指标，明显优于其他 SOTA 方法，且在小尺度数据集 Market1501（128*64）上的 SSIM 指标得到最高的 0.3169，比第二名 PIDM 高出 3.8%。

在先验条件扩散模型第一阶段，在给定源图像和姿势坐标作为条件的情况下，先验条件扩散模型采用一个变换网络来预测目标姿势下的全局特征。

在模糊修复非线性的条件之下的扩散数据库模型进入了第二阶段，进一步完善第一阶段的全局非线性特征，，建立源图像和目标图像之间密集对应关系，该阶段可确保跨多个维度（包括图像、姿势和特征）进行对齐，对于实现逼真的结果至关重要。

在完善条件扩散模型第三阶段：在前一阶段生成初始粗粒度目标图像后，细化条件扩散模型介入以提高图像质量和纹理细节。

此阶段利用先前生成的粗粒度图像作为条件，进一步提高图像保真度并确保纹理一致性，涉及修改第一个卷积层，并使用图像编码器从源图像中提取特征。采用交叉注意力机制将纹理特征注入网络，便于纹理修复和细节增强。通过使用多个卷积层，可以在不同的时间间隔执行不同的操作。

（编辑：聊城站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!