加入收藏 | 设为首页 | 会员中心 | 我要投稿 聊城站长网 (https://www.0635zz.com/)- 智能语音交互、行业智能、AI应用、云计算、5G!
当前位置: 首页 > 站长资讯 > 动态 > 正文

腾讯 AI 实验室在姿势引导人物图像合成方面获取新突破

发布时间:2023-11-04 15:04:02 所属栏目:动态 来源:
导读:最近,腾讯的人工智能研究部门推出了一种名为渐进条件扩散模型的技术(Pcdms)来提高虚拟人员形象的逼真度。这项技术的应用可以更加有效和真实地生成角色姿势。

PCDMs 在 DeepFashion 和 Market1501 数据集上的各
最近,腾讯的人工智能研究部门推出了一种名为渐进条件扩散模型的技术(Pcdms)来提高虚拟人员形象的逼真度。这项技术的应用可以更加有效和真实地生成角色姿势。

PCDMs 在 DeepFashion 和 Market1501 数据集上的各项指标,明显优于其他 SOTA 方法,且在小尺度数据集 Market1501(128*64)上的 SSIM 指标得到最高的 0.3169,比第二名 PIDM 高出 3.8%。

在先验条件扩散模型第一阶段,在给定源图像和姿势坐标作为条件的情况下,先验条件扩散模型采用一个变换网络来预测目标姿势下的全局特征。

在模糊修复非线性的条件之下的扩散数据库模型进入了第二阶段,进一步完善第一阶段的全局非线性特征,,建立源图像和目标图像之间密集对应关系,该阶段可确保跨多个维度(包括图像、姿势和特征)进行对齐,对于实现逼真的结果至关重要。

在完善条件扩散模型第三阶段:在前一阶段生成初始粗粒度目标图像后,细化条件扩散模型介入以提高图像质量和纹理细节。

此阶段利用先前生成的粗粒度图像作为条件,进一步提高图像保真度并确保纹理一致性,涉及修改第一个卷积层,并使用图像编码器从源图像中提取特征。采用交叉注意力机制将纹理特征注入网络,便于纹理修复和细节增强。通过使用多个卷积层,可以在不同的时间间隔执行不同的操作。
 

(编辑:聊城站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章