2024欧洲杯(中国区)官网-登录入口这么咱们就赢得了最终的扫尾y-2024欧洲杯(中国区)官网-登录入口

1.JPG

近期,国外筹备机视觉与步地识别会议CVPR 2022在好意思国新奥尔良举行,并同步进行线上会议。由王君乐博士率领的腾讯Turing Lab执行室提交的论文《High-resolution Face Swapping via Latent Semantics Disentanglement》(基于隐语义解耦的高分辨率换脸)顺利入选。

论文由腾讯Turing Lab与华南理工大学、卡迪夫大学及中国香港大学相助完成。接下来,咱们将为群众解读论文的中枢后果,一说念来学习筹备机视觉规模的最前沿参谋吧!

基于隐语义解耦的高分辨率换脸

High-resolution Face Swapping via Latent Semantics Disentanglement

在换脸任务中,咱们需要针对给定的源脸和贪图脸,将源脸的身份信息移动至贪图脸上,并同期保抓贪图脸的属性信息。该技能频年来赢得盛大心理的,并在互动文娱、广电、安全与狡饰保护等规模均展现出较大的应用后劲。

这篇论文建议了一种新的、基于预测验GAN模子中内在先验常识的换脸尺度,达成了高分辨率(1024X1024)换脸。该尺度除了能保抓贪图脸的常见属性信息,如表情、姿态、光照、配景等以外,还不错更好地保抓贪图脸的妆容信息。

在这个职责中,咱们期骗生成造反模子隐空间的解耦特质,将不同性质的属性折柳移动。具体来说,表情、姿态等是与结构干系的属性,而光照、格调等是与外不雅干系的属性。这两类属性由隐编码的不同层折柳限度:一张图片隐编码的前半部分限度结构信息,此后半部分限度外不雅信息。

咱们先折柳将源脸和贪图脸回转到StyleGAN的隐空间内。同期将源脸和贪图脸要害点的热图送入要害点编码器,得到一个结构属性滚动向量,这个向量作用在源脸的隐编码上,即可达成结构属性的移动。

同期,咱们用贪图脸隐编码的后半部分代替源脸隐编码的后半部分,这么即可达成外不雅属性的移动。将科罚之后的隐编码送入预测验好的StyleGAN中,即可得到初步的换脸扫尾。

2.JPG

此外,为了达成贪图脸配景的移动,咱们将贪图脸径直送入贪图编码器,得到不同分辨率的特征,并和StyleGAN中间经由中产生的特征在解码器中进行交融。这么咱们就赢得了最终的扫尾y。执行扫尾标明,咱们的尺度在图片和视频换脸任务中,很多方面的效果均擢升了多SOTA尺度。

注:图片只用作学术参谋,无须于生意用途。

对于CVPR

CVPR 全称 IEEE 国外筹备机视觉与步地识别会议(IEEE Conference on Computer Vision and Pattern Recognition),该会议始于 1983 年,是筹备机视觉和步地识别规模的顶级会议。本年大会共收到来自全球各大高校、科研机构与科技公司共8186篇投稿,最终摄取的论文险些皆代表了年度筹备机视觉规模最新、最高科研水平以及往日发展趋势。

3.JPG

这次论文入选,亦然对腾讯Turing Lab执行室现阶段科研及翻新才智的招供。往日,腾讯Turing Lab将接续发愤,为群众在筹备机视觉规模带来更多可能。

腾讯Turing Lab执行室隆重东说念主

4.JPG

王君乐博士

中国素有“礼仪之邦”的美誉,这体现在人际交往过程中,有着一套非常繁琐的礼仪规范,不仅如此,通常还伴随着钱财的馈送和交换,这就是“送礼”。古人将礼物称为“挚”,认为有“执以至者”的意思,即亲自带着礼物到主人家,通过这种方式来表达自己的真情厚意。《仪礼·士相见礼》就记载了人们初次相见时送礼的场景。

经出版社授权,第一财经选取书中部分篇章,以飨读者,本文发表时有删节。

腾讯人人参谋员

领有十余年筹备机视觉、多媒体、机器学习规模参谋西宾,在东说念主体姿态推测与重建、图像质地评价、筹备照相学、千里浸式多媒体等规模有较深的了解及实战西宾,并在这些规模率领团队进行探索与落地的职责。

曾主导腾讯CenseoQoE画质评价决策的建树与社区开源,主导腾讯时尚云游戏云霄虚实互动技能的研发。此外2024欧洲杯(中国区)官网-登录入口,在包括CVPR、NeurIPS、TIP、TMM等顶级会议及期刊上发表多篇论文,并为多个会议及期刊担任审稿东说念主及组织者。