Google轻量化脸部编辑GAN模型,低阶手机也可即时生成高品质输出

on

|

views

and

comments

Google针对生成对抗网路(Generative Adversarial Network,GAN)的高运算复杂度提出解决方案,将原本需要在伺服器执行的脸部编辑模型轻量化,推出可在手机上运作的少样本脸部风格模型MediaPipe FaceStylizer,提供高品质脸部图片生成,并且透过MediaPipe平台公开,让用户能够自订部署到行动装置上。

生成对抗网路是一种深度学习模型,其包含生成器和监别器两部分,生成器负责生成图像,而监别器的任务则是分辨图像是不是真实的,也就是发现该图像是否由生成器所产生。而MediaPipe FaceStylizer针对脸部风格化设计,具有脸部生成器和脸部编码器两个主要元件。脸部编码器的主要功能用於生成对抗网路反转(GAN Inversion),将图像映射到生成器的潜在码(Latent Code)中。

生成对抗网路反转是指用於寻找导致模型输出的输入,这个输入再经过生成对抗网路的生成器时,会产生特定图像,换句话说,当存在一张图片,想要知道生成对抗网路的生成器中,可以产生该张图片的潜在码,这个过程便称为生成对抗网路反转。脸部编码器便是找出潜在码的角色,以便脸部生成器可以再次使用该潜在码,生成相同或是类似的脸部图像。

除此之外,研究人员为了最佳化生成器,特别设计了一些损失函式,并且结合常用的生成对抗网路损失函式,藉以最小化生成器的错误,他们从一个较为复杂的StyleGAN模型,提炼出一个更轻量的生成器BlazeStyleGAN。轻量生成器虽然容量小、执行快,但生成的图片品质仍然很高。下图研究结果显示,BlazeStyleGAN生成的图像品质很好(图下),而且因为研究人员在损失函式的设计,进一步减少了StyleGAN可能产生的瑕疵和伪影(图上)。

从参数数量和计算FLOPs评估模型复杂度,与StyleGAN拥有3,340万参数相比,BlazeStyleGAN的复杂度大幅降低,在输出图片解析度为256×256的情况下,仅需要约200万参数和1.28G FLOPs的BlazeStyleGAN模型。当输出解析度为1024×1024,BlazeStyleGAN-1024可减少95%运算复杂度,而且输出图像品质与StyleGAN-1024模型没有明显差异,甚至抑制来自StyleGAN模型的伪影。

研究人员在高效能的装置上,对MediaPipe FaceStylizer的推论时间进行基准测试,BlazeStyleGAN-256和BlazeStyleGAN-512在所有拥有GPU的装置上都能达到即时运算,在更高阶手机的执行时间甚至不到10毫秒。BlazeStyleGAN-256还可以在iOS装置上以CPU即时生成结果。

Google将会透过MediaPipe平台,向用户公开MediaPipe FaceStylizer。BlazeStyleGAN模型经过训练之後,只需要几行程式码,就能透过MediaPipe Tasks FaceStylizer API部署已汇出的TFLite模型到各平台的应用程式。

openvpn是什么软件

热门文章

达发科技AI卫星定位晶片获机器人大厂Segway采用!有何特色?

达发科技,已研发出AI卫星定位晶片「AG3335A」,其具备公分级高精度RTK(Real Time Kinematic)卫星定位能力,现已获机器人大厂赛格威(Segway)投入Segway Navimow i系列「无线割草机器人」使用,该款机器人标榜多种户外,可能受遮蔽物干扰卫星讯号的地方,也能精准输出数据。

德凯携手TTC共推台湾AI/资通安全/低轨卫星验测技术

为推进台湾人工智慧(AI)安全(Safety)、资通安全(Security)与低轨卫星(LEO)等验测技术之发...

AI 晶片需求暴增,华为暂缓高阶手机生产

由於中国市场对华为 AI 晶片需求飙升,加上良率限制,迫使中国科技巨头必须考虑优先满足 AI 晶片需求,进而暂缓高阶手机 Mate 60 系列生产。 《路透社》引述知情人士的消息指出,华为将会优先生产昇腾(Ascend)AI 晶片而非麒麟(Kirin)晶片,因此 Mate 60 系列生产将会受到影响...

最新文章

相关推荐

0 0 投票数
Article Rating
订阅评论
提醒
guest
0 Comments
内联反馈
查看所有评论
0
希望看到您的想法,请您发表评论x