如今AI技术已经渗透了我们的生活,比如很多短视频平台就有AI/AR道具,创作者可以利用这一类道具来创造更有趣的内容。具体而言,它们同属于美颜算法的范畴,那么就让我们来看看,经过多年的演变,已经发展了哪些内容。
一、物体/动作检测技术
这一类应该是最早应用在短视频内容创作上的,包括很多自拍相机也有类似的功能。比如眨眼睛、吐舌头、比各种手势来触发一些特效,这些是基于人脸的。同理,基于一些生活中的图标、物体检测来触发一些特效。
二、美颜、美妆、美体、美牙等人像美化功能
这些其实都是基于关键点技术,无论是人脸的关键点检测还是人体的关键点检测技术,不论是5点、21点还是137、200+、1000+的点,又从2D的关键点到3D的关键点,这里都是为了帮助机器确认人脸的五官位置以及面部轮廓来进行的比例调整,比如大眼、瘦脸、瘦腰、拉腿等等。
这些比较基础,对于关键数量依赖比较少。如果想要做的更加精细,比如美妆里面需要进行眼妆等等小部位的刻画,这就需要关键点数量的增加,甚至如果想要做丰额头、高鼻梁、低颧骨、丰苹果机等效果,就需要一些3D mesh的辅助。
当然如果在媒体这个用户体验做到既可以拉腿、细腰、丰胸,同时又不让背景畸变,就需要引入抠图和补全技术了,有些场景下也可以使用3D人体重建的技术。
三、AR类
所谓AR类,我们统一都定义为在已有的显示空间中叠加3D渲染的CG素材,不论是叠加在人脸上的,还是叠加在环境中的。
这些底层技术一部分依赖于3D的人脸关键点定位技术,另一部分依赖于空间3D定位技术,如何在不同的用户手机姿态运动下、用户本身做各种动作的情况下,能保证叠加3D素材的绝对位置固定,这个是对于技术考验最大的部分。当然3D素材的精致程度,很大程度也依赖于CG的生成效果。
四、GAN
GAN,又称“生成类网络”,在美颜算法中,常用于智能换脸、美颜风格替换等功能。由于GAN本身网络的特性就十分适合短视频这类、以内容生产作为主要驱动力的产品定位,通过使网络学习大量的目标图片的风格,AI技术结合一些短视频类的模板就可以非常快速地帮助用户生成非常搞笑的、可爱的、炫酷的短视频内容、也非常适合结合短视频平台的各种节日运营活动展开。
以上就是美颜算法在AI技术中发展出的新内容,如果你对美颜sdk开发有需求,欢迎咨询官方客服。
声明:本文由美狐原创,未经允许禁止转载,谢谢合作。