今天是
2050大会上的年青人都在用AI干什么?
发布时间:2024-04-28   都市快报

浙江警校学生用一张照片还原0到70岁的模样 

00后姑娘大三休学创业 用AI帮陈坤创作《山海经》大电影

昨天傍晚,杭州云栖国际会展中心一楼大厅内,一张八仙桌周围挤满了人。有一件蓝白黑的格子衬衫特别眼熟,定睛一看,果然是王坚院士。一桌子的年青人或坐着或站着,有说有笑,像极了话剧《茶馆》里的一幕。

从一匹马到人形机器人、从宇宙到极光、从恐龙到古生物、从一棵树到探索自然,从AIGC到电影……这个周末,来自全球各地的年青人,因为相同的兴趣爱好聚集到了云栖小镇。

有人站在最亮眼的聚光灯下分享自己的梦想,有人分享自己对最新技术的思考和实践,还有人仅仅是坐在一起看一场露天电影、踢一场球、打一场游戏。

刑侦剧里“三岁画老”真的可以做到!

两年前,有一本叫《猎罪图鉴》的探案网剧很火。剧中“天才模拟画像师”沈翊凭借声音和骨感,或者受害人只言片语的描述,就可以画出凶手的相貌,甚至“三岁画老”,通过人脸的骨骼推断画出成年后的长相。

现实生活中,真的可以三岁画老,以画追凶吗?

浙江警察学院学生、同时也是“未来之貌”项目创始人的彭星源,向大家揭秘了基于GAN(生成式对抗网络)的面容时光机技术:通过一张小小的照片模拟出一个人0至70岁的样子。

当初,彭星源看了剧中三岁画老的神奇功能,突然想到自己曾关注过的一个社会问题:走失儿童。

有关数据统计,我国每天有2763人走失,其中很多是无辜儿童。比如中国最大寻找失踪未成年人的公益网“宝贝回家”,数据库中有近18万的失踪人群,网站让几千个家庭重聚,但这个数量只占到了总数的2.5%左右。其中的一个重要原因,是“宝贝回家”发布的照片,很多是小朋友小时候的照片,但随着慢慢长大,很难追踪到长大之后的样貌。

他印象最深的一个案例是2018年,贵州遵义的一对父母终于找到了自己失散30多年的孩子。这个孩子其实没有走远,一直生活在离家只有10多公里的地方,而且经常去亲叔叔家的小吃店里吃饭。

专业领域出生的彭星源开始思考,能不能用数据去帮助更多的家庭寻找走失儿童?

一张小时候的照片,可能是黑白的,也可能因为时间久远有了裂痕。彭星源和团队对照片作预处理后,通过算法,还原出0至70岁的样貌,一套总共34张照片,每张照片的年龄跨度在1-2岁之间。

这里面涉及三个核心技术,面容预测、老照片修复和人脸识别。面容预测是最有意思的一个模型之一,即基于GAN的生成式对抗网络。GAN源于博弈论中的两人零和博弈。

零和博弈指的是当两个人在不同的博弈中达到纳什均衡状态,即达到一个最吻合的状态。放在算法中,通过生成器和判别器不断地进行交流和博弈,直到最后,生成器能够生成出判别器无法再判别你是虚假照片的情况,就达到了想要的效果。

彭星源说,虽然现在很多App也推出了面容预测的功能,但大部分偏娱乐效果,只是在照片上加了皱纹效果,并不符合人脸衰老的规律。

目前“未来之貌”团队对这项技术作了一些测试。“我们穿越时光,为是的成全希望,希望未来之貌带着时光机送宝贝回家。”彭星源说。

00后姑娘大三休学创业all in AI

AI大电影《山海奇镜》背后的故事

大三休学创业all in AI,00后姑娘陌叁渡和同学们成立一个叫“跃墨”的工作室,最近刚完成了陈坤导演的《山海奇镜》AI电影部分原画输出。

陌叁渡是中央美术学院艺术管理专业学生。她说自己看到AI绘画工具Midjourney那一刻,就被打动了,“AI关键词的底层逻辑是艺术理论,正好和我专业对口。”果然,她设置关键词,尝试生成的作品也在网上得到了很多人的认可。

《山海奇镜》被称为国内第一部AI大电影,故事来源于先秦古籍《山海经》,将传说中的各类奇异怪兽先用AI生成图片,再将图片合成视频。“因为电影涉及很多个动态画面,如何保证风格的统一性是难点,设置什么样的关键词,用什么样的工具都有考究。”

许多人一提到AI,第一印象往往是它能轻松生成各种内容,从而担心人类即将被替代。“一个短短一分钟的AI影片,从剧本创作到分镜设计,再到画面输出、驱动、剪辑和特效制作,每一个环节都由人类的创意和想法所驱动。”陌叁渡认为,AI时代,人类依然是创作的主体,创意的核心。

任素汐唱歌时的伴舞竟不是真人

首个登上了央视春晚的AI视频

龙年央视春晚,任素汐演唱了一首《枕着光的她》,不知道你发现没,现场伴奏视频,是将一段真人双人舞用AI的风格转绘成陶瓷的舞蹈。

这也是央视春晚首次AI生成的视频,这次在2050的现场,陶瓷双人舞蹈作者之一的Simon阿文和大家详细讲解了转绘舞蹈制作全过程、遇到的技术难点,以及对应的解决方案。并探讨如果把时间节点放到当下,会有什么新的技术方案。

Simon阿文是AbleSlide 联合创始人,也是一名AI创作者。他说,如果是将一个人的舞蹈转化为卡通或者其他想要的风格,技术上并不复杂,但如果是两人的动作,就很难了,因为双人舞蹈会有拥抱等靠在一起的动作,导致AI在提取骨骼、人物轮廓等很难流畅表达出来,有时候还会出现性别交换等问题。

为了解决这个问题,刚开始Simon阿文他们尝试先将单人舞蹈转绘,再进行双人合成。但这个工作带来了大量的后期制作时间,好在经过多次探索尝试,最后找到了好用的工具插件,接入了一个叫ControlNet tile模型,让其参考原视频的角色细节特征,从而固定住角色特征。

这里还有个哭笑不得的细节。如何将自己想要的风格准确描述并且告诉AI,一直是个难题。Simon阿文说前期他在输入有关陶瓷的关键词后生成的陶瓷人物,质感一直不好,最后还是灵机一动去亚马逊上搜了大量的陶瓷商品,看他们的商品介绍单词,尝试输入porcelain figurine(瓷娃娃),终于生成了满意的质感。

通过这么久的尝试,Simon阿文也表示,AI在一定程度上解放了技术,提高了效率,但它仍然只是一个帮助人类实现想法的工具。真正取代人类的不是AI,而是那些懂得如何运用AI的人。


来源:都市快报    作者:记者 沈积慧 刘永丽    编辑:李佳萌