画家在画布上戳点,形成手绘作品独特的笔触。
你觉得这是哪部纪录片。
不不不。
视频中的每一帧都是AI生成的。
或者告诉它,来一个画布上的画笔特写,它就能直接创作出整个画面。
不仅可以凭空画出画笔,照着马头喝水也不是不可以。
还是那句话马儿喝水,这个AI抛出了这张图:
好家伙,这是以后做视频的节奏。真的是靠一张嘴...
是的,在那种情况下,AI绘制的文本到图像是蓬勃发展的,Meta AI这种情况下的研究人员对AI一代进行了超级进化。
这次真的可以用嘴做视频了:
人工智能被称为Make—A—Video,它直接从DALL的静态和稳定扩散中生成飙升的动态。
给它几个字或者几行文字,就能生成这个世界上实际上不存在的视频画面,还能掌握很多风格。
不仅纪录片风格能hold住,整个科幻效果也不错。
当两种风格混合在一起时,时代广场上跳舞的机器人似乎毫无矛盾感。
小文艺清新的动画风格,看来Make—A—Video也把握住了。
经过这么一波操作,真的让很多网友看傻了,连评论都简化成三个字母:
大个子乐村意味深长地说:该来的总会来。
毕竟在一句话生成视频之前,很多业内人士都觉得快。不过,元这一手真的有点快:
比我想象的快了九个月。
甚至有人说:我适应不了AI的进化速度...
文本生成模型的超级进化版本
你可能会认为Make—A—Video是DALL的视频版本。
实际上,差不多就是这么回事。
如前所述,制作视频是文本图像生成模型的超级进化那是因为这个AI工作的第一步实际上是依靠文本来生成图像的
从数据上看,是DALL E等静态图像生成模型的训练数据,是成对的文本—图像数据。
虽然Make—A—Video最终会生成视频,但它并没有使用成对的文本—视频数据进行专门训练
当然,视频也参与其中,但它主要是用一个单独的视频片段来教会AI如何在现实世界中移动。
具体到模型架构,Make—A—Video主要由三部分组成:
文本图像生成模型p
时空卷积层和注意层
一个用于提高帧速率的帧内插网络和两个用于提高图像质量的超级子网。
整个模型的工作过程就是酱阿姨的工作过程:
首先,根据输入文本生成图像嵌入。
然后,解码器Dt生成16帧64×64 RGB图像。
插值网络F将对初步结果进行插值,以实现理想的帧速率。
然后画面的分辨率会被第一个超分网络提升到256×256第二超级子网络继续优化,进一步提升画质至768×768
基于这一原理,Make—A—Video不仅可以根据文字生成视频,还具有以下能力。
将静止图像转换为视频:
从原始视频生成新视频:
刷新文本视频生成模型SOTA
事实上,Meta的Make—A—Video并不是第一次尝试从文本生成视频。
例如,清华大学和致远在今年早些时候推出了他们自研的一句话视频生成AI:CogVideo,并且这是目前唯一开源的T2V模型。
此前,GODIVA和微软的女娲也实现了根据文字描述生成视频。
可是这一次,视频制作的质量明显提高了。
在MSR—VTT数据集上的实验结果表明,Make—A—Video大大刷新了SOTA在FID和CLIPSIM上的成绩。
此外,Meta AI的团队还使用Imagen的DrawBench进行了主观评测。
他们邀请测试人员体验制作视频,并主观评价视频和文本之间的逻辑对应关系。
结果表明,制作视频在质量和逼真度上都优于其他两种方法。
还有一点
有趣的是,Meta在发布新AI的同时,似乎也拉开了T2V机型竞赛的序幕。
StabilityAI,stability Diffusion的母公司,坐不住了。创始人兼首席执行官艾玛德说:
我们将发布一个比制作视频更好的模型,每个人都可以使用的模型!
就在几天前,一篇相关论文出现在ICLR网站上。
生成的效果是这样的:
对了,虽然Make—A—Video还没有公开,但是Meta AI官方也表示已经准备推出试玩版让大家实际体验一下,有兴趣的朋友可以蹲一会儿~
论文地址:
参考链接:
声明:以上内容为本网站转自其它媒体,相关信息仅为传递更多企业信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。投资有风险,需谨慎。
三大航货运业务逆势增长,燃油附加费翻番 三大航去年亏损仍在加剧,航空业出路何在。3月30日晚间,国内三大航司相继发布2021年年报,三大航营收均录得增...
3999元起,小米11Ultra手机限时特惠150 日前,小米春季发布会上正式推出了小米11Ultra,该机拥有黑白两色,精密陶瓷工艺机身,黑色沉稳大气,白色优雅...
新北洋:累计回购605万股占比0.9088% 每经AI快讯,新北洋3月31日晚间发布公告称,截至2022年3月31日,公司累计通过回购专用证券账户以集中竞价...
中青旅:2021年营收同比增长两成持续布局“旅游+ 中青旅3月31日披露2021年报,公司全年实现营业收入86.35亿元,较上年增加20.76%,实现归属于上市公...
高值设计·重构未来——SK瓷砖x金堂奖战略合作云发 SKCERAMICS2022随着消费新升级,新生代消费群体对居住空间的诉求,越来越艺术化、多元化、个性化。SK...
605389长龄液压3月24日收盘小幅上涨0.57 2022年3月24日长龄液压(605389)收盘点评:长龄液压今日小幅上涨.57%,早盘低开-0.50%,报4...
600358国旅联合3月24日全天上涨2.48%, 2022年3月24日国旅联合(600358)收盘点评:国旅联合今日上涨2.48%,早盘低开-0.41%,报7....
600386北巴传媒3月24日收盘数据:较昨日下跌 2022年3月24日北巴传媒(600386)收盘点评:北巴传媒今日微跌-.25%,早盘高开0.25%,报4.0...
海能实业:2021年度独立董事述职报告王义华 安福县海能实业股份有限公司2021年度独立董事述职报告王义华各位股东及股东代表:本人作为安福县海能实业股份有限...
601598中国外运3月24日股价收盘3.88元与 2022年3月24日中国外运(601598)收盘点评:中国外运今日股价与昨日持平早盘高开0.77%,报3.91... 
601138工业富联3月24 2022年3月24日工业富联(60113...
陈小春开启京东汽车超级直播夜 11月9日晚18点,京东汽车11.11超...
挑战善行者丨2021速8酒店 热爱不止,善行不息善行者是一种勇气善行者...
布局宠物蓝海市场安心养宠物计 京东健康宠物医院作为安心养宠物最重要的升...
苏炳添用9秒83的佳绩带领亚 每0.01秒的提升都是汗水与泪水...
4×100米接力决赛 中国男 4×100米接力·决赛中国女队4...
JBL/UA PROJECT 在这七月热汗运动季,由高保真至潮...
中国队“00后”纷纷登上东京 杨倩、管晨辰、李雯雯、全红婵……...
体育赛事招商的三大注意事项 今年4月姚明和篮协对CBA商务开发权的争...
传统体育文化的两大现代价值 中国传统体育文化丰富多彩,内容博大精深,...
当今世界体育对人的价值体现在 不知你想过没有,在当今这个高度互联网化、...
体育分析中机器学习的标准:预 运动分析有相当一部分属于机器学习,即从数...
进行冬奥会体育营销的五个关键 明年冬奥会将在北京和张家口举行,关于奥运...
父母如何从家庭教育当中反思自 某天晚上睡不着,忽然想到能够写这么一个角...
思维教育对幼儿的四大好处 思想教育对幼儿的益处,幼儿思想处于直观行...
父母教育孩子前必须要知道的前 网上的很多文章提到过,一些懵懂型鸡娃的家...
华为是第一大客户EDA第一股 在半导体芯片设计领域,EDA软件也是卡脖...
新的设计和技术风向奥迪gra 2021年9月3日消息,奥迪将在2021...