#照片跳舞火了#只要一张照片就能生成一段舞蹈视频,又一个大模型应用出圈是非常多小伙伴都想了解的内容,下面小编为大家整理的#照片跳舞火了#只要一张照片就能生成一段舞蹈视频,又一个大模型应用出圈相关信息,欢迎大家的分享收藏哟!
从2024年首个工作日起,兵马俑、马斯克以及众多网友参与的虚拟科目三舞蹈和网红舞蹈视频开始在国内各类社交媒体和朋友圈广泛传播。这些长约十秒钟的视频并非由真实人物出演,而是由大型人工智能模型生成,这种易于参与的“虚拟舞蹈”热潮在网络上迅速兴起。网民们热议道:AI解决了他们四肢协调问题、科目三的风潮刮进了考古界、从此无需担忧科目三跳步时扭伤脚踝……这一切都源于阿里云通义千问APP推出的一项新功能。用户只需在通义千问APP内输入特定口令如“通义舞王”或“全民舞王”,就能进入体验页面。根据提示上传个人照片后,只需短短十几分钟就能生成逼真度极高的舞蹈视频,视频中的人物脸部表情、身材比例、服饰以及背景等特点均能得到良好保留。
据了解,这一创新功能背后的核心技术是由阿里通义实验室自主研发的视频生成模型——Animate Anyone。早在十一月底,这项研究成果已在Twitter、YouTube等海外社交平台上引发轰动,相关视频播放量破亿,项目在GitHub上的星标数量也在短短几天内超过了1万,成为了近期大模型领域备受关注的热门算法之一。
该算法不仅在生成效果方面引人注目,其技术路径也颇受业界关注。视频生成是大模型研究领域的热门课题之一,然而长期以来,如何在生成的人物形象视频中确保形象一致性、动作流畅且可控、以及无瑕疵的时间顺序一直是技术难题。根据公开发布的学术论文,Animate Anyone融合了多种创新技术,采用ReferenceNet来捕捉并保留原始图像信息,从而高度再现人物、表情及服装细节;同时,该算法运用了高效Pose Guider姿态引导器以确保动作精确可控;再者,通过时序生成模块的有效运用,成功保障了视频帧间连贯流畅的效果。在相同的测试数据集上,Animate Anyone相较于国内外同类模型表现出显著的优势。
早在今年九月,通义千问成为中国首批获得备案的大模型,而在通义千问APP上线之后,其功能不断迭代升级,目前已涵盖文本对话、语音对话、翻译、PPT大纲助手、小红书文案创作、视频生成等多项服务内容。(来源:大众新闻客户端 段婷婷)
以上就是多特软件站小编给大家带来的#照片跳舞火了#只要一张照片就能生成一段舞蹈视频,又一个大模型应用出圈全部内容了,希望对小伙伴们有所帮助。
了解更多消息请关注收藏我们的网站(news.duote.com)。