(资料图)
这波AIGC(利用人工智能技术来生成内容)的热潮,已经开卷视频了。近日,阿里达摩院低调地在魔搭社区(ModelScope)放出了“文本生成视频大模型”。
据了解。目前文本生成视频大模型,由文本特征提取、文本特征到视频隐空间扩散模型、视频隐空间到视频视觉空间这3个子网络组成,整体模型参数约17亿。支持英文输入。扩散模型采用Unet3D结构,通过从纯高斯噪声视频中,迭代去噪的过程,实现视频生成的功能。
记者发现,这个模型目前已经开放给用户试玩,只要输入一些简单的描述词,就可以看到生成的视频效果。比如输入“A panda eating bamboo on a rock”,就可以看到一只大熊猫坐在岩石上吃竹子的画面。
不过,目前这个模型还不支持中文输入,而且生成的视频长度多在2-4秒,等待时间从20多秒到1分多钟不等,画面的真实度、清晰度以及长度等方面还有待提升。
不止是阿里达摩院,总部位于纽约的人工智能初创公司Runway也发布了一种从文本到视频转化的AI模型Gen-2。上个月,这家曾参与创建Stable Diffusion的公司推出过模型Gen-1,能通过文本提示或参考图像指定的风格,将现有视频转化为新视频。比如将“街道上的人”变成“粘土木偶”,只需要一行提示词。
早在去年,谷歌和Meta都展示了各自在文本转视频上的尝试,利用AI生成泰迪熊洗碗和在湖上泛舟等视频。但这两家公司都没有宣布将相关技术推进到研究阶段以外的计划。
不过,从目前此类模型生成视频的等待时间,画面的真实度、清晰度以及长度等各方面来看,距离产出令人满意的视频还有很大距离。
-
天天微头条丨同花顺董事长首次回应员工持股平台补税风波事实上,如果无法筹集到资金补缴税款,无疑将对凯士奥和同花顺产生重大负面影响。对此,同花顺董事长易峥就记者的提问回复到...
-
【天天聚看点】北京市商务局:支持二手车扩大流通和经销发展2023年1月1日至10月31日期间,企业经营车辆转出本市超过30辆后,每增加一辆给予800元运费补贴,单个企业最高支持额度不超过200万元。
-
看点:2023全球6G技术大会开幕 未来数字世界“超级基础设施”备受关注3月22日,2023全球6G技术大会开幕。本次大会以“6G融通世界,携手共创未来”为主题,由国家6G技术研发推进工作组和总体专家组...
-
世界今热点:硅业分会:本周硅料价格跌幅约2.6% 短期内将维持缓跌走势据中国有色金属工业协会硅业分会22日消息,本周硅料价格延续缓跌下行走势,国内单晶复投料成交均价为21 82万元 吨,周环比...
-
当前观察:收评:两市小幅上涨沪指涨0.31% CPO概念股领涨截至收盘,沪指报3265 75点,涨0 31%,成交3825 1亿元;深成指报11496 93点,涨0 61%,成交5753 4亿元;创业板指报2341...
-
天天微头条丨同花顺董事长首次回应员工持股平台补税风波
2023-03-22 17:30:47
-
【天天聚看点】北京市商务局:支持二手车扩大流通和经销发展
2023-03-22 16:44:35
-
看点:2023全球6G技术大会开幕 未来数字世界“超级基础设施”备受关注
2023-03-22 16:30:45
-
世界今热点:硅业分会:本周硅料价格跌幅约2.6% 短期内将维持缓跌走势
2023-03-22 16:42:02
-
当前观察:收评:两市小幅上涨沪指涨0.31% CPO概念股领涨
2023-03-22 15:26:40