Sora火爆的当下,国内大模型企业如何追赶Sora,难点在哪儿?2月23日晚,360集团创始人周鸿祎独家回应了新京报贝壳财经记者的这一问题。他认为,Sora的技术路线如果被开源,国内将能很快赶上,但在追赶Sora时,算力有可能成为门槛,对此,集中国内所有AI企业的算力或许是方法之一。
周鸿祎接受记者采访。新京报贝壳财经记者罗亦丹/摄
文生视频技术路线方向已被Sora确定但工程化思路需要探索
Sora发布后,周鸿祎曾一连发了十多条视频谈论这一文生视频大模型,他认为Sora对物理世界的很多描述符合常识,符合人类对世界的认识,因此不能把Sora仅看作一个文生视频的工具,而要看到背后人工智能的发展。
对于Sora采用的技术,周鸿祎称目前Pika、Runway等文生视频公司可能只是使用了文生图模型的相关技术,但Sora将文生图模型技术与文生文模型技术结合了起来,因此才能达到令人惊叹的效果。
周鸿祎对贝壳财经记者表示,Sora所代表的技术路线出炉后,国外也有两条路线的斗争,一条是OpenAI的闭源,另一条是以Meta为代表的开源,“开源路线的目标就要打破闭源,他们会不断去猜测闭源是怎么做的,最后再开源出来。开源出来的好处是,很多小公司和大公司的个人成员会积极地在开源项目中借鉴他人成果,同时再贡献自己的成果,其化学作用会非常明显。”
在他看来,一旦Sora的技术被开源出来,国内就能很快跟上。一个可供参考的事实是,一年前的今天ChatGPT冲击科技圈,而国内企业仅用了不到一年的时间就达到了GPT3.5的技术水平。
周鸿祎告诉贝壳财经记者,他近几日跟很多AI专家有过交流,发现目前许多技术里用到的模型和算法都是公开的,他认为OpenAI最大的能力一个是找方向,另一个就是工程化思路非常严谨。因此,现在需要把工程化的思路探索出来,“此前大家学习ChatGPT的过程中,同样也是在方向已确定的情况下,解决‘具体一个坎怎么过’、‘碰到一个山怎么翻’,踩很多坑,验证许多具体的方法,这需要时间。”
Sora可能会生成更长视频追赶Sora国内应集中算力
周鸿祎同时认为,在追赶Sora方面,算力可能也是一个坎。
此前,有专家分析称,Sora的参数规模不大,约为30亿。对此周鸿祎持反对态度,“这就弄错了一个概念,视频的参数和文本的参数是不能简单做对比的,文本有10万字,视频只有640×480,但是它两个所占的存储量完全不在一个数量级上。所以Sora可能不仅有30亿参数,第二就算只有30亿参数,他视频分析对算力的消耗应该是远远超过千亿模型的。所以,当现在国内显卡都被卡脖子之后,算力就可能会是一个问题。”
“Sora为什么只能做1分钟视频,我猜测因为它和4秒6秒有本质的差别,4秒和6秒是因为全部用像素来生成,没有这个世界的知识。4、6秒之后这个图怎么样?你就想不出来了。”周鸿祎猜测,Sora能生成一分钟的视频,就意味着也能生成10分钟、60分钟的视频,但是为什么不做呢?是由于算力和成本的限制。
同样,算力问题也出现在中国的AI行业中。对此,周鸿祎表示,他正在思考是否要提出如下建议,“目前,Meta已经有50万块GPU,明年可能会买百万块,微软应该也会按照百万级别去下订单。而国内的所有人工智能公司加在一起可能有50万块GPU,但都分散在各个公司里。”
在他看来,是否能够把国内的GPU算力都集中起来,“我之所以最近一直在科普,是因为Sora不仅仅是一个文生视频的工具,如果是的话我们落后就落后了,无非是广告落后一点、电影拍得慢一点,这些落后除了可能对娱乐业造成影响外,不会影响大国竞争,但实际上Sora预示着AGI(通用人工智能)的一个关键节点,所以我认为这对国家很重要。”
责任编辑:陈建瑞SN243