中文版SORA何时落地?期待千模相竞
与之前ChatGPT发布时,中文版GPT千模大战,一片热闹的场景不同,时至今日,依然没有哪家公司推出可以“平替”SORA的文生视频AI大模型,在未来,哪家科技公司最有希望率先推出中文版SORA呢?
自从SORA发布以后,它就一直是科技界最热门的话题,甚至可以不要之一,就连巨头谷歌隆重发布人工智能大模型这种新闻,都在它的面前,被直接压下,黯然失色。
在我国,Sora的影响同样巨大,SORA概念相关的股票连续多日上涨,势头甚至超越了之前的ChatGPT概念股,仅2月20日,Sora相关股票板块中,就有超过60只股票上涨,甚至有5家公司的股价飙升超过了四成!
发布中文版Sora,无疑成了科技和互联网领域各大科技公司新的目标。
然而,与之前ChatGPT发布时,中文版GPT千模大战,一片热闹的场景不同,时至今日,依然没有哪家公司推出可以“平替”(打个折的也行)SORA的AI模型。
中文版SORA为何难产?
- 技术门槛高:Sora作为一款先进的AI视频模型,其技术门槛较高,需要投入大量的人力、物力和财力进行研发和优化。
- 中文语言和文化环境的特殊性:中文语言和文化环境的特殊性也会对模型的研发和应用带来一定的挑战。
- 硬件问题:训练大模型需要大量,不,海量高算力的GPU芯片,美国的芯片禁售令,让国内众多科技公司巧妇难为无米之炊。
- 资源投入不足:国内之前对文生视频的前景预判不足,过于保守,导致在资源(算力、资金、技术、人才等)上的投入不够。
- 数据问题:相较于高质量的文本和图片数据,高质量的视频数据样本数量本身较少,版权限制也比较多,图文匹配数据的标注、清洗难度也大很多。
- 风险规避:研发并应用先进算法的风险较高,大部分企业即使是OpenAI,也尽量避免采用全新的技术路线,而是在不断推动现有技术路线的边界。
谁最有可能率先推出中文版SORA?
让我们大胆预测一下。
字节跳动
字节一直在AI方面努力不懈,手里也有海量视频资源(全用庞大的短视频用户、短视频库、抖音、西瓜视频等等)可供训练,资金充足,因为出海成功,受禁售令影响小得多,在视频资源、硬件设施的构建上具有国内其他企业无法比拟的优势。
但是,它在AI领域,起步远远晚于百度和阿里巴巴等大公司!
CEO曾表示,他难以相信技术团队直到2023年才开始讨论GPT,尽管业内领先的大模型公司,包括百度等,早在2018-2021年就开始了。
字节随后开始加速追赶。
2023年下半年,推出了十多款AI产品,其中包括基础大模型“云雀”、流行的C端AI对话应用程序,如“豆包”、“话炉”和“抖音小晴”,以及辅助创作的AI工具,比如剧情创作平台“BagelBell”和电商内容创作应用“即创”。
还开放了大量的内部职位,希望调动公司内最优秀的技术和产品人才投入到AI研发中。
虽然字节起步相对较晚,降低了它第一个推出SORA中文版的可能,可它手中掌握的资源和技术、人才储备,依然能排在第一梯队。
腾讯
个人非常不看好!
可能像引战,但就我自己的使用体验来看,它的混元大模型等,跟竞品对比……有些一言难尽。
比如。
我让它帮我写一个调用混元大模型API的示例程序,它连API接口地址都是瞎编的,连蒙五六次,都不对。
这可是你自己的API啊!
百度
个人感觉百度最有可能,它没什么短板。
在人工智能领域,有着深厚的技术积累和丰富的应用经验,文心一言、百度大脑、百度飞桨等人工智能平台在国内乃至全球都有一定的影响力,文生图等,很早就落地,并且拿来盈利了。
此外,百度在自然语言处理、计算机视觉等方面也有非常强的技术实力。
文心一言,特别是4.0版,相当优秀。
它旗下虽然没有抖音、西瓜视频这种优势短视频平台,但有爱奇艺、百度看看、YY直播等资源,资源不算领先,但也够用,硬件上更不弱,有很强的技术实力和资源来研发中文版SORA文生视频大模型。
阿里
它的可能性也很大,个人认为,它抢先发布首个中文版SORA的可能性,只比百度略低一点点。
通义千问我使用起来很舒服,还有通义万象等一大堆模型。
另外,阿里还有很多开源的模型、小模型,可供大家免费下载、部署在本地电脑上,进行个性化的语料库投喂、训练,这点还是挺大气的。
其他的
我实际使用、部署过的,智谱清言在文本分析上很不错;科大讯飞的语音识别特别赞,API调用极其方便,功能很强……类似科技公司和产品还真不少。
不过。
总觉得它们整体实力、综合资源等方面,要推出首个中文版SORA,相当困难,不如阿里和百度。
您觉得呢?
留个言吧 抢沙发