谁是中国版sora? -k8体育

鏖战一年的“百模大战”还未结束,两个海外ai巨头又给国内科技大厂出了难题。就在春节假期的尾声,谷歌和openai毫无征兆地放出了各自的 ai新“核武”。谷歌拿出的新一代多模态大模型gemini 1.5 pro,将性能提升到了百万级别,完全秒杀了openai的gpt-4 turbo,暂居地表最强。而后

鏖战一年的“百模大战”还未结束,两个海外ai巨头又给国内科技大厂出了难题。

就在春节假期的尾声,谷歌和openai毫无征兆地放出了各自的 ai新“核武”。

谷歌拿出的新一代多模态大模型gemini 1.5 pro,将性能提升到了百万级别,完全秒杀了openai的gpt-4 turbo,暂居地表最强。

而后者发布的*文生视频模型 ,则基于视觉美学的惊艳表现,更让人印象深刻,迅速成为全球科技圈追捧的热点。

在生成视频的保真度、长度、稳定性、一致性、分辨率、文字理解等各方面,sora已经超过gen-2、svd-xt、pika等主流产品,做到了当前*,可以说一出手就是王炸。

去年,国内的百度、阿里、科大讯飞等互联网公司纷纷推出了自研大模型,争抢智能变革时代的船票;华为、小米、oppo、vivo等手机厂商也布局大模型,希望新技术为见顶的市场带来新的生机;众多创业公司也进入该赛道,试图轻装上阵、弯道超车。

但物理意义上的鸿沟让国内的大模型产品在性能、生态等方面还与chatgpt有着不小的差距。而如今视频生成模型sora的诞生,不出意外也将再次掀起一波跟风的浪潮。

然而,颠覆性的效果往往来自颠覆性的思路。从当前节点来看,在ai大模型领域国内企业与世界前端到底还有多大差距?差在哪里?又有哪些种子选手可能脱颖而出?

01

恐慌

对于sora的横空出世,马斯克的评论“gg humans(人类认输了)”,算是一种主流看法。

此前,虽然已经有大量文生视频技术,但尚未实现技术收敛,主要实现路径是通过各种手段让单帧的图片“动”起来,类似定格动画。而从用户的实际需求来看,视频每一帧之间的连贯性与自然度是价值的关键,也就是视频每帧语义信息的无缝衔接才是核心。

也就是说,sora这种围绕需求提供对应技术k8体育的解决方案的产品,要远远优于通过技术可实现的角度来创造产品。

根据openaik8体育官网上的介绍指出,sora与之前的文生视频思路并不一样,是让模型一次预测多帧画面,并且确保视频主体保持不变。这正是其巧妙之处——在视频帧上做突破,提升了生成视频的使用上限。

360创始人周鸿祎也给予了极高评价,他认为sora的诞生意味着agi(通用人工智能)的实现可能从十年缩短至一两年。

作为sora的前辈,ai文生视频创企runway联合创始人兼ceo cristóbal valenzuela感慨道,以前需要花费一年的进展,变成了几个月就能实现,又变成了几天、几小时。

sora发布前还曾有很多烟雾弹式的信息被放出。比如openai 组建了研究儿童安全的新团队,或是正准备推出 gpt-4.5-turbo,但真正的“杀手级更新”被隐藏得很好。这也导致像pika、runway一样的明星创业公司,面对sora措手不及。

其实,国内外大厂对于ai视频生成的态度一直模棱两可。根本问题在于,现在的人工视频质量、效果更好,且成本也能接受;ai 视频生成此前没有大家想象的那么颠覆,所以整体策略偏向防御,而非进攻。

值得一提的是,国内的字节跳动以及百度的嗅觉更加敏锐。百度早在去年3月文心一言的发布会上,便发布了ai文生视频的功能,百度ai会自动根据文字内容寻找合适的视频素材,生成视频后并自动发布,这是属于文心一言aigc的ttv(文本内容情感化分析)功能。

字节跳动则在去年11月发布了pixeldance,可以通过上一个视频片段尾帧,为下一个视频片段头帧提供指导的思路,在视频时长上有所突破,但至今仍然没有开放用户测试,所以具体效果如何还是未知。

如果从gpt的发展路径来看,所有做ai视频生成甚至做大模型的公司将面临新一波危机。就像周鸿祎所说,尽管国内大模型发展水平表面看已经接近gpt-3.5,但实际上跟4.0比还有一年半的差距。openal手里应该还有一些秘密武器,无论是gpt-5还是机器自我学习自动产生内容。

但是危险中也蕴藏着机遇。openai证明了用大模型的思路做视频是可行的,文生视频能蔚然成风成为全球新一轮aigc竞赛的焦点,也给短视频平台上的直播电商、内容创作等带来更高的天花板。其他互联网企业和内容平台,需要做的只是证明自己也可以用大模型做出视频。

从技术角度来看,sora属于多模态混合模型,由大语言模型和文图生成器拼接而成。这也意味着多模态模型迭代节奏加快,不出意外2024年的*波ai风潮将就此展开。

02

风起

自2022年末chatgpt崭露头角,其强大的影响力如野火燎原般蔓延至国内科技圈。百度、阿里巴巴、腾讯等一众互联网大厂,以及以米ov为代表的智能硬件公司,仿佛嗅到了新时代的气息,纷纷宣布推出自家的大模型,意图在这波ai浪潮中占据一席之地。

与此同时,文生图、文生视频等多模态aigc产品也在有序推进。实事求是地来看,ai生文、生图的应用,早已层出不穷,相关的技术不断日新月异。相比之下,ai文生视频,却是一个迟迟未被攻下的阵地,难度和价值一样巨大。

公开信息显示,包括字节跳动、百度、阿里、海康威视、万兴科技、拓尔思、当虹科技在内的科技公司,都在积极布局文生视频,但与sora相比存在不小的差距。

简单来讲,之前的ai文生视频工具,仅仅停留在“模拟现实”的层面,sora则已经跃升到了“构建现实”的新高度。两者的根本区别在于,前者只是对现实世界的表面模仿,难以深入捕捉现实世界的物理规则和动态变化;而后者则是在虚拟世界中重新构建了一种与现实世界并行的存在。

sora不仅学习了像素与画面的呈现,更深入理解了现实世界的“物理规律”。例如在现实世界中,我们每咬下一口食物,食物上都会留下咬痕,这是遵循物理规则的自然现象。sora生成的视频中,同样能够精准地再现这一细节,做到“咬下去有痕迹”,从而在虚拟世界中*再现了现实世界的真实感。而这是其他文生视频产品所做不到的。

以百度的文心一言为例,虽然其能够根据输入的文本生成视频,但在处理复杂场景和细节描绘方面仍存在不足。并且百度ai文生视频也更像是从已有素材库中找到更接近文字意思的视频进行拼接,单靠ai很难生成新的视频内容。

今年初,字节跳动发布了一款超高清文生视频模型magicvideo-v2。据悉,该模型输出的视频在高清度、润滑度、连贯性、文本语义还原等方面,比目前主流的文生视频模型gen-2、stable video diffusion、pika 1.0等更出色。

抖音的张楠已于2月初辞去ceo岗位,聚焦在剪映业务上。这意味着,抖音将加强对ai生图和视频产品的布局,其中文生视频自然是重中之重。

不过在张楠的规划中,ai视频所应具备的更高保真度生成效果、更清晰生成画面、更顺畅自然的逻辑理解能力等,也被sora一朝之间吊打。

相对于互联网巨头的低调表现,一些上市公司在近期却积极发声,纷纷披露自己在视频生成模型领域的业务情况。

据不完全统计,包括万兴科技、博汇科技、易点天下、数码视讯、汉王科技、当虹科技、东方国信、神思电子、因赛集团、拓尔思、国脉文化、佳都科技在内的超10家a股上市公司,近三个月以来在互动平台上各自披露了相关视频生成模型领域的业务情况。

但不能否认的是,真正达到前沿水平的公司凤毛麟角,许多公司只是在跟风炒作,缺乏真正的技术储备和研发能力。

东方国信直言不讳地表示,他们在ai视频生成领域尚无成熟的技术储备;而神思电子则回应称,公司正在对文生图、图生文、视频生文、文生视频等多模态数据互相跳转的收敛性质进行深入研究,言下之意,他们在这方面的技术也还在探索阶段。

ai文生视频的颠覆性,可以具体到实际运用层面来看。图片、视频生成能帮助提高企业的商业化需求,如帮助降低广告客户成本、便捷制作视频等。拿字节跳动举例,其广告客户投放总成本中有一到两成为视频制作成本,而去年开始字节已经用相关产品帮助广告客户压缩这部分投入。

与上一波chatgpt的风潮相似,尽管在推出类似ai文生视频产品方面国内企业难免落后一步,但也不失为一个摸着sora过河的机会。

03

涌动

从全球市场来看,ai仍然引领着整个科技商业前进的方向,而且多模态成为主流。从大语言模型到多模态,再到通用人工智能的路径已经逐渐清晰,分歧点还是在于节奏的判断。

此前,openai花了大约半年时间来测试大语言模型gpt-4。如果测试sora需要差不多的时长,这个强大的视频生成工具可能会在今年8月份开放。而这半年时间便是其他企业积累力量的窗口期。

毕竟chatgpt已经问世一年多,但还有大量用户没有使用过聊天机器人相关产品,这也为其他企业迎头赶上提供了机会。

而目前国内企业面临的*问题,还在于*梯队的ai公司如百度、科大讯飞的股价,因各种原因被打到了地板价,而国外的*企业,如英伟达、微软的股价创出新高,openai的估值仍然在不断上升。这也意味着海内外ai企业在资本、人才、技术、市场号召力等方面存在着天然的优劣差异。

周鸿祎认为,科技竞争最终比拼的是人才密度和深厚积累。事实也是如此,sora应用的是transformer diffusion。从模型架构来看,如果以transformer为基准,那么文生视频依旧是龙头科技企业更有优先权,但是如果生成式视频架构依旧围绕diffusion展开的话,创业企业机会要更大一些。

不过没有一骑绝尘的技术,只有螺旋式上升的产业繁荣。

sora虽然可以一次性生成几十秒到一分钟的视频,但是真正在应用阶段,如果产品没有提供足够多的微操空间,确保用户能够将其整合到自己的工作流中,那么大概率也只能叫好不叫座。

好在技术的扩散才刚刚开始,不会有任何一家公司“猝死”在新技术的出现上。openai更像是一个开拓者,强项在于铺路,普及应用尚需要生态的力量。

就像是在文生文模型上的模块化组合,是否会有类似手机、智能音箱一样的专有智能设备问世?让更多用户可以在端侧使用模型,构建起开源 小参数模型 移动端的思路,把当下的产品做一次革新。这是国内厂商所擅长的,但同时也是未来内卷的阵地。

从单点的突破来看,sora具有里程碑意义;但是从商业化需求和混剪工作流效率提升来看,sora本身的价值和落地效果还有待考究。

想仅靠ai生成的一分钟视频成为下一个董宇辉、李佳琪并不现实,更别说制作长视频或者电影、电视剧了,即便是做一个短视频,是通过一遍遍修改提示词更加有效率,还是在视频剪辑软件里按照创作者的想法调整素材更快?显然,期待sora变得更强,不如期待视频剪辑软件中尽早增添ai模块,从而切实提升工作效率。

即使最终sora全面放开注册,普通用户也难以做出如当前演示案例般的视频demo。所以最终各个大厂的决胜点还是在于如何普及多模态的应用,如何在工具中加入ai功能,更直接地优化工作流程。

新兴技术具有普适性,并不是某个企业的专属。对于国内企业来说,在多模态上的探索不妨可以参考gpt的发展、落地方式,在特定垂直领域的应用层面找到自身的优势,并以此作为方向实现快速发展。

只是在这个过程中,拼的还是人才密度、落地程度以及犯错误的次数。

(0)
小多多的头像小多多创始人

相关推荐

  • 「进化半导体」完成近亿元融资,中合汽车基金、同创伟业领投,本轮融资的完成,将加快推动氧化镓材料的国产化进程,是产业链核心环节在新一代半导体产业生态布局中的重大进展,也是创新工艺构想加快向现实生产力转化的又一棒加速度接力。

    2023年4月14日
  • 东方甄选和董宇辉的“宫斗大戏”结局,堪称诡异。周一晚,新东方总裁俞敏洪和董宇辉一起直播吃了顿火锅,不仅凿实了给董宇辉升职加薪的消息,也给他提供了许多人想都不敢想的优厚待遇。董宇辉从“打工仔小董”一跃变成“董总”,完成了身份跃迁,同时还撵走了针对他的孙东旭。不到一周的时间内,一出堪比“甄嬛从甘露寺杀回

    2023年12月21日 创投
  • 小鹏汽车第二季度财报出炉,先看几个关键数据:营收50.6亿,同比下滑31.9%;净亏28亿,同比增加3.8%;汽车毛利率为-8.6%,去年同期9.1%。从以上几个数字来看,小鹏的业绩表现并不好,这也导致其股价在财报公布当天出现暴跌,8月18日,小鹏汽车美股跌幅一度超7%,当天收盘跌幅回落至4.28%

    创投 2023年8月20日
  • 恋综终于完成了一次升级。先是《喜欢你我也是4》里开始启用“人海战术”,接着《怦然心动20岁3》拿下豆瓣8.1分、刷新恋综评分,再到《心动的信号6》两间小屋加码人海战术、新颖恋综人设女嘉宾登场,今年的恋综逐渐焕发出新生命力。而在《心动的信号6》大结局点映礼,终于迎来了cp粉们的热搜狂欢,多组cp的诞生

    创投 2023年9月22日
  • 01 曾经的巨头已节节败退“生意火爆,人人都有干劲。光一个月营业额就有21万元。”这是2002年,广州家乐福万国店内,在热狗肠仔柜台负责卖货的黎姐,回顾2002年该柜台营业场景的表述。“后期她转卖卤水,一个月营收也稳定在10万元以上。卖飞饼的生意也不错,一份6.8元的榴莲飞饼,一天能卖掉三四百份。”

    2024年7月2日
  • 来源:东四十条资本(id:dsstcapital) 作者:曹玮钰 传统行业,还会有大的新机会吗?比如服装。 服装行业历来不算个“性感”赛道,加之近几年增长趋缓,服装已成“夕阳行业”…

    创投 2021年10月25日
  • 90后女孩:车祸失明后,我辞职成为义眼师,接受自己的缺陷真的需要时间,于是她给足自己时间和耐心,接受敏感的情绪,以及不完美的样子。

    2023年4月10日
  • 对于很多教育从业者来说已经都看得出来接下来国内的教育资源会向职业教育倾斜,那么在a股市场上有哪些公司算是职业教育中的优质股呢?这篇文章就跟大家聊聊这个话题! 洪涛股份:公司董事会同…

    创投 2022年1月25日
  • 新能源车,重磅红利

    上周五a股在一大堆真假难辨小作文的刺激下出现莫名大跌,很大程度破坏了市场的情绪。周末两天风平浪静,大家也都寄希望今天能稍微回血缓和情绪,但没想到猜对了开头没猜对结果。今天三大指数从小幅高开到一度大跌再到尾盘神秘资金入场把指数拉回来,但还是未能翻红,总成交1.52万亿,也比周五少了3108亿。看得出来

    2024年11月27日 创投
  • 车圈「董明珠」,能成为何小鹏的「陈书婷」吗,在众多新能源车名企的人事变动中,小鹏汽车最引人注目,是因为其除了旧有高管辞职、离任外,发生了震动业界的“重磅引媛”。

    创投 2023年5月10日
  • 珞珈山下,巍巍武大。今天(11月29日),武汉大学迎来130岁生日。震撼的一幕出现:雷军个人向母校捐赠13亿元人民币,刷新武大建校以来单笔最大捐赠额,这也是全国高校收到的最大一笔校友个人现金捐赠。武汉大学党委书记黄泰岩介绍,近10年来武大校友向母校捐款累计已达56亿元,校友捐赠位居全国前三。正如他说

    创投 2023年11月30日
  • 晟运能源获政府引导产业基金a轮融资,加速储能技术创新与市场布局

    投资界(id:pedaily2012)11月19日消息,晟运能源获得近亿元a轮融资。本轮融资资金将用于建设储能设备生产工厂、pcs设备深度研发以及大储、工商储多型号研发,全力推动晟运能源在储能领域的战略规划与技术升级,进一步加速市场拓展步伐,同时也为公司在南方市场的深入布局提供了关键支撑。晟运能源是

    2024年11月19日
  • 6月15日-6月16日,泡泡岛音乐与艺术节福州站成功落幕。根据木鸟民宿数据,泡泡岛音乐与艺术节福州站的落地,带动福州15日至16日民宿订单环比上月同期上涨35%。当下,音乐节的主力军是已经或者即将步入工作的90后、95后乃至00后的青年群体。木鸟民宿作为品牌支持方助阵泡泡岛音乐与艺术节福州站,结合

    2024年6月19日
  • 不会装、修不好、弄坏了……不少网友抱怨“找师傅就像开盲盒”,暗讽市面上服务水平参差不齐,具有严重的不确定性。更令人忧心的是,有些师傅来路不明,导致售后无门,消费者权益得不到任何保障。在服务平台层出不穷的当下,挑选靠谱的专业平台成为一大难题。全国最 大的综合性家居服务平台万师傅,率先运用互联

    2024年10月16日
  • 娃哈哈的抖音官方旗舰店,7天涨粉超200万。在没开启直播的情况下,销量依旧暴涨,以至于娃哈哈发视频呼吁:理性消费,按需拍单。娃哈哈的ad钙奶、八宝粥等产品,已经在部分平台售罄,被迫开启预售模式。有快递员发视频表示:拉快递这么久,*次见到这么多娃哈哈。在线下,娃哈哈产品同样是顶流。有超市在娃哈哈的货架

    2024年3月6日
网站地图