大模型混战这一年:进化之赛、效率之争、落地之战 -k8体育

日行千里,烈火烹油的两年过去,飞速发展的大模型行业怎么样了?与两年前“百模大战”为技术争夺的景象不同,玩家们有两个速度之争:一是技术迭代和产品更新的速度,二是商业化赚钱和应用落地的速度。技术和产品的迭代很直观,直接推动大模型行业的百舸争流。从语言大模型,到文生视频大模型,再到3d生成大模型,几乎每隔

日行千里,烈火烹油的两年过去,飞速发展的大模型行业怎么样了?

与两年前“百模大战”为技术争夺的景象不同,玩家们有两个速度之争:一是技术迭代和产品更新的速度,二是商业化赚钱和应用落地的速度。

技术和产品的迭代很直观,直接推动大模型行业的百舸争流。从语言大模型,到文生视频大模型,再到3d生成大模型,几乎每隔几个月就会有让人眼前一亮的大模型出现。

大家都在尝试和摸索。每一次技术的扩大亮相,都会将具有前瞻性的大模型厂商推到聚光灯下,并引发新一轮的行业追随。

有人*,就有人追赶。这些尚未成熟的技术,给了探路者弯道超车的机会,也带来了商业化的压力。

尤其是进入今年下半年,整个行业的风向更加微妙。市场逐渐对大模型祛魅,资本也回归理性,行业的两股势力也发生了站位的转换。

一边是阿里、字节等巨头投入的动作明显加快,收编大模型创业公司的核心人才,推出一系列ai产品;一边是创业公司开始重新评估自身的路线,国内“ai六小虎”有两家逐步放弃预训练模型,业务重心转向ai应用。

这背后,直指行业第二个速度之争:商业化的效率。

毋庸置疑,当下的大模型赛道高度拥挤,随着算力成本上涨、算力分配有限,对创业公司而言,大模型这场战役时间线拉得越长,创业公司的压力就越大。

“ai大模型(赛道),将只剩下10家企业扮演重要角色。”中国工程院外籍院士张亚勤曾表示。这几乎是行业的共识,最后的胜利属于少数的玩家。

大模型最终会进化成什么样,还不确定,但可以确定的是,大模型浪潮下,技术仍在迭代,场景仍在惊艳,商业化也始终在探索的路上。

过去两年,大模型不缺惊艳时刻,行业也处于百家争鸣的阶段,无论是暂时*的玩家,还是奋力追赶的玩家,都有机会在奔跑中,抢到更多的蛋糕。

01

3d世界、自主 agent、

思考大模型……大模型惊艳迭代

从chatgpt的惊艳亮相开始,新一轮的ai浪潮整整奔涌了两年。ai想象力被重启,大模型站上c位,围绕大模型的讨论和尝试也爆发式增长。

大模型的终局是什么样的?这一问题的答案吸引众多玩家前赴后继地卷技术、卷应用。

根据lifearchitect.ai数据,截至目前,全球总共有467个大模型。新技术不断涌现,行业竞速赛愈演愈烈,大模型厂商都在不断迭代升级,旨在离agi更进一步。

进入到今年,除了应用上的百家争鸣,一个明显的变化在于,以chatgpt为代表的大语言模型局限性日益显现。比如,他们只能处理文本领域的任务,无法与物理和社会环境进行互动;虽然大模型语料库已经十分丰富,但关于人类的价值观的文本,他们并不具备理解能力……

技术被重构,大模型行业也在不断改进和进化中,行业在寻找下一个更“类人”的模型或应用。

北京时间12月3日,“ai教母”李飞飞创立的world labs推出最新成果:世界模型,一张单个图像即可生成3d世界。

以往,我们熟知的大多数genai工具仅能制作图像/视频2d内容。world labs则实现了在3d中生成,视频的控制性、一致性能得到改善。world labs称,他们所生成场景的独特之处在于它们具有交互性,而且是可修改的。

这是今年9月份创立world labs以来,李飞飞团队推出的*成果,也是其迈向空间智能的*步。早在成立之初,李飞飞团队瞄准的就是空间智能,其初衷就是空间智能的ai,能够对世界进行建模,同时根据3d时空中物体/地点/交互进行推理。

李飞飞的个人影响力,加之空间智能的想象力,world labs成立三个月,有消息称其估值达10亿美元。

两天后,北京时间12月5日,google deepmind紧随其后发布了最新基础世界模型genie 2。作为今年初推出的genie模型的升级版,genie 2只需要一张图就能生成可玩的ai系统。deepmind透露,genie 2具备从不同视角(如*人称视角与等距视角)生成连贯世界的能力,这些生成的世界可持续时间长达一分钟,尽管多数情况下维持在10到20秒之间。

如果说世界模型展现的是模型理解虚拟世界运作规律,并准确做出预测的能力,那openai今年9月推出的o1系列模型则在于会思考。

彼时,openai ceo奥特曼对o1信心满满,“我认为这次 o1 模型发布最重要的信息是,ai 发展不仅没有放缓,而且我们对未来几年已经胜券在握。”

与gpt系列模型不同,o1系列模型有更强大的“思路链”,模型会在思考后回答用户问题,输出高质量的内容,而非迅速回应无效回答。此外,o1系列更擅长推理,推理能力大幅提升,特别是在奥数、编程等领域展现出了优势。

行业风向标的新动作,引发国内大模型厂商的追赶。11月16日,月之暗面公布了k0 math;11月20日,deepseek上线deepseek-r1-lite大模型;11月27日,昆仑万维推出“天工大模型 4.0” o1 版……无一不在强调大模型的逻辑思考能力。

无论是哪种路线的大模型进化,都让人类离agi更进一步。

其中,在应用层面,今年还有一个趋势不能忽视,人类与机器的互动方式正在发生范式转变,拥有对话功能的gpt逐渐进化能行动的ai agent(智能体)。

市场研究机构 research and market在11月11日发布的报告中指出,未来五年ai智能体的市场规模将增加420亿美元。麦肯锡也表示,ai智能体将是生成式ai的下一个前沿。

具体到玩家的动作上,“有手、有脑、有眼睛”的ai agent成为玩家抢滩的对象。

10月份,作为最早探索agent的初创企业智谱,推出自主智能体autoglm ;一个月后的agent openday上,智谱展示了ai agent的最新成果,包括autoglm、autoglm-web、glm-pc三个版本,对应手机、浏览器、电脑的应用场景。

新升级的autoglm能够理解超长指令,执行超长任务,在多步、循环任务中,autoglm的速度表现超过人手动操作。可以预见的是,当技术足够成熟,一个agent就能帮助人操控一切。

此前,微软ignite大会上,微软宣布已建立全球规模*的企业级ai agent生态系统;前openai高管创办的初创公司anthropic推出名为claude的ai智能体;openai被传出将在2025年1月发布代号为operator的智能体。

在国内,智能体也百花齐放。一边是手机厂商开始拿出智能体、智能助力讲故事;一边是巨头下场做智能体。比如字节跳动的扣子、腾讯云的腾讯元器、百度智能云千帆agentbuilder、阿里云大模型平台百炼、……

这一年,大模型不缺惊艳时刻。会思考的大模型、会想象的大模型、会预测的大模型,站在大模型技术的潮头,走向agi的路上,更惊艳的产品迭代一直在发生。

02

ai视频,新的角逐中谁都不甘落后

时间回到今年2月,行业军备竞赛持续一年,openai再次将大模型行业推至高潮。openai以世界模拟器的名号发布了视频生成模型 sora,让“一句话生成视频”变成可能。

行业的加速器来自sora。追赶sora、超越sora,几乎成了海内外大模型玩家的共识。

在海外,今年5月,谷歌发布对标sora的文生视频模型veo;6月,luma推出dream machine视频生成模型,ai视频生成初创公司runway推出gen-3 alpha模型。

将视角放到国内,玩家们为“中国版sora”争先恐后,催生两轮爆发期。

先是今年5月开始,生数科技vidu、快手可灵、字节即梦、智谱清影、商汤vimi等都相继发布文生视频模型。

今年9月,国产视频生成大模型又迎来了新一轮爆发。minimax正式发布视频模型video-01、阿里云在云栖大会上发布通义万相全新视频生成模型、美图宣布miraclevision大模型完成视频生成能力的升级。

今年11月,腾讯混元大模型正式上线视频生成能力。目前的生成视频支持中英文双语输入、多种视频尺寸以及多种视频清晰度。另一边,月之暗面旗下kimi被爆出正在内测ai视频生成功能“kimi创作空间”,可通过12种预设风格模板和自定义创作功能,为用户制作个性化音乐视频。

两轮爆发期间,随着初创企业和巨头的入局,ai视频赛道正变得拥挤。更关键的是,经过上半年密集发布新产品的阶段,想要在竞争中突出重围,行业的比拼从“有没有”升级为“好不好用”。

为了变得好用,升级更新是玩家们的统一动作。在国内,动作最快的莫过于有视频基因的快手和抖音。

截至今年9月,快手可灵经历了十次迭代升级。目前,在可灵1.5模型的支持下,可灵ai可以直出1080p高清视频,挑战大屏清晰度与质感。在图生视频方面,可灵1.5模型可以响应更复杂的文本描述要求。此外,可灵ai还支持运动笔刷、对口型等功能。

快手科技2024年投资者日上,快手主站业务与社区科学线负责人盖坤介绍,已有累计超260万人使用过可灵ai,并累计生成超2700万个视频、5300万张图片。

同为视频赛道的字节,与快手正面交锋。今年一季度,字节ai研发团队将视频生成模型的优先级排在前列。3月底,即梦开启视频生成功能内测;9月,字节发布豆包模型家族的两款视频生成模型seaweed和pixeldance,并通过即梦ai、火山引擎小范围邀测。

相比于之前的视频生成模型大多只能完成简单指令,字节的这两款模型能让视频在大动态与运镜中自由切换,拥有变焦、环绕、目标跟随等多镜头语言能力,能更好地服务在视频、电影领域的专业创作者。

11月,seaweed面向平台用户正式开放。据字节方面介绍,本次开放使用的豆包视频生成模型seaweed是该款模型的标准版,仅需60秒即能生成时长5秒的高质量ai视频,*国内业界3至5分钟的所需生成时间。

从底层技术看,ai视频赛道玩家的路线基本一致,即采用transformer架构的新型扩散模型dit,进行相关扩散、生成的技术突破。也就是说,玩家更多是通过训练数据丰富产品功能。

这也是字节、快手在ai视频赛道跑得更快的原因。“sora们”切入的60s视频正是字节、快手的基本盘。在短视频生态下,二者有丰厚的视频土壤滋养,这种视频数据的训练,正是推动大模型“好用”的关键因素。

历经近一年,国内文生视频大模型赛道进入了sora时刻。ai视频大模型的生成能力迈入新阶段的同时,我们也要看到行业的焦虑。

从实际落地层面上看,如果是b端商业生产,短剧、电影、广告对画面的连续性、一致性要求很高;如果是c端用户娱乐,对ai生成的*要求是真实性。

需求倒逼技术,想实现真正的好用,并不容易。

从技术上看,当下视频模型在理解、创作物理世界方面的表现依旧有限,画面的连贯稳定、主体的一致真实以及视频的时长都亟需迭代进化。

从成本上看,当下的视频技术很难下放到寻常百姓家,名噪一时的sora至今仍处于研究阶段,仅面向少数专业人士进行内测,很大一部分原因就在于高昂的成本。

再回到ai视频是行业趋势的这个问题上,厂商们之所以纷纷下注,一方面是因为行业需求催生了市场规模。

头豹研究院数据显示,2021年中国ai视频生成行业的市场规模为800万元,预计2026年,这一市场规模将达到92.79亿元。

另一方面,大模型的商业落地进度越来越迫切,相比于chatgpt这种聊天机器工具,ai视频生成是大模型技术商业化落地更具潜力的赛道。

03

效率之争、落地之战

两年,给行业带来技术革命,也让行业变得冷静。

今年7月,2024世界人工智能大会上,百度创始人李彦宏在演讲中提到,“2023年国内出现了百模大战,其实造成了社会资源的巨大浪费,尤其是算力的浪费。”

李彦宏言辞激烈的背后,是整个行业更加理性。市场期待在模型之中长出能落地的应用,为大模型厂商赚到钱、为各行各业提供效率。

抛开技术问题,这注定是一场应用落地的效率之战,这也就回到了商业化的问题上。

从去年“百模大战”,到今年应用之战,无论是哪个阶段,商业化都是大模型行业反复提到的话题。大模型的特殊性在于“烧钱”,技术上的研发成本,应用上的运行成本,每一步都少不了真金白银的支持,这也是大模型企业们的“紧箍咒”。

在国内,相比于两年前焦灼地坐上牌桌,争做“中国openai”的执念,这群ai明星企业将重点放在了商业化落地应用的探索上。

据智能涌现报道,被称为“ai六小虎”的6家中国大模型独角兽(智谱、零一万物、minimax、百川智能、月之暗面、阶跃星辰)中,已经有两家逐步放弃预训练模型,缩减了预训练算法团队人数,业务重心转向ai应用。

这透露了市场两个曲线,一个是部分初创企业正被困在商业化的焦虑里;二是行业商业化战线拉长,巨头的战斗力更足。

比如去年只发布了语言大模型的字节,今年一口气补全了视频、3d、音乐等多领域的大模型。在应用层面,字节陆续推出了十几个ai应用,覆盖了娱乐、对话、agent等多个产品方向。

在c端表现上,下半年巨头商业化的影响力更为突出。据数据分析机构questmobile,字节豆包app今年9月的日活已达760万,成为中国日活*的ai产品。

这一趋势下,大厂和创业公司的角色站位也发生变化。尤其是步入今年下半年,当资本冷静,一些ai明星创业公司被巨头收编,大模型创业公司高管加入大厂。

这验证了大厂坚决投入ai的重要性。ai是个增量,不仅能为大厂原有业务带来新的想象力,大厂原有的业务场景也可以为ai提供商业闭环。

不过,尽管是资源和场景更为丰富的大厂,面对市场对其巨额ai投入何时能换来回报的质疑时,也有些迷茫。

迷茫的背后,还有个更重要的问题:scaling law还成立吗?

所谓scaling law,是大模型行业的一个重要技术原理。具体而言,openai四年前曾经发布过一篇论文表示,模型的性能会随模型参数量、数据量、计算资源增加而指数提升。

只要scaling law 还成立,那么大模型的能力就可以通过算力、参数、数据的训练实现agi。

行业仍是积极的。特别是openai推出o1后,标志着大模型能力突破到了l2阶段。大模型开始真正拥有了逻辑思维能力,在无人力干预的情况下进行规划、验证和反思。

某种程度上,o1打破了预训练的 scaling law 瓶颈,商业上解锁了新的可能。在openai和智谱给出的“通往agi五阶段”的定义中,两家公司均将多模态和语言能力归在l1阶段,也就是最为基础的能力配备。

这个行业,从chatgpt,到sora,再到o1,openai仍是具有时代性的公司。也许和过去一样,哪个大模型厂商能*追上o1,市场还会迎来一波新高潮。

追赶技术的路上,玩家们不能忽视的是如何把钱花到刀刃上,这是一场技术、应用、场景的效率之战。

眼下,行业的淘汰赛已经开始,李彦宏曾预测,在未来ai浪潮里,市场中99%的伪创新都将被淘汰,只有1%的企业能够脱颖而出。谁是这1%,谁能创造“新”世界,要等市场给出答案。

(0)
小多多的头像小多多创始人

相关推荐

  • 前海盛世获21世纪金融年会2024“年度卓越客户服务品牌机构”大奖_行业动态

    11月9日,经过近2个月的社会征集和专家评选,《2024年21世纪金融竞争力优秀案例》在“第十九届21世纪金融年会 ”上正式揭晓。前海盛世卓 越管理有限公司(qh prestige management limited,以下简称“前海盛世”)凭借其先进的管理经验、出色的科技创新力,以及*的客户服务

    2024年11月12日
  • 易建联退役

    “时间飞逝,眨眼间,篮球已经陪我走过了21年。经过慎重的考虑,今天,我决定正式告别我的篮球职业生涯。”8月29日23时56分,易建联在微博上发布了自己的退役声明,顿时引爆了舆论场。声明中,易建联动情地写道:“再见啦,我最热爱的篮球:感谢你赋予我这段21年的美妙旅程,有热血、有喜悦、有遗憾、有泪水,有

    2023年8月30日 创投
  • 清昴智能完成数千万元天使轮融资,绿洲资本领投

    清昴智能完成数千万元天使轮融资,绿洲资本领投,清昴智能创始团队来自于清华计算机系,在边缘计算和模型自动压缩方向有十余年积累。

    2023年6月25日
  • 谁会成为人形机器人第一城?

    马斯克又给人形机器人加了一把火。23日马斯克在x平台上表示,特斯拉明年将生产出真正有用的人形机器人供内部使用,并预计2026年将大规模生产,供其他公司使用。2024年以来,在大模型和具身智能等概念带动下,人形机器人进入高光时刻。激烈的市场氛围如烈火烹油,一些新玩家也接连出现。据「产业象限」不完全统计

    2024年7月29日 创投
  • 资本烧火的预制菜,还没熟

    人类对于美食的向往,是深刻在基因之中。一顿新鲜、干净、满满锅气的炒菜,足以抚慰忙碌工作下疲惫的身心。但这种与美食不期而遇的满心欢喜,因为预制菜的火热,逐渐沦为怀疑与担忧。现在的餐厅从玉盘珍馐,逐渐沦为“科技与狠活”,并且大多数餐厅并不告知消费者它们使用预制菜,餐品价格也不会因为是预制菜而有所降低。不

    2023年10月6日
  • 2023,香水抢了口红的饭碗

    “疫情的时候习惯戴口罩了,疫情之后口红使用频率也下降了很多。”小云是小红书上的一位美妆博主,今年,在她的测评名单里,口红的出镜率减少了一半。主要原因是“品牌方口红测评的需求变少了”。另一方面,让小云头疼的是,香水的合作逐渐变多,然而,香水不具备可视性,需要她花点心思传达出不同香水的气味特征。壹览商业

    创投 2023年12月8日
  • 水清岸绿展新颜安徽巢湖流域“山水工程”擦亮生态底色_行业动态

    新华丝路合肥7月27日电(阮步影)盛夏七月,八百里湖面碧波粼粼、鸟翔鱼跃、青山环抱,180公里环湖大道绿意盎然,环湖十大湿地串珠成链……安徽…” />

    2023年7月27日
  • 量化师:更懂反向跟单,轻松应对市场挑战实现稳定盈利!_行业动态

    一、反向跟单的来源在金融交易市场中,由于盈利人群的极度稀缺性和亏损人群的绝对性,因此出现了反向跟单的概念。随着投资者越来越注重投资风险控制,…” />

    创投 2023年7月20日
  • 「复制」小杨哥,一场疯狂生意

    「复制」小杨哥,一场疯狂生意,做大切片视频生意后,小杨哥也要准备退休了。在如此庞大的利益面前,也很难有人不会动心。在将2023年目标设定为切片收益再翻一番后,小杨哥旗下“三只羊网络”集团正式宣布,在各大应用商城,上线“众小二”app。

    创投 2023年4月26日
  • 「寡妇年」里的深圳婚庆人

    婚庆摄影师莫文斌入行十年,原本想一份工作做到老,但今年以来,订单变少,出现入不敷出的迹象,让他斟酌起了去留。“转哪一行?这些年积累的人脉怎么用上?”这些问题困扰着他,“从未想过婚庆嫁娶这种大喜行业也会没落。”摄像、摄影、化妆、主持,并属婚庆四大金刚。今年,不管是独立的、还是婚庆公司里的四大金刚,都无

    2024年6月21日
  • 西麦食品喜获国家级荣誉_行业动态

    近日,人力资源社会保障部、中国轻工业联合会、中华全国手工业合作总社发布《关于表彰全国轻工行业先进集体、劳动模范和先进工作者的决定》,广西贺州西麦生物食品有限公司燕麦片车间荣获“全国轻工行业先进集体”称号。据悉,该项评选一般五年一次,旨在表彰和弘扬在轻工行业中作出突出贡献和取得显著成绩的先进集体,激

    2024年11月28日
  • 信用卡欠款被起诉流程 被起诉后处理方法介绍-财经

    信用卡的方便,受到了很多人喜欢,大多数年轻人都喜欢这种消费付款方式,信用卡既可线下刷卡消费,也可以绑定支付宝、微信等第三方支付平台进行线上支付。如果信用卡欠款严重后,被银行起诉的流…

    创投 2022年1月25日
  • 黄峥、张一鸣之后,又一名40岁企业家退休

    快手2021年上市那一年,投资方五源资本跟时任快手创始人宿华有过一次对话,对话的最后,对方问宿华:“如果给10年后的自己定一个目标的话,会是什么?”宿华的回答是,“我会希望10年后的自己更懂得表达自己。”2023年10月20日,快手科技在港交所发布公告宣布,宿华辞任董事长,由ceo程一笑兼任,该调整

    2023年10月23日
  • 90后新农人,在抖音电商分享西北大地的丰收“红”_行业动态

    丰收之际,枸杞熟了。宁夏大地上,一粒粒鲜红饱满的果子挂满枝头,红霞接天连地,十分壮观。这也是枸杞田里一年最热闹的时候:穿梭的农人、采摘的工人,把镜头架在田间地头的电商主播……垂坠的果实,红到了产业链条上每个人的心里。宁夏中宁是枸杞种植的发源地之一,已有600多年的人工栽培历史。“塞上江南”独特的地

    2023年9月12日 创投
  • 四大名著改编,命运为何各不同?

    名著改编,冰火两重天。在这个《黑神话:悟空》和《西游记》引爆互联网的8月,许多人可能尚未注意到,另一部同样取材于四大名著的改编作品正深陷泥沼、举步维艰。灯塔专业版app显示,由胡玫执导的古装电影《红楼梦之金玉良缘》于8月16日正式公映,上映14天的累计总票房约为546万元。从该影片登陆院线的*天起,

    2024年8月29日
网站地图