中国大模型的路,是不是走歪了? -k8体育

在这波全球大模型的浪潮中,中国与美国无疑成为了领军者。但两国在大模型的发展策略上却出现了显著的分歧。美国,以openai为代表,持续致力于通用型大模型的研发。与此相反,中国则将目光投向了行业大模型。众所周知,国内科技巨头如百度、阿里、华为等,在已有的通用大模型基础上,纷纷推出了为各个行业量身定做的大

在这波全球大模型的浪潮中,中国与美国无疑成为了领军者。但两国在大模型的发展策略上却出现了显著的分歧。美国,以openai为代表,持续致力于通用型大模型的研发。与此相反,中国则将目光投向了。众所周知,国内科技巨头如百度、阿里、华为等,在已有的通用大模型基础上,纷纷推出了为各个行业量身定做的大模型。同时,众多的创新公司和各行各业的头部企业也开始涌入这个领域,积极地发布各类行业大模型。

然而,当我们沉浸在这种欣欣向荣的景象中时,一系列的迹象引起了笔者的关注,我们不得不思考一个问题:中国在大模型的探索之路上是否已经偏离了正确的轨道?难道我们又要重蹈当年saas市场的老路,走入一个看似繁荣却可能是误区的局面吗?

01 行业大模型并不是空中楼阁

大模型的出现和快速发展为ai领域带来了革命性的变革。其中,大模型的核心流程可以简化为两大环节:预训练和微调。通过预训练,我们得到了所谓的“通用大模型”。进而,基于这种通用模型,我们可以使用特定行业的数据进行微调,从而产生“行业大模型”。

在过去的几个月里,我们目睹了中国涌现出大量的行业大模型。这种现象背后隐含的一个事实是:打造行业大模型的技术门槛相对较低。为什么会这样呢?首先,随着开源技术的普及,技术上的壁垒逐渐被打破。许多优质的预训练技术、框架和工具已经被广大研发者和机构所采纳和使用。其次,相对于开发一个全新的大模型,微调现有的通用大模型更为简单快捷,只需要大量、高质量的行业数据即可。

打造一个强大的通用大模型却是一项长期且复杂的任务,这需要巨大的计算资源、多样化的数据和深厚的技术积累。因此,相比之下,行业大模型的产生,就显得更为便捷了。

但这种便捷性带来的是双刃剑效应。大量涌现的所谓行业大模型,并不具备真正的竞争壁垒。这其中的原因多种多样。技术上,因为它们大多基于相似的开源技术和通用大模型进行微调,很少有真正的技术创新。数据上,尽管行业数据是关键,但许多企业并没有真正挖掘、整合和利用这些数据的能力,使得其微调的效果并不理想。

02 底层通用大模型的每次迭代,都将“淹没”一大批所谓的行业大模型

当我们谈论现代技术时,我们必须理解其动态性和快速发展的特性。大模型技术的快速迭代就是一个典型的例子,每次通用大模型的升级都使其前一代的技术变得陈旧。

以openai的gpt系列为例,从gpt到gpt-4,其发展历程几乎可以形容为“飞速”。而在技术世界中,速度就是竞争力。每当openai发布一个新版本,它都会因为更多的参数、更先进的算法和更高的性能,使前一版本相形见绌。而这种进化不仅仅局限于通用模型,实际上,它更多地影响到了基于前一代模型微调出的行业大模型。

试想,一个企业可能已经投入大量资源在gpt-3上,开发出一套专门为医疗领域设计的ai系统。但当gpt-4问世时,这家企业突然发现,他们的专业系统在新的通用模型面前相对落后,甚至可能不如直接使用gpt-4的效果。这就是因为,每次通用大模型的迭代都意味着一个巨大的技术飞跃,其对特定任务的处理能力会显著增强。

这种现象与硬件行业的情况相似,我们可以把它比喻为计算机硬件的迅速更新。当intel推出新的处理器时,前一代处理器即使还能正常运行,但在性能和能效方面都会相对落后。而在ai领域,这种更新周期更短、变革更剧烈。

回到大模型,当我们基于某一代模型投入大量资源进行微调时,我们必须认识到这种投资的风险性。举例来说,当一个初创公司决定基于gpt-3开发一个针对金融行业的ai助手时,他们可能面临的风险是,仅仅过了几个月,gpt-4或gpt-5的发布会使他们的产品立即过时。

03 行业大模型是商用的重要方式,但不要忘了前提条件

诚然,行业大模型的出现似乎为各个垂直领域带来了巨大的机会。它们可以更好地满足特定行业的需求,提供更加定制化的服务,帮助企业提升业务效率,提供更高品质的客户体验。

然而,一切的基石依然是一个强大的通用大模型。只有当通用模型具备强大的能力时,行业大模型的微调才能真正发挥价值。

值得深思的是,中国在ai领域已取得了许多值得骄傲的成果,但与国际*的通用大模型,如gpt-4相比,国内仍存在一定的差距。这对于中国的技术界来说是一个挑战,也是一个机会。挑战在于如何在短时间内弥补这一差距,机会则在于一旦做到,国内的行业大模型将能够站在一个更高的起点。

而现在的现象是,部分企业在通用模型的基础还不够稳固的前提下,急于推出一系列的行业大模型。这种策略显然有其商业逻辑——尽早进入市场,尝试尽快实现商业变现。但这种策略忽视了一个核心问题,那就是技术的根本价值。

企业应用ai技术的根本目的是为了解决实际业务问题,提高运营效率和客户满意度。而如果一个行业大模型在语言理解、逻辑推理、数理计算或内容生成等核心能力上都表现不佳,那么它所带来的实际商业价值就会大打折扣。客户不会因为一个产品声称自己是某个行业的大模型就选择购买,他们更关心的是这个模型能为他们的业务带来什么实际效益。

因此,对于企业和技术研发者来说,关键不在于急于推出各种行业大模型,而是要认识到,强大的通用大模型是所有行业应用的基石。只有在这个基石稳固的基础上,行业大模型才能真正发挥出其应有的价值。

换言之,现在的首要任务是加强通用大模型的研发,尽快追赶国际水平,然后再以此为基础,推出真正有价值的行业大模型。这样的战略布局,既能保障技术的长远发展,也更能真正满足市场和客户的需求。

真正的创新,应该始终以实际需求为导向,而不是盲目追求短期的商业利益。

04 应该怎么做呢?

对于企业和机构来说,仅仅拥有一个行业大模型并不足以确保其在市场中的竞争优势。

那么,应该怎么做呢?笔者认为,应该在通用大模型和行业大模型上同时发力。

首先,通用大模型还需要尽快进化。无论是文心一格、通义千问还是盘古、混元大模型,都需要进化。

一方面参数规模还需要持续扩大,得有万亿级参数规模的大模型。从技术原理上,扩大参数规模,是提升模型智能涌现的重要方式,这是大模型智能提升的“物理基础”。就像人类为什么比其他动物聪明,人类大脑的神经元数量要显著多于其他动物,就是一个关键的基础。

另一方面,在大模型构建、优化的工程能力方面,还需要进一步提升。大家都是基于transformer架构,技术原理并不是什么秘密,但为什么chatgpt就是比其他大模型表现得更好?关键就是其ai工程化能力更优。就像造原子弹的技术原理并不是什么秘密,但要造出原子弹,却有大量的技术秘诀和经验,是一个浩大的工程。

只有底层通用大模型足够好,在此基础上构建行业大模型才有意义。

接下来,在构建行业大模型阶段,要在两方面发力:

一方面,要汇集足够规模的高质量行业数据。现在的情况是,各行各业的数据资源都非常有限,并且散落在不同的公司和机构中。这种分散性不仅导致了数据的量不足,更关键的是,没有统一的数据标准和质量控制,使得模型训练效果大打折扣。为了解决这一问题,我们需要促进企业和机构之间的合作,推动行业数据的开放和共享。

比如医疗大模型,关键就是要有足够的医疗数据。这需要通过医疗数据的开放共享来构建行业数据集实现,某个企业、机构的数据量始终是有限的。现在限制行业大模型的一个关键瓶颈,就是没有足够的高质量行业数据,行业数据太分散了,而且质量不够高。要着力解决这个问题。

另一方面,要将行业知识固化到行业大模型当中,这需要一些专业人士与ai人才配合,进行大量的模型调优工作。无论是通用大模型还是行业大模型,其背后的初衷都应该是为用户和客户提供真正的价值。客户需要的不仅仅是技术上的新鲜感,更重要的是在真实的业务场景中,模型能够为他们带来实际的帮助和效益。

无论我们在技术上如何进步,始终不能忘记为什么我们要做这一切。

(0)

相关推荐

  • 33年后,日企又想奋斗了?,。更关键的是,如何在有阻力的条件下,在政策和汇率等方面,给出海企业营造更好的融资环境。

    2023年7月3日 创投
  • 2014 年,市场涌现了第一波硬件创业公司,随着最近几年小米生态链企业的上市,这波机会在交出答卷。 那么,为什么我们到现在又要讨论硬件这个主题呢? 因为最近一年时间,我们观察到两个…

    2021年10月18日 创业分享
  • 越南李佳琦,快被中国人造出来了,近1亿人口的越南,电商增长的空间清晰可见,近两年,中国电商创业者积极涌向胡志明、河内。

    2023年6月2日
  • 刚刚又一火箭公司破产,裁员85%暂停运营,与其说是裁员,不如说是公司破产倒闭的前兆,裁员波及到了公司所有团队和部门,无一幸免。丹·哈特称,维珍轨道将“在可预见的未来停止运营”。

    2023年4月4日 创投
  • 氢能产业爆发,绿氢才是关键

    氢能源产业,“一触即发”!氢能被称为“21世纪的*能源”,据国际氢能源委员会发布的《氢能源未来发展趋势调研报告》,2050年,全球氢能源需求将增至目前的10倍,全球氢能产业链产值将超过2.5万亿美元。截图于《工人日报》电子版另据中国氢能联盟预计,至2025年,我国氢能产业产值将达到1万亿元。2050

    2023年8月24日
  • 火锅出海转战欧洲,早在2017-2019年间,火锅品牌曾掀起过一轮出海潮,当时的目的地是东南亚市场。而如今他们又将出海目的地瞄向了更遥远、陌生的欧洲市场。

    2023年6月26日
  • 大型能源装备商「永泰数能」完成pre-a轮融资,投控东海、卓源资本、力合等投资,「永泰数能」是一家全球大规模储能综合k8体育的解决方案提供商,涵盖光伏、锂电、电力系统、充电桩及光电柜多元能源装备及一体化软硬件综合k8体育的解决方案研发商。

    2023年5月15日
  • 产业竞争力理论(industrialcompetitiveness)产业竞争力理论也称国家竞争优势理论。这是竞争战略和国际竞争力领域的国际权威之一,哈佛商学院著名学者迈克尔 #18…

    2022年1月25日
  • 专注过敏免疫治疗与自身免疫治疗,百明信康完成逾11亿元c轮融资,本轮融资的资金将主要用于现有产品管线的全球开发及商业拓展,自主研发平台的构建及新项目的引入,同时也将加快公司国际化和专业化团队的搭建。

    2023年6月30日
  • 这一段时间很多的机构都开始布局一个领域就是职业教育,那么在a股中有哪些公司算是职业教育这个板块中的龙头呢?接下来的文章里就给大家简单介绍几个! 机器人:公司投资的北京汇泽博远机器人…

    2022年1月25日
  • 30亿,重庆渝富龙泽并购基金(母基金)成立,基金将重点投向先进装备、智能网联汽车、电子制造及数字经济等战略性新兴产业相关赛道。

    2023年5月19日
  • 芝麻550分可以贷款吗?据悉芝麻信用是独立的第三方信用服务机构,是蚂蚁金服生态体系内的重要组成部分。芝麻信用通过云计算、机器学习等技术客观呈现个人和企业的信用状况,已经形成芝麻信用…

    2022年1月25日
  • 10月23日,在港上市首日、跟“帝国”没有半毛钱关系的快餐帝国(01843.hk),名副其实地请投资者吃了一次“快餐”—— 来源:wind 公司股价开盘后一路暴涨。一个小时内,最高…

  • 近日,华为mate 60 pro的强势亮相引爆手机市场。众所周知,一款手机集成着多款芯片,它们分别负责不同的功能。主要包括处理芯片、基带芯片、射频芯片、存储芯片、模拟芯片和传感器芯片等。除了这些重要的芯片,还包含其他多种零部件,包括屏幕、结构件以及各种机械和电子元件。然而,国外芯片供应商几乎在以上绝

    2023年9月14日
  • 暑期境外游,用支付宝还是微信?,在支付宝、微信之外,出境游客的选择还有很多,而在各种优惠、羊毛的诱惑下,出境游用支付宝还是微信,不同情况的游客,也会有不同选择。

    2023年7月19日 创投
网站地图