围攻英伟达,三大巨头的芯片再出招! -k8体育

围攻英伟达,三大巨头的芯片再出招!,对于英伟达而言,其面临的挑战是方方面面的,而不是仅仅局限于其gpu。其对手也不仅仅是芯片公司,因此如何在规模化优势的情况下,保证其高性价比,是安然度过未来潜在挑战的有效方法之一。

替换,甚至说干掉英伟达已经不是什么新鲜事了。

凭借其gpu的*优势,英伟达过去几年炙手可热,乘着chatgpt热潮,公司的市值从今年年初至今更是大涨了93.6%,过去五年的涨幅更是达到惊人的385%。虽然gpu是英伟达的最重要倚仗,但这绝不是美国芯片“当红炸子鸡”的*武器。

通过过去几年的收购和自研,英伟达已经打造起了一个涵盖dpu、cpu和switch,甚至硅光在内的多产品线巨头,其目的就是想在一个服务器甚至一个机架中做很多的生意。但和很多做gpgpu或者ai芯片的竞争对手想取替gpu一样,英伟达的“取替”计划似乎也不是不能一帆风顺。

近日,三巨头更是再次出手,想把英伟达拒之门外。

01 博通芯片,瞄准infiniband

熟悉博通的读者应该知道,面向switch市场,美国芯片巨头拥有三条高端产品线,分别是面向高带宽需求的tomahawk、面向更多功能的 trident,以及虽然带宽不高,但是却拥有更深的buffer和更高可编程性的jericho。

昨日,他们带来了jericho系列最新的产品jericho3-ai。在他们看来,这是比英伟达infiniband更适合ai的一个新选择。

据博通所说,大公司(甚至 nvidia) 都认为 ai 工作负载会受到网络延迟和带宽的限制,而jericho3-ai 的存在则旨在减少 ai 训练期间花在网络上的时间。其结构的主要特性是负载平衡以保持链路不拥塞、结构调度、零影响故障转移以及具有高以太网基数(radix)。

博通强调,ai 工作负载具有独特的特征,例如少量的大型、长期流,所有这些都在 ai 计算周期完成后同时开始。jericho3-ai 结构为这些工作负载提供最高性能,具有专为 ai 工作负载设计的独特功能:

    *的负载均衡将流量均匀分布在结构的所有链路上,确保在最高网络负载下实现*网络利用率。

    端到端流量调度的无拥塞操作可确保无流量冲突和抖动。

    超高基数独特地允许 jericho3-ai 结构将连接扩展到单个集群中的 32,000 个 gpu,每个 800gbps。

    零影响故障转移功能可确保在 10 纳秒内自动收敛路径,从而不会影响作业完成时间。

利用这一独特的功能,与 all-to-all 等关键 ai 基准测试的替代网络k8体育的解决方案相比,jericho3-ai 结构的工作完成时间至少缩短了 10%。这种性能改进对降低运行 ai 工作负载的成本具有乘法效应,因为它意味着昂贵的 ai 加速器的使用效率提高了10%。此外,jericho3-ai 结构提供每秒 26 pb 的以太网带宽,几乎是上一代带宽的四倍,同时每千兆比特的功耗降低 40%。

此外,broadcom 表示,因为它可以处理 800gbps 的端口速度(对于 pcie gen6 服务器)等等,所以它是一个更好的选择。对于将“ai”放在产品名称中,broadcom 并没有做出过多解读,甚至关于网络 ai计算功能,他们也没涉及,这着实让人摸不着头脑,因为这是英伟达infiniband 架构的主要卖点。

尽管如此,broadcom 表示其 jericho3-ai 以太网在 nccl 性能方面比 nvidia 的 infiniband 好大约 10%。

“jericho3-ai 结构的一个独特之处在于它提供了最高的性能,同时还实现了*的总拥有成本。这是通过长距离 serdes、分布式缓冲和高级遥测等属性实现的,所有这些都使用行业标准以太网提供。这些因素为*的硬件和软件提供商生态系统提供了网络架构和部署选项的高度灵活性。”博通强调。

02 微软,自研芯片再曝进展

因为chatgpt大火的企业除了英伟达外,作为chatgpt投资人的微软也备受关注。在半导体行业观察日前发布的文章中我们也披露,为了发展chatgpt,微软已经抢购了不少gpu。随着算力需求的增加,微软在后续必须要更多的芯片支持。

如果一如既往地购买英伟达gpu,这对英伟达来说会是一笔昂贵的支出,他们也会为此不爽。于是,就恰如其分地,微软的自研芯片有了更多信息曝光。

据路透社引述the information 的报道,微软公司正在开发自己的代号为“athena”的人工智能芯片,该芯片将为 chatgpt 等人工智能聊天机器人背后的技术提供支持。

根据该报告,这些芯片将用于训练大型语言模型和支持推理——这两者都是生成 ai 所需要的,例如 chatgpt 中使用的 ai 来处理大量数据、识别模式并创建新的输出来模仿人类对话。报告称,微软希望该芯片的性能优于目前从其他供应商处购买的芯片,从而为其昂贵的 ai 工作节省时间和金钱。

虽然目前尚不清楚微软是否会向其 azure 云客户提供这些芯片,但据报道,这家软件制造商计划最早于明年在微软和 openai 内部更广泛地提供其 ai 芯片。据报道,该芯片的初始版本计划使用台积电 (tsmc) 的 5 纳米工艺,不过作为该项目的一部分,可能会有多代芯片,因为微软已经制定了包括多个后代芯片的路线图。

据报道,微软认为自己的 ai 芯片并不能直接替代 nvidia 的芯片,但随着微软继续推动在bing、office 应用程序、github和其他地方推出 ai 驱动的功能,内部的努力可能会大幅削减成本。研究公司 semianalysis 的 dylan patel 也告诉the information,“如果 athena 具有竞争力,与 nvidia 的产品相比,它可以将每芯片的成本降低三分之一。”

关于微软造芯,最早可以追溯到2020年。据彭博社在当时的报道,微软公司正在研究用于运行公司云服务的服务器计算机的内部处理器设计,以促进全行业减少对英特尔公司芯片技术依赖的努力。知情人士透露,这家全球*的软件制造商正在使用arm的设计来生产将用于其数据中心的处理器。它还在探索使用另一种芯片来为其部分 surface 系列个人电脑提供动力。

近年来,微软加大了处理器工程师的招聘力度,在英特尔、超微、英伟达等芯片制造商的后院招聘。2022年,他们甚至还从苹果公司挖走了一位经验丰富的芯片设计师,以扩大自身的服务器芯片业务。据报道,这位名为mike filippo 的资深专家将在由 rani borkar 运营的微软 azure 集团内从事处理器方面的工作。微软发言人证实了 filippo 的聘用,他也曾在 arm和英特尔公司工作过。

今年年初,微软更是宣布收购了一家名为fungible的dpu芯片公司。

微软 azure 核心部门的 cvp girish bablani 在一篇博文中写道:“fungible 的技术有助于实现具有可靠性和安全性的高性能、可扩展、分解、横向扩展的数据中心基础设施”。他进一步指出:“今天的公告进一步表明微软致力于数据中心基础设施进行长期差异化投资,这增强了公司的技术和产品范围,包括卸载、改善延迟、增加数据中心服务器密度、优化能源效率和降低成本。”fungible 在其网站上的一份声明中写道。“我们很自豪能成为一家拥有 fungible 愿景的公司的一员,并将利用 fungible dpu 和软件来增强其存储和网络产品。”

由此我们可以看到微软在芯片上做更多的发布也不足为奇。

03 tpu,已经第四代

在取代英伟达的这条路上,谷歌无疑是其中最坚定,且走得最远的一个。

按照谷歌所说,公司谷歌早在 2006 年就考虑为神经网络构建专用集成电路 (asic),但到 2013 年情况变得紧迫。那时他们意识到神经网络快速增长的计算需求可能需要我们将数量 增加一倍我们运营的数据中心。从2015年开始,谷歌就将其tpu部署到了服务器中,并在后续的测试中获得了不邵的反馈,以迭代其产品。

近日,谷歌对其tpuv4及其基于这个芯片的打造的超级计算系统进行了深度披露。

据他们在一篇博客中介绍,得益于互连技术和领域特定加速器 (dsa) 方面的关键创新,谷歌云 tpu v4 在扩展 ml 系统性能方面比 tpu v3 有了近 10 倍的飞跃;与当代 ml dsa 相比,提高能源效率约 2-3 倍。在与nvidia a100 相比时,谷歌表示,tpu v4比前者快 1.2-1.7 倍,功耗低 1.3-1.9 倍。在与graphcore的ipu bow相比,谷歌表示,其芯片也拥有*的优势。

基于这个芯片,谷歌打造了一个拥有 4,096 个张量处理单元 (tpu)的tpu v4 超级计算机。谷歌表示,这些芯片由内部开发的行业*的光电路开关 (ocs) 互连,ocs 互连硬件允许谷歌的 4k tpu 节点超级计算机与 1,000 个 cpu 主机一起运行,这些主机偶尔(0.1-1.0% 的时间)不可用而不会引起问题。

据谷歌介绍,ocs 动态重新配置其互连拓扑,以提高规模、可用性、利用率、模块化、部署、安全性、功率和性能。与 infiniband 相比,ocs 和底层光学组件更便宜、功耗更低且速度更快,不到 tpu v4 系统成本的 5% 和系统功耗的 5% 以下。下图显示了 ocs 如何使用两个 mem 阵列工作。不需要光到电到光的转换或耗电的网络分组交换机,从而节省了电力。

值得一提的是,tpu v4 超级计算机包括 sparsecores,这是一种更接近高带宽内存的中间芯片,许多 ai 运算都发生在该芯片上。sparsecores 的概念支持 amd、英特尔和高通等公司正在研究的新兴计算架构,该架构依赖于计算更接近数据,以及数据进出内存之间的协调。

此外,谷歌还在算法-芯片协同方面做了更大的投入。如半导体行业观察之前的文章中所说;“随着摩尔定律未来越来越接近物理极限,预计未来人工智能芯片性能进一步提升会越来越倚赖算法-芯片协同设计,而另一方面,由于有算法-芯片协同设计,我们预计未来人工智能芯片的性能仍然将保持类似摩尔定律的接近指数级提升,因此人工智能芯片仍然将会是半导体行业未来几年最为热门的方向之一,也将会成为半导体行业未来继续发展的重要引擎。”

04 写在最后

综合上述报道我们可以直言,对于英伟达而言,其面临的挑战是方方面面的,而不是仅仅局限于其gpu。其对手也不仅仅是芯片公司,因此如何在规模化优势的情况下,保证其高性价比,是安然度过未来潜在挑战的有效方法之一。

不过,可以肯定的是,围绕着数据中心的创新远未接近停止,甚至可以说因为大模型的流行,这场战斗才刚刚开始。

(0)

相关推荐

  • 第一批刷屏全网成人小饭桌,已经倒闭了,成人小饭桌定位在打工人的日常需求,范围也局限在社区餐饮,很难达到理想的盈利水平和市场规模,也无法成为一门有确定性需求的生意,众多“价格刺客”也让“便宜”变了味,连健康和卫生都显得有些微妙。

    2023年7月26日 创投
  • 支付宝余额宝提现要手续费吗?据悉支付宝余额宝提现要手续费。从2016年10月12日,支付宝提现、转账到银行卡开始收费。 支付宝提现是指用户通过支付宝把资金转到银行卡的行为,包括“提…

    2022年1月25日
  • 有多少潮人正在和ai谈恋爱,atrioc和deepfakes的故事似乎预示着,ai正在以一种人们都未曾想到的方式,悄悄重塑着这个社会。

    2023年7月28日
  • 3个月融2轮,普渡科技获阅度资本数亿元c4轮投资,普渡科技是一家研发、设计、生产和销售商用服务机器人的国家级高新技术企业,核心技术为低速自动驾驶、机器人电机驱动与运动控制,主要产品为配送机器人和消毒机器人。

    2023年5月5日
  • 东方甄选在摸着交个朋友们“入淘”,淘宝的头部主播李佳琦们也未必不会摸着东方甄选“出淘”。继推出自有app直播之后,俞敏洪和他的东方甄选又迫不及待的开始了新的圈地运动。8月29日,东方甄选正式开启入驻淘宝直播后的首次正式直播,在淘系铺天盖地的流量加持下,gmv用时10个小时破亿,勉强算是达到了中规中矩

    2023年9月4日
  • 嘉为科技获得超2亿元c轮融资,钟鼎资本领投,嘉为科技成立于2001年,在2015年之前,嘉为科技一直为国内企业提供it运维服务。

    2023年7月27日
  • 《时代报》4日报道,2020年澳元兑美元已上涨了10%,并随着美元的走低,于12月31日创下两年高点77美分。同时,澳元兑其他币种也获得了小幅收益,其中澳元兑英镑上涨了4.8%、澳…

  • 7月16日,中芯国际正式登陆a股,标志着这个科创板最大ipo项目正式收官。 由于中芯国际盘子较大,对于其首日走势,此前市场充斥分歧。 “盘子较大,怕涨不起来,但之前市场太好了,还有…

  • 快手上市后首次实现集团层面整体盈利,一季度总营收252.2亿超市场一致预期,一季度,快手提前实现集团层面整体盈利,经调整净利润达4200万元,总营收达252.2亿,超越彭博市场一致预期的245亿元。

    2023年5月22日
  • 新基金发行是申购还是认购? 新基金在募集期,投资者申请购买叫认购。申购和认购都是申请购买的意思,但二者之间有很大区别: 认购费针对新基金,认购的净值一般都是1元1份。募集期认购费包…

    2021年11月6日
  • 内地新消费,复制到香港,这也考验着内地餐饮进军香港以后,当新鲜劲过去,怎样长期留住消费者。

    2023年7月29日
  • sk-ii「刺」了宝洁一下,如今,化妆品功效越来越细分,sk-ii要想提振业绩、抓住年轻消费者,光靠一个“pitera”怕是还不够。

    2023年6月20日
  • 退市是什么意思,什么是退市,其实现在不少股票都退市了。这对股民来说当然是巨大的坏消息,很多股民其实压根就没想到自己的股票突然就退市了,只听过st风险大,还真没想过这么大的。 上市公…

    2022年1月25日
  • 8月27日,中国电子信息行业联合会主办的2021年度软件和信息技术服务企业竞争力报告及前百家企业发布会在北京举办,中国电子信息行业联合会秘书长高素梅、专家委主任董云庭、副秘书长李杰…

  • 整理 | wendy 7月24日, 2021世界区块链大会·杭州正式开幕。本届大会以“无限未来”为主题,汇聚全球的100 区块链、加密货币行业头部创业者、研究者,以胸怀万里世界的姿…

    2022年3月31日
网站地图