您的位置:锦懂家 > 百态 > >正文

​华为:绕过 CUDA、平替英伟达,我来为中国 AI 公司提供芯片

摘要华为:绕过 CUDA、平替英伟达,我来为中国 AI 公司提供芯片 外界常有这样一种错觉,因为英特尔 CPU 卖的好就将其归于一家成功的硬件公司,而事实上,英特尔统治桌面处理器的功臣是...

华为:绕过 CUDA、平替英伟达,我来为中国 AI 公司提供芯片

外界常有这样一种错觉,因为英特尔 CPU 卖的好就将其归于一家成功的硬件公司,而事实上,英特尔统治桌面处理器的功臣是诞生于 1978 年的 X86 架构。

同样的错觉在英伟达身上也有。

英伟达之所以能够垄断人工智能训练芯片市场,CUDA 架构绝对是幕后功臣之一。

这个诞生于 2006 年的架构,已经涉及计算机计算的各个领域,几乎被塑造成了英伟达的形状。航空航天、生物科学研究、机械和流体模拟及能源探索等领域的研究,80% 在 CUDA 的基础上进行。

而在最火爆的 AI 领域,几乎所有的大厂都在准备 Plan B:谷歌、亚马逊、华为、微软、OpenAI、百度 …… 谁也不想让自己的未来攥在别人手中。

创业服务咨询机构 Dealroom.co 公布过一组数据,在这波生成式 AI 的热浪中,美国获得了全球投融资的 89%,而在 AI 芯片的投融资中,中国 AI 芯片投融资世界第一,超过美国两倍。

也就是说,尽管中美企业在大模型的发展方式和阶段都存在诸多差异,但在掌控算力这件事,大家却显得格外一致。

为什么 CUDA 有这种魔力?

2003 年,英伟达为了与推出 4 核 CPU 的英特尔竞争,开始着手发展统一计算设备架构技术,也就是 CUDA。

CUDA 的初衷是为 GPU 增加一个易用的编程接口,让开发者无需学习复杂的着色语言或者图形处理原语。英伟达最初的想法是为游戏开发者提供一个图形计算领域的应用,也就是黄仁勋口中的 "make graphics programmable"。

不过 CUDA 推出后一直找不到关键应用,也缺少重要客户支持。而且英伟达还要花费大笔金钱来开发应用、维持服务并推广与行销,到 2008 年遭遇金融风暴,显卡销售不好的英伟达营收大跌,股价一度跌到只剩 1.5 美元,比 AMD 最惨的时候还要惨。

直到 2012 年,Hinton 的两个学生用英伟达的 GPU 参加了一个叫做 ImageNet 的图像识别速度比赛。他们使用 GTX580 显卡,利用 CUDA 技术进行训练,结果算出的速度超过第二名数十倍,精确度也比第二名高 10% 以上。

让业内震惊的不只是 ImageNet 模型本身。这个需要 1400 万张图片、总计 262 千万亿次浮点运算训练的神经网络,一个星期的训练过程中仅用了四颗 GTX 580。作为参考,谷歌猫用了 1000 万张图片、16000 颗 CPU 和 1000 台计算机。

这次比赛不仅是 AI 的一次历史转折,也为英伟达打开了突破口。英伟达开始与业界合作推动 AI 生态,推广开源 AI 框架,并与 Google、Facebook 等公司合作推动 TensorFlow 等 AI 技术发展。

这等于完成了黄仁勋口中的第二步,"open up GPU for programmability for all kinds of things"。

当 GPU 的算力价值被发现后,大厂也猛然醒悟,英伟达此前数年迭代和铺垫的 CUDA,已然成为 AI 绕不开的一堵高墙。

为了筹建 CUDA 生态,英伟达为开发者提供了丰富的库和工具,如 cuDNN、cuBLAS 和 TensorRT 等,方便开发者进行深度学习、线性代数和推理加速等任务。此外,英伟达还提供包括 CUDA 编译器和优化器在内的完整开发工具链,使开发者能够更方便地进行 GPU 编程和性能优化。

与此同时英伟达也与许多流行的深度学习框架(如 TensorFlow、PyTorch 和 MXNet)紧密合作,为 CUDA 提供了在深度学习任务中的显著优势。

这种 " 扶上马,送一程 " 的奉献精神,使英伟达仅用了两年半时间,就将 CUDA 生态的开发者数量翻了一倍。

这还不够,过去十余年里英伟达将 CUDA 的教学课程推广到超过 350 所大学,平台内有专业的开发者和领域专家,他们通过分享经验和解答疑难问题,为 CUDA 的应用提供了丰富的支持。

更关键的是,英伟达深知硬件作为护城河的缺陷在于没有用户粘性,于是将硬件与软件捆绑,GPU 渲染要用 CUDA、AI 降噪要用 OptiX、自动驾驶计算需要 CUDA……

尽管英伟达目前凭借 GPU+NVlink+CUDA 垄断了 AI 算力 90% 的市场,但帝国的裂缝已经不止一条了。

一条条裂缝

AI 厂商苦 CUDA 久矣,并不是危言耸听。

CUDA 的神奇之处就在于它处在软硬结合的关键位置,对软件来说它是整个生态的基石,竞争对手难以绕过 CUDA 去兼容英伟达的生态;对硬件来说,CUDA 的设计基本就是英伟达硬件形态的软件抽象,基本每个核心概念都和 GPU 的硬件概念相对应。

那么对于竞争对手来说,就只剩两个选择:

1 绕开 CUDA,重建一套软件生态,这就要直面英伟达用户粘性的巨大挑战;

2 兼容 CUDA,但也要面临两个问题,一是如果你的硬件路线和英伟达不一致,那么就有可能实现的低效且难受,二是 CUDA 会跟随英伟达硬件特性演进,兼容这也只能选择跟随。

但为了摆脱英伟达的钳制,两种选择都有人尝试。

2016 年,AMD 推出的基于开源项目的 GPU 生态系统 ROCm,提供 HIP 工具完全兼容 CUDA,就是一种跟随路线。

但因为工具链库资源匮乏、开发和迭代兼容性代价较大等掣肘,使 ROCm 生态难以壮大。在 Github 上 , 贡献 CUDA 软件包仓库的开发者超过 32600 位 , 而 ROCm 只有不到 600 个。

走兼容英伟达 CUDA 路线的难点在于,其更新迭代速度永远跟不上 CUDA 并且很难做到完全兼容:

1 迭代永远慢一步:英伟达 GPU 在微架构和指令集上迭代很快,上层软件堆栈的很多地方也要做相应的功能更新。但 AMD 不可能知道英伟达的产品路线图,软件更新永远会慢英伟达一步。例如 AMD 有可能刚宣布支持了 CUDA11,但是英伟达已经推出 CUDA12 了。

2 难以完全兼容反而会增加开发者的工作量:像 CUDA 这样的大型软件本身架构很复杂,AMD 需要投入大量人力物力用几年甚至十几年才能追赶上。因为难免存在功能差异,如果兼容做不好反而会影响性能(虽然 99% 相似了,但是解决剩下来的 1% 不同之处可能会消耗开发者 99% 的时间)。

也有公司选择绕开 CUDA,比如 2022 年 1 月成立的 Modular。

Modular 的思路是尽可能降低门槛,但更像是一种奇袭。它提出 " 用于提高人工智能模型性能 " 的 AI 引擎,通过 " 模块化 " 方式解决 " 当前 AI 应用栈常与特定硬件和软件耦合 " 的问题。

为了配合这个 AI 引擎,Modular 还开发了开源编程语言 Mojo。你可以把它想象成一个 " 专为 AI 而生 " 的编程语言,Modular 用它开发各种工具整合到前面提到的 AI 引擎里,同时又可以无缝衔接上 Python,降低学习成本。

但 Modular 的问题在于,其所设想的 " 全平台开发工具 " 太过理想化。

虽然顶着 " 超越 Python" 的头衔,又有 Chris Lattner 名声作为背书,但 Mojo 作为一种新语言,在推广上还需要经过众多开发者的考验。

而 AI 引擎要面临的问题就更多,不仅需要与众多硬件公司之间达成协议,还要考虑各平台之间的兼容。这些都是需要长时间的打磨才能完成的工作,到时候的英伟达会进化成什么样子,恐怕没人会知道。

挑战者华为

10 月 17 日,美国更新了针对 AI 芯片的出口管制规定,阻止英伟达等公司向中国出口先进的 AI 芯片。根据最新的规则,英伟达包括 A800 和 H800 在内的芯片对华出口都将受到影响。

此前英伟达 A100 及 H100 两款型号限制出口中国后,为中国专供的 " 阉割版 "A800 和 H800 就是为了符合规定。英特尔同样也针对中国市场,推出了 AI 芯片 Gaudi2。如今看来,企业们又要在新一轮出口禁令下再进行调整应对。

今年 8 月,搭载华为自研麒麟 9000S 芯片的 Mate60Pro 突然开售,瞬间引发了巨大舆论浪潮,使得几乎同一时间的另外一条新闻很快被淹没。

科大讯飞董事长刘庆峰在一个公开活动上罕见表态,称华为 GPU 可对标英伟达 A100,但前提是华为派出专门工作组在讯飞成立专班工作优化的背景下。

这种突然的表态往往都有深层次的意图,虽然没有预知能力但其效用仍是为了应对两个月后的芯片禁令。

华为 GPU,也就是昇腾 AI 全栈软硬件平台,全栈包括 5 层,自底向上为 Atlas 系列硬件、异构计算架构、AI 框架、应用使能、行业应用。

基本上可以理解为华为针对英伟达做了一套平替,芯片层是昇腾 910 和昇腾 310,异构计算架构(CANN)对标英伟达 CUDA + CuDNN 核心软件层。

当然差距不可能没有,有相关从业者总结了两点:

1 单卡性能落后,昇腾 910 与 A100 还有差距,但胜在价格便宜可以堆量,达到集群规模后整体差距不大;

2 生态劣势的确存在,但华为也在努力追赶,比如经过 PyTorch 社区与昇腾的合作,PyTorch 2.1 版本已同步支持昇腾 NPU,意味着开发者可直接在 PyTorch 2.1 上基于昇腾进行模型开发。

目前华为昇腾主要还是运行华为自家闭环的大模型产品,任何公开模型都必须经过华为的深度优化才能在华为的平台上运行,而这部分优化工作严重依赖于华为。

而在当前背景下,昇腾又具有特殊的重要意义。

今年 5 月,华为昇腾计算业务总裁张迪煊就已透露," 昇腾 AI" 基础软硬件平台已孵化和适配了 30 多个主流大模型,我国一半以上的原生大模型是基于 " 昇腾 AI" 基础软硬件平台打造,包括鹏程系列、紫东系列、华为云盘古系列等。今年 8 月,百度也官宣了推进在昇腾 AI 上与飞桨 + 文心大模型的适配。

并且根据网络上流传的一张图片显示,中国人工智能超算中心除了未披露,基本都是昇腾,据称在新一轮芯片限令后,华为 30-40% 的芯片产能要留给昇腾集群,其余是 Kirin。

尾声

在英伟达展开宏大叙事的 2006 年,没有人认为 CUDA 会是一个革命性的产品,黄仁勋要苦口婆心的说服董事会每年投入 5 亿美金,来赌一个回报期超过 10 年的未知,而当年英伟达的营收也不过 30 亿美金而已。

但在所有以技术和创新作为关键词的商业故事里,总有人因为对长远目标的持久坚持而收获巨大的成功,英伟达和华为都是其中的佼佼者。

参考资料

[ 1 ] 英伟达的「镰刀」,不是 AI 芯片,硅基研究室

[ 2 ] 为了成为 " 英伟达平替 ",大模型厂商开卷了,小饭桌创服

[ 3 ] 成立仅 1 年,这家 AI 明星创企,想挑战英伟达,镁客网

[ 4 ] 英伟达帝国的一道裂缝,远川研究所

[ 5 ] 美计划加紧对华芯片出口,华为领衔演绎国产崛起,华西证券

[ 6 ] AIGC 行业深度报告(11):华为算力分拆:全球 AI 算力的第二极,华西证券

[ 7 ] 2023 年 AIGC 行业专题报告:AI 芯片四大技术路线,寒武纪复制英伟达,申万宏源

[ 8 ] CUDA 如何成就 NVIDIA:AI 领域的巨大突破,腾讯云社区

免责声明 : 本文基于已公开的资料信息或受访人提供的信息撰写,但解码 Decode 及文章作者不保证该等信息资料的完整性、准确性。在任何情况下,本文中的信息或所表述的意见均不构成对任何人的投资建议。

标签:

推荐阅读

  • ​极兔 IPO 背后,飞速增长的价码是什么?

    极兔 IPO 背后,飞速增长的价码是什么? 图片来源 @视觉中国 文 | 向善财经 极兔要上市了。 最近赴港递交招股书的快递物流企业不少,最受关注的除了菜鸟,就是极兔。这家快递企业...

    2023-10-29 10:19:20
  • ​商家困在直播间的低价里

    商家困在直播间的低价里 图片来源 @视觉中国 钛媒体注: 本文来源于微信公众号中国企业家杂志(ID:iceo-com-cn),作者 | 谭丽平,编辑 | 米娜,钛媒体经授权发布。 双 11 伊始,京东...

    2023-10-29 10:17:04
  • ​威海七日游攻略

    威海七日游攻略 威海的景点很多,适合周末出行,是一个旅游城市。威海是个天然的度假胜地,很多人喜欢去威海,是因为这里空气清新、环境优美,是一个天然疗养的好地方。威海是...

    2023-10-28 09:04:33
  • ​黄山宏村自驾游攻略二日游

    黄山宏村自驾游攻略二日游 宏村是徽派建筑的代表,位于安徽省黄山市黟县,宏村被誉为“中国画里乡村”,以山清水秀、山水秀丽而闻名。宏村的人文景观非常多,而且都是国家 A...

    2023-10-28 09:02:17
  • ​自驾东山岛自驾游攻略

    自驾东山岛自驾游攻略 说起东山岛,相信大家都不陌生,这个距离厦门只有200多公里的地方,除了它是个旅游胜地之外。更重要的一点是这里有众多的滨海旅游景点。比如万里海滩、九...

    2023-10-28 09:00:02
  • ​延禧攻略尔晴结局如何(《延禧攻略》人物结局)

    延禧攻略尔晴结局如何(《延禧攻略》人物结局) 【富察皇后】双腿残疾了,不过好在后来医治好了。但是皇后的小皇子被纯妃设计大火烧死了。纯妃收买长春宫太监,换了易爆火花的菊...

    2023-10-28 08:57:46
  • ​为商业航天量身定做,航天科技集团发布六款固体火箭发动机

    为商业航天量身定做,航天科技集团发布六款固体火箭发动机 IT 之家 10 月 22 日消息,10 月 20 日,中国航天科技集团正式发布了包含整体式和分段式在内的商业航天用固体火箭发动机及...

    2023-10-28 08:55:30
  • ​首届东亚 U20 田径锦标赛在扬州开幕

    首届东亚 U20 田径锦标赛在扬州开幕 现代快报讯(记者 顾潇) 东亚文化之都 点燃体育激情, 活力赛事名城 又迎田径盛会。10 月 26 日上午,第一届东亚 U20 田径锦标赛在江苏省扬州市...

    2023-10-28 08:53:14
  • ​华山一日游详细攻略

    华山一日游详细攻略 “奇险天下第一山”是对华山的最好形容,也是每一个来过华山的人心中的真实写照。如果是第一次来华山旅游,那你一定会被它的奇险所折服,每一处险峻都让你...

    2023-10-28 08:50:58
  • ​白鹿原影视城一日游攻略

    白鹿原影视城一日游攻略 白鹿原影视城是西安旅游的一个热门景点,位于西安市碑林区白鹿路中段,距离西安市中心仅20公里左右。影视城内有白鹿原广场、三国城等景点,主要包含正...

    2023-10-28 08:48:42
  • ​黄山3日自驾游攻略

    黄山3日自驾游攻略 黄山位于安徽省南部黄山市境内,因其独特的山势、奇特的自然景观和壮丽的人文景观被誉为“天下第一奇山”。黄山以奇松、怪石、云海、温泉四绝闻名于世。黄...

    2023-10-28 08:46:27
  • ​海南攻略自驾游

    海南攻略自驾游 海南,一个很美的地方,很适合自驾。无论是夏天去海边游玩,还是秋天去滨海度假,都是非常不错的选择。同时在海南游玩除了享受大海带来的视觉盛宴,还能享受到...

    2023-10-28 08:44:11
  • ​号称“充电 10 分钟、续航 1200 公里”的丰田固态电池 进展咋样了?

    号称“充电 10 分钟、续航 1200 公里”的丰田固态电池 进展咋样了? 财联社 10 月 23 日讯(编辑 史正丞) 继今年 7 月喊出较目前电动车电池 尺寸减半、重量减半,并实现充电 10 分钟续...

    2023-10-27 07:59:47
  • ​大陈岛攻略一日游

    大陈岛攻略一日游 大陈岛是台州的一个海岛,距离台州市区大概有70公里左右,这里的海岸线非常长。它被誉为“东海明珠”,也是我国唯一的“海岛国家森林公园”。大陈岛属于温岭...

    2023-10-27 07:57:31
  • ​承德马镇自驾游攻略

    承德马镇自驾游攻略 马镇是一座具有悠久历史的古镇,也是一座具有鲜明民族特色的小镇。这里风景优美,自然景观与人文景观相结合,独具特色。在这里,可以感受到一种古朴的氛围...

    2023-10-27 07:55:15
  • ​建德梅城古镇一日游攻略

    建德梅城古镇一日游攻略 梅城古镇位于浙江省杭州市建德市,是一座千年的水乡古镇。她既是历史文化名城,又是名茶之乡,也是著名温泉。梅城古为吴越要津,南朝萧梁王刘宋故里,...

    2023-10-27 07:52:59
  • ​成都到泸沽湖4日自驾游攻略

    成都到泸沽湖4日自驾游攻略 四川的泸沽湖,风景优美,人文荟萃。它位于四川省凉山彝族自治州宁南县境东北边的泸沽湖流域,距离成都230公里,是中国最大的高山湖泊,同时也是一...

    2023-10-27 07:50:43
  • ​贵州游玩自驾游攻略

    贵州游玩自驾游攻略 作为一个喜爱旅游的人,我是很喜欢旅游的。之前有一个朋友,在云南玩了很长时间,然后又带着她去了很多地方看了很久,就觉得贵州旅游景点很不错!今天就带...

    2023-10-27 07:48:27
  • ​富士康回应旗下企业遭调查:集团会积极配合相关单位工作

    富士康回应旗下企业遭调查:集团会积极配合相关单位工作 富士康旗下芯片设计子公司珠海凌烟阁曾参展 2021 世界半导体大会,富士康 logo 在图右侧(来源:钛媒体 App 编辑拍摄) 钛媒...

    2023-10-27 07:46:11
  • ​成都三日游攻略详细安排

    成都三日游攻略详细安排 成都,我来过很多次,每次来都有不同的感受。我是一个不爱旅行的人……但是在成都,我是被这个城市给吸引了。这里有成都的各种特色小吃,还有美食,特...

    2023-10-27 07:43:55