来历:半导体工业纵横
前两天,英伟达第三季度财报总算出了。结果是预期中的向好,营收 351 亿美元,同比增加 93.7%。净利润 193.1 亿美元,同比增加 109%。
简略核算便是上个季度英伟达共赚 2542 亿人民币,净利润 1398 亿,均匀每天爆赚 15 亿人民币,相当于一天赚出 8 套北京价值 2 亿的四合院。
GPU 的呈现就标志着挣钱,三季度英伟达的毛利率高达 74.6%。什么概念?被誉为「大自然的印钞机」、将钟睒睒捧上我国首富宝座的农民山泉,毛利率也不过 60%
英伟达的图形处理单元(GPU)技能之杰出,已广为人知。相较之下,国产 GPU 的影响力则显得较为有限。
但是,近年来,我国国内的许多 GPU 企业开端锋芒毕露。经过继续的投入和尽力,国产 GPU 在功用、功用和运用范畴等方面都有了提高,逐步赢得了商场的认可和用户的信赖。国产 GPU 不仅在传统图形处理范畴取得了开展,也可以在人工智能、高功用核算等新式范畴展现出必定的竞赛力。
01
景嘉微
景嘉微是国内自主知识产权图形 GPU 领军企业,是国内少量几家出产 GPU 且具有自主知识产权的公司。
景嘉微的 GPU 产品包含JM5400、JM7200、JM9 系列和景宏系列,掩盖传统范畴和新式范畴。
JM5400 是景嘉微前期推出的一款 GPU 产品,标志着国产 GPU 的起步;JM7200/7201 系列适用于桌面作业、图形作业站及有高要求的图形生成及显现等范畴。景嘉微在 JM7 系列时期已完结了与干流国产 CPU 与操作系统的适配作业。
JM9 系列是景嘉微的第三代 GPU 产品,包含 JM9100 和 JM92 系列,它们在前两代的基础上进一步优化了功用与功耗,最低功耗不到 2W,全面支撑国产 CPU、国产操作系统和国产固件,可广泛运用于 PC、笔记本电脑、工控机、图形作业站等核算机设备。
景宏系列是景嘉微本年成功研制的产品,首要用于 AI 练习、AI 推理和科学核算等范畴。依据公告,景宏系列支撑 INT8、FP16、FP32、FP64 等混合精度运算,支撑全新的多卡互联技能进行算力扩展,适配国内外干流 CPU、操作系统及服务器厂商,可以支撑当时干流的核算生态、深度学习结构和算法模型库,大幅缩短用户适配验证周期。
02
天数智芯
天数智芯通用 GPU 产品天垓、智铠系列
天数智芯通用 GPU 产品适配干流 CPU 芯片/服务器厂商,可以支撑国内外干流 AI 生态和各种深度学习结构。天数智芯现已发布了两款自主研制的通用 GPU 产品天垓 100、智铠 100,具有运用掩盖广、开发易搬迁、功用可预期、全栈可定制、运用本钱低一级特色。
天垓 100是天数智芯推出的全自研通用 GPU 练习产品。它选用通用 GPU 架构,兼容世界干流 GPU 通用核算模型,支撑国内外干流 AI 生态和深度学习结构及原生算子。2022 年末,天数智芯曾宣告天垓 100 累计出售订单已打破 5 亿元。
智铠 100 系列加快卡根据通用 GPU 架构,支撑多种视频标准解码、800+通用指令集、国内外干流深度学习开发结构。兼容 CUDA 生态,支撑商场干流生态,高达 128 路视频接入。均匀搬迁时刻相较商场干流产品下降 50% 以上,生态运用搬迁敏捷。
天数智芯推出的国内首个通用核算运用开发及评测渠道 DeepSpark 继续迭代,到现在已会聚300+练习和 80+推理模型示例,支撑干流 AI 运用结构,供给多维度测评系统。
天数智芯自主算力集群计划可以有用支撑 OPT、LLaMa、GPT-2、CPM、GLM 等干流 AIGC 大模型的 Pretrain 和 Finetune。一起适配支撑了清华、智源、复旦等在内的国内多个研究组织的开源大模型。
03
中微电
中微电的 GPU 产品有:南风一号、南风二号、南风三号。「南风一号」GPU 首要运用于信创核算机显现可满意党政、金融及安防等信创工业链专用整机电脑 PC 显卡需求。「南风二号」供给高功用并行核算才能,满意服务器、练习机、推理机、边际核算、科学仿真核算、智算中心等人工智能商场需求。
上一年 12 月,中微电科技「南风一号」显卡(NF1001)导入了世恒 TD120A2 整机。标志着产品现现已过了我国长城各项功用、功用、可靠性、兼容性、安稳性等测验。「南风一号」也与麒麟操作系统(V10 SP1)、飞扬处理器(D2000、FT2000)、奇安信浏览器等多家国产设备、运用完结兼容性互认证。「南风一号」从「产品」正式转型为「产品」。
本年 4 月,中微电宣告「南风二号」中心 IP 研制完结,经过了 FPGA 的仿真测验。试验结果表明,「南风二号」AI 推理功用到达 48TOPS,根本完结了国家工业和信息化部揭榜挂帅项目和深圳市科技严重专项项目的参数目标。
04
芯动科技
芯动科技也推出了 GPU 产品:风华 1 号、风华二号。
风华一号发布于 2021 年,是首款国产高功用 4K 级显卡 GPU。包含「风华 1 号」A 型卡(单芯桌面端)、「风华 1 号」B 型卡(双芯服务器端)两款,选用 12nm 制程工艺。支撑国产新基建 5G 数据中心、桌面、元世界、云游戏、云桌面等千亿级工业。
风华二号发布于 2022 年 8 月,是一款集超低功耗、强烘托、4K 高清三屏显现、4K 视频解码、智能 AI 核算于一体的桌面和笔记本 GPU,选用自研 LPDDR5X 显存,带宽到达 10Gbps,整卡实测功耗 4~15W。
工控范畴,芯动科技的风华 2 号 GPU 已在各大城市轨道交通系统的主动售检票系统中完结大规划商用。该系统中的主动检票机、主动售票机和半主动售票机等设备,选用风华 2 号 GPU 后,可支撑 4 屏显现和长时刻低功耗高安稳运转,
消费电子范畴,天天电竞发布的国潮电竞专业显卡品牌「赤兔」,搭载了芯动科技自研的风华 GPU 芯片。
05
沐曦集成
本年 9 月,沐曦集成近期完结了新一轮股权融资,参加此次出资的组织包含浦东创投集团、上海科创基金、湘江国投、启夏本钱、中卫颐和及上海源庐加佳信息科技有限公司等多家闻名出资方。
现在沐曦集成电路的 GPU 产品包含:曦思 N 系列、曦云 C 系列、曦彩 G 系列。
曦彩 G 系列 GPU 是针对图形烘托加快的解决计划,沐曦自主知识产权架构供给杰出的图形图像烘托与视频处理才能,可广泛运用于元世界、云桌面、云游戏、云手机、数字孪生、XR等场景。
曦思 N 系列首款产品曦思N100 是一款面向云端数据中心运用的人工智能推理 GPU,自 2022 年末产品量产以来,已在才智交通、才智安防、智能转码等人工智能范畴取得广泛运用。沐曦集成与眸瑞科技联合发布的「贴图超分」技能,依托曦思 N 系列 AI 推理 GPU 的强壮算力,初次将 AI 超分成功运用到了 3D 模型范畴。
曦云 C 系列通用 GPU(GPGPU)芯片是针对智算及通用核算的完美解决计划,沐曦自主知识产权架构供给强壮高精度及多精度混合算力,可广泛运用于智算以及通用核算、教育和科研等场景。曦云 C500 单卡算力高达 30TFlops FP32,单卡 64GB HBM2E 高带宽显存,带宽 1.8TB/s,这张卡还装备自研 MetaXlink 高速接口,适合于大模型练习。4 卡既可以支撑 65B 大模型推理,8 卡可以支撑 130B 模型推理。
2023 年,沐曦携手智谱篇章、优刻得一起发布了国产首台 GPU 千亿参数大模型训推一体机。第一批客户是北京航天总医院、数字宁夏建造运营有限公司。
06
登临科技
登临科技成立于 2017 年,现在 Goldwasser 系列产品现已完结规划量产,团队致力于以 GUGPU 为中心构建高功用核算渠道。
Goldwasser 系列产品:包含边际核算产品 Goldwasser UL,功率 25-35W,INT8 算力 32-64TOPS;半高半长的服务器核算卡 Goldwasser L,功耗 40-70W,供给 128-256TOPS 算力;还有一种全高全长的 Goldwasser XL,输出 512TOPS 算力。
该公司最引人注意的当地是,宣称其自主立异的通用 GPU 具有「与 CUDA/OpenCL 等编程模型兼容的核算架构」,使其可以很好地与 Nvidia 竞赛,但一起也或许使用 Nvidia 最大的竞赛优势——CUDA 与之对立。
据称,在首代 Goldwasser 产品量产后一年内,登临科技完结国内干流运营商、操作系统、CPU、互联网企业、人工智能结构、服务器企业的兼容互认证,并发布登临瀚海生态计划。
登临科技创始人李建文、登临科技联合创始人王平本硕均就读于清华大学,全球运营副总裁杨剑曾任华为全球供应链副总裁,其研制团队具有长时间的 GPU 研制和商业产品化经历。此外,登临科技在硅谷、成都、杭州等城市共设立了七个研制中心。
07
壁仞科技
壁仞科技创立于 2019 年,致力于研制原创性的通用核算系统,树立高效的软硬件渠道,一起在智能核算范畴供给一体化的解决计划。现在,壁仞科技首款国产高端通用 GPU 壁砺系列已量产落地。
BR100 系列通用 GPU 芯片是国内算力最大的通用 GPU 芯片,包含 BR104 和 BR100 两大产品。根据自主原创的芯片架构开发,选用 7 纳米工艺制程,并结合了包含 Chiplet(芯粒技能)等在内的多项业界前沿芯片规划、制作与封装技能。其间 BR104 对标英伟达 2020 年推出的 A100、BR100 对标英伟达 4nm 芯片 H100。
此外,壁仞科技还推出了「壁砺」系列算力产品,这些产品进一步丰厚了壁仞科技的 GPU 产品线,满意了不同客户和运用场景的需求。
壁仞科技与浪潮科技协作推出了搭载 BR100 的 OAM服务器「海玄」,其峰值浮点算力达 8PFLOPS,最大功耗为 7KW,为数据中心供给了高能效、低 TCO(总具有本钱)的数据中心集群计划,可满意数据中心对大规划数据处理和高功用核算的需求,支撑云核算、大数据分析、人工智能等多种运用的运转。
08
摩尔线程
最近,证监会官网显现,摩尔线程智能科技(北京)股份有限公司(下称摩尔线程)在北京证监局处理教导存案挂号,正式发动 A 股上市进程,教导组织为中信证券股份有限公司。
摩尔线程也是国内仅有的在 B 端和 C 端均有布局的国产 GPU 企业,其芯片选用先进 MUSA 架构。
现在产品有 MTT S 系列显卡、MTT 系列 GPU 芯片、智算集群解决计划。MTT S 系列显卡包含 MTT S80、MTT S70、MTT S50、MTT S3000、MTT S4000。
MTT S80 被称为「国产游戏第一卡」,是国内仅有可以支撑 DX12 的消费级显卡。发布至今,该卡的 Windows 驱动现已迭代多个版别,已完结国内 TOP50 抢手游戏 100% 兼容,已追寻超越 400 款游戏的运转状况,累计正式适配和优化游戏 185 款。到 2024 年 10 月,MTT S80 在图形测验软件 3DMark 11 中的成果,已提高至 4.5 倍。
MTT 系列 GPU 芯片包含:苏堤、春晓、曲院。苏堤是我国首颗全功用 GPU 芯片,曲院则是根据摩尔线程自研架构的最新一代全功用 GPU 芯片,可以供给人工智能所需的综合算力,尤其是针对大言语模型练习和推理的处理才能。
此外,针对大模型练习,摩尔线程现已落地了全国产的夸娥(KUAE)智算中心全栈解决计划,从千卡智算集群到万卡集群计划。
09
结语
从现在的状况来看,部分国产 GPU 产品在功用上现已取得了必定前进,如壁仞科技的 BR100 系列 GPU,其峰值算力超越了英伟达现在在售的旗舰核算产品 A100 GPU 的三倍,并发明了全球通用 GPU 的算力记载,可以满意一些对算力要求较高的运用场景需求。
一起,一些国产 GPU 芯片选用了先进的制程工艺和封装技能,在提高功用的一起,有用降低了功耗。例如芯动科技的风华 2 号,在低功耗形式下作业功耗仅在 4w 左右,能效比远优于商场平等算力产品。
越来越多的国产 GPU 厂商意识到生态建造的重要性,并活跃与上下游企业、科研组织等打开协作,一起构建完好的工业生态。如摩尔线程与很多职业协作伙伴联合展现了根据其智算集群的丰厚职业大模型运用计划,推动了国产 GPU 在各范畴的运用和开展。
与英伟达、AMD 等世界巨子比较,国产 GPU 在全体技能水平上仍存在必定距离,特别是在高端 GPU 商场,国外产品在功用、能效比、功用完好性等方面仍占有优势。但饱经沧桑,方成正果。国产 GPU 的开展进程,也是其不断寻求技能前进的进程。
前几年广受本钱追捧的GPU(图形处理器)这一硬核赛道正在步入洗牌期,一些本来备受瞩目的通用GPU规划企业先后堕入运营窘境。与此一起,有头部企业持续求新求变,已步入AI(人工智能)中心战场。
关于职业现状,北京社科院研究员王鹏向证券时报记者剖析,当时国产GPU工业处于快速展开与洗牌并存的阶段。一方面,跟着AI大模型的需求激增,国产GPU商场敏捷兴起,出现出如摩尔线程、壁仞科技等一批具有立异才能的企业。这些企业在技能研制、产品立异等方面取得了显着展开,为国产GPU职业注入了新的生机。另一方面,商场竞争也日益剧烈,部分草创企业因为资金链断裂、技能瓶颈等问题堕入窘境,乃至面对裁人、诉讼等危险。
“久远来看,国产GPU职业仍具有宽广的展开前景。这源于人工智能、大数据、云核算等技能的快速展开,对高功能GPU的需求持续添加;一起,国家方针对半导体工业的支撑力度不断加大,为国产GPU职业供给了杰出的展开环境。此外,跟着国产芯片公司在生态构建、技能立异等方面的不断尽力,国产GPU有望逐步缩小与世界抢先水平的距离。”王鹏说。
几家欢欣几家愁
近来,国产GPU独角兽壁仞科技一则动态引起业界注重。该公司在上海证监局处理IPO教导存案挂号,教导券商为国泰君安。这是继本年8月26日燧原科技教导存案陈述发布后,又一家发动IPO的上海AI芯片企业。
壁仞科技创立于2019年,致力于研制原创性的通用核算系统,树立高效的软硬件途径,一起在智能核算范畴供给一体化的解决计划。到现在,公司已完结多轮融资,揭露融资总额超越50亿元,投资方包含启明创投、IDG本钱、中芯聚源、格力创投等。
现在,壁仞科技首款国产高端通用GPU(GPGPU)壁砺系列已量产。在9月举办的2024全球AI芯片峰会上,壁仞科技还初次发布了其自研的异构GPU协同练习计划,该计划打破了大模型异构算力孤岛难题,完成了在本乡异构多GPU芯片算力练习技能范畴的初次打破。
另一家国内GPU独角兽企业也有新动作。本年7月,摩尔线程宣告对其夸娥(KUAE)智算集群解决计划进行严重晋级,从当时千卡等级大幅扩展至万卡规划。摩尔线程创始人兼CEO张建中表明,在多元趋势下,万卡已是AI模型练习主战场的标配。
事实上,在国内,万卡集群建造正高歌猛进。上一年7月,华为昇腾AI集群规划从开始的4000卡集群扩展至16000卡,是国内首个万卡AI集群。
不过,当时国产GPU工业的分解亦非常显着,一些本来备受瞩目的企业连续堕入窘境。本年8月底,曾取得2024年度重庆市“独角兽企业”称谓的象帝先被曝约400位职工被裁。公司在回应中坦陈:“展开面对必定的商场调整压力……正在进行安排结构和人员装备的优化等……并寻觅外部融资时机。”另一方面,象帝先股东还在申述其创始人唐志敏,因其未能筹措到许诺的5亿元B轮融资。
在象帝先堕入窘境之前,同处在GPU赛道的砺算科技也曾预警。至本年8月19日,东芯股份公告拟以不超越2亿元收买砺算科技37.88%股份,砺算科技的资金紧张局势方得以缓解。
GPU占AI芯片
多半比例
在中关村物联网工业联盟副秘书长袁帅看来,当时国产GPU职业处于一个杂乱而要害的转型期,短期职业呈现降温文分解,首要是因为商场竞争加重、技能门槛进步、本钱落潮等要素导致企业资金压力增大。在此布景下,部分实力较弱的草创企业在面对应战时往往愈加软弱,而头部企业则凭仗其技能实力、商场布局和资金优势逐步锋芒毕露。
按界说和运用看,GPU起初是一种显现芯片,用于加快核算机上的图画处理。跟着技能进步和运用规模的扩展,GPU衍生出了GPGPU,后者是经过运用GPU并行处理才能特别强、核算能效比高的特色,处理更为杂乱的核算使命(如AI模型练习与推理等)。基于此,现在的GPU已被广泛运用于人工智能、虚拟现实、游戏、科学核算等许多范畴。
IDC数据显现,估计到2025年,GPU仍将占有全球AI芯片多半商场比例。Gartner此前猜测,2023年全球人工智能芯片(包含GPU、TPU等)的商场规划到达530亿美元,并估计在2024年添加至671亿美元。到2027年,全球人工智能芯片商场规划估计到达1194亿美元。
从职业格式来看,作为GPU的发明者,英伟达占有肯定抢先位置。Jon Peddie Research(JPR)数据显现,2024年榜首季度英伟达的全球AIB显卡(也称独立GPU)商场比例飙升至88%,而AMD的商场比例下降至12%。JPR估计,2024年第二季度,AI练习器GPU的出货量将持续添加,而游戏AIB商场或许相等或走低。在AI芯片主战场,据TechInsights数据,英伟达2023年的数据中心GPU出货量约为376万片,比2022年多出近100万片,商场占比98%,收入达362亿美元。压倒性打败了AMD和英特尔等竞争对手。
微软公司和Meta等数据中心运营商运用英伟达的芯片来开发和运转AI模型,巨大的需求使其销售额和股价飙升。英伟达市值在本年6月曾登顶全球榜首,到达3.33万亿美元。最新财报显现,在英伟达Hopper(GPU构架途径)、GPU核算和网络途径微弱需求的推进下,公司数据中心本年第二季度收入到达262.72亿美元。
英伟到达达现在效果凭的是什么?袁帅告知证券时报记者,这首要源于英伟达在GPU规划、制作工艺以及软件优化等方面具有深沉的技能堆集,其产品在功能、功耗比和安稳性等方面均处于职业抢先位置。一起,该公司树立了完善的生态系统,包含CUDA途径、软件开发工具包(SDK)以及丰厚的第三方运用支撑等,为开发者供给了快捷的开发环境和广泛的运用场景。
“英伟达的芯片产品先进且功能强壮,配套软件生态完善浸透率高,而且产品迭代进化速度快速,所以商场位置尚难以撼动。”深度科技研究院院长张孝荣以为。
时机和应战并存
国内商场方面,自2019年以来,一批国产GPU草创公司先后建立,其间出现了壁仞科技、摩尔线程、燧原科技等AI芯片规划独角兽。一起,还有一批老牌芯片规划公司也入局GPU范畴。
这些公司的时机在于美国出口控制布景下的国产代替。2022年10月,美国政府制止英伟达向我国出口高功能H100、A100芯片。英伟达随后专门面向我国商场推出了不违背美国出口控制要求的A800和H800芯片,至上一年10月,这两项芯片也被约束。2024年2月,英伟达向我国商场特供的H20芯片承受预定,但该芯片与H100装备比较,GPU中心数量削减41%,功能下降28%。对此,英伟达2023年11月曾泄漏,数据中心事务两成以上受出口控制影响。
与此一起,国内GPU厂商正迎头赶上。IDC在2023年中发布的一项我国AI加快卡(揭露商场)出货量核算显现,2022年上半年到2023年上半年,我国AI加快卡出货约109万张,英伟达商场比例为85%,华为市占率为10%,百度市占率为2%,寒武纪和燧原科技均为1%。
从国内产品效果来看,不只华为昇腾系列体现杰出。2024年5月份,摩尔线程与智谱AI展开了新一轮GPU大模型适配、功能测验。结果表明,在推理方面,摩尔线程自研全功能GPU显着优于基准比照产品RTX 3090和RTX 4090;在练习方面,摩尔线程夸娥千卡智算集群的练习精度与A100集群比较,差错在1%以内,而集群功能扩展系数超越90%,模型算力运用率(MFU)与A100集群适当。
壁仞科技则于2022年8月推出选用7nm制程的GPGPU芯片BR100,该芯片峰值算力到达世界厂商彼时在售旗舰产品3倍以上,创下国内互连带宽纪录。
不过,应战也随之而来,一些职业抢先企业先后被美国政府“盯上”。2022年12月,寒武纪等36家被美国政府列入“实体清单”。2023年10月,壁仞科技、摩尔线程等亦被添加到实体清单中。
这对相关企业影响几许?寒武纪在2024年半年报中表明,公司及部分子公司已被列入“实体清单”,将对公司供应链的安稳形成必定危险。受“实体清单”等供应链不利要素影响,公司上半年营收6476.53万元,较上年同期下降43.42%。
生态建造待完善
王鹏指出,当时世界政治经济环境的改变对GPU职业产生了必定影响。特别是美国对我国AI工业的镇压方针约束了国内相关企业的进口途径和供应链安稳性。
袁帅向证券时报记者表明,在面对外部封闭前提下,国产GPU厂商要站稳脚跟并在高端AI芯片范畴争得一席之地并非易事。在硬件层面,国内芯片代工企业在高端工艺和产能方面相对缺乏,难以彻底满足国产GPU规划厂商对高端AI芯片的出产需求;在软件层面,英伟达等世界巨子在软件生态(CUDA等)和IP授权方面具有强壮优势。国产GPU厂商在构建和完善软件生态以及获取要害IP授权范畴仍显单薄。
事实上,CUDA被业界遍及以为是英伟达最大护城河。英伟达CEO黄仁勋在本年也曾着重CUDA软件系统生态关于AI年代的重要性。“现在,CUDA已完成良性的展开循环,全球具有500万开发者,掩盖医疗保健、金融服务、核算机职业、汽车职业等范畴。”黄仁勋说。
我国工程院院士,高功能核算研究所所长郑纬民在本年7月7日的信息化百人会上指出:“这些年国产芯片无论是软件硬件都有很大的展开,可是用户不太喜爱用,原因是国产卡的生态系统不太好。”
郑纬民以为,这需求做好系统规划和相关软件优化,详细包含十个方面:编程结构、并行加快、通讯库、算子库、AI编译器、编程语音、调度器、内存分配系统、容错系统、存储系统等。在他看来,在国产算力支撑大模型练习时,国产AI芯片只能到达国外芯片60%的功能,但如果把前述十个方面的软件生态做好了,客户也会满足。
国泰君安在本年3月发布的《注重AI芯片配套的软件生态》陈述中总结:谁能做出我国版“CUDA”,就能占据AI算力高地。国内各大厂商已在GPU生态上活跃布局,包含驱动程序、开发工具、运用程序接口(API)等,以保证其产品可以更好地服务于人工智能、大数据处理、云核算和游戏等多样化的运用场景。例如,华为推出了CANN以及对应的生态系统,力求打破技能瓶颈。此外,像景嘉微、摩尔线程等公司也在自主研制GPU产品,并尽力打造与之兼容的软件环境,以削减对外部供货商的依靠,提高国产GPU的商场竞争力等。
证券时报记者 王一鸣前几年广受本钱追捧的GPU(图形处理器)这一硬核赛道正在步入洗牌期,一些本来备受瞩目的通用GPU规划企业先后堕入运营窘境。与此一起,有头部企业持续求新求变,已步入AI(人工智能)中...
《科创板日报》记者注意到,现在,国内GPU范畴已跑出多家公司,包含摩尔线程、壁仞科技、燧原科技、瀚博半导体、景嘉微(300474)等。其间,景嘉微(300474)现已上市,市值近450亿元;摩尔线程、壁仞科技、燧原科技则纷繁发动IPO。
本年初,工业和信息化部等七部分发布《关于推进未来工业立异开展的施行定见》,其间说到“加速打破GPU芯片等技能”“建造超大规模智算中心”等。
由此,多方头部组织出资出手行云,亦是对国产GPU的看好。
▌生态位竞赛战略,一众明星本钱投了“天才少年”
从发表的信息来看,参加行云本轮融资的出资组织,阵型较为强壮。既有智谱AI、仁慈集团等工业本钱,也有闻名前期组织中科创星、奇绩创坛、水木清华校友基金;更有商场化组织嘉御本钱、春华本钱、同创伟业、峰瑞本钱等。
如此多明星本钱出手行云,与公司开创人季宇,联合开创人、CTO余洪敏不无关系。《科创板日报》记者从行云开创团队处了解到,公司开创人季宇为清华大学核算机系博士,是“华为天才少年”,主攻体系结构、AI芯片方向。
在华为,季宇曾是海思昇腾芯片编译器专家,担任多个昇腾编译器项目。作为研讨科学家,季宇也打开AI编译器领和处理器微架构域许多应战性问题攻关。
另一联合开创人、CTO余洪敏,资格也非常深沉。学历布景上,余洪敏是中科院半导体所博士,先后担任锐迪科(RDA)智能手机芯片AP SOC、百度昆仑芯、海思车载昇腾芯片等多款芯片技能Leader和研制担任人,以及地平线芯片研制总监和征途系列SOC规划开发交给和团队处理担任人。
获益于AI大模型算力需求激增,底层AI芯片成为赢家。现在,英伟达市值已逾越苹果,成为全球市值最高的公司,总市值高达3.44万亿美元。
一位半导体范畴出资人在承受《科创板日报》记者采访时表明,之所以押注AI芯片范畴,源于赛道中有英伟达这样的公司,使得该范畴充溢幻想、潜力巨大。
那么,草创企业行云如安在巨子之下,占有一席之地?行云开创团队告知《科创板日报》记者,公司核心技能为经过自研GPGPU内核,着重于产品生态位的芯片竞赛战略,而非替换战略。
“在曩昔,打败CPU的既不是其他CPU,也不是GPU,而是CPU+GPU体系。今日与英伟达GPU竞赛的方法,也不是同质化的GPU或xPU,而是一种新的芯片品类和GPU+新品类构成新体系。”行云开创团队表明。
具体来说,“异构+白盒”是“行云”对核算方法进行改造。即在一般的x86服务器上以pcie拓宽方法布置,构成显存密集型产品。这种产品可以与英伟达等公司的算力密集型产品,合作运用或独立运用于对显存需求更高的场景。
行云开创团队表明,经过与大模型prefill和decode别离方法以及各类并行的结合,终究提高大模型推理功率;而且极大降低本钱,让一般顾客可以负担得起高质量大模型的不定量运用。
水木清华校友种子基金合伙人丁昳婷告知《科创板日报》记者,出资行云,除了由于开创团队强壮,公司的产品定位也有别于现有AI芯片。即在大模型推理场景下进行极致的体系级架构取舍,有望处理现在显存容量的瓶颈,然后处理存算不匹配的问题。
行云开创团队表明,新一轮融资完结后,将继续完善消费级和超算级产品线的两代产品,尽早向商场推出可以运用高质量大模型的超低本钱单卡以及高性能超算级云端产品。
▌阿里也出手了,互联网大厂纷繁押注国产GPU
产品研制仅仅榜首步,但终究需求走进工业。上述出资人对《科创板日报》记者表明,“AI芯片跟其他芯片不一样,除了团队、融资才能以外,来自大厂等的工业扶持必不可少。”
从发表的信息看,智谱AI是行云最显着的工业本钱方。作为国内大模型“六小龙”,其是一家B、G端完结全面开花,且能与头部大厂掰手腕的企业。据不完全统计,本年前三季度,智谱AI中标项目达22个,散布在通讯、金融、动力、教科等职业,且以央国企客户为主。
智谱AI出资行云,首要或是为了取得大模型场景的GPU芯片研制才能。
《科创板日报》记者注意到,内行云的出资方中,还有峰瑞本钱的身影。工商信息显现,上海峰瑞睿佳出资中心(有限合伙)(简称,上海峰瑞睿佳)作为第6大股东,持有行云5.5135%的股权,为5%以上股东。
股权穿透显现,上海峰瑞睿佳LP中,显现阿里巴巴和蚂蚁集团子公司的身影。其间,阿里巴巴(我国)有限公司持有5%的股份,蚂蚁集团子公司持有10%的股份。
实际上,现在跑出的摩尔线程、燧原科技、瀚博半导体等3家GPU公司中,背面股东方均有互联网大厂身影。
以最近处理上市教导存案挂号的摩尔线程为例,财联社创投通数据显现,摩尔线程阅历5轮融资,背面站着腾讯出资、字节跳动战投部两大互联网大厂。
无独有偶,成立于2018年的燧原科技,6年时间内完结10轮融资,累计融资额近70亿元,其间腾讯接连六轮参投,成为榜首大股东,持股份额高达20.49%。
本年9月,燧原科技还加入了腾讯云工业高效能云智算中心共建方案,与腾讯云一起打造新一代的智算中心AI基础设施。
此外,瀚博半导体则有大厂快手的出资。
关于工业本钱的重要性,行云开创团队表明,接连融资不仅为行云的研制带来丰盛的资金支撑,更重要的是使用得天独厚的工业资源,协助行云集成深化场景,在场景中堆集厚实的经历,推进大模型推理场景芯片的技能落地。
上述出资人也对《科创板日报》记者表明,“AI芯片中,软件算法的占比和重要性很高,工程落地中涉及到许多算子优化,GPU架构之下需求跟终端客户做深度交流。因而,大厂和战略工业方的加持,对公司的研制和商业化进程,会给予极大协助。”
本文源自:科创板日报
近来,大模型芯片范畴跑出一名新秀,北京行云集成电路有限公司(简称“行云”)接连完结总额数亿元的天使轮及天使+轮融资,出资方包含多家头部战略方及闻名财政组织。《科创板日报》记者注意到,现在,国内GPU范...