前几年广受本钱追捧的GPU(图形处理器)这一硬核赛道正在步入洗牌期,一些本来备受瞩目的通用GPU规划企业先后堕入运营窘境。与此一起,有头部企业持续求新求变,已步入AI(人工智能)中心战场。
关于职业现状,北京社科院研究员王鹏向证券时报记者剖析,当时国产GPU工业处于快速展开与洗牌并存的阶段。一方面,跟着AI大模型的需求激增,国产GPU商场敏捷兴起,出现出如摩尔线程、壁仞科技等一批具有立异才能的企业。这些企业在技能研制、产品立异等方面取得了显着展开,为国产GPU职业注入了新的生机。另一方面,商场竞争也日益剧烈,部分草创企业因为资金链断裂、技能瓶颈等问题堕入窘境,乃至面对裁人、诉讼等危险。
“久远来看,国产GPU职业仍具有宽广的展开前景。这源于人工智能、大数据、云核算等技能的快速展开,对高功能GPU的需求持续添加;一起,国家方针对半导体工业的支撑力度不断加大,为国产GPU职业供给了杰出的展开环境。此外,跟着国产芯片公司在生态构建、技能立异等方面的不断尽力,国产GPU有望逐步缩小与世界抢先水平的距离。”王鹏说。
几家欢欣几家愁
近来,国产GPU独角兽壁仞科技一则动态引起业界注重。该公司在上海证监局处理IPO教导存案挂号,教导券商为国泰君安。这是继本年8月26日燧原科技教导存案陈述发布后,又一家发动IPO的上海AI芯片企业。
壁仞科技创立于2019年,致力于研制原创性的通用核算系统,树立高效的软硬件途径,一起在智能核算范畴供给一体化的解决计划。到现在,公司已完结多轮融资,揭露融资总额超越50亿元,投资方包含启明创投、IDG本钱、中芯聚源、格力创投等。
现在,壁仞科技首款国产高端通用GPU(GPGPU)壁砺系列已量产。在9月举办的2024全球AI芯片峰会上,壁仞科技还初次发布了其自研的异构GPU协同练习计划,该计划打破了大模型异构算力孤岛难题,完成了在本乡异构多GPU芯片算力练习技能范畴的初次打破。
另一家国内GPU独角兽企业也有新动作。本年7月,摩尔线程宣告对其夸娥(KUAE)智算集群解决计划进行严重晋级,从当时千卡等级大幅扩展至万卡规划。摩尔线程创始人兼CEO张建中表明,在多元趋势下,万卡已是AI模型练习主战场的标配。
事实上,在国内,万卡集群建造正高歌猛进。上一年7月,华为昇腾AI集群规划从开始的4000卡集群扩展至16000卡,是国内首个万卡AI集群。
不过,当时国产GPU工业的分解亦非常显着,一些本来备受瞩目的企业连续堕入窘境。本年8月底,曾取得2024年度重庆市“独角兽企业”称谓的象帝先被曝约400位职工被裁。公司在回应中坦陈:“展开面对必定的商场调整压力……正在进行安排结构和人员装备的优化等……并寻觅外部融资时机。”另一方面,象帝先股东还在申述其创始人唐志敏,因其未能筹措到许诺的5亿元B轮融资。
在象帝先堕入窘境之前,同处在GPU赛道的砺算科技也曾预警。至本年8月19日,东芯股份公告拟以不超越2亿元收买砺算科技37.88%股份,砺算科技的资金紧张局势方得以缓解。
GPU占AI芯片
多半比例
在中关村物联网工业联盟副秘书长袁帅看来,当时国产GPU职业处于一个杂乱而要害的转型期,短期职业呈现降温文分解,首要是因为商场竞争加重、技能门槛进步、本钱落潮等要素导致企业资金压力增大。在此布景下,部分实力较弱的草创企业在面对应战时往往愈加软弱,而头部企业则凭仗其技能实力、商场布局和资金优势逐步锋芒毕露。
按界说和运用看,GPU起初是一种显现芯片,用于加快核算机上的图画处理。跟着技能进步和运用规模的扩展,GPU衍生出了GPGPU,后者是经过运用GPU并行处理才能特别强、核算能效比高的特色,处理更为杂乱的核算使命(如AI模型练习与推理等)。基于此,现在的GPU已被广泛运用于人工智能、虚拟现实、游戏、科学核算等许多范畴。
IDC数据显现,估计到2025年,GPU仍将占有全球AI芯片多半商场比例。Gartner此前猜测,2023年全球人工智能芯片(包含GPU、TPU等)的商场规划到达530亿美元,并估计在2024年添加至671亿美元。到2027年,全球人工智能芯片商场规划估计到达1194亿美元。
从职业格式来看,作为GPU的发明者,英伟达占有肯定抢先位置。Jon Peddie Research(JPR)数据显现,2024年榜首季度英伟达的全球AIB显卡(也称独立GPU)商场比例飙升至88%,而AMD的商场比例下降至12%。JPR估计,2024年第二季度,AI练习器GPU的出货量将持续添加,而游戏AIB商场或许相等或走低。在AI芯片主战场,据TechInsights数据,英伟达2023年的数据中心GPU出货量约为376万片,比2022年多出近100万片,商场占比98%,收入达362亿美元。压倒性打败了AMD和英特尔等竞争对手。
微软公司和Meta等数据中心运营商运用英伟达的芯片来开发和运转AI模型,巨大的需求使其销售额和股价飙升。英伟达市值在本年6月曾登顶全球榜首,到达3.33万亿美元。最新财报显现,在英伟达Hopper(GPU构架途径)、GPU核算和网络途径微弱需求的推进下,公司数据中心本年第二季度收入到达262.72亿美元。
英伟到达达现在效果凭的是什么?袁帅告知证券时报记者,这首要源于英伟达在GPU规划、制作工艺以及软件优化等方面具有深沉的技能堆集,其产品在功能、功耗比和安稳性等方面均处于职业抢先位置。一起,该公司树立了完善的生态系统,包含CUDA途径、软件开发工具包(SDK)以及丰厚的第三方运用支撑等,为开发者供给了快捷的开发环境和广泛的运用场景。
“英伟达的芯片产品先进且功能强壮,配套软件生态完善浸透率高,而且产品迭代进化速度快速,所以商场位置尚难以撼动。”深度科技研究院院长张孝荣以为。
时机和应战并存
国内商场方面,自2019年以来,一批国产GPU草创公司先后建立,其间出现了壁仞科技、摩尔线程、燧原科技等AI芯片规划独角兽。一起,还有一批老牌芯片规划公司也入局GPU范畴。
这些公司的时机在于美国出口控制布景下的国产代替。2022年10月,美国政府制止英伟达向我国出口高功能H100、A100芯片。英伟达随后专门面向我国商场推出了不违背美国出口控制要求的A800和H800芯片,至上一年10月,这两项芯片也被约束。2024年2月,英伟达向我国商场特供的H20芯片承受预定,但该芯片与H100装备比较,GPU中心数量削减41%,功能下降28%。对此,英伟达2023年11月曾泄漏,数据中心事务两成以上受出口控制影响。
与此一起,国内GPU厂商正迎头赶上。IDC在2023年中发布的一项我国AI加快卡(揭露商场)出货量核算显现,2022年上半年到2023年上半年,我国AI加快卡出货约109万张,英伟达商场比例为85%,华为市占率为10%,百度市占率为2%,寒武纪和燧原科技均为1%。
从国内产品效果来看,不只华为昇腾系列体现杰出。2024年5月份,摩尔线程与智谱AI展开了新一轮GPU大模型适配、功能测验。结果表明,在推理方面,摩尔线程自研全功能GPU显着优于基准比照产品RTX 3090和RTX 4090;在练习方面,摩尔线程夸娥千卡智算集群的练习精度与A100集群比较,差错在1%以内,而集群功能扩展系数超越90%,模型算力运用率(MFU)与A100集群适当。
壁仞科技则于2022年8月推出选用7nm制程的GPGPU芯片BR100,该芯片峰值算力到达世界厂商彼时在售旗舰产品3倍以上,创下国内互连带宽纪录。
不过,应战也随之而来,一些职业抢先企业先后被美国政府“盯上”。2022年12月,寒武纪等36家被美国政府列入“实体清单”。2023年10月,壁仞科技、摩尔线程等亦被添加到实体清单中。
这对相关企业影响几许?寒武纪在2024年半年报中表明,公司及部分子公司已被列入“实体清单”,将对公司供应链的安稳形成必定危险。受“实体清单”等供应链不利要素影响,公司上半年营收6476.53万元,较上年同期下降43.42%。
生态建造待完善
王鹏指出,当时世界政治经济环境的改变对GPU职业产生了必定影响。特别是美国对我国AI工业的镇压方针约束了国内相关企业的进口途径和供应链安稳性。
袁帅向证券时报记者表明,在面对外部封闭前提下,国产GPU厂商要站稳脚跟并在高端AI芯片范畴争得一席之地并非易事。在硬件层面,国内芯片代工企业在高端工艺和产能方面相对缺乏,难以彻底满足国产GPU规划厂商对高端AI芯片的出产需求;在软件层面,英伟达等世界巨子在软件生态(CUDA等)和IP授权方面具有强壮优势。国产GPU厂商在构建和完善软件生态以及获取要害IP授权范畴仍显单薄。
事实上,CUDA被业界遍及以为是英伟达最大护城河。英伟达CEO黄仁勋在本年也曾着重CUDA软件系统生态关于AI年代的重要性。“现在,CUDA已完成良性的展开循环,全球具有500万开发者,掩盖医疗保健、金融服务、核算机职业、汽车职业等范畴。”黄仁勋说。
我国工程院院士,高功能核算研究所所长郑纬民在本年7月7日的信息化百人会上指出:“这些年国产芯片无论是软件硬件都有很大的展开,可是用户不太喜爱用,原因是国产卡的生态系统不太好。”
郑纬民以为,这需求做好系统规划和相关软件优化,详细包含十个方面:编程结构、并行加快、通讯库、算子库、AI编译器、编程语音、调度器、内存分配系统、容错系统、存储系统等。在他看来,在国产算力支撑大模型练习时,国产AI芯片只能到达国外芯片60%的功能,但如果把前述十个方面的软件生态做好了,客户也会满足。
国泰君安在本年3月发布的《注重AI芯片配套的软件生态》陈述中总结:谁能做出我国版“CUDA”,就能占据AI算力高地。国内各大厂商已在GPU生态上活跃布局,包含驱动程序、开发工具、运用程序接口(API)等,以保证其产品可以更好地服务于人工智能、大数据处理、云核算和游戏等多样化的运用场景。例如,华为推出了CANN以及对应的生态系统,力求打破技能瓶颈。此外,像景嘉微、摩尔线程等公司也在自主研制GPU产品,并尽力打造与之兼容的软件环境,以削减对外部供货商的依靠,提高国产GPU的商场竞争力等。
《科创板日报》记者注意到,现在,国内GPU范畴已跑出多家公司,包含摩尔线程、壁仞科技、燧原科技、瀚博半导体、景嘉微(300474)等。其间,景嘉微(300474)现已上市,市值近450亿元;摩尔线程、壁仞科技、燧原科技则纷繁发动IPO。
本年初,工业和信息化部等七部分发布《关于推进未来工业立异开展的施行定见》,其间说到“加速打破GPU芯片等技能”“建造超大规模智算中心”等。
由此,多方头部组织出资出手行云,亦是对国产GPU的看好。
▌生态位竞赛战略,一众明星本钱投了“天才少年”
从发表的信息来看,参加行云本轮融资的出资组织,阵型较为强壮。既有智谱AI、仁慈集团等工业本钱,也有闻名前期组织中科创星、奇绩创坛、水木清华校友基金;更有商场化组织嘉御本钱、春华本钱、同创伟业、峰瑞本钱等。
如此多明星本钱出手行云,与公司开创人季宇,联合开创人、CTO余洪敏不无关系。《科创板日报》记者从行云开创团队处了解到,公司开创人季宇为清华大学核算机系博士,是“华为天才少年”,主攻体系结构、AI芯片方向。
在华为,季宇曾是海思昇腾芯片编译器专家,担任多个昇腾编译器项目。作为研讨科学家,季宇也打开AI编译器领和处理器微架构域许多应战性问题攻关。
另一联合开创人、CTO余洪敏,资格也非常深沉。学历布景上,余洪敏是中科院半导体所博士,先后担任锐迪科(RDA)智能手机芯片AP SOC、百度昆仑芯、海思车载昇腾芯片等多款芯片技能Leader和研制担任人,以及地平线芯片研制总监和征途系列SOC规划开发交给和团队处理担任人。
获益于AI大模型算力需求激增,底层AI芯片成为赢家。现在,英伟达市值已逾越苹果,成为全球市值最高的公司,总市值高达3.44万亿美元。
一位半导体范畴出资人在承受《科创板日报》记者采访时表明,之所以押注AI芯片范畴,源于赛道中有英伟达这样的公司,使得该范畴充溢幻想、潜力巨大。
那么,草创企业行云如安在巨子之下,占有一席之地?行云开创团队告知《科创板日报》记者,公司核心技能为经过自研GPGPU内核,着重于产品生态位的芯片竞赛战略,而非替换战略。
“在曩昔,打败CPU的既不是其他CPU,也不是GPU,而是CPU+GPU体系。今日与英伟达GPU竞赛的方法,也不是同质化的GPU或xPU,而是一种新的芯片品类和GPU+新品类构成新体系。”行云开创团队表明。
具体来说,“异构+白盒”是“行云”对核算方法进行改造。即在一般的x86服务器上以pcie拓宽方法布置,构成显存密集型产品。这种产品可以与英伟达等公司的算力密集型产品,合作运用或独立运用于对显存需求更高的场景。
行云开创团队表明,经过与大模型prefill和decode别离方法以及各类并行的结合,终究提高大模型推理功率;而且极大降低本钱,让一般顾客可以负担得起高质量大模型的不定量运用。
水木清华校友种子基金合伙人丁昳婷告知《科创板日报》记者,出资行云,除了由于开创团队强壮,公司的产品定位也有别于现有AI芯片。即在大模型推理场景下进行极致的体系级架构取舍,有望处理现在显存容量的瓶颈,然后处理存算不匹配的问题。
行云开创团队表明,新一轮融资完结后,将继续完善消费级和超算级产品线的两代产品,尽早向商场推出可以运用高质量大模型的超低本钱单卡以及高性能超算级云端产品。
▌阿里也出手了,互联网大厂纷繁押注国产GPU
产品研制仅仅榜首步,但终究需求走进工业。上述出资人对《科创板日报》记者表明,“AI芯片跟其他芯片不一样,除了团队、融资才能以外,来自大厂等的工业扶持必不可少。”
从发表的信息看,智谱AI是行云最显着的工业本钱方。作为国内大模型“六小龙”,其是一家B、G端完结全面开花,且能与头部大厂掰手腕的企业。据不完全统计,本年前三季度,智谱AI中标项目达22个,散布在通讯、金融、动力、教科等职业,且以央国企客户为主。
智谱AI出资行云,首要或是为了取得大模型场景的GPU芯片研制才能。
《科创板日报》记者注意到,内行云的出资方中,还有峰瑞本钱的身影。工商信息显现,上海峰瑞睿佳出资中心(有限合伙)(简称,上海峰瑞睿佳)作为第6大股东,持有行云5.5135%的股权,为5%以上股东。
股权穿透显现,上海峰瑞睿佳LP中,显现阿里巴巴和蚂蚁集团子公司的身影。其间,阿里巴巴(我国)有限公司持有5%的股份,蚂蚁集团子公司持有10%的股份。
实际上,现在跑出的摩尔线程、燧原科技、瀚博半导体等3家GPU公司中,背面股东方均有互联网大厂身影。
以最近处理上市教导存案挂号的摩尔线程为例,财联社创投通数据显现,摩尔线程阅历5轮融资,背面站着腾讯出资、字节跳动战投部两大互联网大厂。
无独有偶,成立于2018年的燧原科技,6年时间内完结10轮融资,累计融资额近70亿元,其间腾讯接连六轮参投,成为榜首大股东,持股份额高达20.49%。
本年9月,燧原科技还加入了腾讯云工业高效能云智算中心共建方案,与腾讯云一起打造新一代的智算中心AI基础设施。
此外,瀚博半导体则有大厂快手的出资。
关于工业本钱的重要性,行云开创团队表明,接连融资不仅为行云的研制带来丰盛的资金支撑,更重要的是使用得天独厚的工业资源,协助行云集成深化场景,在场景中堆集厚实的经历,推进大模型推理场景芯片的技能落地。
上述出资人也对《科创板日报》记者表明,“AI芯片中,软件算法的占比和重要性很高,工程落地中涉及到许多算子优化,GPU架构之下需求跟终端客户做深度交流。因而,大厂和战略工业方的加持,对公司的研制和商业化进程,会给予极大协助。”
本文源自:科创板日报