国产GPU,使用开花

liukang202415小时前群众吃瓜1158

来历:半导体工业纵横

真实的国产GPU,应用开花的图片

前两天,英伟达第三季度财报总算出了。结果是预期中的向好,营收 351 亿美元,同比增加 93.7%。净利润 193.1 亿美元,同比增加 109%。

简略核算便是上个季度英伟达共赚 2542 亿人民币,净利润 1398 亿,均匀每天爆赚 15 亿人民币,相当于一天赚出 8 套北京价值 2 亿的四合院。

GPU 的呈现就标志着挣钱,三季度英伟达的毛利率高达 74.6%。什么概念?被誉为「大自然的印钞机」、将钟睒睒捧上我国首富宝座的农民山泉,毛利率也不过 60%

英伟达的图形处理单元(GPU)技能之杰出,已广为人知。相较之下,国产 GPU 的影响力则显得较为有限。

但是,近年来,我国国内的许多 GPU 企业开端锋芒毕露。经过继续的投入和尽力,国产 GPU 在功用、功用和运用范畴等方面都有了提高,逐步赢得了商场的认可和用户的信赖。国产 GPU 不仅在传统图形处理范畴取得了开展,也可以在人工智能、高功用核算等新式范畴展现出必定的竞赛力。

01

景嘉微

景嘉微是国内自主知识产权图形 GPU 领军企业,是国内少量几家出产 GPU 且具有自主知识产权的公司。

景嘉微的 GPU 产品包含JM5400、JM7200、JM9 系列和景宏系列,掩盖传统范畴和新式范畴。

JM5400 是景嘉微前期推出的一款 GPU 产品,标志着国产 GPU 的起步;JM7200/7201 系列适用于桌面作业、图形作业站及有高要求的图形生成及显现等范畴。景嘉微在 JM7 系列时期已完结了与干流国产 CPU 与操作系统的适配作业。

JM9 系列是景嘉微的第三代 GPU 产品,包含 JM9100 和 JM92 系列,它们在前两代的基础上进一步优化了功用与功耗,最低功耗不到 2W,全面支撑国产 CPU、国产操作系统和国产固件,可广泛运用于 PC、笔记本电脑、工控机、图形作业站等核算机设备。

景宏系列是景嘉微本年成功研制的产品,首要用于 AI 练习、AI 推理和科学核算等范畴。依据公告,景宏系列支撑 INT8、FP16、FP32、FP64 等混合精度运算,支撑全新的多卡互联技能进行算力扩展,适配国内外干流 CPU、操作系统及服务器厂商,可以支撑当时干流的核算生态、深度学习结构和算法模型库,大幅缩短用户适配验证周期。

02

天数智芯

天数智芯通用 GPU 产品天垓、智铠系列

天数智芯通用 GPU 产品适配干流 CPU 芯片/服务器厂商,可以支撑国内外干流 AI 生态和各种深度学习结构。天数智芯现已发布了两款自主研制的通用 GPU 产品天垓 100智铠 100,具有运用掩盖广、开发易搬迁、功用可预期、全栈可定制、运用本钱低一级特色。

天垓 100是天数智芯推出的全自研通用 GPU 练习产品。它选用通用 GPU 架构,兼容世界干流 GPU 通用核算模型,支撑国内外干流 AI 生态和深度学习结构及原生算子。2022 年末,天数智芯曾宣告天垓 100 累计出售订单已打破 5 亿元。

智铠 100 系列加快卡根据通用 GPU 架构,支撑多种视频标准解码、800+通用指令集、国内外干流深度学习开发结构。兼容 CUDA 生态,支撑商场干流生态,高达 128 路视频接入。均匀搬迁时刻相较商场干流产品下降 50% 以上,生态运用搬迁敏捷。

天数智芯推出的国内首个通用核算运用开发及评测渠道 DeepSpark 继续迭代,到现在已会聚300+练习和 80+推理模型示例,支撑干流 AI 运用结构,供给多维度测评系统。

天数智芯自主算力集群计划可以有用支撑 OPT、LLaMa、GPT-2、CPM、GLM 等干流 AIGC 大模型的 Pretrain 和 Finetune。一起适配支撑了清华、智源、复旦等在内的国内多个研究组织的开源大模型。

03

中微电

国产GPU,应用开花的图像

中微电的 GPU 产品有:南风一号、南风二号、南风三号。「南风一号」GPU 首要运用于信创核算机显现可满意党政、金融及安防等信创工业链专用整机电脑 PC 显卡需求。「南风二号」供给高功用并行核算才能,满意服务器、练习机、推理机、边际核算、科学仿真核算、智算中心等人工智能商场需求。

上一年 12 月,中微电科技「南风一号」显卡(NF1001)导入了世恒 TD120A2 整机。标志着产品现现已过了我国长城各项功用、功用、可靠性、兼容性、安稳性等测验。「南风一号」也与麒麟操作系统(V10 SP1)、飞扬处理器(D2000、FT2000)、奇安信浏览器等多家国产设备、运用完结兼容性互认证。「南风一号」从「产品」正式转型为「产品」。

本年 4 月,中微电宣告「南风二号」中心 IP 研制完结,经过了 FPGA 的仿真测验。试验结果表明,「南风二号」AI 推理功用到达 48TOPS,根本完结了国家工业和信息化部揭榜挂帅项目和深圳市科技严重专项项目的参数目标。

04

芯动科技

芯动科技也推出了 GPU 产品:风华 1 号、风华二号。

风华一号发布于 2021 年,是首款国产高功用 4K 级显卡 GPU。包含「风华 1 号」A 型卡(单芯桌面端)、「风华 1 号」B 型卡(双芯服务器端)两款,选用 12nm 制程工艺。支撑国产新基建 5G 数据中心、桌面、元世界、云游戏、云桌面等千亿级工业。

风华二号发布于 2022 年 8 月,是一款集超低功耗、强烘托、4K 高清三屏显现、4K 视频解码、智能 AI 核算于一体的桌面和笔记本 GPU,选用自研 LPDDR5X 显存,带宽到达 10Gbps,整卡实测功耗 4~15W。

工控范畴,芯动科技的风华 2 号 GPU 已在各大城市轨道交通系统的主动售检票系统中完结大规划商用。该系统中的主动检票机、主动售票机和半主动售票机等设备,选用风华 2 号 GPU 后,可支撑 4 屏显现和长时刻低功耗高安稳运转,

消费电子范畴,天天电竞发布的国潮电竞专业显卡品牌「赤兔」,搭载了芯动科技自研的风华 GPU 芯片。

05

沐曦集成

本年 9 月,沐曦集成近期完结了新一轮股权融资,参加此次出资的组织包含浦东创投集团、上海科创基金、湘江国投、启夏本钱、中卫颐和及上海源庐加佳信息科技有限公司等多家闻名出资方。

现在沐曦集成电路的 GPU 产品包含:曦思 N 系列、曦云 C 系列、曦彩 G 系列。

曦彩 G 系列 GPU 是针对图形烘托加快的解决计划,沐曦自主知识产权架构供给杰出的图形图像烘托与视频处理才能,可广泛运用于元世界、云桌面、云游戏、云手机、数字孪生、XR等场景。

曦思 N 系列首款产品曦思N100 是一款面向云端数据中心运用的人工智能推理 GPU,自 2022 年末产品量产以来,已在才智交通、才智安防、智能转码等人工智能范畴取得广泛运用。沐曦集成与眸瑞科技联合发布的「贴图超分」技能,依托曦思 N 系列 AI 推理 GPU 的强壮算力,初次将 AI 超分成功运用到了 3D 模型范畴。

曦云 C 系列通用 GPU(GPGPU)芯片是针对智算及通用核算的完美解决计划,沐曦自主知识产权架构供给强壮高精度及多精度混合算力,可广泛运用于智算以及通用核算、教育和科研等场景。曦云 C500 单卡算力高达 30TFlops FP32,单卡 64GB HBM2E 高带宽显存,带宽 1.8TB/s,这张卡还装备自研 MetaXlink 高速接口,适合于大模型练习。4 卡既可以支撑 65B 大模型推理,8 卡可以支撑 130B 模型推理。

2023 年,沐曦携手智谱篇章、优刻得一起发布了国产首台 GPU 千亿参数大模型训推一体机。第一批客户是北京航天总医院、数字宁夏建造运营有限公司。

06

登临科技

登临科技成立于 2017 年,现在 Goldwasser 系列产品现已完结规划量产,团队致力于以 GUGPU 为中心构建高功用核算渠道。

Goldwasser 系列产品:包含边际核算产品 Goldwasser UL,功率 25-35W,INT8 算力 32-64TOPS;半高半长的服务器核算卡 Goldwasser L,功耗 40-70W,供给 128-256TOPS 算力;还有一种全高全长的 Goldwasser XL,输出 512TOPS 算力。

国产GPU,应用开花的图像

该公司最引人注意的当地是,宣称其自主立异的通用 GPU 具有「与 CUDA/OpenCL 等编程模型兼容的核算架构」,使其可以很好地与 Nvidia 竞赛,但一起也或许使用 Nvidia 最大的竞赛优势——CUDA 与之对立。

据称,在首代 Goldwasser 产品量产后一年内,登临科技完结国内干流运营商、操作系统、CPU、互联网企业、人工智能结构、服务器企业的兼容互认证,并发布登临瀚海生态计划。

登临科技创始人李建文、登临科技联合创始人王平本硕均就读于清华大学,全球运营副总裁杨剑曾任华为全球供应链副总裁,其研制团队具有长时间的 GPU 研制和商业产品化经历。此外,登临科技在硅谷、成都、杭州等城市共设立了七个研制中心。

07

壁仞科技

壁仞科技创立于 2019 年,致力于研制原创性的通用核算系统,树立高效的软硬件渠道,一起在智能核算范畴供给一体化的解决计划。现在,壁仞科技首款国产高端通用 GPU 壁砺系列已量产落地。

BR100 系列通用 GPU 芯片是国内算力最大的通用 GPU 芯片,包含 BR104 和 BR100 两大产品。根据自主原创的芯片架构开发,选用 7 纳米工艺制程,并结合了包含 Chiplet(芯粒技能)等在内的多项业界前沿芯片规划、制作与封装技能。其间 BR104 对标英伟达 2020 年推出的 A100、BR100 对标英伟达 4nm 芯片 H100。

此外,壁仞科技还推出了「壁砺」系列算力产品,这些产品进一步丰厚了壁仞科技的 GPU 产品线,满意了不同客户和运用场景的需求。

壁仞科技与浪潮科技协作推出了搭载 BR100 的 OAM服务器「海玄」,其峰值浮点算力达 8PFLOPS,最大功耗为 7KW,为数据中心供给了高能效、低 TCO(总具有本钱)的数据中心集群计划,可满意数据中心对大规划数据处理和高功用核算的需求,支撑云核算、大数据分析、人工智能等多种运用的运转。

08

摩尔线程

最近,证监会官网显现,摩尔线程智能科技(北京)股份有限公司(下称摩尔线程)在北京证监局处理教导存案挂号,正式发动 A 股上市进程,教导组织为中信证券股份有限公司。

摩尔线程也是国内仅有的在 B 端和 C 端均有布局的国产 GPU 企业,其芯片选用先进 MUSA 架构。

现在产品有 MTT S 系列显卡、MTT 系列 GPU 芯片、智算集群解决计划。MTT S 系列显卡包含 MTT S80、MTT S70、MTT S50、MTT S3000、MTT S4000。

MTT S80 被称为「国产游戏第一卡」,是国内仅有可以支撑 DX12 的消费级显卡。发布至今,该卡的 Windows 驱动现已迭代多个版别,已完结国内 TOP50 抢手游戏 100% 兼容,已追寻超越 400 款游戏的运转状况,累计正式适配和优化游戏 185 款。到 2024 年 10 月,MTT S80 在图形测验软件 3DMark 11 中的成果,已提高至 4.5 倍。

MTT 系列 GPU 芯片包含:苏堤、春晓、曲院。苏堤是我国首颗全功用 GPU 芯片,曲院则是根据摩尔线程自研架构的最新一代全功用 GPU 芯片,可以供给人工智能所需的综合算力,尤其是针对大言语模型练习和推理的处理才能。

此外,针对大模型练习,摩尔线程现已落地了全国产的夸娥(KUAE)智算中心全栈解决计划,从千卡智算集群到万卡集群计划。

09

结语

从现在的状况来看,部分国产 GPU 产品在功用上现已取得了必定前进,如壁仞科技的 BR100 系列 GPU,其峰值算力超越了英伟达现在在售的旗舰核算产品 A100 GPU 的三倍,并发明了全球通用 GPU 的算力记载,可以满意一些对算力要求较高的运用场景需求。

一起,一些国产 GPU 芯片选用了先进的制程工艺和封装技能,在提高功用的一起,有用降低了功耗。例如芯动科技的风华 2 号,在低功耗形式下作业功耗仅在 4w 左右,能效比远优于商场平等算力产品。

越来越多的国产 GPU 厂商意识到生态建造的重要性,并活跃与上下游企业、科研组织等打开协作,一起构建完好的工业生态。如摩尔线程与很多职业协作伙伴联合展现了根据其智算集群的丰厚职业大模型运用计划,推动了国产 GPU 在各范畴的运用和开展。

与英伟达、AMD 等世界巨子比较,国产 GPU 在全体技能水平上仍存在必定距离,特别是在高端 GPU 商场,国外产品在功用、能效比、功用完好性等方面仍占有优势。但饱经沧桑,方成正果。国产 GPU 的开展进程,也是其不断寻求技能前进的进程。

告发/反应

相关文章

扩张与洗牌并存 国产GPU厂商发力AI生态

证券时报记者 王一鸣前几年广受本钱追捧的GPU(图形处理器)这一硬核赛道正在步入洗牌期,一些本来备受瞩目的通用GPU规划企业先后堕入运营窘境。与此一起,有头部企业持续求新求变,已步入AI(人工智能)中...

“天才少年”创业国产GPU 一众明星本钱投了

近来,大模型芯片范畴跑出一名新秀,北京行云集成电路有限公司(简称“行云”)接连完结总额数亿元的天使轮及天使+轮融资,出资方包含多家头部战略方及闻名财政组织。《科创板日报》记者注意到,现在,国内GPU范...

友情链接: