《智能网卡行业概览(2021).docx》由会员分享,可在线阅读,更多相关《智能网卡行业概览(2021).docx(17页珍藏版)》请在三一办公上搜索。
1、智能网卡(SmartNIC)行业概览(2021)CPU算力增长速度与数据中心网络传输速率增长速度差距逐渐拉 大,催生了智能网卡的需求。后摩尔时代下,CPU算力无法按照摩尔 定律增长,提升遭遇瓶颈,而数据中心网络向高带宽和新型传输体系 发展,其网络传输速率迈向100Gbps,且未来快速向200Gbps与 400Gbps 发展。智能网卡作用为灵活卸载CPU不适合的处理任务,满足数据平面 网络处理需求并兼容现有网络协议生态。其核心作用在于减轻CPU算 力负担并让其处理更重要的任务。而传统的网卡仅负责数据链路的传 输、网络堆栈算法和协议,其他如存储、网络加解密和安全等功能会 占用大量CPU资源。智能网
2、卡理论上可基于FPGA、MP与ASIC三类核心处理器进行设 计,而已商用的智能网卡产品形态为ASIC+GP和NP+GP,基于不同 核心处理器的智能网卡类别及其特点。维于ASIC:设计的智健网卡U基=7输亡iS计的曾陇同卡门崔悚高,您罔燃也快长,希鬟两年左右的开 生国期.中耳互奈度的ASIC前期研发 成本在几百里网平万差元不绪.H具由咨富姓畦在我注义宛理内时 歌据平面近E煽日Jt理,并投崔勺甲 葩度向的硬忏加速玄持.如枇目使用口民无怪可实H &成事的辰T r fJH43 *tA5C *发捽算力优皆,但在新密用肪息下治五页;S的 可金6性-从丽童1?素0芯且阳货立间耳可跄田 较任.蚓间雨忒有此更化
3、.住鼻十用括苴已玺藩 后于新的软怦南事+接亍FPGA设计的智鹿雨卡J垦于叩逐遗计的笛能网1?可卅恨宓太 的计尊隹力粕足够的灵污壮.ffiTfe 拒质兑定献化的特性.FPGA可同时利 用煮隼些并行、板裾并行和询求并行 来辟色玫退并提花在吐园。flffliE.印皿布轼于GLI和OL 曾基于指令集的处理龈在滞式订茸上 具有疣E忧封;-I只与王期耗“ FGA柜驻j ASICMP 4L理as功均5成J 具牛理盅H FPGa 1JHVHDL1LV?I ilcgStJ! 件揩谣迎有查行4W. Mias的抽*是玄就低, 瞄笙I.虹3开W裔不JEiL FPGA开发有校柱第三方厂iBJfl共混周IP帙,其同买程开
4、技成本十牙矗鼻.u up即 yii-i.cor&. Sioc-fePfosoc-HP- Rffi.笠NVIDIA收购豹MeliancM具七与可偏旌性.50C-GP和5OC-HP怕质于F PSA有tst鸟的可琉琏性.口性健筮 50C-GP50C-NPfr?STfPGAl4辟盘购差.箸;智能计算芯世界的 3ueFEldJB?i.哭出的SRASlC+GP的 留徒胃卡,保正了一定的可斯艳荏 Mffia 了一走的性黄,全球智能网卡行业未来五年新增市场规模逐步攀升,主要得益于 智能网卡方案的逐步成熟,叠加全球通用服务器出货量的稳定增长以 及L3级别智能驾驶汽车的技术落地。中国智能网卡新增市场地模及预测,2
5、020-2025年W:华美市中国君能时卡市场貌K I按营收讨)年厘台潭长军5551%中国智能网卡行业在2023-2025年迎来高速增长,主要得益于新轮服务器在网更新周期及各类云应用普及率的提升中国智能网卡 新增市场规模及预测。中国互联网+云计算厂商更偏好采用中国自研 的智能网卡产品,而非北美厂商如lntel、NVIDIA、Broadcom等,但中国厂商在技术上与北美厂商存在较大差距,且中国厂商缺乏商用经 验,其产品大多停留在实验室阶段,量产存在困难。同时,不同厂家 技术方案差异化巨大,导致服务器升级改造时易出现硬件不兼容的情 况。智能网卡产业链为从上游软件侧EDA、IP核、硬件侧的制造和封 装
6、到中游智能网卡的集成和供应,再到下游云计算、通信和智能驾驶 领域的应用。EDA工具软件可分为芯片设计辅助软件、可编程芯片辅助设计软件、系统设计辅助软件等。Synopsys、Cadence、Mentors约占全球EDA市场份额的80%,占中国市场份额的90%。佃点甯等以fpg a可立为! 口 IP15l-34Sc=SH 申Jt用怛事为复菜的肪 计可懂改整tt 的围I堆.主塞君三神右: 占金舟堪院 国茁IP核将一些在数字电路中常用但较为复杂的功能块设计成可修叩房工且毋.哗可丹为K H设计誓的款H -可竭 既Z片域的改il我忙, 矛块保计苦的此悴号. Syncfss- Cadence . UiWEE
7、豹占全日iFD* 南某由Hi的皿.占等BROADCOMInFUNGIELE 抛 HUAWEI4EBU LAMATHk.官 n IS U TH W L W IB i5 K hyniM ti旬Q1DK9E不髯*:煎!布炉冒 fit有卡尸品慕冒海摆 快腐胁吝片.改参数的模块,主要有三种存在形式:HDL语言形式,网表形式和 版图形式。ARM占全球IP核市场份额的40.8%。智能网卡上游EDA软件主要应用在可编程逻辑芯片设计中,其市 场已在全球范围内形成较为成熟的竞争格局,EDA三巨头通过兼并 收购持续扩大规模并占据全球80%市场份额。FPGA芯片设计流程EDA软件主要应用在可编程的逻辑芯片设计中,如F
8、PGA芯片的设计输入编琴HDL代码功能仿真蜀仿真编辑器芯片设计文件仿真矗 序 适配器a如真文件艮壁土垂通S世羿成功成功设计。其设计流程主要为7个步骤,分别为设计准备、设计输入、功 能仿真、逻辑综合、布局布线、时序仿真、编程下载与硬件测试。整个芯片设计流程需要用到的EDA工具有设计输入编辑器、仿真器、HDL综合器、适配器和编辑器。整个过程需要不停低迭代,直到EDA软件行业在全球范围内已形成成熟的竞争格局,三大EDA巨通过功能仿真和时序仿真验证。EDA软件全球市场份颔synopsys*cadenceSi Iva cdSILVACO华大久天ANSYS头Synopsys、Cadence和Mentor占
9、据全球80%的市场份额。三大EDA 巨头总体在逻辑综合工具、时序分析工具、模拟/混合信号定制化电 路、版图设计、布局布线工具相较于其他EDA软件开发商有着绝对的 优势。智能网卡上游封测环节为集成电路制造的后道工序,对提升智能 网卡芯片的稳定性及制造水平尤为关键。未来高端集成电路国产化替 代空间大,中国本土封测厂商市占率有望提升。集成电路制造工艺流程芯片设计 I晶圆制造 封装测试逻辑电蹈:-光罩制作、护膜-切割-电路设计:i 切片;装片图像设计研磨焊纹-验证设计J氧化i 塑封-光罩校准-盖印i 蚀刻-切筋成型! 扩散-成品刑试(FT)i -离子植入-化学气相沉积-电机金底煮是i -晶圆秘删(cp
10、) : ;.? 音噩计舁芯也界封测为ic制造的后道工序,分为封装和测试,是提高IC稳定性 及制造水平的关键工序。封装环节是将引线框架上的集成电路焊盘与 引脚相连接以达到稳定驱动集成电路的目的,并用塑封料保护集成电 路免受外部环境损伤;广义半导体测试工艺贯穿ic设计、制造、封 测三大过程,包括验证设计、晶圆检测CP)和封测环节中的成品检 测(FT)。智能网卡产线的萌生受到数通市场需求的强驱动,其将网络、存 储、操作系统中需要高性能的数据平面卸载到智能网卡以降低数据中心税,让CPU集中精力于客户的应用程序。数据中心是进行大规模计算、海量数据存储和提供互联网服务的 基础设施。近年来,人工智能和大数据
11、的兴起对算力的要求激增,然 而,在后摩尔定律时代,CPU算力增长放缓,需要新的体系结构以增 强其算力、网络传输等方面的性能。同时,相比数据中心,云数据中 心的应用类型和用户交互方式更丰富,硬件更加定制化。资源虚拟化、 分布式计算、定制化计算和细粒度计算是云数据中心的四大趋势。数据中心应甲需求大据、AT 智能应用需求适用地理翠 性隘提升辕慢敝据中心 云应用需求产生在四大趋势下,从虚拟网络、网络功能、操作系统和数据处理四 个方面产生的除用户应用程序外的数据中心税不仅浪费了 CPU资 源,还导致应用程序无法充分利用硬件的低延迟和高吞吐量。将虚拟 网络、网络功能、操作系统和数据处理等功能卸载至智能网卡
12、上进行 处理,对现代数据中心的性能和成本有重要意义。数据中心分布式计算催生了高性能数据中心网络,而虚拟化、网 络功能、操作系统和数据结构处理伴随着巨大性能开销。数据结构处理中,键值存储通常基于哈希表实现,高性能键值存储系统的数据中心税吞吐量瓶颈可归因为键值操作中的计算和随 机存储器访问中的延迟。基于CPU的键值存储需花费CPU周期来进 行键比较和哈希槽计算,KV-Direct可将键值处理从CPU移动到智能 网卡上进行。“散据中心税”拆解+杰程间*信包括堆感栈宅.A 享肉存,共辜悒号 毛河云原诏系场中多个*毋丸 辜计*. 存智能计算芯世界基于虚拟交换机的网络虚拟化模型中,虚拟机发送和接收的每个
13、数据包都需要由虚拟交换机(vSwitch)处理,与非虚拟化环境相比, 这种额外的主机处理会降低性能和吞吐量,增加平均延迟,并增加 CPU的使用率。虽然软件实现的虚拟交换机和网络高层次虚拟化功能可以使用 更多数量的CPU核来支持更高的性能,但这会加大资产和运营成本。 把硬件资源抽象成顺序读写的套接字连接。存储被抽象成文件系统。对于分布式应用程序普遍使用操作系统中的套接字原语进行通 信,而对于HTTP负载均衡器、DNS服务器、Redis键-值存储服务器等通信密集型的应用程序,操作系统占用了 50%至90%的CPU时间, 大部分用来处理套接字操作。数据中心低延时、高带宽的网络服务,以及虚拟网络转发性
14、能提 升的迫切需求驱动着智能网卡的发展,在网络协议和硬件卸载等方面为CPU释放宝贵资源。智能网卡协议地理智能网卡卸载QVS前应转权率对比 如眼场景Non-WLAN臻说智能网卡作为一种有编程能力的网卡,可以快速处理网络协议, 提供高效的网络I/O。传统的网卡仅支持标准以太网或Infiniband 中的一种网络协议,而智能网卡除了传统TCP/IP协议,还支持RoCE v1/v2、iWARP等加速数据通路的协议,进而从CPU上卸载更多网络 协议处理到网卡上,在数据中心中也能提供低延时、高带宽的网络服 务。云计算场景下的虚拟化技术需要靠软来实现Hypervisor,但伴 随巨大的性能开销。虚拟机和物理
15、机仍存在较大的性能差距,阿里云 和亚马逊等云厂商将虚拟化、网络、存储等相关组件卸载到智能网卡 上,从而消除虚拟化、网络和存储组件带来的开销,提高虚拟机的性 能。MEC加速需求场号智能阿卡加速方案NFVIJsOVS加速OV$g 仲柱汨.世盗景SDN控制*范流泰配骂单 .野渔曩配置写入球悝庠.更新到OVS- dataparh, 04曲沪止散番通通下滩也能用卡, 可节*科司牢的cpu.u ME匚应用时基翩设腌忸的碧迂时、岛速率持我性律玉很禺 的蜜求.拌实坡力E1升的羔械为联群,歇摒并行把理靓为 提升的美镇花概鼓.后厚般时代匚PLI的畿存和核段增长纹 ffi.引人智鸵耳卡可笑既普发忡陀和反裾处卷能力杼
16、升的U虚川化同户面W:下氟到MFC,降低待桁时邕 成少带弗盅扒化用户茵师叽适主罪是粘乖(GPR55iifi协 占屈.实现软破窣辈.但相附于忤烧专用适忏性筐有所下过)业害卸找右向一条检据洗的后设牡据掴文内降,时于超低廷时的应用祀业务无法满足其11谁贫求,亦 若能向卡推收,常包.处理后宜眨站座,适值节 可引入我鸵河卡作为琪件加速。点曲磐折蛀理屐次,粗煎。VNFJS虚拟化 用户面加速5G技术要求网络实现大容量、大带宽、大联结、低延迟、低功 耗驱动了智能网卡在边缘机房部署的可能。在当前网络架构中,核 心网部署在远端,传输时延较大,且无法满足5G时代下数字化和智 能化对算力的高要求。为了分担终端算力,将
17、算力向云端移动,同时为了降低时延,将 业务向边缘移动。MEC部署在网络边缘,可以减少数据传输过程中 的转发和处理时延,并降低终端成本。但随着各种业务和应用汇聚在 边缘端,导致MEC边缘云的计算开销激增,而边缘机房的供电、散热 及承重能力有限,无法通过堆加大量的X86 CPU来提升算力,且CPU 性能已无法按摩尔定律增长。中国智能网卡厂商硬件性能较国际巨头差距较大,落后原因为技 术积累不足以及上游EDA和先进制程工艺被外国掌控;智能网卡软件 行业进入门槛较低,但中国本土企业创新速度同样落后于国际巨头智 能网卡硬件壁垒。智能网卡硬件壁垒1于*于 颂5ms4蹄龄m乃加心 IBGbg 4睥Gbp5MO
18、Gb玳ms智能网卡软件壁垒中国网络芯片的传输速率落后国际巨头1 -2代,停留在10Gbps。中国网络芯片时延为5ms左右,与国际巨头NVIDIA和Boradcom的网 络芯片时延高2-4ms。落后的主要原因为高传输速率的网络芯片是基 于调制解调模型QAM完成的,而中国本土企业对OAM算法优化程度不 足,难以开发高速率网络芯片;另外,25/40Gbps的网络芯片采用的 是10/14nm制程工艺,研发周期超过2年且研发成本超千万,初创企 业难以负担。中国处理芯片如FPGA门级数停留在千万级,制程为28nm,而国 际巨头FPGA先进制程为7/10nm,门级数过亿。落后的主要原因为中 国缺乏EDAX具
19、,不能支持门级数过亿的设计工作,且美国对中国施 加EDA出口限制;另外,14nm处理芯片产线开工成本高、若无一定订单量支撑,芯片代工厂难以投产。处理器芯片渠道壁垒智能网卡处理器FPGASoC ASIC自研 外购 ARM指令集 RISC-V探理喧国自裾性舞藩后万悬爵敏值焚ARMNWDfA联购,指令集不成熟球技术封锁中国芯片产业起步较晚,过个环节受美国制约,导致中国本土企业自研FPGA的性 能远落后于国际巨头。而外购FPGA则是在FPGA基础上集成驱动与功能软件,最后 卖给客户。云计算和互联网大厂软件研发实力强乳可自己采购FPGA再研发自己 所需要的功能口智能网卡企业若选择SoC技术路线,则需要像
20、ARM公司授牝ARM被NVIDIA收购 后.未来中国本土企业可能面阳技术封锁,而RISC-7指令集虽然开渡.但是缺少 相匹配的EDA,整体生态不成熟。初创企业初期会使用FPGA或SoC作为主流产品,之后不断改进需求再集成相应功 能寸待需求清晰且功能与之柜匹醇后一 口根据客户需求使用ASIt?:.霸能计算芯世界智能网卡功能的实现如VxLAN、RDMA、DPI等功能的开发难度相对较低,只需要研发团队对汇编语言和底层协议熟悉即可,但功能的创新研发速度相比国际巨头至少落后半年,市面上的硬件与虚拟操作系统版本众多,智能网卡企业难以做到同时兼容所有版本。1、英伟达(NVIDIA)全球可编程图形处理技术领袖
21、,是GPU(图形处理器)的发明者,也是人工智能计算的引领者。英伟达2020Q1营收同比增长83.8%,游戏业务和加密货币为主要推动因素。CannectX-7 25/50/100/200/ 400G SmartNICCannectX-6 Dx 10/25/50/100/200G Sm artNICCannectX-6 Lx 25-50G SmartNICCcnnectX-6 10/25/50/100/200G SmartNIC来源:Wind.公司官网,头豹研究院编辑整理英伟达2021年Q1营收为56.6亿美元,同比增长84%。英伟达 拟以400亿美元收购Arm,Am的芯片设计IP被广泛应用于各类
22、终端 市场,在全球移动芯片市场中,Arm架构占比超过九成。收购Am可 让英伟达利用其数据中心智能网卡方面的领先地位,开创一个基于 Arm架构的服务器解决方案新时代,但目前此笔收购存在巨大不确定 性。数据中心业务连创新高英伟达自收购Mellanox以来,其数据中 心产品表现强劲,下游客户对以太网和InfiniBand需求旺盛。数据 中心业务已连续6季度营收创历史新高。2、英特尔(Intel)半导体行业和计算创新领域的全球领先厂商,其SmartNIC C5020X和N5010智能网卡可将交换、存储和安全等功能从服务器CPU 上卸载并释放CPU资源,提升数据中心性能。英特尔微处理器包括 Itaniu
23、m, Xeron, Pentiumlll及 Celeron 等著名的品牌。InventecFPGASmartNICC5020X-d X 设可安英点台 -Irltm 启晚初初龙聂斯L - “新5清求架储合尔e-喋 -尝匚为需的存整特clln -ZNIC机希割英E_ -于rt 萄宅知窗和况- -基F肉牛侦丽- -品S魅鳖祯熊於PG酬蛀一 -产部箱家容拙挤奖廿 -演和野匕1L钉混龈鼾- L 山1 Hl 1E 呻Siliccm FPGA SmartNJCN5D10来渥:Wind.公司宜网,头豹研究院编侑踏I谖产品允许电信设卷制造商OEM)、| 虚拟网塔功能(VNF厂商、系统集I .成商和电信运营商的数
24、据中心架梅II师却网堵工程IS队提升网络性能,.释蹒艮务器CPU罔朋来执行创收型I工作负追二,一英特尔公司业绩整体表现疲软,主要原因为上游云厂商库存去化 和资本开支放缓,以及政企客户需求降低。针对数据中心的10nm至 强可拓展处理器IceLake也进入交付阶段。英伟达与英特尔智能网卡产品对比NVIDIAIntel最新产品BiueFtldZ (SoC)SmartNIC N5010(FPG/1J芯片传输遮革10(X1 (Mellanox CffnnectX-6)iOOG |lntElE810-CAMlNNLj传布时延1msNinW处理器 芯片8 ARM棱Intel Stratix 10 DX 21
25、00 FPGAst理游吞吐微40 OG512G |16*3ZSJ制程工艺14nrr/I:.蜒计算芯世界英特尔2021年Q1营收为196.7亿美元,同比下降0.78%。英特 尔针对数据中心研发的最强数据中心处理器Ice Lake正式发布并进 入交付阶段。其采用10nm制程工艺,并搭配英特尔傲腾持久内存与 存储产品组合、以太网适配器、以及FPGA和经过优化的软件解决方 案,可在数据中心、云计算、5G和边缘计算等领域提供强大的性能 与工作负载优化。Broadcom NetXtreme-S BCM5B800来源:Wind.公司官网,头豹研究院编辑整理一二 智能计算芯迓界3、博通(Broadcom)全球
26、领先的有线和无线通信半导体公司,前身安华高科技(AvagoTechnologies)收购芯片制造商博通公司(Broadcom);其智能网卡BCM58800采用了 TruFlow技术,可在硬件上卸载OvS以及实现SDN 等功能。博通智能网卡产品LW SB99*- 40WR Rl W 一 Ri Broadcom NetXtreme S系列BCM58BOO系列数据中心System-on片(3oC)器件专门用于在不i;断发展的数据中心中实现解决方案口BCM58B00器件采用NetXtreme E系列高级网络控制i| 器,高性能ARM CPU模块.PCI Express (PQe)| G如3接口.用于计
27、算卸栽的关键加速器和包括L3,缓存和。DR4接口的高速内存子系统,所有这些都|通过一致的片上网络(NOC)结祠互连勺;博通主营构成为有线基础设施和半导体及相关产品,销售毛利率 稳步上升,其在路由器和交换机芯片市场份额第一,但在服务器处理 器布局较少。英伟达与博通智能网卡产品对比NVIDIABr DadtQTi最新产品BlueField2 (SoC)Stingray Adopter (g网络 芯片传输速率100G (Mellancw CQnrwctX-6)1O(H3 (ar Dad com MctXtrcme-5 BCM56600)1悻输时延Ims2-3mE烛理器 芯片处理旃 芯片吝吐坦核400G8 ARM校制程工艺14nm毛倒能计支芯世界博通2021年Q1营收 为132.65亿美元,同比增长14.35%。博 通业绩增长的原因之一或为在半导体领域多次并购整合优质资源后 显现成效。博通在路由器与交换机芯片市场份额第一,但在服务器处 理器的布局较少。博通发挥自身在网络解决方案的优势,抢夺智能网 卡市场,填补其在服务器处理器空白。