Asp站长网 www.AspZz.Cn表示5G具有灵活的前导码,以满足低延迟连接的需求。随着边缘计算需求的增长,现有的回传网络处理速度无法匹配5G网络数据产生的速度和容量需求,需要在边缘部署新的、更快和更高容量的路由。
 
5G虚拟化网络功能需要高度分布式的数据中心。这类数据中心可以部署足够多的服务器,在运行5G网络的同时运行边缘云服务。
 
将工作负载置于边缘要求对应用构建和运行的方式进行调整,让代码可以从数据中心的服务器到客户场所设备中的微控制器。需要管理高度分布式的应用和数据,编排大规模的边缘操作。(云原生技术和DevSecOps技术)推送到边缘的代码应该是自包含的,每个组件必须完整,包含代码、配置、库以及软件定义的环境,代码作为一个整体构建、测试和部署,确保容器或虚拟机可以在任何地方运行。
 
DPU的出现
在云基础设施领域,CPU用于通用计算,构建应用生态,虚拟化技术例如Hypevisor等占用大量的内存和CPU资源,而真正用作共享的资源受到较大的影响。以网络协议处理为例,解析报文需要接近100个cycle,线速处理10G的网络需要约4个Xeon CPU的核,单做网络数据包处理,就可以占去一个8核高端CPU一半的算力。而GPU用于加速计算,专注于图像处理、流媒体处理,并继续朝着AR、VR处理,AI加速的方向发展。在云基础设施领域,需要一种技术,能够卸载CPU负荷,最大限度的将硬件资源共享给租户。
 
十年前,网络处理器(NP)主要用于包处理、协议处理加速,应用在各种网关、防火墙、UTM等设备上,多采用多核NOC架构。后来Intel推出了DPDK技术,在用户空间上利用自身提供的数据平面库手法数据包,绕过linux内核协议栈,极大提升了包转发速率,原来需要NP来实现的网关类设备,现在X86就能满足性能要求。而DPU则是5G时代集网络加速为一体的新型数据处理单元。DPU内部融合了RDMA、网络功能、存储功能、安全功能、虚拟化功能。接手CPU不擅长的网络协议处理、数据加解密、数据压缩等数据处理任务,同时兼顾传输和计算的需求。DPU起到连接枢纽的作用,一端连接CPU、GPU、SSD、FPGA加速卡等本地资源,一端连接交换机/路由器等网络资源。总体而言,DPU不仅提高了网络传输效率,而且释放了CPU算力资源,从而带动整体数据中心的降本增效。
 
1950年以来,CPU是计算机或智能设备的核心
 
1990年以来,GPU登上舞台
 
而5G的时代是数据革命时代,也是DPU的时代。
 
什么是DPU
DPU是相当于智能网卡的升级版本,增强了网络安全和网络协议的处理能力,增强了分布式存储的处理能力,将软件定义网络、软件定义存储、软件定义加速器融合到一个有机的整体中,解决协议处理,数据安全,算法加速等计算负载,替代数据中心用于处理分布式存储和网络通信的CPU资源。
 
DPU本质上是分类计算,是将数据处理/预处理从CPU卸载,同时将算力分布在更靠近数据发生的地方,从而降低通信量,涵盖基于GPU的异构计算,基于网络的计算(In-NetworkComputing)、基于内存(In-Memory-Computing)的计算等多个方面。DPU定位于协同处理单元,是数据面与控制面分离思想的一种实现,其与CPU协作配合,后者负责通用控制,前者专注于数据处理。在局域网场景下DPU通过PCIe/CXL等技术连接同一边缘内各种CPU、GPU,广域网场景下主要通过Ethernet/infiniband等技术实现边缘与边缘间、边缘与云之间的连接。
 
DPU包括特定的报文处理引擎,如P4、POF等,此外还包含ARM等协处理器能够处理路由器场景中的大量分支预测。具备低延迟的交换能力,能将不同类型的数据包快速分发给不同的处理单元。
 
基于DPU的网络处理模块是完全可编程的。相比于ASIC,DPU能随着网络、协议、封装和加密算法的快速变化,以软件的速度改变硬件的能力。通过DPU提高每个网络节点上的计算能力,相比标准网卡,同等算力所需的服务器数量更少,降低了前期成本、空间、电力和散热的要求,DPU会降低大规模部署网络服务的TCO。
 
DPU将成为新的数据网关,集成安全功能,使网络接口成为隐私的边界。可将开销巨大的加解密算法如国密标准的非对称加密算法SM2、哈希算法SM3和对称分组密码算法SM4,交由DPU处理。未来,随着区块链技术的成熟,共识算法POW、验签等都会消耗大量的CPU算力也可以固化在DPU中。
 
DPU将成为存储的入口。分布式系统中NVMeof协议扩展到InfiniBand或TCP互联的节点中,实现存储的共享和远程访问。这些数据流的协议处理可以集成在DPU中,作为各种互联协议控制器。
 
DPU将成为云服务提供商管理资源的工具,云服务提供商将云资源管理占用全部下沉至DPU,将CPU、GPU全部释放出来,作为基础设施提供给云租户。提供者与使用者两者之间的资源严格区分,管理界面清晰,方便使用。
 
DPU实现的方式:
不同厂商DPU实现方式不一:
 
Marvell收购了Innovium,提供面向5G的基带处理 DPU,其OCTEON 10系列DPU,采用台积电5nm制程,首次采用ARM Neoverse N2 CPU内核;
Netronome,其NFP4000流处理器,包括48个数据包处理内核和60个流处理内核,所有这些内核都可以通过P4编程;
Pensando其Capri处理器具有多个可编程的P4处理单元。
Fungible,其DPU基于MIPS,面向网络、存储、虚拟化,包含52个MIPS小型通用核以及6个大类的专用核。
英伟达 2019年3月,收购以色列芯片公司Mellanox,其推出的BlueField-2包括8个ARM Cortex-A72核及多个专用加速核区域。DOCA(data center infrastructure-on-a-chip Architecture)作为 DPU上的软件开发平台,提供标准API,将驱动程序、库、示例代码、文档和与包装的容器组合在一起,支持基于DPU应用和服务的快速开发。
 
英特尔,收购了深度学习芯片公司Nervana System,以及移动和嵌入式机器学习公司Movidius,将CPU与FPGA结合在一起构建DPU。提供DPDK(Intel Data Plane Development Kit),为用户空间高效的数据包处理提供库函数核驱动的支持,通过SR-IOV技术,实现不同应用通过DMA直接与PCIe设备一起工作。FPGA扩展到300万个逻辑单元,可以与其他处理模块一起实现网络、内存、存储和计算。
 
Broadcom基于Arm实现DPU,主要面向交换机、路由器芯片。以NetXtreme E系列控制器为基础,搭载TruFlow技术,推出了Stingray SmartNIC。
 
Xilinx 2019年收购了solarFlare,其最新发布的Alveo SN1000系列基于 16nm UltraScale+FPGA架构,容量为100万个LUT,包含一个NXP的16核ARM处理器,可以在FPGA上每秒处理400万个状态连接和1亿个数据包。其solarFlare onload(TCPDirect)功能应用于全球90%的金融交易所。
 
AWS Nitro,采用了网络卡、存储卡、控制器卡多卡形态来实现DPU功能。收购了以色列芯片上Annapurna labs。
 
阿里云,推出了MOC卡产品,集成了志强D处理器、FPGA,是一种单卡形态产品。

dawei

【声明】:九江站长网内容转载自互联网,其相关言论仅代表作者个人观点绝非权威,不代表本站立场。如您发现内容存在版权问题,请提交相关链接至邮箱:bqsm@foxmail.com,我们将及时予以处理。