“FPGA+ASIC”:优势整合型处理器会成AI芯片的主流吗?
作者:管理员
来源:本站
浏览数:0
发布时间:2019/5/31 9:21:30
AI应用场景的广阔性,让如今的CPU、GPU、FPGA以及ASIC几乎都能从中分得一席之地。但随着AI算法的持续演进,数值精度的选择也会呈现出更加多样化的趋势,这也为现有的AI处理器架构提出了新的挑战。若是不能与时俱进,紧跟算法技术更迭的脚步,最终只会落得被淘汰的终局。
要在AI芯片领域先发制人,硬件架构的创新必然最直截了当的途径。为此,Achronix近日正式对外公布了全新的“FPGA+”技术,将ASIC的优势属性融合在FPGA当中,令其即拥有如同ASIC那般的低功耗和低成本特性,又具备更简化设计的灵活性和增强功能,在各项性能上都远超传统FPGA的水平。
未来五年CAGR达38.4% 市场需求促FPGA与ASIC加速融合
如果抛去成本比拼性能,在CPU、GPU、FPGA以及ASIC四者之间, FPGA可以算是综合性能相对占优的解决方案。也正因此,市场上很多类型的AI应用都乐于采用FPGA来做芯片开发。据Semico Research 于2019年5月发布的数据报告显示,2018年,FPGA在AI应用市场创造了10亿美元的收入,从2019到2023年未,CAGR将保持在38.4%,2023年市场销售额有望超过50亿美元。
不过,这一切都要以FPGA不断加速创新为前提,以求在AI市场用更大的差异化优势来与CPU、GPU和ASIC抗衡。作为FPGA技术的领先企业,Achronix本次推出的Speedster7t系列,就创新性的在FPGA中融合了ASIC的技术,能够提供相比以往FPGA更强势的性能。
Achronix Semiconductor总裁兼首席执行官Robert Blake
Achronix Semiconductor总裁兼首席执行官Robert Blake在产品发布会上表示:“我们最新发布的Achronix Speedster7t是灵活的FPGA技术与ASIC核心效率的融合,它提供了一个全新的‘FPGA+’芯片品类,这代表了我们建立在四个架构代系的硬件和软件开发基础上的创新和积淀,以及与客户之间的密切合作。”
Achronix 融合FPGA与ASIC优势特性的Speedster7t
这种融合会否是未来AI芯片的演变趋势?针对这个问题,Robert表示:“目前,市场需要ASIC技术中拥有一些可编程的属性,而对FPGA这种可编程器件,也需要加入一些ASIC的低功耗等属性。所以未来,我们所看到的可能会向既不是传统的FPGA,又不是传统的ASIC方向去演变,这个市场会不断的改变并伴随更多的增长。对Achronix公司来说,我们既有IP,同时也有器件,如果客户做ASIC芯片需要有一小部分编程的属性,我们可以提供,想要FPGA拥有ASIC性能,我们也能够提供,这是我们很大的一个优势。”
AI芯片如何同时提升算力和速度?
任何一款AI芯片,一旦被拿来与同类竞品相比对,算力和速度必然是首当其冲。但光有算力和速度显然是不够的,随着AI芯片越来越多的强调存算一体化,尤其对于边缘计算这类端侧应用,存储和计算若能同时进行,无疑能够极大的降低数据延时,对提高芯片的整体效率大有裨益。
Speedster7t的MLP就是为此而生,Robert告诉记者:“Speedster7t的核心采用了全新高度可配置的计算密集型单元模块——MLP,即机器学习处理器单元。每个MLP中拥有大规模的可编程计算单元平行阵列,能够提供业界最高的基于FPGA的计算密度,并可以支持4到24位的整点格式和高效浮点模式。一个MLP可以同时实现32个乘法,比传统FPGA中DSP的效率要高5倍。”
提供高算力的MLP具体特性
高算力必然也需要大带宽的支持,据Robert介绍,Speedster7t器件是目前唯一支持GDDR6存储器的FPGA,每个GDDR6存储控制器都能够支持512Gbps的带宽。整个Speedster7t器件中有多达8个GDDR6的控制器,可以支持4Tbps的GDDR6累加带宽,并以很小的成本就可以提供与基于HBM的FPGA等效存储带宽。
这对于速度也会有很大提升,Speedster7t还有72个高性能的SerDes,可以达到1到112 Gbps的速度,Robert强调这是经过硅片实际验证得出的结果。而且,还带有前向纠错(FEC)的硬件400G以太网MAC,支持4x 100G和8x 50G的配置,每个控制器有8个或16个通道的硬件PCI Express Gen5控制器。为了应对400G以太网数据的处理需求,Achronix采用的是将数据进行分割并行处理的方法。
高带宽的二维片上网络NOC
除了用高算力的MLP和大带宽的GDDR6来提升效率之外,二维片上网络NOC的应用,也是Achronix从芯片内部来突破速度极限的关键点。据悉,NOC主要就是被用来提升芯片内部数据流通的速度,这种方式在传统的FPGA线路布局上做出了极大的改变,它是采用片上网络的模式,类似3D结构的高速公路,通道之间的数据能够快速流通且互不影响。
具体来讲,Robert Blake解释到:“专用二维NOC极大地简化了高速数据移动,确保数据流可以轻松地定向到整个FPGA结构中的任何自定义处理引擎。其中每一条通道,我们都是采用了256个Byte的走线,同时可以跑2GHz的速度。所以,每一条通道我们会有512G的带宽,但是我们每一个都是来回且相向的。所以,相向的话,乘以为倍数我们能够达到1TB的速度。但如果采用传统的FPGA走线,如果有200多条线的话,每一条线要达到2GHz的速度是不可能的,最多只能够达到300MHz。”
CPU、GPU、FPGA和ASIC 究竟谁会成为AI处理器的主流?
从AI芯片市场爆发之日起,业界一直对CPU、GPU、FPGA、ASIC谁将会是未来AI处理器的主流争议不断。而这次,Achronix创新性的将FPGA和ASIC的优势融为一体,显著降低功耗和成本的同时,也能提供基于FPGA的可编程能力,这是否也意味着更多的融合方案会逐渐取代单一的AI处理器架构,成为市场的主流?
对于这个问题,Robert认为:“每一类芯片都有其技术长处,并且AI芯片的市场在不断增长,所有的芯片类型都会从中受益,所以我认为未来会是一个多种方案并存的局面。就FPGA方面来讲,我们比较看好的应用会是语音、网络加速以及机器学习,这是我们器件方面的主要应用;如果是IP产品的话,我们认为主要还是5G、无线以及汽车ADAS这类市场,以及在存储器内部也会有需要加入运算的功能,让器件更灵活,这样就可能需要一些编程的能力。”
由此看来,FPGA未来在AI领域的市场前景仍是相当可观的。更何况,Achronix的FPGA如今已经具备了“FPGA+ASIC”的双重优势,想必这在接下来的AI芯片市场中能够保持非常高的竞争力。毕竟,差异化是一个很大的优势,相信“FPGA+”的这种差异化,也会引发AI芯片技术的又一轮创新热潮,并持续引领AI处理器向多方案融合、优势互通的方向演变。