首页 行业 最新信息 查看内容

430亿晶体管,1020万逻辑单元,英特尔发布全球最大容量FPGA

2019-11-8 01:45| 发布者: | 查看: 84| 评论: 0

摘要:   晓查发自望京  量子位报道公众号 QbitAI  11 月,英特尔将在全球各地举办 FPGA 技术日,北京是第一站。在第一站的活动中,英特尔发布了全球最大容量的全新 FPGA:Stratix 10 GX 10M FPGA。  这款 FPGA 包 ...

  晓查 发自 望京
  量子位 报道 公众号 QbitAI

  11 月,英特尔将在全球各地举办 FPGA 技术日,北京是第一站。在第一站的活动中,英特尔发布了全球最大容量的全新 FPGA:Stratix 10 GX 10M FPGA。

  这款 FPGA 包含 1020 万个逻辑单元,430 亿个晶体管,并且采用了英特尔的 EMIB 封装技术,将多个晶片封装在一起。

  该产品是全球密度最高的 FPGA,现已量产。多家客户已经收到全新的英特尔 Stratix 10 GX 10M FPGA 样片。

  Stratix 10 FPGA 在 5G 网络、人工智能、ASIC 验证上都有广泛地应用,未来几周内将会有合作伙伴公布与英特尔的合作计划。

  现在,已有微软 Bing、Azure 云以及英国软件公司 VMWare 与英特尔在 FPGA 加速方案上展开合作。

  密度最高 FPGA

  英特尔 Stratix 10 FPGA 是全球密度最高的 FPGA,拥有 1020 万个逻辑单元,其密度是英特尔之前密度最高 FPGA 设备的的 3.7 倍,后者为原英特尔 Stratix 10 系列中元件密度最高的设备。

  因为自有的 EMIB 技术让英特尔得以设计、制造并交付目前世界上密度最高、计算能力最强的 FPGA。

  使用 EMIB 技术将I/O和内存单元连接到 FPGA 构造晶片,从而实现了英特尔 Stratix 10 FPGA 家族的规模和种类不断扩张。

  这些技术让英特尔能够通过整合不同的半导体晶片,包括 FPGA、ASIC、eASIC、3D 堆叠内存单元和光子器件等,用于将几乎任何类型的设备整合到封装系统 (SiP) 中,以满足特定的客户需求。

  英特 Stratix 10 FPGA 设备集成了 8GB 或 16GB 的 3D 堆叠 HBM2 存储单元,具备 PCIe 4.0 兼容能力。

  之后,英特尔还发布了为数据中心打造的 Agilex FPGA,这是一个全新的产品,这款产品是基于英特尔最新的 10nm 技术。

  在性能上相比前代产品有巨大的提升,在性能上提升了 40%,功耗降低了 40%,算力达 40TFLOPS,并且支持下一代内存技术 DDR5 和傲腾内存,以 PCIe Gen 5 与英特尔 CPU 进行通讯,数据传输速率达 112G。

  英特尔表示,Stratix 10 FPGA 和 Agilex FPGA 与英特尔原来的硬件技术也有紧密的结合。

  至强处理器 +FPGA,提供了面向特定工作负载的软件堆叠优化。

  英特的傲腾技术,为 FPGA 提供一个内存层,从而支持更高容量、更低延迟的方案。

  在传输方面,Stratix 10 可以实现数据的快速移动,支持 100G 以太网传输。

  这些 FPGA 技术为 AI 系统提供了优化,在加速语音识别、视频处理方面优于其他传统解决方案。

  使用英特尔 FPGA PAC D5005 产品进行语音处理,功耗比 GPU 产品低 6 倍,延迟比 GPU 低 29 倍,而吞吐量高 48 倍。此外英特尔还提供 Arria 10 GX FPGA 为视频分析提供加速。

  补上 oneAPI 的 FPGA 拼图

  前不久,英特尔在北京的一场技术分享会上公布了一些“oneAPI”的技术细节。

  顾名思义,“oneAPI”的目的就是提供统一的编程模型,简化在不同硬件架构上的 AI 程序开发工作,让开发者用一套源代码创建适用于不同硬件的 AI 应用程序。

  早在去年 12 月,英特尔就推出了“oneAPI”,并将于今年 11 月下旬发布开发者测试版本。

  目前在人工智能计算上主要有 CPU、GPU、AI 加速器和 FPGA,分别用于标量、矢量、矩阵和空间运算。

  开发者需要为不同工作负载选择合适的硬件架构,不同架构的硬件之间缺少通用语言和 API,造成每个平台的 AI 开发者都需要提供额外的软件资源。

  英特尔基于行业标准和开放式规范,提出了 oneAPI,让开发者可以在不同架构上获得统一的软件开发体验。

  英特尔在这四种芯片上均有涉足,今天随着 Stratix FPGA 和 Agilex FPGA 的推出,英特尔顺势公布了基于 FPGA 的 OneAPI。

  基于行业标准和开放式规范,开发者可以在不同架构上获得统一的软件开发体验。

  考虑到不同平台语言的不统一,英特尔还为 oneAPI 加入了一个配套的直接编程语言数据并行C++ (DPC++),它基于C++,通过社区项目提供语言增强功能。

  针对 FPGA,英特尔还在 oneAPI 中提供 Vtune 分析器,它能在运行时收集数据,帮助用户分析 CPU 和 FPGA 数据交互效能。

  现在已有 GPU、AI 加速器等专门用于 AI 的芯片架构,为何要在 FPGA 开发 AI?

  英特尔表示,FPGA 空间架构提供了数据和任务的并行性,帮助用户显著提升性能。FPGA 的优势在于低延迟,直接将数据读取和写入在具有内存属性的片上内存结构里。


鲜花

握手

雷人

路过

鸡蛋
毒镜头:老镜头、摄影器材资料库、老镜头样片、摄影
爱评测 aipingce.com  
返回顶部