首页 行业 最新信息 查看内容

最强AI训练集群华为Atlas 900首个外部应用正式发布

2019-12-1 00:29| 发布者: | 查看: 150| 评论: 0

摘要:   作者:包永刚  两个月前的全联接大会上,华为发布了目前全球最快的训练集群 Atlas 900。不过,设计和制造出强大的硬件对于硬件提供商而言并非最困难的事情,能否将其应用于不同领域体现出其价值才是成功的标志 ...

  作者:包永刚

  两个月前的全联接大会上,华为发布了目前全球最快的训练集群 Atlas 900。不过,设计和制造出强大的硬件对于硬件提供商而言并非最困难的事情,能否将其应用于不同领域体现出其价值才是成功的标志。

  本周五,鹏城实验室联合华为在深圳发布鹏城云脑Ⅱ基本型系统发布会,这是 Atlas 900 第一个外部应用案例。这不仅代表着华为鲲鹏和昇腾双引擎计算战略的向前迈进,也是华为在 5G+AI 时代能否保持领先的关键。

最强 AI 训练集群华为 Atlas 900 首个外部应用正式发布

  Atlas 900 落地鹏城云脑Ⅱ

  Atlas 900 由数千颗昇腾 910 AI 处理器互联构成,每颗昇腾 910 AI 处理器内置 32 个达芬奇 AI Core,单芯片提供比业界高一倍的算力(256TFLOPS@FP16),总算力可达到 256P~1024P FLOPS @FP16。Atlas 900 发布时,华为给出的数据是在 Fastest cluster ResNst-50@ImageNet 测试中,华为成绩为 59.8 秒,比第二名 70.2 秒的成绩高出了 10 秒多。

  峰值算力和测试成绩是判断硬件性能很好地指标,但实际中的应用效果更为关键。在 Atlas 900 发布之时,华为就介绍其联合上海天文台与 SKA 共同打造的,一张南半球的星空图有 20 万颗星星,当前条件下,天文学家要从这 20 万颗星星中,找出某种特征的星体,相当困难,需要 169 天的工作量。用上 Atlas 900,只用 10 秒,就从 20 万颗星星中检索出了相应特征的星体。时间从 169 天缩减到 10 秒就是 Atlas 900 实际应用效果最直观地说明。

  另外,全联接大会上,中国工程院院士、鹏城实验室主任高文院士也分享了鹏城实验室基于华为 Atlas 900 集群打造鹏城云脑Ⅱ的平台规划。两个月之后的 2019 年 11 月 29 日,鹏城云脑Ⅱ基本型系统正式发布。高文院士介绍,鹏城云脑Ⅱ原型系统实现了 100 PFLOPS 的算力,并计划到明年底扩展至 1000 PFLOPS 级 AI 算力。

最强 AI 训练集群华为 Atlas 900 首个外部应用正式发布

  据悉,双方目前正在联合攻坚 AI 集群的规模进化以及 AI 功能的进化,解决散热、组网等影响集群扩展的关键问题,为实现明年 1000 PFLOPS 级 AI 算力。

  1000PFLOPS 是个什么概念?2019 年 6 月开始,超算 TOP500 的入门门槛超过 1PFLOPS(每秒一千万亿次浮点运算),这是全球超算 TOP500 榜单 26 年以来的又一历史性突破。根据 TOP500 本月发布的最新一期超算排行,排名第一的美国超算 Summit(顶点)的性能为 148.6 PFLOPS。接下来,超算的竞赛将进入 Exascale 计算(百万兆级的计算,也可称E级超算)时代,也就是 1000PFLOPS 级。

  不过,以 Atlas 900 为基础的鹏城云脑Ⅱ是 AI 计算集群,虽然性能将达到E级,但主要是面向 AI 计算,与 TOP500 的超算系统还有所区别。

  需要补充的是,鹏城云脑是鹏城实验室的人工智能开放开源平台,鹏城云脑面向全国,为人工智能基础研究和应用基础研究提供多层次、多样化的资源环境支撑,服务我国人工智能领域创新发展。此前的 2018 年一期工程中,鹏城云脑初步建成上线运行了以“鹏城云脑-1”为核心的P级计算系统。

  在鹏城云脑Ⅱ原型系统发布的当天,鹏城实验室与深圳市政府就一系列重大项目签约,向卫生健康、公安交警、巴士交通、政务等场景提供鹏城云脑强大的 AI 算力,支撑市政重大项目智慧升级。

  另据雷锋网了解,不断进化、动态升级的鹏城云脑还将持续向国内外的科研机构、高等院校等组织提供云端 AI 算力,充分发挥华为 Atlas 900 集群的优势,搭好科学研究和探索的地基。

最强 AI 训练集群华为 Atlas 900 首个外部应用正式发布
华为高级副总裁、Cloud & AI 产品与服务总裁侯金龙(左)与鹏城实验室主任高文(右)出席鹏城云脑Ⅱ发布会

  Atlas 900 与华为 5G+AI 的未来

  至此,Atlas 900 已经在内部和外部都已经落地,但其可以更多地应用于科学研究与商业创新,如天文探索、气象预测、自动驾驶、石油勘探等领域。并且在实际应用中享受到高算力带来的优势。

  做一个简单的对比,要实现 256 PFLOPS 的算力,经测算如果使用通用 CPU 需要 6195 个机柜,使用 GPU 需要 208 个机柜。而基于昇腾架构对深度学习业务的优化,以及芯片优化之外增加的如板级液冷、柜级密闭绝热等系统级优化, Atlas 900 集群使用 16 个机柜就能实现 256 PFLOPS 的算力,并且将功耗从 40000 千瓦降低至 736 千瓦,实现更高性价比。

最强 AI 训练集群华为 Atlas 900 首个外部应用正式发布

  当然,将 Atlas 900 中既有昇腾系列 AI 处理器,也有鲲鹏系列 CPU。华为在全联接大会上推出了鲲鹏和昇腾双引擎的计算战略。华为技术有限公司 Cloud&AI 产品与服务总裁侯金龙近日接受雷锋网等媒体采访时表示:“这两个计算引擎将会应用于向各个行业,我们认为 AI+5G+ 云会使能各个行业,使各个行业进入智能时代。目前除了鹏城实验室的鹏城云脑外,金融、智慧城市、电力、交通、互联网等行业都采用了鲲鹏和昇腾这两个计算引擎。”

  还需指出的是,硬件生态的强大还需要软件生态的协同,英特尔和英伟达在高性能计算领域的成功就是很好地例子。因此,在近一年的时间里,华为相继推出训练和推理框架 MindSpore、芯片算子库和高度自动化算子开发工具 CANN、一站式 AI 开发管理平台 ModelArts。并且这些软件和硬件覆盖了云、边、端。

  不仅如此,华为还计划打造强大的生态。侯金龙介绍,计算产业的核心就是开发者生态,华为计划在未来三年会投资 15 亿美元发展开发生态。希望和各个高校一起,基于鲲鹏和昇腾的计算架构体系联合各个高校开发教材,让学生至少可以学习我们这个体系。

  他还透露,明年 2 月份鹏城云脑和华为会举办一个开发者大会,规模将超过两万人。

  雷锋网小结

  对于任何一家芯片提供商而言,设计出性能和功耗都具有优势的芯片只是迈向成功的第一步,只有获得用户的认可并且持续迭代芯片才能视为芯片的成功。对于华为而且,基于其技术和客户的积累,推出新的硬件更容易获得应用,所以我们看到 Atlas 900 发布两个月后就已经有两个应用案例。但正如 Atlas 900 是一个复杂的系统一样,华为要在 5G 和 AI 的时代胜出,除了硬件,强大的软件和开发者生态都至关重要,我们也看到了华为在这些方面的投入。


鲜花

握手

雷人

路过

鸡蛋
毒镜头:老镜头、摄影器材资料库、老镜头样片、摄影
爱评测 aipingce.com  
返回顶部