菜单 学习猿地 - LMONKEY

VIP

开通学习猿地VIP

尊享10项VIP特权 持续新增

知识通关挑战

打卡带练!告别无效练习

接私单赚外块

VIP优先接,累计金额超百万

学习猿地私房课免费学

大厂实战课仅对VIP开放

你的一对一导师

每月可免费咨询大牛30次

领取更多软件工程师实用特权

入驻
97
0

英特尔数据中心“全家福”助燃上海交通大学“π2.0”超算系统

原创
05/13 14:22
阅读数 495

前不久,英特尔推出了一系列以数据为中心的产品组合,包括第二代英特尔至强可扩展处理器、英特尔傲腾数据中心内存和存储解决方案、软件以及平台技术等,以帮助用户从数据中挖掘更多价值。

笔者得知,上海交通大学“π2.0”超算系统成为中国高校中最早选用第二代英特尔至强可扩展处理器的最大规模高性能计算集群,并且在计算和存储性能上得到了显著的提升。那么具体是怎么实现的呢?一起来听上海交通大学网络信息中心计算部主任林新华博士,为我们详细讲述高性能计算架构创新改造背后的故事。

瓶颈产生

上海交通大学是我国历史最悠久、享誉海内外的知名高等学府之一,是教育部直属并与上海市共建的全国重点大学。经过120多年的不懈努力,上海交通大学已经成为一所“综合性、研究型、国际化”的国内一流、国际知名大学。

上海交通大学一直致力于超算的建设和投入,一期“π”超算系统于2013年6月进入全球TOP500超算排行榜。虽然是一个部署在大学的超算平台,但是在当时的上海乃至于整个华东地区,“π”超算都是一个先进的存在。时至今日,此系统一直为全校师生服务,支持重要科研项目,覆盖包括生命科学技术学院、物理与天文学院、化学与化工学院等多个学院。

而如今,距离π的部署已经过去了5年多的时间,按照IT基础设施的更新频率,π已经算是“超期服役”,更何况,声名遐迩的π超算受到了全校师生的喜爱,随着使用人数的增加、软件的深度优化和硬件架构的升级,目前的硬件系统已经无法满足当前用户的需求,整体平台迫切需要进行升级改造。

据林新华博士介绍,上海交通大学与英特尔保持了长期良好的合作关系,2013年“π1.0”高性能计算系统采用英特尔至强E5处理器;2017年合作建立英特尔并行计算中心,采用英特尔架构以及AI技术推广代码现代化。2018年再次考虑使用英特尔Cascade Lake处理器进行二期建设,那时Cascade Lake还没有发布,我们就已经跟英特尔展开了深度的测试和研究。

对症下药

在经过全方位的评估之后,上海交通大学“π2.0”超算系统最终采用英特尔全新一代的Cascade Lake金牌处理器,被辅以业界先进的计算网络Intel Omni Path存储系统,满足计算和存储过程中全线速、无阻塞的通信需求,既可承载临时计算或生产测试环境下的计算任务,还能应对海量小文件并发的需求。

在沟通中笔者得知,上海交通大学“π2.0”超算系统双精度浮点数理论性能2.1PFlops,拥有658台双路节点和1316颗第二代英特尔至强金牌6248处理器。AI与传统HPC应用的融合,充分利用第二代英特尔至强可扩展处理器的新特性:英特尔深度学习加速、AVX512指令集、支持英特尔傲腾数据中心级持久内存。

为什么说是英特尔“全家福”全面助燃超算系统升级呢?那是因为除了采用最新的处理器之外,还有网络和存储的全面加成。

在高速网络互连方面,采用了英特尔Omni-Path架构100Gbps,MPI应用平滑升级,不需修改代码,单交换机芯片支持48端口,单交换机最大支持1152端口,成本更低、扩展性更高。

在存储方面,上海交通大学又成为首家采用全闪存NVMeLustre存储系统的高校,搭载英特尔固态盘DC P4610+双OPA卡+Lustre新特性+分布式存储技术,实现了开源架构、软硬一体、全闪存、分布式存储的完美结合。

据林新华博士介绍,采用英特尔整体解决方案之后,计算及存储性能显着提升:在计算性能方面,升级至第二代英特尔至强可扩展处理器后,实际应用(VLPL-S)性能方面,单节点提升达4.5倍,四节点提升达4.7倍;在存储性能方面,基于英特尔固态盘DC P4610和双OPA卡,单台存储服务器(OSS)IO性能可达15GB/S,相比原有系统提升达5倍。

收益背后

如此强悍的性能,得益于全新一代Cascade Lake处理器的全面升级与优化。事实上,这款被称为“第二代至强可扩展处理器”的平台除了具备强大的计算能力之外,在存储与AI应用层面都进行了不少的优化。

从产品规格来说,全新一代Cascade Lake处理器在旗舰级产品上进一步升级,从原有的铂金至强8100系列升级到了铂金9200系列,可以支持最高56个物理核心112个线程,还能够支持48条PCIe通道、6通道DDR4内存等等诸多特性。最重要的是,Cascade Lake处理器采用了新扩展指令集AVX512_VNNI用于加速深度计算和AI相关负载,官方数据显示VNNI在AI应用的推理性能上相比上一代产品可获得数倍提升。

存储是英特尔部署的另一大产品线,伴随着全新一代Cascade Lake处理器的发布,英特尔在存储上也正式宣布了傲腾数据中心级持久内存(OptaneDC persistent memory)。从名字就能够看出,这款被称为“内存”的产品具备了内存的形态,但是它的本质上是基于英特尔3DXPoint技术的固态盘,因此在性能上它介乎于内存和传统SSD之间,但是相比传统SSD也能够带来数倍的性能提升。

不仅如此,全新推出的网络优化型英特尔至强可扩展处理器,专为网络应用而设计。基于与通信服务提供商合作,该系列产品旨在提供更大的用户容量,减少网络功能虚拟化(NFV)基础设施的瓶颈。今天,英特尔至强可扩展处理器能够支持高性能、高效率、可扩展的敏捷型5G就绪网络。

写在最后,从超算应用到AI推理,第二代英特尔至强可扩展处理器的提升让整个IT基础设施领域受益匪浅,通过多样化的、多种形态的产品组合,为用户提供了满足不同应用场景的选择,让用户充分体会到全新平台、英特尔“全家福”系列产品在计算、存储、互联、管理等领域的全栈优势。英特尔强大且经过优化的以数据为中心的解决方案可以更加高效地支持从云到端的多种高成长性工作负载,为推动企业转型和业务创新、加速数字经济落地提供强劲动力。

发表评论

0/200
97 点赞
0 评论
收藏
为你推荐 换一批