英特尔数据中心“全家福”助燃上海交通大学“π2.0”超算系统

前不久,英特尔推出了一系列以数据为中心的产品组合,包括第二代英特尔至强可扩展处理器、英特尔傲腾数据中心内存和存储解决方案、软件以及平台技术等,以帮助用户从数据中挖掘更多价值。

笔者得知,上海交通大学“π2.0”超算系统成为中国高校中最早选用第二代英特尔至强可扩展处理器的最大规模高性能计算集群,并且在计算和存储性能上得到了显著的提升。那么具体是怎么实现的呢?一起来听上海交通大学网络信息中心计算部主任林新华博士,为我们详细讲述高性能计算架构创新改造背后的故事。

瓶颈产生

上海交通大学是我国历史最悠久、享誉海内外的知名高等学府之一,是教育部直属并与上海市共建的全国重点大学。经过120多年的不懈努力,上海交通大学已经成为一所“综合性、研究型、国际化”的国内一流、国际知名大学。

上海交通大学一直致力于超算的建设和投入,一期“π”超算系统于2013年6月进入全球TOP500超算排行榜。虽然是一个部署在大学的超算平台,但是在当时的上海乃至于整个华东地区,“π”超算都是一个先进的存在。时至今日,此系统一直为全校师生服务,支持重要科研项目,覆盖包括生命科学技术学院、物理与天文学院、化学与化工学院等多个学院。

而如今,距离π的部署已经过去了5年多的时间,按照IT基础设施的更新频率,π已经算是“超期服役”,更何况,声名遐迩的π超算受到了全校师生的喜爱,随着使用人数的增加、软件的深度优化和硬件架构的升级,目前的硬件系统已经无法满足当前用户的需求,整体平台迫切需要进行升级改造。

据林新华博士介绍,上海交通大学与英特尔保持了长期良好的合作关系,2013年“π1.0”高性能计算系统采用英特尔至强E5处理器;2017年合作建立英特尔并行计算中心,采用英特尔架构以及AI技术推广代码现代化。2018年再次考虑使用英特尔Cascade Lake处理器进行二期建设,那时Cascade Lake还没有发布,我们就已经跟英特尔展开了深度的测试和研究。

对症下药

在经过全方位的评估之后,上海交通大学“π2.0”超算系统最终采用英特尔全新一代的Cascade Lake金牌处理器,被辅以业界先进的计算网络Intel Omni Path存储系统,满足计算和存储过程中全线速、无阻塞的通信需求,既可承载临时计算或生产测试环境下的计算任务,还能应对海量小文件并发的需求。

在沟通中笔者得知,上海交通大学“π2.0”超算系统双精度浮点数理论性能2.1PFlops,拥有658台双路节点和1316颗第二代英特尔至强金牌6248处理器。AI与传统HPC应用的融合,充分利用第二代英特尔至强可扩展处理器的新特性:英特尔深度学习加速、AVX512指令集、支持英特尔傲腾数据中心级持久内存。

为什么说是英特尔“全家福”全面助燃超算系统升级呢?那是因为除了采用最新的处理器之外,还有网络和存储的全面加成。

在高速网络互连方面,采用了英特尔Omni-Path架构100Gbps,MPI应用平滑升级,不需修改代码,单交换机芯片支持48端口,单交换机最大支持1152端口,成本更低、扩展性更高。

在存储方面,上海交通大学又成为首家采用全闪存NVMeLustre存储系统的高校,搭载英特尔固态盘DC P4610+双OPA卡+Lustre新特性+分布式存储技术,实现了开源架构、软硬一体、全闪存、分布式存储的完美结合。

据林新华博士介绍,采用英特尔整体解决方案之后,计算及存储性能显着提升:在计算性能方面,升级至第二代英特尔至强可扩展处理器后,实际应用(VLPL-S)性能方面,单节点提升达4.5倍,四节点提升达4.7倍;在存储性能方面,基于英特尔固态盘DC P4610和双OPA卡,单台存储服务器(OSS)IO性能可达15GB/S,相比原有系统提升达5倍。

收益背后

如此强悍的性能,得益于全新一代Cascade Lake处理器的全面升级与优化。事实上,这款被称为“第二代至强可扩展处理器”的平台除了具备强大的计算能力之外,在存储与AI应用层面都进行了不少的优化。

从产品规格来说,全新一代Cascade Lake处理器在旗舰级产品上进一步升级,从原有的铂金至强8100系列升级到了铂金9200系列,可以支持最高56个物理核心112个线程,还能够支持48条PCIe通道、6通道DDR4内存等等诸多特性。最重要的是,Cascade Lake处理器采用了新扩展指令集AVX512_VNNI用于加速深度计算和AI相关负载,官方数据显示VNNI在AI应用的推理性能上相比上一代产品可获得数倍提升。

存储是英特尔部署的另一大产品线,伴随着全新一代Cascade Lake处理器的发布,英特尔在存储上也正式宣布了傲腾数据中心级持久内存(OptaneDC persistent memory)。从名字就能够看出,这款被称为“内存”的产品具备了内存的形态,但是它的本质上是基于英特尔3DXPoint技术的固态盘,因此在性能上它介乎于内存和传统SSD之间,但是相比传统SSD也能够带来数倍的性能提升。

不仅如此,全新推出的网络优化型英特尔至强可扩展处理器,专为网络应用而设计。基于与通信服务提供商合作,该系列产品旨在提供更大的用户容量,减少网络功能虚拟化(NFV)基础设施的瓶颈。今天,英特尔至强可扩展处理器能够支持高性能、高效率、可扩展的敏捷型5G就绪网络。

写在最后,从超算应用到AI推理,第二代英特尔至强可扩展处理器的提升让整个IT基础设施领域受益匪浅,通过多样化的、多种形态的产品组合,为用户提供了满足不同应用场景的选择,让用户充分体会到全新平台、英特尔“全家福”系列产品在计算、存储、互联、管理等领域的全栈优势。英特尔强大且经过优化的以数据为中心的解决方案可以更加高效地支持从云到端的多种高成长性工作负载,为推动企业转型和业务创新、加速数字经济落地提供强劲动力。

Image placeholder
XuDong
未设置
  97人点赞

没有讨论,发表一下自己的看法吧

推荐文章
一个解决方案 四种架构 英特尔oneAPI来了

面向不断扩展的多元化计算需求,英特尔提出了全新的产品和技术战略,扎根于六大技术支柱——制程和封装,架构,内存和存储,互连,安全,软件。英特尔将通过横跨这六大技术的全方位计算创新,驱动计算性能的指数级提

英特尔:云从此处升起

如今,云计算已真正走过了“早期采用者”阶段,进入“早期大多数”。更多的组织已经认同了云计算所能够带来的巨大价值,将业务负载迁移到云上,以获得云的敏捷性、可用性、可扩展性等优势。而云计算也正式迈进2.0

英特尔第二代至强与傲腾,为企业IT带来了什么?

在企业IT基础设施领域,英特尔第二代至强可扩展处理器与傲腾数据中心级持久内存名声在外,是英特尔以数据为中心的产品组合中的代表之作。于今年4月份发布的第二代英特尔至强可扩展处理器,以强大的平台能力,实现

京东云和英特尔“花样”升级高性能云硬盘

数据,已成为这个时代的基调。当我们因为数据带来新的机遇而喜不自胜的时候,也常常会不可避免地遇到一些随之而来的困扰。与如何更好地使用数据相比,数据的存储和管理是更棘手的问题所在。面对海量数据爆炸式的增长

打通“边-云”连接 英特尔携手腾讯加速5G&MEC落地

随着5G的到来,边缘计算在5G的应用场景中起到了很好的连接作用。首先实现了移动网络和应用的连接,可以使得业务在5G网络上得到更高质量的交互;其次,5G的边缘计算可以实现2B和2C业务的连接,2B业务能

弃局5G基带芯片,全力进军AI芯片!英特尔20亿美元收购以色列芯片公司Habana

大数据文摘出品昨天,英特尔发表声明,宣布收购以色列AI芯片制造商HabanaLabs,交易额达到20亿美元。这是英特尔在人工智能领域的又一重大投资,此前还包括NervanaSystems和Movidi

初探英特尔存储“秘密基地”:傲腾小白 学成归来

可以把这篇文章当成故事听、你也可以把它看成游记、你还可以认为它是一篇技术贴,whatever,如何包装不重要,接下来的干货才是重点:忆往事英特尔傲腾数据中心技术,是英特尔“以数据为中心”战略的具体体现

阿里系统软件迎战“双11”超高流量峰值全纪录

刚刚过去的2018年天猫“双11”,创下了全天2135亿GMV的数字奇迹,零点交易峰值比往年提升50%,各项指标均创下历史新高。2018年是“双11”的第十年,也是阿里系统软件事业部参与的第二个“双1

好马配好鞍 戴尔&AMD重塑数据中心基石

“当机关枪的射速是敌人几倍的时候,食堂伙食好不好,机枪手学历高不高,姿势对不对,这些都变得不重要了!”AMD中国区商用事业部销售总监周俊杰说。不用再怀疑AMD的回归如今,数据中心市场面临诸多挑战:对计

机器扭碎,强力消磁还能恢复!数据中心年年升级,废弃“云垃圾”让谷歌头大

大数据文摘出品作者:蔡婕、林安安、曹培信今年7月1日,《上海市生活垃圾管理条例》正式实施,它被称为“史上最严垃圾分类措施”。条例一出,这4种颜色的桶,就彻底改变了上海人民的生活。但是一种新型的垃圾——

《Gartner 2019年数据中心网络魔力象限》报告解读

日前,Gartner发布了2019年数据中心网络魔力象限。此次报告从7个维度(产品或服务、总体生存能力、销售执行/定价、市场反应/记录、营销执行、客户体验和操作),来衡量12个入选企业,并基于前瞻性和

2019年度IT168技术卓越奖名单:数据中心类

光阴如梭,一年的工作转瞬又将成为历史,2019年即将过去,崭新的2020年即将来临。新的一年意味着新的起点新的机遇新的挑战,众多企业“决心再接再厉,更上一层楼”,努力打开新局面。作为读者们的老朋友,2

ASC19激战开启:20支超算战队向最高荣誉发起冲击

  今天,备受关注的2019世界大学生超级计算机竞赛(ASC19)在大连理工大学正式开幕。ASC超算竞赛是由中国发起的世界最大规模的大学生超算赛事,正式发起于2012年,本届大赛由亚洲超算协会、浪潮集

联想“融合计算”助力能源行业破局发展

随着油气行业改革进程的加快,石油行业需要的高性能系统要具有强大的硬件性能表现及能耗比、有优秀的开发应用软件技术配套、符合石油石化行业发展需求、符合开放标准,并且有广泛的合作伙伴支持。为了满足全球日益增

阿里云为什么有底气喊出“全面上云的拐点到了”?

摘要:拐点,又称反曲点,在高等数学里,拐点指的是凹凸性变化的点,在生活中借指趋势发生变化的点。(例如:经济运行出现回升拐点)虽然上云是大势所趋,但企业全面上云可能还需要一些时日,这或许是绝大部分从业者

马云入选“全球十大思想者”,排名在贝索斯之前

大数据文摘出品消息来源:央视新闻、澎湃新闻、中国日报网1月21日,据央视新闻报道,美国《外交政策》杂志评选出了全球十大思想者榜单,阿里巴巴创始人马云成为唯一获选的中国企业家,排名第三,位列企业家之首。

vue全家桶都包括什么?

Vue全家桶介绍vue全家桶:vue+vuex(状态管理)+vue-router(路由)+vue-resource+axios+UI框架(iview、vant、elementUI等等)Vue有著名的全

从0到1,马蜂窝大交通团队如何构建高效研发流程体系?

“旅游之前,先上马蜂窝”已经成为许多人习惯性的选择。2019年5月,马蜂窝完成了新一轮融资,金额达2.5亿美元。这也标志着通过集内容、社区、交易为一体的消费决策场景构建,从攻略社区起家的马蜂窝开始迈入

中新生态城的交通状况,是嘛时候成的“津门第一”?

今天大早,刚来完一套煎饼果子的小张打算开车去滨海新区拜访客户作为天津的市辖区滨海新区早在2005年就被写入“十一五”规划成为国家重点支持开发的国家级新区在快速稳健的发展中,整个新区一片方兴未艾的繁荣景

ZILLIZ AI数据中台:打破数据处理瓶颈,释放AI效能

在最近结束的第十届中国数据库技术大会(DTCC2019)上,ZILLIZ得到了众多专业评委的一致认可,获选为“2019中国数据库技术年度评选——年度创新企业”。这家成立于2016年的企业,凭借对技术发

2019年,数据中台为什么火了?

2019年,“数据中台”火了!一方面,过去一年BATJ、TMD等新老互联网巨头前后脚地发布重大消息,称集团层面正在推动以搭建中台为目标的组织架构变革,其中数据中台将是重要一环。而远在2015年就提出“

SACC2019:爱奇艺的大数据中台战略(附演讲实录)

  孙斌爱奇艺高级总监主要负责爱奇艺的大数据中台、商业智能、内容智能制作等业务。在互联网产品设计和研发方面有十多年经验,曾就职于微软、hulu、雅虎等公司。摘要:爱奇艺的业务已经从单一的视频业务发展为

AI 数据中台 Mega 及其应用

随着AI在各行业落地的进一步深化和应用数据量的飞速增长,越来越多的AI科学家痛苦地发现数据ETL、数据仓库和海量特征向量检索等数据处理流程花费了他们大量宝贵的时间和精力。AI数据中台Mega打破了人工

“翟天临”克星?哥本哈根大学开发反“枪手”AI,识别作业代写准确率接近90%

大数据文摘出品编译:曹培信、周家乐随着毕业季的邻近,翟天临又一次被网友们骂上了微博热搜。翟的论文抄袭事件过后,许多高校都加强了论文评审标准,更有严格的院校连非毕业生的论文结课都要查重。许多深夜改论文的

美埃默里大学华人实验室突遭关闭,两华人教授及部分中国雇员被强制遣返

大数据文摘出品作者:魏子敏、宋欣仪据美《科学》杂志报道,佐治亚州亚特兰大的埃默里大学(EmoryUniversity)突然关闭了知名华人生物学家李晓江和李世华教授夫妇的实验室。22日,埃默里大学解雇了