设为首页收藏本站 关注微博 关注微信

全球新闻在线

全球新闻在线 首页 科技新闻 技术解析 查看内容

改良的奖项决赛选手所展现的超等计算核物理代码

2021-8-27 15:30| 发布者: wdb| 查看: 83| 评论: 0|原作者: [db:作者]|来自: [db:来源]

摘要: 改良的奖项决赛选手所展现的超等计算核物理代码 ,更多it技术解析新闻关注我们。

AndréWalker-Loud是燃料部劳伦斯伯克利实验室(伯克利实验室)的一名科学家,是该团队的结合领导人,该团队是本月将得到的计算机协会戈登贝尔奖的六名决赛选手之一。。

Walker-Loud与DOE 劳伦斯利弗莫尔实验室(LLNL)的Pavlos Vranas一同领导的团队运用全新一代DOE超等计算机提升了计算中子生命精准持续时间的能力,此中包括DOE's Oak的200-petaflop Su毫米it超等计算机岭实验室(ORNL)和LLNL的125-petaflop Sierra超等计算机。

与此前在ORNL的27-petaflop Titan超等计算机上发展的科学测试比较,Walker-Loud的团队将这点模拟的科学利用提速了Sierra的10倍和Su毫米it的15倍。

模拟可行帮助解开宇宙的神秘面纱

粒子物理学和核物理学之中存留一条细线,亚原子粒子夸克,胶子起首与质子和中子联合成原子核。

在这条线的一边是宇宙,由于它应当依据粒子物理学的准则模子:差不多无物质,而且充满了来源物质和反物质的相互破坏的剩余辐射。在这条线的另一边是咱们观看到的宇宙:时空以星系,太阳和行星的方式散布着物质。

为了了解物质和反物质之中的不对称性,科学家们正好运用大型超等计算机来寻觅新的物理发觉。经过称为晶格量子色能源学(QCD)的繁杂数值方法,科学家们计算了夸克和胶子在时空晶格上的相互效用,以探讨QCD根本物理理论中核的显露。经过桥接粒子相互效用和原子核的探讨,格子QCD模拟也是学习宇宙如何运作的切入点。

本年早些时刻,Walker-Loud的团队在奥克兰领导计算机构(OLCF)的Titan超等计算机上解决了与中子生命相干的要紧计算,该计算机是ORNL的DOE科学使用者设备办公室。参与峰会,以及LLNL的超等计算机。探讨人士计算了核子轴向耦合 - 质子和中子的根本性质 - 精度为1%(误差极小)。探讨界曾经预测到2020年此前这类精准度是不可能的,可是Walker-Loud的团队能够运用改良的物理算法将达成计算所需的统算量降低10倍。

LLNL的Pavlos Vranas说:“中子的生命约为15分钟,这很要紧,由于它对宇宙的品质成分发生了深远的作用。”

关于戈登贝尔奖提交,探讨人士期望经过增添时空格子的尺寸并降低未来名目的不确定性来声明它们可行在Su毫米it和Sierra上扩展这一成就。

在晶格QCD计算中增添晶格大小也是核物理学界的长久指标,因而探讨人士可行干脆从QCD中常规地模拟轻核(如氘或氦) - 这点难题比模拟更繁杂,更具挑战性。中子生命。

在Su毫米it上,探讨人士模拟了一种格子,每个体积方向有64个位点,时间有96个。每个站点与其它站点仅相隔0.09飞秒(飞秒表是1千万亿分之一米)。虽然模拟宇宙的总尺寸仅为5.6飞秒,但它足以探讨中子的弱死亡并降低计算中的不确定性。Walker-Loud显示,这种格子是团队估计它们须要改良计算所需的最小格子,像Sierra和Su毫米it这样的体系将能够运用很大的格子。

探讨人士面对的第一大挑战之一便是将它们的计算分成众多部分。

“咱们的科学难题是一种统算难题,须要运转数千到数百万个小型事业,但这非是在大型超等计算机上面部分署事业的有用形式,”Walker-Loud说。

计算的全体效能是经过QUDA实现的,QUDA是针对GPU改良的QCD库,由KID Clark和NVIDIA的同事以合格子QCD探讨社区开发。QUDA被集成到Chroma代码中,该代码由Jefferson Lab的BálintJoó和其它与USQCD合作开发的人士开发,用于为大型计算机开发晶格QCD计算。团队将本人的代码与这点改良的库一同包装成lalibe以接连Chroma。Lalibe的进行由LLNL的Arjun Gambhir领导。

Lattice QCD探讨人士好几年来一直在应用GPU,但Su毫米it和Sierra经过将单个节点上的若干GPU与当地内存相连而非是将单个GPU与单个CPU配对来提升计算能力。

“节点上的GPU比节点到节点通信具备更快的通信带宽。咱们在不多数量的节点上解决很大的难题,“Walker-Loud说。“依据这点Gordon Bell的运转概况,只要2周即可生成6 PB的数据。这对咱们日前的制造形式来讲没有办法治理。“

为了治理事业和数据的预期10倍增添要素,该团队已将其由Jülich探讨中心的Evan Berkowitz开发的Bash经理METAQ进级为名为MPI_JM的C ++版本。MPI_JM的进行由加州大学伯克利分校的Ken McElvain领导。

METAQ和MPI_JM治理器皆是体系批料理调整程序和利用程序作业脚本之中的当中层,使团队能够更有用地将数十万个任务捆绑到一种接一种运转的几百个作业中。

在具备超越4,000个节点的超等计算机上,在房间两侧的节点之中拆分作业会浪费宝贵的通信时间。MPI_JM库对节点发展排序,以第一大化将任务放置在体系上相邻节点上的几率。

除了更有用地治理这点作业外,MPI_JM还应允使用者将“仅CPU”任务放到与GPU稠密型事业相同的计算节点上,而不会相互干扰任务。关于中子生命的计算,这可行节省名目计算时间的10%到20%,由于从前只占CPU的任务占用了全个节点。关于将来更繁杂的计算,节省的费率可能是两倍或更多。

该团队运用MPI_JM将4,224个节点扩展到Sierra的4,224个节点,运用METAQ在Su毫米it上扩展到1,024个节点,在较大的Sierra运转中达到20 petaflops - 这类类别的晶格QCD计算的显着功能飞跃。该团队估计会扩展到Su毫米it上的众多节点可行实现多达30 petaflops的功能。

更多技艺剖析关心咱们。