超算需求倒逼“架构”变革 ,华为分布式存储加注HPDA赛道

第一财经2021-09-24 17:55:36

作者:李娜    责编:宁佳彦

数据存储作为科技强国的关键基础设施,在当前大型超算中心、新型油气勘探、基因测序、自动驾驶、气象预测、宇宙探索等领域发挥着重要作用,同时也是高性能计算(HPC)领域数据应用和数据分析的重要支撑平台。

华为在“重投”数字基础设施的同时,也将这一领域视为数字赛道发展的重要方向。

9月24日,在华为全联接大会的第二天下午,华为常务董事、ICT产品与解决方案总裁汪涛发布了多款数字基础设施相关技术,其中包括了业界首个面向高性能数据分析(HPDA)的分布式存储OceanStor Pacific。在华为看来,高性能数据分析的大时代正在来临。

“HPDA是超算领域正在发生的一个重要趋势,智能世界的加速到来,让AI、大数据技术也正在加速和HPC超算技术产生深度融合。”华为海量存储领域总裁王怡东在采访中对记者表示,数据密集型应用的爆发正在让高性能计算系统从以算力为中心逐步转变为以数据为中心。

根据华为官方微博显示,在今年7月国际超算大会最新一期IO500排行榜中,基于华为AI基础软硬件的“鹏城云脑II”超级计算机再次刷新世界纪录,蝉联全系统输入输出和10节点规模系统两项世界冠军。而在2021年国际超算大会(ISC)公布的最新的TOP500榜单中,其中有342套系统采用了AI相关的加速技术,TOP10无一例外都采用了AI相关的算力。

随着AI和大数据的技术发展,越来越多HPC应用借助AI和大数据技术深度挖掘数据背后的价值,使得数据分析量急速增加。

根据全球HPC市场研究机构Hyperion Research预测,2019年到2024年基于AI和大数据的HPC存储的复合年增长率超过17%,远远超过服务器6.9%的复合年增长率,到2024年,HPC市场将有超过40%来自数据密集型超算。

“多样化算力会带来多样化业务负载,这就好比一个跑100M的短跑运动员顶多可以多跑一下200M和400M,但是基本没办法兼顾10000M长跑项目。为了解决这个问题,业界通常采用不同类型的存储来应对。”王怡东对记者表示,新的超算架构要求打破内存墙、协议墙的双重限制,多样算力直接按需加载到存储系统,华为为了减少算力之间数据搬移,提高分布式算力并行处理效率,将重点放在了存储的架构创新上。

经过了多次技术迭代,王怡东对记者表示,华为在最新方案上采用了“融合非结构化数据索引”的创新技术架构,也就是说,华为分布式存储可以原生支持文件、对象以及大数据协议。所谓原生协议支持,就好比一个人的母语就有三种,可以随意在不同的语境中切换,实现沟通交流效率的最优。而传统意义上,一般存储的"母语"只有一种,只能通过网关这种翻译来实现协议之间的对话。必然会带来语义或者性能上的损失。因此,通过架构创新可以实现分析效率的提升。

同时,这种技术不仅能被使用在政府超算领域。在HC大会现场,汪涛表示,目前,除了超算中心领域,华为OceanStor Pacific已在能源勘探、气象预测以及基因检测等多个商用超算领域成功落地。

比如,在全球SKA天文望远镜阵列中,上海天文台与华为合作,搭建了世界首台SKA区域中心原型机核心业务存储系统。而在油气勘探领域,华为与中石油东方物探也已完成了单体数据量最大的油气地震勘探数据处理项目。

“数字基础设施既面临新挑战,也迎来属于海量存储的大时代。”王怡东对记者表示,到2025年,新增数据量是180ZB,其中超过80%是非结构化存储,而其中仅仅2%的数据被储存,仅仅10%的数据被分析,随着应用场景的逐步打开,高性能数据分析将会迎来更大的发展空间。

第一财经广告合作,请点击这里 此内容为第一财经原创,著作权归第一财经所有。未经第一财经书面授权,不得以任何方式加以使用,包括转载、摘编、复制或建立镜像。第一财经保留追究侵权者法律责任的权利。 如需获得授权请联系第一财经版权部:
021-22002972或021-22002335;banquan@yicai.com

文章作者

分享
热度
意见反馈箱:yonghu@yicai.com
客服热线:400-6060101 Copyright 第一财经 ALL Rights Reserved