凭借云化使用的超算服务模式,以及随需供应超算算力的优势,正在崛起的超级云计算服务平台,成功地满足了市场对超算旺盛的需求,同时破解了超算中心运营难的问题,正在成为引领超算商业化发展的新趋势。
日前,2020中国超级计算机榜单正式公布,北京超级云计算中心一举闯入前三甲,成为新型超算中心的佼佼者,其成功的经验,有望成为一种可以复制的超算商业化新范式。
勇夺TOP3的背后,是内在综合能力的自然体现
据组委专家组公布的数据,北京超级云计算中心A分区的主要参数为3000个计算节点,采用了6000个AMD 第二代EPYC(霄龙)处理器(代号Rome),测试性能为3.74 PFlops(千万亿次每秒),系统峰值高达7.03 PFlops,Linpack效率达到53.20%,在其前面只有40960颗SW26010的神威太湖之光超级计算机和35584颗Intel Xeon E5-2692的天河二号超级计算机两个庞然大物。
榜单发布人、中国科学院计算技术研究所研究员张云泉介绍,2020年共计提交73台新系统,根据TOP100排行规则,排重合并后新增机器上榜47台,这也意味着,2019年榜单中的100台系统仅剩余53台,淘汰率接近50%,HPC榜竞争程度之激烈可见一斑。
北京超级云计算中心成立于 2011 年,依托中国科学院计算机网络信息中心建立,由北京北龙超级云计算有限责任公司负责运营,是怀柔科学城北京市人民政府与中国科学院共同建设的重点项目。为什么一家成立了9年的超算中心,仍然具有冲击超算榜单新高度的旺盛活力?
其实,超算中心能够找到一种可持续的发展模式,获得与时俱进、不断进取的升级能力,其中涉及了科技创新、商业模式、以及服务和生态等多个层面的综合因素。北京超级云计算中心的一鸣惊人绝非偶然,令人惊艳的成绩正是其内在综合实力的一种水到渠成的外在体现,值得我们深度去挖掘探秘。
握住科技创新趋势,实现算力迭代升级
历史上每一次技术的重大迭代升级,都是产业格局重构的转折点。
从科技创新层面看,2019年8月,AMD公司在美国旧金山召开新品发布会,隆重发布了代号为“罗马”的第二代 AMD EPYC 霄龙系列处理器。这个全球首颗7nm制程工艺的“地表最强”X86服务器芯片,犹如在芯片界投下的一颗重磅炸弹。在架构方面,新一代AMD Infinity架构突破了x86性能和计算能力,获得了同类产品最高的I/O和内存带宽,在多种工作负载下最高能够将总体拥有成本 (TCO) 降低 50%。
敏锐地把握住技术创新的趋势,3个月后的同年11月,北京超级云计算中心选择戴尔科技为设备供应方,采用第二代AMD EPYC 处理器的A分区迅速正式上线了100个节点,截至2020年10月已逐步扩容到3000节点,从而一举斩获2020中国HPC 榜单前三强。
以应用驱动技术升级,以动态扩容满足市场需求
笔者相信,北京超级云计算中心绝不会仅仅为了冲击榜单去扩容,而是紧扣客户应用需求,快速在技术能力方面做出反应,从而能够不断吸引更多客户,再倒逼技术能力的进一步升级,最终形成了“应用与技术”相互促进的双向良性循环。
例如,今年7月底有用户提出新的应用需求,仅用了3个星期,北京超级云计算中心就完成了新设备的采购和新服务的上线运营,有力地支撑了短时爆发的科研与业务的需求。
这种能力,来自于北京超级云计算中心“云化超算服务+随需供应”的超级云计算创新模式。
超算为什么要上云?一是可以加速创新,二是可以优化成本,三是弹性灵活。通过动态扩容极大地满足市场需求的快速变化,北京超级云计算中心一举打破了供需之间难以快速匹配的鸿沟,既赢得了源源不断的客户,也凭借27万核、性能高达10Pflops的总算力,实现了国内通用X86超算市场排名第一。
整合资源,提供“质量好、服务好、价格好”的超级云计算服务
技术创新的最终目的是满足客户的需求,提升客户的体验。客户希望得到VIP级的服务,北京超级云计算中心就以客户价值为导向,积极通过整合资源,优化产品设计、提升服务质量、提高系统利用率,为客户了提供“质量好、服务好、价格好”的超级云计算服务。
为了贴近应用需求,更好地服务客户,北京超级云计算中心通过设计、数据处理、产品发布等多环节的协同,在IaaS层形成了高性价比的超级共享云、高稳定性的超算专用云,以及定制独享的超算专属云;在PaaS层是超算云系统和超算行业云;在SaaS层则可以提供面向石油勘探、风电预测、仿真设计、气象预报、海洋监测、环境治理等应用服务的能力。
这样就实现了资源在云端:超算资源随需弹性扩展,用户无建设风险及成本;软件在云端:预安装多种计算软件及程序,推动国产计算应用发展;无所不在的计算:在任何时间,任意地点,登录后都可以进行计算服务;计算更强大:无限空间,按需扩展,服务体验升级。
同时还做到了响应及时:配有5分钟响应的客户服务团队;保障有利:7*24小时的技术支持工程师服务,常规问题在24小时内解决,复杂问题72小时内解决;一站式服务:软件部署、调试优化等专业服务。
栽下梧桐树,自有凤凰来
通过融合“超算”、“互联网”、“云服务”技术,提供性能卓越、类别丰富的“一站式”在线超级计算服务,北京超级云计算中心赢得了包括科学研究、航空航天、气象预报、地质勘探、生物制药等领域越来越多行业客户的青睐。
今年新型冠状病毒肺炎疫情突发,牵动着全国人民的心,奋战在一线的不仅有医护人员,还有专注于病毒防治的研究人员。为了助力抗击新型冠状病毒疫情,北京超级云计算中心为疫情相关的15家科研机构免费提供了1000万核时的计算、技术服务,保障了科研工作者进行基因测序、疫苗研发、药物筛选、病毒突变预测等工作。
超算在当今世界,已经成为各国的竞争焦点。IDC数据显示,2019年,全球高性能计算市场规模318亿美元,其中公有云支出39亿美元,渗透率12.3%,复合年均增长率(CAGR)为 18.8%。
《观研天下》研究报告显示,2019年,中国高性能计算市场规模约为282亿元,云服务渗透率仅为3%,远低于全球水平。可喜的是,中国超算正迎来发展的黄金期,超算硬件、应用及服务的市场前景广阔,预计到2024年,HPC云服务市场规模将达到76亿元,复合年均增长率高达45%。
而北京超级云计算中心以“创新应用与技术升级”相互促进的成功模式,正在成为HPC云服务化和商业模式创新的主要推动者。
小结
从目前的发展趋势来看,超算行业正在形成三类市场:第一类,尖端超算,主要针对万核以上的应用,需要国家集中力量办大事,打造最尖端的超算中心;第二类,通用超算,主要是万核、千核以下的应用,需要性价比高的解决方案,超级云计算中心的模式对推动超算商业化具有重大的作用;第三类,行业超算,主要是从单核到几千核的应用,需要根据业务需求设计上云流程,提供行业定制。
三类超算模式相辅相成,相得益彰,共同助力科研效率提升,最大程度优化成本,提升用户使用体验。
而在超算竞争中胜出的秘诀,绝不仅仅是单纯的技术和产品的竞争,更是商业模式以及服务和生态的竞争。北京超级云计算中心已经探索出了一条成功有效的途径:以云服务方式提供通用超算资源,为拓展科学边界、推进技术创新提供了更强劲的动力,可以满足市场巨量的计算需求。系统建成以来,为通用计算用户提供了良好的平台,与各个国产应用单位进行了深度交叉合作,为探讨未来超算中心建设和商业化运营的模式创新提供了有益的探索。