开云kaiyun数字之约 发展之约|数字新基建——加快构建高质量算力供给体系 提升网络传输效能

 

  开云kaiyun央广网北京9月1日消息(记者吕红桥)据中央广播电视总台经济之声《天下财经》报道,在日前闭幕的数博会上,贵州广电五舟公司产品方案部负责人高瞻向记者介绍了公司多款算力服务器。对人工智能有所关注的人可能都知道,以前算力服务器里的智算芯片,也就是GPU,主要靠进口,国产GPU虽然很多,但是企业应用的热情不高。而从这届数博会的展览展示可以看出,国产GPU出货量大幅攀升,应用的速度明显加快。高瞻表示,有的国产GPU还出现了供不应求的现象。

  高瞻介绍:“昇腾910训练卡供货比较紧张。今年5月份下的单做训练整机,到8月份才分到货,生产不过来。昇腾310的推理卡比较多,昇腾910卡现在还是比较紧缺。”

  与智能算力不同,通用算力使用的是CPU,这类芯片中,国产芯片也获得了用户的认可,市场占有率比前些年大幅提升。再加上路由器、交换机、光模块等设备,国产算力设备已经形成了完整的解决方案。从一开始遇冷到现在受热捧,国产算力设备为什么提升如此之快?京东集团技术委员会主席、京东云事业部总裁曹鹏分析:一方面,随着软件系统优化和生态建设,国产算力设备的兼容性在不断提升;另一方面,用户也在主动适配国产算力设施。

  曹鹏表示:“虚拟GPU和云海都是全面适配国产化基础设施的,所有GPU厂商都会有自己的虚拟GPU方案,但他们所有的方案只能对自己的产品进行优化。我们可以进行全方位异构兼容,在一个虚拟GPU的纳管池里同时放英伟达GPU、升腾GPU、寒武纪GPU。”

  今年以来,我国算力设施的另一大进步是利用率提升很快。以往,受多重因素影响开云kaiyun,智算中心GPU的利用率并不高,在推理场景下有的利用率甚至还不到30%,造成资源闲置浪费。而曹鹏表示,在使用虚拟GPU技术后,算力的利用率可以提升一倍。

  曹鹏介绍:“一台GPU的服务器可能上面插着8个卡或者16个卡,在训练和推理的时候,这些卡用不满,有很多空闲时间。大家知道GPU服务器现在很贵,这些卡空着,是资源的极大浪费。当我们把其做了统一的纳管和虚拟化之后,大家用的就是虚拟GPU,可以充分利用GPU的空闲时长,哪个物理卡空着,他们就会用哪个。原来有8个卡,同时跑8个任务,只能给8个人用。现在8个卡可以给16个人用。”

  得益于多重技术优化,我国正加快构建高质量算力供给体系。国家数据局发布的数据显示,我国“东数西算”八大国家枢纽节点拉动投资超过2000亿元,现有数据中心标准机架总规模超过195万台,集聚和拉动效应进一步凸显。与此同时,算力网络传输效能持续提升。1毫秒时延城市算力网、5毫秒时延区域算力网、20毫秒时延跨国家枢纽节点算力网在示范区域内初步实现。

  中国联通董事长陈忠岳说:“我们加快建设算网基础设施,推进下一代互联网发展,持续推进‘新八纵八横’国家骨干网建设,打造高通量、高性能、高智能的算力智联网,也就是AINet,提升全域算力的智能调度水平。”

  国家数据局局长刘烈宏表示,集约化、一体化、协同化、价值化、绿色化是算力设施建设的重要趋势,要鼓励试点试验开云kaiyun,积极寻求国家数据基础设施建设的最优解。