随着以ChatGPT等模型为代表的人工智能应用的快速崛起,对算力的需求猛增。为满足AI时代日益增长的计算需求,紫光集团旗下新华三集团近日在2023 NAVIGATE领袖峰会上发布了H3C UniServer G6和HPE Gen11系列11款新产品。这些新的服务器产品为人工智能跨场景构建了全面的矩阵,为处理海量数据和模型算法提供了强大的底层平台,并保证了人工智能计算资源的充足供应。
丰富的产品矩阵,满足多样化的AI计算需求
作为智能计算领域的领导者,新华三集团深耕人工智能领域多年。 2022年,新华三在中国加速计算市场取得最高增速,在国际知名AI基准MLPerf中累计获得132项全球第一,展现了强大的技术实力。
凭借在智能计算基础上构建的先进计算架构和智能算力管理能力,H3C专门针对大规模模型训练推出了智能计算旗舰产品H3C UniServer R5500 G6。他们还推出了适合大规模推理/训练场景的混合计算引擎H3C UniServer R5300 G6。这些产品进一步满足不同AI场景下的多样化计算需求,提供全面的AI计算覆盖。
专为大规模模型训练而设计的智能计算旗舰
H3C UniServer R5500 G6 集强度、低功耗和智能于一体。与上一代相比,它提供了三倍的计算能力,对于GPT-4大规模模型训练场景来说,训练时间减少了70%。适用于大规模训练、语音识别、图像分类、机器翻译等多种AI业务场景。
优势:R5500 G6最多支持96个CPU核心,核心性能提升150%。它配备了全新的NVIDIA HGX H800 8-GPU模块,提供32 PFLOPS的计算能力,使大规模模型AI训练速度提升9倍,大规模模型AI推理性能提升30倍。此外,在PCIe 5.0和400G网络的支持下,用户可以部署更高性能的AI计算集群,加速AI在企业中的采用和应用。
智能:R5500 G6支持两种拓扑配置,智能适应各种AI应用场景,加速深度学习和科学计算应用,大幅提升GPU资源利用率。得益于H800模块的多实例GPU特性,单个H800可以分为7个GPU实例,最多可以有56个GPU实例,每个实例都有独立的计算和内存资源。这显着增强了AI资源的灵活性。
低碳足迹:R5500 G6完全支持液冷,包括CPU和GPU的液冷。 PUE(电源使用效率)低于 1.1,可以在计算激增的情况下实现“冷计算”。
值得一提的是,R5500 G6一经发布,就在“2023计算性能实力排行榜”中被评为“2023年十大杰出高性能服务器”之一。
混合计算引擎,灵活匹配训练和推理需求
H3C UniServer R5300 G6作为新一代AI服务器,相比上一代在CPU和GPU规格上都有了显着提升。其性能卓越、拓扑智能、计算存储一体化,适用于深度学习模型训练、深度学习推理等人工智能应用场景,灵活匹配训练和推理计算需求。
性能出色:R5300 G6 兼容最新一代 NVIDIA 企业级 GPU,与上一代相比,性能提升 4.85 倍。支持GPU、DPU、NPU等多种类型的AI加速卡,满足不同场景下AI的异构算力需求,赋能智能时代。
智能拓扑:R5300 G6提供五种GPU拓扑设置,包括HPC、并行AI、串行AI、4卡直连、8卡直连。这种前所未有的灵活性极大增强了对不同用户应用场景的适应性,智能分配资源,驱动算力高效运行。
计算存储一体化:R5300 G6灵活容纳AI加速卡和智能网卡,将训练和推理能力结合起来。它支持多达10个双宽GPU和24个LFF(Large Form Factor)硬盘插槽,可以在单台服务器上同时进行训练和推理,为开发和测试环境提供经济高效的计算引擎。存储容量高达400TB,充分满足AI数据的存储空间需求。
随着人工智能热潮的席卷而来,算力不断被重塑和挑战。新一代AI服务器的发布,标志着新华三集团致力于“与生俱来的智能”技术、持续推动智能计算演进的又一里程碑。
展望未来,新华三集团以“云原生智能”战略为引领,秉承“细致务实,赋予时代智能”的理念。他们将持续培育智能计算沃土,探索人工智能深层次应用场景,以面向未来、适应性强的计算能力,加速智能世界的到来。
发布时间:2023年7月4日