关键业务服务器负责承载数据库、ERP等企业核心应用,直接关系到业务发展的生命线,是企业成功的关键。为保障企业关键应用的稳定运行,H3C HPE Superdome Flex系列关键业务服务器应运而生,在提供强劲性能的同时,保持了99.999%的高可用性。已广泛应用于政府、金融、医疗、教育等各行业关键业务场景。
最近,IDC 发布了一份题为“关键任务平台在向‘数字优先’战略转变中提供连续性”的报告。报告中,H3C HPE Superdome Flex系列关键业务服务器再次获得IDC的AL4级可用性评级,并表示“HPE是AL4级市场的关键参与者”。
IDC 为计算平台定义了四个级别的可用性,从 AL1 到 AL4,其中“AL”代表“可用性”,数字越大表示可靠性越高。
IDC对AL4的定义:平台通过广泛的硬件可靠性、可用性和冗余能力,能够在任何情况下稳定运行。
被评为AL4的平台大多是传统大型机,而H3C HPE Superdome Flex系列关键业务服务器是唯一满足该认证的x86计算平台。
利用 RAS 策略创建持续可用的 AL4 关键业务平台
故障是不可避免的,一个优秀的平台应该具备及时处理故障的能力。它需要采用先进的故障管理策略来识别基础设施故障的根本原因,防止其对IT堆栈组件(例如操作系统、数据库、应用程序和数据)造成影响,从而导致设备停机和业务中断。
H3C HPE Superdome Flex系列关键业务服务器基于RAS(Reliability、Availability、Serviceability)标准设计,旨在实现以下目标:
1、通过检测并记录错误来定位故障。
2. 分析故障,防止故障影响操作系统、数据库、应用程序和数据等更高级别的 IT 堆栈组件。
3. 修复故障,尽量减少或避免停电。
H3C HPE Superdome Flex系列关键业务服务器近期获得IDC AL4级评级,充分认可了其高水平的RAS能力,将其描述为能够在任何情况下持续运行的容错平台,具有全面的硬件RAS和硬件覆盖整个系统的冗余功能。
具体来说,H3C HPE Superdome Flex系列的RAS特性体现在以下三个方面:
1. 使用 RAS 功能检测跨子系统的错误
子系统级 RAS 功能用于较低 IT 层,以收集错误检测证据、确定根本原因并识别错误之间的相关性。内存RAS技术增强了内存可靠性,降低了内存中断率。
2. 固件可防止错误影响操作系统和应用程序
内存、CPU 或 I/O 通道中发生的错误仅限于固件级别。即使处理器未完全正常运行,固件也可以收集错误数据并执行诊断,从而确保诊断正常进行。可以对系统内存、CPU、I/O 和互连组件进行预测性故障分析。
3. 分析引擎处理并纠正故障
分析引擎持续分析所有硬件是否存在故障,预测故障并启动自动恢复功能。及时向系统管理员和管理软件通报问题,进一步减少人为错误的发生,提高系统可用性。
发布时间:2023年8月8日