查看服务等级协议中对可用性的承诺(如99.95%或99.99%),并确认指标类型:是否仅指机房供电/网络,还是包含应用层。重点核查是否有明确的赔偿条款、测量窗口、以及可用性计算方法(排除维护时间如何处理)。
除可用性外,关注响应时间(支持工单首次响应)、恢复时间目标(RTO)与恢复点目标(RPO)、网络延迟与丢包率指标。优质厂商会在SLA中列明这些值并提供历史报告。
要求查看历史可用性报表、第三方监控数据(如UptimeRobot/Datadog)或真实客户案例,验证SLA兑现率和赔付记录。
警惕“最佳努力(best-effort)”或含糊条款,优选有明确量化指标且支持独立审计的SLA。
备份策略应涵盖备份频率(如实时、每小时、每日)、备份类型(全量、增量、快照)、保留策略(短期与长期)、以及是否有离线/异地备份。完整策略还要包含加密、不可变备份(immutability)与访问控制。
关注是否使用快照结合增量复制、是否支持连续数据保护(CDP),以及备份数据是否传输与存储全程加密(传输层和静态数据)。
有效的备份策略必须有定期的恢复演练记录,证明备份可用且恢复流程成熟。
确认备份数据的存放地点(本地/菲律宾境内/跨国),是否满足数据主权与隐私法规(如当地数据保护法规)。
RTO决定系统从故障到可用所需时间,RPO决定可容忍的数据丢失量(时间)。评估时要看SLA中给出的RTO/RPO数值是否合理并与业务需求对齐。
要求厂商提供历史恢复演练日志、真实故障案例和恢复时间统计。理想情况下,厂商能展示多次演练中平均与最大恢复时间,且演练环境与生产环境相似。
评估应包含单点故障、全站点故障、网络分区和数据损坏等场景,并确认演练频率(至少每季度一次或更频繁)。
将RTO/RPO与业务损失模型(每小时损失)结合,判断SLA赔偿是否能覆盖潜在风险。
SLA与备份策略应明确数据加密、密钥管理、访问控制、审计日志与事件响应时间。查看是否有第三方安全认证(如ISO27001)或遵循行业合规标准。
备份数据在传输与静态时必须加密,最好支持客户自管密钥或硬件安全模块(HSM)。
采用不可变存储或写一次读多(WORM)策略以防勒索攻击后删除备份;在SLA或合同中明确恢复权利与数据持有权。
确认厂商在菲律宾的合规实践,是否能应对政府/司法要求、数据泄露通知流程以及跨境数据传输规则。
评估运维团队的组织结构(7x24值班、应急团队)、工具链(自动化备份、监控平台)、以及事件响应流程。优秀厂商会有实时监控、告警路由和多级升级机制。
至少监控可用性、备份成功率、备份时延、存储容量与网络链路健康,并对关键阈值设置自动告警与SLA触发器。
运维应具备自动化恢复脚本、基础设施即代码(IaC)能力以及对恢复流程的定期演练和回顾(post-mortem)。
评估网络与电力冗余(如BGP、多运营商、N+1或2N电源)、多机房/多可用区部署能力,以验证其在不同故障情况下维持SLA的能力。