可用性是衡量服务稳定性的核心指标,对企业业务连续性影响最大。首先关注SLA里写明的具体数字,例如常见的有99.9%、99.95%或99.99%,并询问该数值是如何计算的(是月度、季度还是年度基准)。
其次要看是否明确排除项(maintenance windows、计划性停机、第三方故障等),以及是否提供客观的可用性统计来源(例如第三方监控或提供历史可用性报告)。同时确认可用性计算方法(总可用时间 / 总时间)和时间窗口,一些供应商会把短时抖动合并为一次故障,这会影响赔偿计算。
对于重要业务建议优先考虑99.95%及以上的SLA;对核心电商、支付类应用则尽量争取99.99%或异地冗余方案支持。
“供应商保证每月可用性不低于99.95%,并在月度可用性低于约定值时按比例给予服务抵扣,排除计划性维护需提前48小时书面通知。”
双向CN2强调的是经过中国电信CN2网络优化的国际回程链路,往返质量和稳定性对大陆用户访问台湾服务器的体验至关重要。SLA应明确链路的丢包率、时延(延迟)和抖动等指标,例如丢包率不高于0.5%,平均时延不超过200ms(根据目标用户地调整)。
还要看链路冗余描述:是否存在多条物理或逻辑路径(双路由由不同运营商出口),以及在单路故障时的自动切换时间(通常希望在30-120秒内完成)。最好要求供应商提供历史链路性能报告或允许第三方监控验证。
在SLA中加入验收测试条款,明确通过ping、traceroute、iperf等工具在指定时间段进行链路质量测试的频次与判定标准,测试失败应触发补偿或整改要求。
把“允许客户接入第三方监控并要求月度链路报告”写进SLA,或约定在连续两次链路质量不达标时自动升级为工程支持并给予服务信用。
SLA应明确不同严重级别(Severity 1~4或Critical/High/Medium/Low)的响应时间与恢复目标(例如响应时间:Critical 15分钟内、High 30分钟内;恢复目标:Critical 4小时内)。要关注是否区分工作时间与非工作时间,以及是否提供7x24的支持与电话直通通道。
还要看是否有故障升级流程(如NOC->工程师->高级工程师->厂商支援),以及在维修或替换硬件时的零配件到场与替换时限(RTTR, Mean Time To Repair)。如果涉及网络故障,需明确故障定位责任分配与第三方(电信运营商)协同机制。
SLA应规定故障通知渠道(邮件、短信、电话、工单系统)及后续定期状态更新频率,例:Critical每30分钟更新一次,直到故障关闭。
把“响应时间以工单创建时间为准,若供应商未在约定时间内响应则视为违约并触发赔偿”写入条款,能有效保护企业权益。
关注备份频率(RPO,数据允许损失时间窗口)与恢复时间目标(RTO),例如每日备份(RPO 24小时)或小时级备份(RPO 1小时)。SLA要写明备份存储位置(同机房/异地)、加密与数据保密措施,以及恢复演练的频率与通知。
冗余方面,要求明确服务器硬件冗余(RAID、双电源)、网络冗余(多出口、多骨干)以及是否支持跨可用区或异地容灾(DR)方案。如果企业业务要求较高,应把异地热备或冷备的启动条件、演练窗口和费用写入SLA。
若存在合规要求(例如个人信息、金融数据),SLA应包含数据主权、审计配合与数据删除/回收策略,明确在合同终止时数据交付或销毁方式和时间。
“供应商提供每日异地备份,备份保留期不少于30天;在客户提出数据恢复请求后48小时内完成首次数据恢复并确认完整性。”
SLA中的赔偿机制应明确违约触发条件、赔偿计算方式(通常以服务费用按比例或固定天数抵扣)、最高赔偿上限(如月费的100%)以及申请赔偿的流程与时间窗(例如故障发生后30日内提交申请)。避免出现“仅在供应商确认后生效”的单方面条款,应保留客户凭监控数据申诉的权利。
同时关注合同变更与终止条款:变更需提前通知并经双方书面确认;若供应商单方面降低SLA级别或频繁违约,客户应有权按照约定比例解除合同并要求数据移交。还要看供应商在不可抗力、第三方原因下的免责范围是否合理,避免过宽的免责条款。
建议在SLA中加入定期评估条款(如季度技术评审),并保留第三方审计或监控接入权限;对关键服务可设置分阶段扣款或试运行期条款以降低初始接入风险。
在签署前把关键条款(可用性、链路质量、响应/恢复时间、备份/冗余、赔偿/终止)逐条列入合同正文或附件,并约定双方验收与争议解决机制。