要准确评测延迟,应结合多种测试:ICMP(ping)用于快速感知往返时延,TCP/HTTP 请求用于模拟实际应用延迟,MTR 或 traceroute 用于定位路径问题。测试应覆盖不同时间段并计算平均值、百分位(P50/P95/P99)和抖动(jitter),以反映真实用户体验。建议使用分布在东亚、北美、澳洲的节点发起测试,避免单点偏差。
评测带宽时要区分标称带宽、实际吞吐量和并发能力。使用 iperf3 做点对点吞吐测试以获得 TCP/UDP 最大吞吐,使用真实流量(如并发下载/多连接 HTTP)来测试应用场景下的有效带宽。注意观察峰值与持续带宽、突发(burst)能力和供应商的流量整形或共享(contention)。测试时需记录上行/下行以及不同时间窗口的表现。
评估可用性应以长期监控数据为基础:计算可用率(例如 99.9%)、事件频率、平均恢复时间(MTTR)和故障影响范围。使用外部探测(多地域合成监控)与内部健康检查结合,记录每次故障开始/结束时间并标注根因。将 SLA 声明与实际观测对比,展示历史可用率曲线与置信区间以便判断稳定性。
权重应基于用户场景定制:对实时交互类(游戏/VoIP)以延迟为主,推荐权重延迟60%、可用性25%、带宽15%;对视频直播则带宽和可用性重要,带宽50%、可用性30%、延迟20%;普通网站/电商可用性40%、延迟30%、带宽30%;备份/归档以带宽和可用性为主,带宽50%、可用性40%、延迟10%;企业数据库倾向可用性50%、延迟35%、带宽15%。评测网站应提供这些模板并允许自定义。
展示时应提供原始数据(延迟分位、吞吐曲线、历史可用率)与合成评分(按权重计算的总分)。允许用户调整自定义权重并实时看到排名变化,提供权重对总分的敏感度分析与阈值高亮。使用雷达图、时间序列图和表格同时呈现,注明测试时间窗与样本数量,确保评分透明并附上方法说明与误差范围,方便不同技术背景的用户理解与选择。