1.
延迟(Latency / RTT)
- 测量目标:对目标用户所在的主要城市(例如北京、上海、广州)进行ICMP/TCP RTT测试。
- 推荐阈值:到北京单向延迟小于80ms,双向RTT小于160ms为优;到上海单向延迟小于60ms为佳。
- 测试工具:使用ping、mtr、psping(Windows)和iperf3 TCP测试确认应用感知延迟。
- 频次与窗口:在不同时间段(高峰、离峰)各进行至少100次采样,计算平均值、中位数与99百分位。
- 影响因素:跨海链路、运营商互联(CN2直连/绕路),以及目的地防火墙或防护设备的处理延迟都会显著影响RTT。
2.
丢包率与抖动(Packet Loss & Jitter)
- 丢包要求:业务敏感(VoIP/游戏)应低于0.1%;一般WEB/API应低于0.5%。
- 抖动要求:连续包延迟抖动(Jitter)应尽可能低,建议平均抖动<10ms为优。
- 测试方法:使用mtr进行长时追踪,统计各跳丢包;使用iperf3进行UDP流测试量化丢包率。
- 示例判断:若出口链路在传输高并发请求时丢包率上升到1%以上,需怀疑链路拥塞或防火墙限流。
- 缓解手段:优先选CN2直连带宽、选择有QOS/流量工程的运营商并使用多线或CDN分流。
3.
带宽与吞吐(Bandwidth & Throughput)
- 理解计费:按峰值带宽(如1Gbps)计费与按流量(GB/月)计费在成本结构上差别大。
- 吞吐测试:使用iperf3做TCP/UDP测试,测量传输饱和时的有效带宽(并发流数影响显著)。
- 硬件限制:VPS虚拟网卡、虚拟化平台(KVM/Xen/Hyper-V)对吞吐上限有影响,注意numa/virtio驱动配置。
- 监控指标:持续监控带宽使用峰值、95/99百分位带宽、以及突发流量持续时间。
- 表格示例:标准吞吐测试结果(样例数据)
| 测试项 | 目标地 | 平均吞吐 | 并发流数 |
| TCP窗口测试 | 北京 | 280 Mbps | 4 |
| TCP窗口测试 | 上海 | 420 Mbps | 6 |
| UDP丢包吞吐 | 广州 | 200 Mbps(丢包0.2%) | 8 |
4.
BGP/路由与CN2直连情况
- 查看路由:确认VPS运营商是否在路由表中宣告CN2直连、是否与国内主干运营商存在直接互联。
- AS路径长度:短的AS路径通常意味着更少的跳数与更低延迟,优先AS路径稳定的供应商。
- 路由冗余:确认是否有多线出口或备份路径以避免单点链路故障。
- 测试示例:使用bgp.he.net查询提供商AS号及其到中国运营商的互联。
- 运营商承诺:要求提供商在SOA/合同中写明CN2路由是否为默认路由或按需启用。
5.
可用性与SLA(Uptime)
- SLA指标:关注月度可用率(99.95%/99.99%)及故障赔偿条款的定义与执行流程。
- 故障检测:确认提供商是否提供API或控制面板事件通知与故障历史查询。
- 维护窗口:明确例行维护计划、预计时长及是否会影响公网链路。
- 实测可用性:通过外部监控(例如Pingdom/Prometheus)长期采样验证SLA。
- 真实案例:某客户在2024年Q1使用A厂商VPS,实际年可用率记录为99.92%,根据SLA获得5天免费时长补偿。
6.
DDoS防护与清洗能力
- 防护等级:确认是否有默认DDoS防护,清洗阈值(例如10Gbps/100Gbps)与是否为按次计费。
- 清洗位置:边缘清洗(CDN/全球清洗)优于本地主机清洗,能减少对VPS资源影响。
- 响应时效:了解告警到清洗启动的SLA(例如5分钟内响应)。
- 日志与溯源:是否提供攻击流量日志、黑名单与溯源信息便于后续处置。
- 案例说明:某电商在促销期间受到10Gbps SYN洪泛攻击,供应商在3分钟内启动全球清洗,峰值流量降到正常水平后业务无中断记录。
7.
监控、告警与观测能力(Observability)
- 基本指标:CPU、内存、磁盘IO、网络吞吐、丢包、连接数、进程状况等常规指标必须可视化。
- 历史与长时序:至少保留30天指标,建议支持Prometheus/Graphite导出。
- 告警策略:支持阈值告警、复合规则与推送渠道(邮件/SMS/Webhook)。
- API与集成:确认是否提供API查询指标及事件,便于接入统一运维平台。
- 实战建议:对关键业务建立自动化故障切换与流量清洗触发规则,减少人工介入时间。
8.
存储、IOPS与磁盘类型
- 磁盘类型:区分本地SSD、NVMe与网络盘(如Ceph/NAS),IOPS与延迟有明显差别。
- IOPS需求评估:数据库类服务建议选择可保证高IOPS的独立NVMe或本地SSD。
- 测试方法:使用fio做随机读写、顺序读写测试并记录平均延迟(ms)与IOPS。
- 容量与快照:确认快照频率、恢复时间与备份存取速率。
- 配置示例:推荐配置(数据库主机)——4 vCPU / 8 GB RAM / 1 x 500 GB NVMe(本地) / 10,000 IOPS 保证。
9.
运维支持与安全合规
- 支持能力:24/7技术支持、SLA响应时间与进阶技术支持(如内核调优)的可用性。
- 权限与责任:明确提供商与客户在安全事件中的责任分界(例如DDoS清洗由提供商负责,主机被入侵由客户负责)。
- 合规性需求:若面向中国用户,确认是否满足备案、数据主权或相关合规要求(必要时使用国内镜像或CDN)。
- 自动化运维:确认是否支持镜像管理、自动化部署(cloud-init、Ansible)及快照策略。
- 真实配置案例:某SaaS公司使用美国CN2 VPS配置:2 x Intel Xeon E5 vCPU, 4 GB RAM, 100 GB NVMe, 1 Gbps 带宽峰值(按流量计费),并配合国内cdn+国线回源,月均带宽流量2.2 TB,全年未发生超过2小时的可用性中断。
10.
成本结构与扩展能力
- 成本组成:分为固定资源费、带宽计费、流量清洗/防护费用与存储快照费用。
- 弹性扩展:确认是否支持按需扩容CPU/内存、临时提升带宽以及自动扩容组(Autoscaling)。
- 计费示例表:按月计费对比(样例)
| 项 | 配置A(基础) | 配置B(增强) |
| vCPU / RAM | 2 / 4GB | 4 / 8GB |
| 带宽 | 100 Mbps(按流量) | 1 Gbps(按峰值) |
| 月成本(估算) | $25 + $0.08/GB | $120(包月) |
- 扩展策略:建议采用混合架构(
美国CN2 VPS + 国内CDN + 多线回源)以兼顾成本与体验。
- 采购建议:在签订长期合同时要明确带宽峰值、清洗额度、SLA与支持级别,避免后期因流量突增产生高额账单。
来源:评估美国vps cn2 时必须关注的十项网络与运营指标清单