首先确认是单台台湾服务器问题还是整个子网/机房问题。用基础连通性测试判断故障范围是最直接的方式。
1) 在本地或其他可访问节点执行 ping(例如:ping -c 4 IP),确认是否有回应;
2) 使用 traceroute 或 mtr(Linux:traceroute -n IP / mtr --report IP)查看到达路径中断点;
3) 如果云控制台提供串流控制台或VNC,登录到主机控制台查看网卡状态(ip a / ip link show)及默认路由(ip route show)。
ping -c 4 1.2.3.4; traceroute -n 1.2.3.4; ip a; ip route;
若 traceroute 在运营商边缘即终止,可能是运营商或互联链路问题;若云主机控制台显示网卡 DOWN 或 IP 丢失,优先检查虚拟交换/安全组。
延迟和丢包可能来源于链路拥塞、路由不稳定、MTU 不匹配或主机负载问题,快速定位需要分层排查。
1) 用 mtr(带足够时长)观察丢包发生在哪一跳;
2) 在目标云主机上查看 CPU/IO/网络队列(top / iostat / sar / ss -s),排除主机端性能瓶颈;
3) 用 iperf3/iperf 在两端做带宽测试确认吞吐,或用 tcpdump 抓包定位重传/碎片/MTU 问题。
mtr --report --interval 1 IP; iperf3 -s / iperf3 -c server; sudo tcpdump -i eth0 host IP and icmp;
若丢包在云提供商内部多跳出现,需联系云商检查交换/宿主机;若丢包只在最后一跳,可能是虚拟网卡驱动或安全组限流导致。
DNS 问题通常表现为无法解析、解析到旧IP或解析延迟,排查时要同时核对解析链与本地缓存。
1) 使用 dig 或 nslookup 逐级查询(dig +trace 域名)查看权威解析链是否正常;
2) 在不同位置(本地、云端、公共 DNS 如 1.1.1.1/8.8.8.8)对比解析结果,判断是否为缓存或递归解析问题;
3) 检查云主机配置的反向解析(PTR)是否正确,检查 CDN 或负载均衡器是否在前端做了 IP 映射。
dig +trace example.com; dig @8.8.8.8 example.com A; nslookup example.com 1.1.1.1;
若权威 DNS 返回正确但客户端解析错误,建议清除本地 DNS 缓存并检查 /etc/hosts 是否被误写;CDN/负载均衡变更需检查生效时间(TTL)。
端口不可达既可能是主机防火墙(iptables/nftables)或云安全组策略,也可能是路由/NAT 问题。分层检查能快速定位责任方。
1) 从外网尝试 telnet IP port 或使用 curl,记录失败类型(超时 vs 立即拒绝);
2) 在云控制台检查安全组/ACL 是否放通对应协议与源IP;
3) 登录云主机查看本地防火墙规则(sudo iptables -L -n 或 sudo nft list ruleset)和服务监听(ss -tulnp / netstat -tuln)。
telnet 1.2.3.4 22; curl -v http://1.2.3.4:80/; ss -tulnp | grep 80; sudo iptables -L -n;
若外网尝试显示“Connection refused”,通常是服务未监听或本地防火墙拒绝;若超时,优先检查云端安全组或中间 NAT/负载均衡策略。
应用层问题可能与容器网络、虚拟网桥、NAT、反向代理或TLS配置有关,定位时要检查从进程到网络的每一层。
1) 确认进程/容器是否正确绑定到预期 IP 与端口(ss/netstat,docker ps / kubectl describe pod);
2) 若使用容器或虚拟网络,检查桥接接口(brctl show / ip link)和 NAT 规则(iptables -t nat -L -n);
3) 用本机 curl 或 wget 访问本地 127.0.0.1:端口 与内网 IP:端口,确认是应用本身还是外部路由问题。
ss -lntp; docker inspect <容器>; iptables -t nat -L -n; curl -v http://127.0.0.1:8080/;
容器化环境下常见问题为端口映射未生效或 CNI 插件异常,检查云主机内核参数(如 net.ipv4.ip_forward)和 MTU 配置可解决部分连接异常。