先描述一下背景,我是学校实验室的队长,实验室有一台刀片机服务器。因为学长毕业了,自然轮到我来管理。
最近刀片机烧了,学校拿去报修,这两天送回来,数据无大碍。
刀片机是用 xen 虚拟化方案,主控是 CentOS 系统,为了方便说明,这里贴出主控的内网 ip 地址:172.18.6.104
。然后我启动了 2 个虚拟服务器,一个是172.18.6.101
,另一个是172.18.6.106
,这两台虚拟机启动正常,都是 CentOS 系统。
奇怪的事情来了,我在其他机器上,ping 得通主控 104,却 ping 不通其 2 台虚拟机 106 和 101。
然后我又用 tracert 来追踪两条路径,得到如下结果( 101 和 106 情况一样):
~ ➤ traceroute 172.18.6.104
traceroute to 172.18.6.104 (172.18.6.104), 30 hops max, 60 byte packets
1 172.18.72.254 (172.18.72.254) 0.255 ms 0.248 ms 0.241 ms
2 192.168.222.186 (192.168.222.186) 0.571 ms 1.062 ms 1.084 ms
3 172.18.6.104 (172.18.6.104) 0.249 ms 0.276 ms 0.291 ms
~ ➤ traceroute 172.18.6.106
traceroute to 172.18.6.106 (172.18.6.106), 30 hops max, 60 byte packets
1 172.18.72.254 (172.18.72.254) 0.275 ms 0.270 ms 0.262 ms
2 192.168.222.186 (192.168.222.186) 0.474 ms 0.583 ms 0.742 ms
3 * * *
4 * * *
5 * * *
6 * * *
从结果中可以看出,路径是一样的,但是到192.168.222.186
这个交换机,就卡了,我觉得是交换机路由问题吧。
我咨询了一下老师,老师说 104 都通,怎么可能是路由交换的问题呢,104、106 都是一个实体机,共用的一个网卡,104 一直正常,这就说明线路、网络都是没问题。
然后我远程登录 ssh 104 这台主控,在主控上 ping 106,是通的。在主控上 ssh 登录 106 这台机器,发现有点奇怪,就是断断续续的,输入一个命令好久才回显,这时候,其他机器 ping 106,有时候是通的。
现在还没定位出问题,老师说可能是 ip 地址冲突了,问了下学长他说不可能;我也检查了防火墙问题,也不管用。
求各位前辈支支招,谢谢了。
补充一下 106 路由表:
[root@localhost ~]# route -n
Kernel IP routing table
Destination Gateway Genmask Flags Metric Ref Use Iface
172.18.6.0 0.0.0.0 255.255.255.0 U 0 0 0 eth0
169.254.0.0 0.0.0.0 255.255.0.0 U 1002 0 0 eth0
0.0.0.0 172.18.6.254 0.0.0.0 UG 0 0 0 eth0
我发现这个 169.254 有点奇怪啊,查了下好像 DHCP 未分配到 ip 地址就是这个了。
1
imn1 2017-06-30 17:53:10 +08:00
我只想知道这帖的几个 tag 怎么算出来的?
|
2
xfspace 2017-06-30 18:05:00 +08:00 via Android
169.254.0.0/16 一般都是无法获取 IP 或 IP 冲突才会出现的地址
|
3
cftm82 2017-06-30 18:09:14 +08:00 1
169.254.0.0/16 都有,没关系。目测虚拟机和网关连接有问题。查下虚拟机 ping 网关通吗?
|
4
cftm82 2017-06-30 18:11:10 +08:00
不通的话查下和宿主机的网桥
|
5
netcan OP 貌似已经解决了,谢谢各位,我把 169.254.0.0/16 这个路由删了,就正常了。。。
|
6
netcan OP 删除路由表,过了几分钟貌似就正常了。
``` [root@localhost ~]# route -n Kernel IP routing table Destination Gateway Genmask Flags Metric Ref Use Iface 172.18.6.0 0.0.0.0 255.255.255.0 U 0 0 0 eth0 169.254.0.0 0.0.0.0 255.255.0.0 U 1002 0 0 eth0 0.0.0.0 172.18.6.254 0.0.0.0 UG 0 0 0 eth0 [root@localhost ~]# route del -net 169.254.0.0/16 dev eth0 [root@localhost ~]# route -n Kernel IP routing table Destination Gateway Genmask Flags Metric Ref Use Iface 172.18.6.0 0.0.0.0 255.255.255.0 U 0 0 0 eth0 0.0.0.0 172.18.6.254 0.0.0.0 UG 0 0 0 eth0 [root@localhost ~]# w 16:31:52 up 51 min, 2 users, load average: 0.00, 0.01, 0.00 USER TTY FROM LOGIN@ IDLE JCPU PCPU WHAT root pts/0 172.18.6.104 15:45 3:11 0.36s 0.36s -bash root pts/1 172.18.72.13 16:26 0.00s 0.02s 0.00s w ``` |
7
netcan OP @cftm82 网关 172.18.6.254 一直都通,我觉得是 169.254.0.0 的问题,之前还真没见过这个。。。
|
8
trepwq 2017-06-30 18:36:21 +08:00 via iPhone
应该 dhcp client 插的路由,我曾经也遇到过,重启就好了,当然删了路由也行
|
10
johnnie502 2017-06-30 21:43:58 +08:00
机架,刀片,傻傻分不清楚
|