现象描述
组网:S3025M通过百兆以太口连接5200的HAB的一个百兆以太网口,S3025下挂用户通过在5200上进行VLAN认证上网。
现象:S3025下的上网用户通过获得IP地址后,开始可以正常上网,但过几分钟或十几分钟后,用户就无法上网了,需要将地址释放重新获取IP地址后才可以继续上网。但过几分钟或十几分钟又会异常掉线。
告警信息
S3025与5200连接的以太网口信息显示一切正常,为百兆全双工。5200也无任何告警信息。
原因分析
首先排除5200的DHCP SERVER的问题,由于开始可以正常上网,说明用户获取IP地址这一过程是没有问题的,但后来时间不定的异常掉线,这有可能是与交互报文有关。估计是5200对在线用户的监测报文在某个地方出现了问题,使5200认为用户已经不在线,主动释放用户的上网权限,导致用户异常掉线。
处理过程
1、首先察看S3025的端口实时信息,发现S3025与5200连接的以太网口收发包正常。说明该端口无任何问题。
2、用PC接在S3025下可以正常上网,但过一会还是会异常掉线,在PC上抓包发现有许多目的MAC为单播地址的ARP报文,按照协仪规定这种ARP报文是不标准的,普通ARP报文目的MAC地址都是广播的。这种目的地址为单播的ARP报文是5200用来探测上网用户是否在线的特有报文。PC掉线后,这种报文就没有捕获到了。
3、在5200上打开DEBUG DHCP报文的开关,发现有很多ARP的DHCP探测报文都没有得到在线用户的回应。
4、将S3025换成2403F,同样用PC接在2403F下上网,发现上网正常,没有出现掉线的现象。在PC上抓包同样可以看到许多目的MAC都为单播的ARP报文。此时在5200上查看Debug DHCP调测信息,发现ARP的DHCP探测报文都有了在线用户的回应。
5、怀疑是S3025将这种目的MAC为单播的ARP报文丢弃,但这又与开始用户能上网矛盾,因为如果3025丢弃该报文的话,那么上网的用户应该开始就上不了网,而且掉线的时间也应该是固定的,不会在几分钟到十几分钟之间掉线时间不等。
6、为了排除上行网线的问题,将S3025与5200的连接网线换成另外一根网线,结果发现上网用户正常,没有出现过异常掉线的现象。问题解决。
建议与总结
该问题比较隐蔽,因为在S3025上行口用不标准网线连接时,在3025查看端口信息看不出任何异常,而且也可以正常上网一段时间,表面看起来跟正常网线没有任何区别,所以定位比较困难。5200向在线用户定时发送ARP单播探测报文,如果连续五次没有收到在线用户的应答报文的话,5200就认为该用户已经不在线,主动释放该用户的上网权限。用2403F上网的时候没有出现异常掉线,而用S3025时就会出现异常掉线的现象,而上行使用的都是同一根网线。由此可以看出,S3025对网线的质量要求要高一些,如果使用不标准网线与之相连的话,就有可能出现丢包现象,如果是丢掉类似这种5200的探测报文的话,就会导致用户异常掉线。所以建议在遇到与S3025组网时,需要特别注意使用网线的标准性,一定要按照国际标准线序来制作网线,这样才会避免出现一些莫名其妙的问题,保障网络运行的稳定性。
【相关文章】