最近有一次非典型的AC问题处理,为啥说非典型呢?因为排错的过程还是比较漫长,从原因定性又不是传统的疑难问题,也可以说是因为“天时地利人和”等等多种因素凑在一起才会出现的问题,这里和大家做个分享,今后大家处理问题的时候也会多一个考虑的方向。
客户一大早报修,据说是部署在网络出口的网络行为控制设备(以下简称AC)突然不正常了,紧急安排工程师上门。
工程师小吴到了现场发现所谓的AC功能异常只是它的应用控制功能出了问题,客户的AC设置应用控制的策略,限制客户端电脑不能访问娱乐网站,不良网站等,之前一直都是正常的,今天一上班突然发现策略都失效了,大家可以随意访问各种娱乐网站,游戏网站,炒股网站等等,客户对网络访问的控制策略要求很严格,这种情况当然需要紧急排除,小吴马上进入了紧张的排错过程中。
小吴认认真真的把AC上所有的策略全部检查了一遍未发现异常,把所有用户组检查了一遍仍然正常,又把所有设置的对象检查了一遍还是正常!小吴以前处理类似问题,基本上都是用户自己调整策略时候的一些细节错误导致了功能异常,仔细检查两遍基本都会解决,“难道我这两天熬夜,视力下降了?不行我再检查三遍!一定处理掉!这么个小问题解决不掉,简直太丢人了!”小吴的好胜心被激发了起来,真是又反反复复核对了三遍,依然无果。
难道是授权问题?客户设备的应用控制服务正好今天到期了?小吴检查授权,所有授权都是服务期内。
难道是这个设备自动更新了某些补丁,导致了功能异常?小吴找到了新的方向乐坏了,马上检查设备的软件版本和补丁更新情况,检查之后,小吴不由得心中一阵狂喜,果然设备昨天晚上更新了一个补丁,太棒了!小吴连忙找客户负责人沟通情况,商定在客户午休的时候对设备补丁进行回滚还原,“小样的,这我还解决不了你吗?“小吴急迫的等待着午休时间的到来。
到了午休,小吴迫不及待的进行了补丁回滚的操作,重启设备,一气呵成,结果功能还是不正常!小吴有点犯迷糊了,使出最后的法宝,厂商400求救,400电话拨通之后,小吴和400售后一起排错,当然还是这老三样,从头一点点的检查,厂商400也没有法宝一下子解决问题,眼看时间一分一秒的流逝,问题还是没有解决“这调休调的我都不知道今天是周几了,一点周日的感觉的都没有了”两个客户的员工在旁边闲聊,这句话一下子刺激到了小吴“难道是策略的时间问题?”小吴灵感来了,他连忙去对着电话大喊“快去找如来佛祖!不对,是查时间策略”把400人员吓得一愣,果然两人发现客户设置的应用控制策略中的生效时间,是工作日,但是今天因为十一放假调休,今天虽然上班但是今天是周日,所以策略不生效!
“天时”:今天是周日,“地利”:今天大家上班,“人和”:小吴和400都过糊涂了,没想到今天是周日,最终导致了这个问题排错的过程比较漫长!
总结处理网络问题,还是看变量,设置没有调整过,硬件没有变动过,线路没有变化过,其中软件补丁更新是一个误导项,唯一变量就是今天不是工作日,很容易被忽略的一个变量,导致了问题处理的冗长。遇到网络问题还是要多角度分析,从变量下手,才可以稳准狠的搞定问题。
文/上海蓝盟 IT外包专家