错误691处理操作规范|错误691
摘要:根据网络的典型模型,相关设备具体分析,结合维护部门的设置制定出行之有效的维护作业方法和程序。 关键词:终 端 汇聚端 服务器端 作为一个网络维护工作者,在实际的工作中,发现很多的时候,很多的故障,都是依靠我们的技术人员个人的技术积累,维护的具体心得,采取的各种灵活的处理方式。虽然这种方式有着不拘一格的机动性,但是更多的时候显现出故障定位准确率低,处理手段简单粗糙,影响故障的时延,降低设备质量。所以,规范化故障处理程序成为当务之极。下面就以691故障为例,浅谈一下操作的规范化,形成一个类似医学上可靠,科学的处理方案。
要排除故障,就要对可能引发故障的原因做一个全面的了解,针对不同内因引起的故障,采取不同的方法,类似医学的先检查,后上手段。我们首先建立一个网络的抽象模型,像一个医用解剖图,对其内在机理做一下阐述。
这是一个高度抽象,具有一般代表性的组网图,请看:
下面简述一下用户上网的认证过程:
当用户打开电脑和modem,需要上网,首先打开pppoe软件,输入用户名和密码,点击连接,请求验证。ppp信息到达Modem后经ethernet格式封装,到达Switch在经过Vlan封装到达路由器的BAS接口。经过剥离后,根据BAS配置的相关模板和Athentication方案进行处理,发往Radius服务器。验证通过后,用户获取相应的ip地址和访问权限,显示宽带已连接,可以进行网上冲浪了。可就在此时,计算机出现一个提示框,错误691,用户名和密码错误,这就是我们要解决的问题。根据以上过程,处理意见如下。
1 首先我们应该想到的是终端的错误
(1)原因:用户忘记了密码和用户名,输入的信息错误,这样的问题很常见,也比较好解决。处理方法:找到正确的资料,重新输入,问题解决。(2)原因:用户名和密码的输入框中存在空格等不可见字符,看着好像输入正确,其实xp系统自建的拨号软件对空格等字符敏感,按照正常信息发送,这样的问题也好处理。处理方法:重新输入用户名和密码,删除不可见字符。(3)原因:计算机pppoe软件组错误,如文件缺损(包含网卡驱动),此时输入的信息正确,但发往Modem的信息也错误,自然验证错误。这类问题较为隐蔽,希望多加注意。
处理方法:在排除1,2可能后,重新安装计算机的tcp/ip协议族(包括网卡驱动),此后验证通过。(4)原因:硬件损坏,如网卡损坏等,这类问题特征较为明显,在计算机的使用中伴随大量的并发特征,发生概率较低,直观的检查设备管理器相关设备,自检就能发现。
解决方法:更换相关计算机硬件。其次,我们就应该想到是认证服务出了问题了。
2 其次我们就应该想到是认证服务器的问题
(1)认证服务器数据丢失。(2)认证服务器比对程序错误。(3)认证服务器连接中断,造成无法认证,返回not ackknowlege信心。(4)认证服务配置错误,主要有raduis配置,路由等。需要修改为正确的配置。这类问题,我们设有专门的认证服务器维护机构,打电话咨询,做好用户的解释工作,等待结果,同时可以改为认证模式为不认证,解决上网问题,缩短故障时延,减少用户的不满。
3 第三我们应该去考虑VBAS信息是否正常
为了精确定位用户信息,减少用户帐号被盗概率,我们要去对用户的具体位置,作出精确定位,保证用户只能在自己的环境中使用自己的帐号。用户的具体信息在接入交换机后,封装了vlan,vlan不能具体识别用户具体物理位置。为此,我们在BAS设备和接入设备见采用了vbas协议,通过vbas协议相关字节,记录用户详细信息。所以我们就应该根据此线索去查找。
(1)接入设备(如MA5300),配置vbas命令错误。修改其命令,认证恢复正常。(2)认证设备BAS绑定物理端口错误(如MA5200G),BAS需要绑定接入设备的上行端口的mac地址,上行口更换,mac发生变化,vbas绑定也需要相应变化。更改vbas绑定,认证正常。 (3)用户物理位置发生变化(如更换接入设备端口),由于此时报告给认证服务器的信息是旧的信息,Radius认为是非法用户,造成认证失败。这时只要从Raduis重新绑定就可以了。(4)用户认证域发生变化,用户需要不同的ip和权限,更换了域名,由于Radius的精确绑定性,也造成认证错误,此时也要重新绑定。
4 第四开始看一看是不是认证吊死现象
这种现象虽然放到了最后,但也是最容易出现的问题。由于用户的非法关机,路由的突然中断,Raduis服务器收不到用户下线信息,就会认为用户在线。此时再次认证,当然通不过了。这时要通知互联网设备管理机构,清除用户的在线记录就可以了。
任何问题都是由简单到复杂,再由复杂到简单。
一般的健全配置由三个部分组成,局端,负责线路和用户终端;汇聚端,负责接入,转发,路由的维护;服务端,负责各计费、认证等服务器的工作。
这样我们接到一个691故障申告,具体的处理方案就出来了。
第一 首先检查用户的输入和计算机软硬件故障,由负责局端技术人员负责。
第二 检查局端无错误,通知汇聚工作部门检查接入,交换,路由设备的配置。
第三 此时责任人发生改变,汇聚工作部门负责的问题解决后回馈局端或客服,通知用户。不是汇聚问题,通知服务器维护部门解决,责任义务上传。
第四 服务器端工作人员查证处理后给予反馈,到汇聚部门,再到局端负责人,通知用户同时通知客服人员回访用户,做到完美结束。
第五 区域性691直接提交汇聚部门检查,由汇聚部门协调完成。
第六 全局性691提交汇聚部门,并转发服务器维护部门,检查完成后,回访用户。(由存在路由断链的可能,上述两个部门应配合工作。)
这样,一个科学,完善,可执行的程序标准就出来了。像临床成熟的治疗方案一样会得到大家的认可,谢谢大家,请多指正。
本文为全文原貌 未安装PDF浏览器用户请先下载安装 原版全文
