1告警系统分析
C&C08程控交换机在运行过程中,当某些部件出现故障时,交换机的告警系统就会检测收集到各种软、硬件故障,然后经维护软件处理后在告警台输出告警信息报告,并通过告警箱显示告警级别及告警原因,发出可视、可闻信号,提示维护人员进行必要的处理,以保证设备的正常运行。
C&C08交换机的告警系统采用分散采集、集中处理的方式,将各种告警信息集中到告警通信板分类处理后,再分别送到告警灯、告警箱和远端网管中心。根据故障对设备的影响程度、重要性及紧迫性分为紧急故障、重要故障、一般故障和提示性故障等4个告警级别。
1.1紧急告警(一级告警)
紧急告警需要紧急处理,这种告警往往具有全局性,会导致主机瘫痪,对应红色告警级别指示灯和急促铃声。如主机板故障、网板故障、时钟板故障等,故障内容涉及CPU、EMA、BNET、CNT、CTN、SNT、FBI等重要部件。
1.2重要告警(二级告警)
重要告警指局部范围内的单板或线路故障告警和事故告警,需要及时处理,否则会影响重要功能的实现,如用户板故障、数字中继板故障等;对应信号为红色指示灯及次急促铃声。故障内容涉及SIG、MFC、DRV、ST、ASL、MC2、OPT及NOD等板件,以及信令链路故障等。
1.3一般告警(三级告警)
一般告警,指一般性的,描述各单板或线路工作是否工作的状态故障告警和事故告警;提醒维护人员及时查找告警原因,消除故障隐患,对应信号为黄色指示灯及断续铃声。故障内容涉及单板复位、PCM告警等。
1.4警告告警(四级告警)
警告告警是提示性告警,指不会影响系统性能的提示性的故障告警和事故告警,如测试板告警,这种告警不会影响系统性能,不必及时处理,但对交换机运行状态要做到心中有数,对应信号为绿色指示灯及单次铃声。
在日常维护中,机房维护人员应从以下5个方面察看告警信息:一是机架行列告警灯,二是告警箱,三是维护终端的告警台,四是单板指示灯,五是维护台的“设备控制”单板状态。另外有些故障可能在上述5处都无法查觉,而是来自用户的申告。通过以上方面察看可以获得告警信息和用户申告信息。
2故障分析和处理的原则
C&C08的操作系统不仅具有各种软件管理协调功能,同时还具有差错分析和处理能力。对于机房维护人员来说,后者更具有重要现实意义。因为在实际操作中,我们可以利用交换机的差错分析处理软件对故障进行分析和判断。
当C&C08的操作系统发出告警信息后,机房维护人员首先应根据告警的级别判断障碍性质、重要性及地点,并遵循以下原则对故障进行分析和处理:
(1) 处理重要事件时,首先要提取话单,以免话单丢失;
(2) 在能够处理的范围内,尽量不影响全局通话;
(3) 避免在话务量高峰时处理,最好在话务空闲时进行故障处理;
(4) 观察单板指示灯和维护终端的状态,分析相关单板;
(5) 不要盲目更换单板,防止故障扩散;
(6) 插拔单板时,一定要带防静电腕套,并将接地端靠地连接。
3交换机的故障定位与处理方法
3.1C&C08交换机的测试诊断功能
C&C08具有较强的测试诊断功能。一方面,各智能单板都具有自检功能,设备运行过程中,各智能单板可实时进行自检,一旦发生故障将自动报警或倒换;另一方面可通过测试子系统向主机发送命令,对指定设备进行测试。
3.1.1测试系统的组成和基本原理
(1) 测试系统的组成。C&C08机的测试系统由硬件测试设备、主机软件和终端软件组成。硬件测试设备主要包括用户电路测试板(TSS)、用户模块母板测试总线以及带有自测功能的各种智能单板。测试系统的主机软件是指运行于交换模块MPU板的主机软件中的TEST程序模块。测试系统的终端软件由BAM上的测试服务器和工作站上的测试台组成。
(2) 测试系统的基本原理。测试子系统通过终端系统向主机发送人机命令,由主机下达相应的测试命令给相应的设备,启动相应的测试任务。测试完成后将测试结果通过主机送回终端,由终端系统进行分析、统计、显示与打印。
3.1.2测试系统的主要内容
C&C08测试系统的主要内容包括3个部分,即用户电路测试、系统单板测试、测试系统自检。
(1) 用户电路测试。电路测试主要指对交换机用户电路的各项性能或指标的测试。主要包括用户内线测试、用户外线测试及用户仪表测试。测试的性能指标包括:线路绝缘电阻、绝缘电压、绝缘电容及用户板性能测试。
(2) 系统单板测试。系统单板测试是指系统对23种单板提供的单板自检功能,如MPU、EMA、BNET板等。各智能单板在平时即可进行实时自检,一旦有故障将自动向终端发送告警信息。当测试系统向上列单板发出测试命令后,根据各单板返回的测试结果可判断出各单板的运行状态,从面进行故障定位。
(3) 测试系统自检。测试系统自检主要是对测试板、测试总线的检测,以防止因测试板或测试总线的原因导致测试结果出现错误。
在日常的维护工作中,维护人员经常需要利用交换系统提供的各种测试手段对设备出现的各类故障进行定位及定性分析,所以掌握交换机的各种测试内容尤为重要。
3.2C&C08交换机故障分析和处理的方法
故障不同,故障的表现形式也不尽相同。机房维护人员要根据不同故障的表现形式,结合实际工作经验,判断故障的级别,分析故障现象,找出故障产生的原因,并准确锁定故障位置,迅速排除故障。C&C08交换机故障处理方法一般有以下5种:
(1) 排除法。某些故障由于涉及的故障点较多,应先罗列出故障现象及故障发生的可能性,根据话音和信令的流程进行分析,逐步排除。分析故障可能性时,要尽可能做到全面、客观,不要有遗漏,实际排除可能性时,应从可能性低的开始排除,层层递进。
(2) 对比法。参照本系统正常运行的设备或其他工作场地正常运行的设备数据作基准,仔细对比故障设备和正常设备之间的参数区别,分析故障发生的可能性,找出故障的准确位置。
(3) 替换法。对硬件设备故障的处理往往采用替换法。即当怀疑某个电路板出现问题时,维护人员可通过替换电路板的方法进行判断和验证。替换时应做到替换的正常设备要与被替换的设备完全相符,替换后进行相关的后续处理及恢复性的操作,如果一切恢复正常,则表示此故障为硬件设备发生问题。
(4) 数据修改、数据再设定法。此方法适用于软件方面的故障鉴定。如果系统软件在设计和编制时存在某种缺陷,或是系统参数、数据及用户数据等出现某种错误,会导致系统不能在特定情况下正常执行某些任务。当此类现象发生时,维护人员可采用数据修改或数据再设定的方法进行处理。
(5) 人工启动和逻辑复位法。即重新启动或复位法,一般采取按复位键,重新插拔单板,或者直接关闭电源重新复位,对单板的硬件、软件进行逻辑初始化,使其恢复正常的工作状态。此种方法一般是在单板硬件或软件发生混乱而无法正常工作的时候采用。