位置:51电子网 » 技术资料 » 通信网络

网元层故障管理模块的软件可靠性设计技术

发布时间:2008/5/27 0:00:00 访问次数:444

        

    

    典型的gsm/cdma移动通信网由交换分系统、基站分系统和大量移动用户终端三大部分组成。其中,交换分系统也称为移动交换系统(mss),由移动交换中心(msc)、归属位置寄存器(hlr)、被访位置寄存器(vlr)、设备识别寄存器(eir)、鉴权中心(auc)、短消息中心(smsc)等诸多网络元素(network element,简称为网元)和操作维护中心(omc)构成。交换分系统是移动通信系统的控制交换中心,也是移动网与其他通信网的接口。交换分系统中任何一个网络元素出现故障都有可能对整个移动通信系统产生严重影响。在交换分系统中,操作维护中心和各网元实体上的故障管理模块是网元层网络管理系统的一个重要组成部分。本文以移动交换系统网元层故障管理模块为例,介绍在实时系统的软件设计过程中,在保证系统实时性的前提下,提高软件系统可靠性的一些软件设计技术。 1故障管理模块概述

    故障管理模块在交换分系统中所处的位置如图1所示。

    

    

    故障管理模块存在于omc和各网元实体之上。omc上的故障管理模块一般设计为客户端/服务器(c/s)结构,其实现的功能包括:故障信息的持久性保存(一般是写入数据库)、故障信息的显示、网元机架图的显示等。网元上的故障管理模块负责收集各业务进程和控制进程产生的故障信息,经过处理后把这些故障信息转发到omc。故障信息也称为告警消息。一条告警消息在c++中表现为-对象,包括告警发生时间、恢复时间、发生位置和流水号等若干属性。

    

    故障管理模块是监控交换分系统是否正常工作的主要工具,是电信运营商非常重视的一个软件模块。电信运营商对故障管理功能的最基本的要求就是:实时准确,不漏警,不虚警。为了达到这个要求,故障管理模块的设计必须在保证实时性的基础上,确保故障信息的准确无误。

    

    2 网元上故障管理模块的设计和实现

    

    交换分系统中的各种网元实体(如msc、hlr等)都是典型的分布式实时系统,一般由若干个模块构成。交换分系统中的设备都要求全年24小时不间断工作,所以每个模块都采用了主机备用冗余的设计。网元中故障管理模块的结构示意图如图2所示。每个模块都有主用和备用2个模块处理机(mp),2个模块处理机同时处于工作状态。备用mp只和主用mp通信,负责备份主用mp中的重要数据。一旦主用mp发生故障,备用mp可以在不中断业务的情况下迅速地转为主用工作状态。

    

    

    从图中可以看出,故障管理模块同时运行在主用和备用mp中。故障管理模块在mp中用3个进程实现。

    

    (1)告警收集进程:收集各业务进程和单板控制进程产生的告警信息,进行必要的格式转换等数据预处理工作,然后把处理后的告警信息放入当前告警列表和消息发送队列。当前告警列表存储在mp内存中的一个数据缓冲区。主用和备用mp中的告警数据缓冲区总是处于一致状态。

    

    (2)告警发送进程:主要的任务是将告警发送队列中的告警消息发送到omc上的故障管理模块。

    

    (3)告警同步进程:主要完成网元和omc之间告警消息的周期性同步、断链同步处理以及主用和备用mp之间的周期性同步和倒换同步处理。该进程是实现不漏警、不虚警要求的重要机制。

    

    3 omc中故障管理模块的设计和实现

    

    omc设计为c/s结构。故障管理模块同时存在于客户端和服务器上,分别用不同的应用进程实现。服务器上的故障管理模块实现的功能有:保存告警信息到数据库;转发告警信息到上一级的网络管理中心;转发告警信息到客户端;处理客户端的数据库操作请求和参数修改请求;控制告警箱等。客户端的故障管理模块实现的功能有:最新告警的实时显示;历史告警的查询和打印;告警屏蔽设定和解除;机架图的实时显示;人机命令界面等。

    在c/s结构的系统中,服务器处于核心地位,服务器端的故障管理进程要确保能长时间正常工作。在omc系统中,可以使用看门狗机制监控故障管理进程。看门狗实际上是一个错误监控程序,可以用一个高优先级的应用进程来实现。看门狗进程定时向故障管理进程发送握手消息,故障管理进程收到

        

    

    典型的gsm/cdma移动通信网由交换分系统、基站分系统和大量移动用户终端三大部分组成。其中,交换分系统也称为移动交换系统(mss),由移动交换中心(msc)、归属位置寄存器(hlr)、被访位置寄存器(vlr)、设备识别寄存器(eir)、鉴权中心(auc)、短消息中心(smsc)等诸多网络元素(network element,简称为网元)和操作维护中心(omc)构成。交换分系统是移动通信系统的控制交换中心,也是移动网与其他通信网的接口。交换分系统中任何一个网络元素出现故障都有可能对整个移动通信系统产生严重影响。在交换分系统中,操作维护中心和各网元实体上的故障管理模块是网元层网络管理系统的一个重要组成部分。本文以移动交换系统网元层故障管理模块为例,介绍在实时系统的软件设计过程中,在保证系统实时性的前提下,提高软件系统可靠性的一些软件设计技术。 1故障管理模块概述

    故障管理模块在交换分系统中所处的位置如图1所示。

    

    

    故障管理模块存在于omc和各网元实体之上。omc上的故障管理模块一般设计为客户端/服务器(c/s)结构,其实现的功能包括:故障信息的持久性保存(一般是写入数据库)、故障信息的显示、网元机架图的显示等。网元上的故障管理模块负责收集各业务进程和控制进程产生的故障信息,经过处理后把这些故障信息转发到omc。故障信息也称为告警消息。一条告警消息在c++中表现为-对象,包括告警发生时间、恢复时间、发生位置和流水号等若干属性。

    

    故障管理模块是监控交换分系统是否正常工作的主要工具,是电信运营商非常重视的一个软件模块。电信运营商对故障管理功能的最基本的要求就是:实时准确,不漏警,不虚警。为了达到这个要求,故障管理模块的设计必须在保证实时性的基础上,确保故障信息的准确无误。

    

    2 网元上故障管理模块的设计和实现

    

    交换分系统中的各种网元实体(如msc、hlr等)都是典型的分布式实时系统,一般由若干个模块构成。交换分系统中的设备都要求全年24小时不间断工作,所以每个模块都采用了主机备用冗余的设计。网元中故障管理模块的结构示意图如图2所示。每个模块都有主用和备用2个模块处理机(mp),2个模块处理机同时处于工作状态。备用mp只和主用mp通信,负责备份主用mp中的重要数据。一旦主用mp发生故障,备用mp可以在不中断业务的情况下迅速地转为主用工作状态。

    

    

    从图中可以看出,故障管理模块同时运行在主用和备用mp中。故障管理模块在mp中用3个进程实现。

    

    (1)告警收集进程:收集各业务进程和单板控制进程产生的告警信息,进行必要的格式转换等数据预处理工作,然后把处理后的告警信息放入当前告警列表和消息发送队列。当前告警列表存储在mp内存中的一个数据缓冲区。主用和备用mp中的告警数据缓冲区总是处于一致状态。

    

    (2)告警发送进程:主要的任务是将告警发送队列中的告警消息发送到omc上的故障管理模块。

    

    (3)告警同步进程:主要完成网元和omc之间告警消息的周期性同步、断链同步处理以及主用和备用mp之间的周期性同步和倒换同步处理。该进程是实现不漏警、不虚警要求的重要机制。

    

    3 omc中故障管理模块的设计和实现

    

    omc设计为c/s结构。故障管理模块同时存在于客户端和服务器上,分别用不同的应用进程实现。服务器上的故障管理模块实现的功能有:保存告警信息到数据库;转发告警信息到上一级的网络管理中心;转发告警信息到客户端;处理客户端的数据库操作请求和参数修改请求;控制告警箱等。客户端的故障管理模块实现的功能有:最新告警的实时显示;历史告警的查询和打印;告警屏蔽设定和解除;机架图的实时显示;人机命令界面等。

    在c/s结构的系统中,服务器处于核心地位,服务器端的故障管理进程要确保能长时间正常工作。在omc系统中,可以使用看门狗机制监控故障管理进程。看门狗实际上是一个错误监控程序,可以用一个高优先级的应用进程来实现。看门狗进程定时向故障管理进程发送握手消息,故障管理进程收到

相关IC型号

热门点击

 

推荐技术资料

耳机的焊接
    整机电路简单,用洞洞板搭线比较方便。EM8621实际采... [详细]
版权所有:51dzw.COM
深圳服务热线:13751165337  13692101218
粤ICP备09112631号-6(miitbeian.gov.cn)
公网安备44030402000607
深圳市碧威特网络技术有限公司
付款方式


 复制成功!