通信人家园

标题: MSTP故障处理案例及与MSAP对接问题分析  [查看完整版帖子] [打印本页]

时间:  2021-9-23 18:08
作者: houwb1002     标题: MSTP故障处理案例及与MSAP对接问题分析

MSTP故障处理方法案例及与MSAP对接组网问题分析
                        摘要
本文从骨干网及本地网设备维护实际情况出发,随着新设备、新网络、新技术的出现,各省本地网接入、汇聚层设备愈加复杂,PTN、IPRAN、OTN、POTN等网络对接问题,异厂家互联互通问题增加,面临着大量的MSTP业务的维护和故障处理。本文从现网设备故障处理经验中总结了几种常见的MSTP故障处理方法及案例。
1 MSTP简介
近年来,随着通信技术的飞速发展和互联网的大力普及,电脑、手机、电视等终端都能上网了,带宽需求急剧增加。一种基于SDH的多业务传送平台即MSTP应运而生,它实现了ATM、TDM以及以太网业务的接入和传送,并提供了统一的网管。MSTP设备是传统SDH设备的延续,基于SDH的多业务传送节点除应具有标准SDH传送节点所具有的功能外,还具有以下主要功能特征。  
(1)具有TDM业务、ATM业务或以太网业务的接入功能;  
(2)具有TDM业务、ATM业务或以太网业务的传送功能包括点到点的透明传送功能;  
(3)具有ATM业务或以太网业务的带宽统计复用功能;  
(4)具有ATM业务或以太网业务映射到SDH虚容器的指配功能。
MSTP同样存在缺点:
    (1)不提供以太网业务层保护,完全基于SDH提供的物理层保护,需要预留保护带宽;
    (2)支持的业务带宽粒度受限于SDH的虚容器,最小为2 Mbps ;
    (3)不提供以太网QoS支持,无法满足不同业务的差异性应用;不提供多个业务流的统计复用和带宽共享,带宽利用率低;
2 MSTP故障处理及案例
    接入设备厂家较多,不同厂家设备对各种开销、告警处理会略有不同,碰到具体设备具体分析,下面只介绍常用思路。
用户申告一般分为三类:一是PING不通,业务中断。二是PING通,但存在丢包或高时延现象。三是双向带宽不一致,上行和下行速率相差很大。但总的来说MSTP与SDH故障定位思路一样,可利用环回法、告警性能事件、测试帧等手段定位故障与排除。
2.1 PING不通,业务中断。
处理此类故障必须要根据告警性能来判断,如出现TU-AIS,TU-LOP等SDH层面告警,优先处理。如果端口无告警可通过查看封装及修改踪迹字节的方法确认,如查看无问题,则查看实际上行下行速率确认SDH是否有问题。如有问题,则可通过环回法定位故障,环回时需注意各种保护方式,以免影响判断。第二步查看端口TAG属性、端口工作模式、VLAN ID、LCAS、CRC校验等,如果两端查看全无问题可挂笔记本PING测查看流量情况,注意防火墙要关闭,必要时使用抓包工具辅助判断故障原因。
2.2 能PING通,但存在丢包或高时延现象
同样先查看SDH有无信号劣化、通道误码等告警,如果以太口是光口需查看功率是否合适,必要时可复位端口、单板观察告警是否消失。也可通过环回法挂表跑2层流量的方法定位故障。对于时延大的情况,可采用分段测试方法定位故障,如果是骨干段,可让集团网管查看当前电路是否走的最优路由,本地段注意保护方式,确认路由情况。
举例一:
故障现象:用户申告反应时延高,PING小包100+ms,已经无法使用。
故障分析:按照集团要求标准时延是1000公里单程8ms,首先应该先确定一下两点大概距离,另注意ping命令是双向时延。
处理过程:第一步要处理还是SDH层面告警,先查看两端以太网板卡是否正常,其次中间SDH有无性能异常情况。如果SDH和以太告警及性能均正常,则需要按照SDH电路处理方法分段环测定位。
第二部可以采取骨干出口落地电路,挂笔记本和两边用户对PING,或者挂表让两边接入网管都向对方做环的方法初判高时延是哪个方向。
由于保护方式问题,如果是长途方向时延高,需联系集团网管查看155M或者高速通道是否走的最近路由。
如果是北京本地方向高时延,北京本地是SNCP保护,需与本地网管确认一下工作路由,可以采取同时强制切换的方法分别测试不通路由。
按照以上步骤处理应该可以定位故障,但也不排除客户端硬件性能的问题,下面只举一个例子。
如果用PING命令PING对方时会收到回包,比如:
1.来自192.168.1.1的回复:字节32时间=20msTTL=53
2.来自192.168.1.1的回复:字节32时间=18msTTL=53
3.来自192.168.1.1的回复:字节32时间=19msTTL=53
4.来自192.168.1.1的回复:字节32时间=2000msTTL=53
5.来自192.168.1.1的回复:字节32时间=21msTTL=53
6.来自192.168.1.1的回复:字节32时间=20msTTL=53
按照上面回复情况来看,第5帧比第4 帧应该早收到才对,但实际4,5帧的顺序并没有改变。这种就是本地硬件问题,并非网络时延。
2.3 上下行速率不一致,相差很大
此类故障在业务开通中不易发现,开通业务时采用换回L2流量跑RC2544脚本正常,满足带宽、时延要求。但用户使用一段时间后加大业务量发现上行下行带宽相差很大,已经影响使用。
案例二:
故障现象:大兴星光影视城开通一条北京至外地MSTP10M专线,用户不认可联通5800仪表测试带宽结果,要求笔记本互拖文件为准,但是发现互拖时上传和下载速率不能同时达标。一个方向带宽占满后另一个方向带宽急剧下降。
故障分析:大兴星光影视城有一端华为3500设备提供接入,专线较多,基本已经占满设备,设备版本比较老,EFS0版本为N4EFS0,板卡缓存只有几十K,网管升级为N5后缓存会达到2M。
处理过程:由于是长途专线,根据用户故障现象,首先采取分段测试方法,即由北京长途出口将10M电路落至EFS0板卡上与北京本地用户对测。电路落好后先排查各方告警及性能,均无问题进行下一步。
1.用5800仪表测试环路,方庄做以太口硬环,长话上门星光影视城用仪表跑L2流量,结果正常,满足10M带宽。
2.方庄和星光影视城挂笔记本对PING,通。然后方庄做FTP服务器,星光影视城登陆进行下载和上传,发现同一时间确实只有一个方向带宽可以占满,另一个方向速度差了非常多。
3.初步怀疑是板卡缓存问题,方庄先做测试。做测试之前还要考虑到笔记本性能问题,故准备3台笔记本,一台上传、一台下载、一台作为FTP服务器使用。
4.方庄自己搭建10M环境,配置两块N5EFS0板卡,一块接服务器笔记本;一块接路由器,路由器连接上传和下载笔记本。此时上传和下载两台电脑均可达到1.25MB/S。
5.联系本地华为督导找时间对星光影视城设备升级,升级成N5EFS0。
6.升级完成后长话再次上门,并准备好固态硬盘笔记本。
7.依用户要求,由于方庄没有SSD笔记本,所以方庄以太口下接两台电脑,一台做下载用,另一台共享文件让星光影视城下载。长话上门测试OK,达标。
8.方庄放通业务,长话直接跟外地互拽测试(外地也用SSD笔记本),OK,速率达标。故障解决。
3 MSTPMSAP对接组网问题分析
在电信市场竞争日趋激烈的今天,集团大客户业务已成为运营商非常重要的客户资源及收入来源,面对大客户租用专线的带宽升级、数据安全、稳定可靠的特殊需求,如何为集团大客户提供个性化专家级电信服务,已成为电信市场竞争的焦点。
    我司现网接入平台主流应用是SDH/MSTP,MSAP,光纤收发器等。尤以SDH/MSTP产品接口规范,互通性好,网管能力强,具备网络保护以及故障恢复机制,现网已大量应用与大客户接入,下面简单介绍MSTP和MSAP混合组网对接问题的分析,这里以高科MSAP设备举例:
3.1 光口类对接问题
    J0字节对接问题,J0在STM-N帧结构再生段开销中,称为再生段踪迹字节,华为设备默认发J0为HUAWEI SBS,高科设备默认发送J0字节为MSAP-G10 RSOH,虽然目前设备厂商只用J0字节作为接入端标示符,适配不影响业务,但建议两端修改为一致,消除不匹配告警,北京网管开通业务是默认发送J0为15个0。
    J1字节对接问题,J1字节在STM-N帧结构中称为通道踪迹字节。有些厂家的某些板卡会将J1字节适配作为保护倒换条件,所以建议两端J1字节修改一致或者禁用。
3.2 以太网对接问题
    华为设备与高科设备以太网板对接时,如果采用默认配置,则会出现一些问题:
    故障现象1,MSAP设备上报低阶通道标签失配告警,华为设备上报LP-RDI告警。此时查看封装字节时发现,MSAP默认为(0*02)异步,华为默认封装为(0*0D)GFP封装,将高科设备修改为GFP封装后告警消失。
    故障现象2,无任何告警,业务PING不通。查看两端以太网配置,踪迹字节、封装模式、LCAS等均无问题,电路没有任何告警,采用以太网硬环,另一端挂表跑L2流量方法流量也环不回来。此时再次查看华为网管,华为以太网单板默认开启FCS检验字节,高科设备默认关闭这个功能。这个字节是用于CRC检测的,如果目的站效验不同,会认为传输中发生问题而丢弃此帧,导致无法PING通,华为设备关闭FCS功能后,故障解决。
3.3 保护组网问题
    目前从骨干网至北京本地保护为MSP1:1保护,北京本地为SNCP保护,接入局至用户端MSAP设备一般是单退上联无保护。常见故障现象为接入端设备主用光纤中断,端口上报R_LOS告警,业务导致备用路由,同时回传MS-RDI告警,对端华为设备收到MS_RDI告警回告,但未作为倒换触发条件,仍然工作在主用路由上,导致华为设备收不到业务,业务中断。此时强制切换华为至保护路由,业务恢复,此类故障应确保倒换同步。
在我们开通业务的过程中,经常会碰到不同厂家混合组网的情况,产生的异常故障往往是不同厂家对接问题,在分析处理这些对接问题时,需要对原理知识及组网方式有清晰的认知。
4 参考文献
1、华为技术公司 《华为MSTP理论知识详解》
2、华为技术公司 《华为SDH基本原理》






通信人家园 (https://www.txrjy.com/) Powered by C114