EPSFB定位分析总结 概述:NR SA网络的部署是一个渐进的过程,LTE网络和NR SA网络将面临长期共存的场景,SA语音方案有EPSFB及VONR,本文主要介绍EPSFB相关问题定个位思路和方法,用于指导生产。 EPSFB拆解为两个步骤 1) EPS FB 2) Fast return 语音互操作方案介绍EPS FB特性 驻留在NR的终端有语音业务且NR不能提供VONR时,由网络侧发起EPS FB流程,回落到LTE,建立VOLTE业务提供语音服务。 EPS FB从流程上来讲主要有如下策略: · EPS FB支持测量的方式,同时也支持盲重定向的方式,以下情况将执行盲重定向到LTE: (1) EPS FB保护定时器超时仍未收到异系统B1测量报告时; (2) 切换准备尝试失败; · 从EPS FB执行方式来区分可以分为如下两种: (1) 基于重定向的EPS FB:终端回落到LTE之后需要读取4G侧系统消息,建立RRC连接,然后建立VOLTE业务,并且如果在EPS FB之前有数据业务,也需要在LTE侧重新建立承载以恢复数据业务; (2) 基于PSHO的EPS FB:终端的语音业务和数据业务(如果存在)一起切换至LTE侧,语音建立时延与数据业务中断时延相对较短; 详细信令如下 步骤(1) | | | NR侧下发B1测控,测量LTE小区RSRP,当前NR2LTE的B1门限值为-111; | | UE上报B1测量报告,仅当LTE小区RSRP>-111时,才会有NREventB1上报,上报信息里包括当前服务小区的信息(NR),以及目标小区信息(LTE,PCI、RSRP); | | | | | | | |
Fast return特性 Fast return特性主要目的是加快EPS FB客户业务结束后返回NR小区的速度,提升客户体验。 Fast return当前有两种方式:基于测量的重定向及基于测量切换。 Fast return具体流程如下: 1) 当客户完成VoLTE语音业务,并删除语音业务承载后,判断UE是否支持NR和NGC:(1)判断终端能力是否支持NR;(2)判断UE的初始上下文/上下文修改信息中的handover restriction list,只要核心网没有将NR列为禁止名单,则认为在5G已开户),如果支持NR和NGC,当前版本还会判断UE携带的业务QCI的切换属性,当存在MUST HO且不存在NO HO的QCI时,转下一步; 2) eNodeB下发异系统B1事件测量; 3) UE收到eNodeB的测量配置,进行异系统NR测量。 a. 如果测量NR信号在InterRatHoNrParamGrp.NrB1B2TimeToTrigger内持续大于InterRatHoNrParamGrp.ServBasedNrB1RsrpThld,则UE上报事件测量报告,选择过滤后信号质量最好的NR小区作为目标小区/频点; b. 如果eNodeB在InterRatHoNrParamGrp.NrB1B2TimeToTrigger超时后,还未收到异系统B1事件上报,则终止异系统B1事件,不再继续后续操作。 c. UE收到NR目标小区或目标频点信息后,完成到NR小区的切换或重定向。 详细信令如下 步骤(1) | | | LTEERAB释放,QCI1承载释放,QCI1释放后会触发LTE2NR的Fast Return流程; | | | | LTE侧下发B1测控,测量NR小区RSRP,当前LTE2NR的B1门限值为-106; | | UE上报B1测量报告,仅当NR小区RSRP>-106时,才会有LTEEventB1上报,上报信息里包括当前服务小区的RSRP(LTE),以及目标小区信息(NR,PCI、RSRP); | | | | | | | | |
语音互操作问题分析思路在进行语音互操作问题定位时,通常与数据互操作进行耦合关联,分析思路前台及后台两个方向进行 1、【前台:投诉和路测问题】通过路测/投诉发现互操作问题,或异系统互操作问题复现时,先识别出问题场景,然后根据相应动作进行分析定位; 2、【后台:商用话统场景问题】通过话统KPI发现的LNR异系统互操作问题,通过分析话统KPI,进行问题范围界定以及确定后续分析动作的次序; 投诉和路测问题 EPS互操作问题90%属于L3信令面问题,针对L3信令面问题,最基础的处理思路逻辑就是观察标准流程在哪里出现了异常,从而进行网元的隔离定界。 EPS FB 问题背景和原理 EPS FB从本质上来讲就是SA不支持VONR,无法建立5QI1,然后通过切换/重定向的方式回落LTE,并进行VoLTE的过程,其中切换/重定向的流程和普通的NR2L切换/重定向基本相同,定位方法可以参考“NR2L切换问题(公共部分)”。 定位此类问题主要熟悉相应的信令流程,看异常流程出现在哪里,从而进行问题的隔离定界。以下是EPS FB的信令流程,供对比参考。 基于切换的EPS FB信令流程图 基于重定向的EPS FB信令流程图 在信令跟踪中寻找EPS FB信令可以通过时间点+PDU SESSION RSRCMODIFY REQ/PDU SESSION RSRC MODIFY RSP来进行查找。 EPS FB的特点是PDU SESSION RSRC MODIFY REQ中携带的是5QI1的修改请求,PDU SESSION RSRC MODIFY RSP中携带的原因值为ims-voice-eps-fallback-or-rat-fallback-triggered。 在路测信令中筛选EPS FB的时候需要注意,在assistant中创建工程完成分析后,可以找到assistant统计的EPS FB失败。 但是需要注意的是,可能存在一种场景,终端发起了VONR尝试,但是由于某些原因,比如网络侧没有开启EPS FB,终端一样语音呼叫会失败,但是不会统计到EPSFBCallFail(MOC)/ EPSFBCallFail(MTC)中,所以进行分析时需要额外对比VONRCallAttempt和EPSFBCallAttempt的次数,如果存在差异,也需要进行分析。 基本参数核查 当EPS FB开关参数配置不正确/EPS FB License没有正确配置/没有添加LTE邻频点的时候,在5QI1对应的PDU SESSION RSRC MODIFY RSP中将会携带原因值not supported 5QI value。 问题类型一:语音与切换流程冲突 现象:AMF发起5QI1的PDU会话修改请求,被gNodeB拒绝,携带原因值为xn handover triggered。 可以看到当AMF发起5QI1的PDU会话修改请求时,终端正在进行Xn切换执行流程。根据TS 38.413 8.2.3 PDU SessionResource Modify流程,在PDU会话修改期间如果切换是必须的,此时可以中断正在进行的PDU会话修改流程,并给核心网回复切换类原因值响应消息,然后触发切换流程。 核心网在收到在收到PDU会话修改响应后(如果识别出是切换导致的PDU会话被临时拒绝),AMF/SMF在切换完成后可能会重新尝试(取决于核心网实现)PDU会话过程。 由于终端已经处于切换执行流程中,源gNodeB认为UE已经去了目标gNodeB接入,而目标gNodeB实际还没有完成接入,因此此类问题只能依靠核心网重新尝试解决。 问题类型二:语音呼叫时延长 EPS FB呼叫时延长问题: (1) 路测指标达标类问题:采用对整体信令分段分析方法,通过和bechmark值对比排查时延异常偏大阶段,针对性的给出优化方案。 步骤一:对路测log进行分段统计 基于不同的EPS FB策略,其分段时延基线可以参考如下: 步骤二:对TOP时延分段进行信令流程分析 1、分段一:SR~RRC ConnectSetup CMP 本段时延是空闲态起呼的终端特有,作用为处于空闲态的终端建立RRC连接进入连接态。优化此段时延主要为减少终端空闲态起呼的比例: (1) 打开终端数据业务开关,尽量保持在连接态; (2) 延长5G的不活动定时器(NRDUCELLQCIBEARER.UeInactivityTimer),尽量使终端保持在连接态; 2、分段二:RRC ConnectSetup CMP~Invite 本段时延是空闲态起呼的终端特有,主要进行终端接入后的鉴权/NAS加密/空口安全流程/同频测量控制以及终端能力查询流程。 优化此段时延主要为减少终端空闲态起呼的比例: (1) 打开终端数据业务开关,尽量保持在连接态; (2) 延长5G的不活动定时器(NRDUCELLQCIBEARER.UeInactivityTimer),尽量使终端保持在连接态; (3) 保证5GC为最新版本,全流程基础处理时延会稍有优化; 3、分段三:Invite~MobilfromNRCMD 本段时延主被叫流程相同,为终端发起呼叫并决定回落的过程,主要包括建立5QI5/尝试建立5QI1(拒绝)/测量LTE过程/切换准备和发起过程。 此段时延的多数时延产生在终端的测量LTE过程,因此优化此段时延可以从以下角度出发: (1) 终端优化测量LTE时延,如果此类终端的测量时延和测量的频点数相关(注明:新版本HS终端为测到一个LTE频点就上报一个LTE频点,和频点数无关),则考虑减少配置LTE邻频点,但是需要注意的是,剩下来的频点必须能够组成连续的LTE覆盖网络,可使用MR+IROAD进行回落频点优化(详见SCYD最佳实践); (2) 网络侧尽量配置覆盖连续的频点为高优先级; (3) 如果现网使用重定向,根据网规网优情况,如果网规网优较好,邻区配置完善,则可以配置EPS FB的执行模式为切换(NRCellOpPolicy.EpsFbModeà HANDOVER),其体验优于重定向; (4) 如果现网使用重定向,但是邻区配置并不完善,在LTE覆盖连续的前提下,可以打开盲模式开关(NRInterRatHoParam.HoModeSwitch:VOICE_BLIND_MODE_SWITCH),以节省测量时延,但是需要注意,一定要把覆盖连续的频点优先级配置为最高(非255)(NRCELLEUTRANNFREQ.VoltePriority); (5) 为了减少LTE弱覆盖区域测量过程无谓的等待,可以缩短EPS FB保护定时器(NRInterRatHoParam.EpsFbProtectionTimer),通常建议配置2s,当定时器超时前仍未收到LTE测量报告,则以盲重定向的形式回落到LTE,需要注意的是,一定要把覆盖连续的频点优先级配置为最高(非255)(NRCELLEUTRANNFREQ.VoltePriority); (6) 其他切换准备相关时延需要核心网侧进行优化; 4、分段四:MobilfromNRCMD~RRCReconfiguration CMP 本段时延主要是终端离开NR接入LTE的时延,主要优化方向: (1) 参考分段三说明,条件允许时使用基于切换的EPS FB; (2) 使用基于切换的EPS FB要保证最强LTE邻区均已经配置邻区关系,防止由于接入相对较差的小区,概率增加接入时延; (3) 使用基于切换的EPS FB,eNodeB优先准入; 5、分段五:RRCReconfiguration CMP~ActivateDedicatedEPSBearerContextAccept(QCI1建立) 本段时延主要包括终端的能力查询/LTE系统测量控制下发/TAU/以及建立QCI1,这段时延主要由终端和核心网引入。 (1) 需要终端尽快发起TAU; (2) 核心网侧快速响应TAU和QCI1建立过程; (3) 无线侧若在使用基于切换的EPS FB时,可以通过handoverrequired消息携带UE NR能力信息,可以节省本段中UE能力查询带来的时延; (4) 由于SA终端大多数支持NSA,切换后查询NSA能力也将耗费较多时间: A. 打开NR能力并行查询开关(GlobalProcSwitch.ProtocolCompatibilitySw:NrCapabilityParallelQuerySw),开关打开后, UE能力查询流程会缩短(EUTRA-NR能力查询和NR能力查询会合并成一个过程), 但存在EUTRA-NR能力和NR能力的总长度超过信令的最大长度的可能; 6、分段六:主叫QCI1建立~被叫SR 本段时延主要是两方面引入: (1) IMS通常在主叫QCI1建立完成之后才给被叫发寻呼,主被叫流程串行进行,可以根据IMS的意见改为并行进行; (2) 寻呼时延: A. 适当缩短NR侧paging周期(NRDUCELLPAGINGCONFIG.DefaultPagingCycle),减少寻呼时延; B. 适当缩短核心网侧paging重发间隔,减少重复寻呼时延; 7、分段7:被叫QCI1建立~ringing 本段时延主要由终端引入,需要终端进行优化; 8、分段8:被叫ring~主叫riging 本段时延主要由核心网引入,需要核心网进行优化; NR2L切换问题(公共部分) 问题背景和原理 NR2L切换属于LNR互操作的一个公共流程,使用到该流程的特性为:基于切换的EPS FB/基于覆盖的NR2L切换/VoNR->VoLTE切换,此章节主要描述NR2L切换公共流程中所遇到的问题定位套路。 NR2L切换的主要流程如下: 注: (1) 基于覆盖的NR2L切换可以通过B1/B2进行异系统测量; (2) EPS FB只通过B1进行异系统测量; 路测或者投诉问题基本都是通过信令流程来观察异常点,从而进行问题的隔离定界。 NR2L切换从信令流程上看,通常有以下问题类型: 1、 网络侧不下发B1测量控制; 2、 网络侧下发了B1测量控制,但是切换准备失败; 3、 终端走重定向不走切换; 4、 切换执行失败; 问题类型一:网络侧不下发B1测量控制 网络侧不下发B1测量控制的问题可以分为两类: 1、 针对基于覆盖的NR2L切换,如果终端没有上报基于测量的A2测量报告,网络侧不会下发B1测量控制,此类问题多为NR本身的信号质量太好,或者A2门限配置过低,无法上报A2测量报告,或者NR本身的信号质量太差,导致先上报盲A2测量报告,网络侧直接进行盲重定向导致; 2、 如果终端已经上报测量A2测量报告,或者是EPS FB场景,网络侧没有下发B1测量控制的场景,此类问题可以从以下3个方面进行排查: (1) 查看NR侧是否已经配置了正确的LTE的邻区邻频点; (2) 查看NR侧配置的LTE邻频点是否在终端支持的eutranBandList里面; (3) 终端是否上报了异系统B1能力; NR侧配置LTE邻区邻频点检查 数据:NR配置文件 检查的MO主要如下: (1) NR侧是否已经配置LTE邻频点:NRCELLEUTRANNFREQ (2) NR侧是否已经配置LTE外部邻区:GNBEUTRAEXTERNALCELL/GNBEUTRAEXTCELLPLMN (3) NR侧是否已经配置LTE邻区:NRCELLEUTRANRELATION (4) 并核查以上配置中的PLMN和测试卡的PLMN是否一致; 终端eutranbandlist检查方法 终端在5G侧上报的UE LTE能力信息在终端侧log和基站侧log中均是以container的形式存在,无法解析,建议终端的能力直接和终端确认或者在终端单独在LTE接入后观察UE上报能力信息。 终端异系统B1能力核查方法 数据:5G信令跟踪 在5G的标口跟踪中,找到此次呼叫终端上报的UE_CAP_INFO消息,找到如下字段(eventB-MeasAndReport),如果终端没有上报,则说明终端不支持eventB能力,网络侧则无法下发B1测量控制,需要终端配合解决。 问题类型二:切换准备失败 切换准备失败在终端侧较难感知,需要在5G信令跟踪中进行筛选,其典型信令流程如下,gNodeB发送给AMF handover required消息后,AMF回复了handover prepare fail消息。 此类问题定位建议抓取:NR标口跟踪/LTE标口跟踪/核心网侧跟踪进行联合定位隔离。隔离的思路方法比较明晰,即找到回复错误原因值的网元并分析原因。 常见NR收到的handoverprepare fail原因值可能的原因(仅为可能的原因参考): 1、ho failure in target 5GC ngran node ortarget system:对应LTE回复handoverprepare fail的原因值为semantic error,可能由于NR配置的LTE外部邻区的cellid和LTE实际的cellid不一致导致; 问题类型三:终端走重定向不走切换 在进行精品网的优化或者客户演示的时候,往往要求NR2L使用切换的方式而不是重定向的方式,以提升客户感知,如果终端走重定向而不走切换的情况,可以通过以下思路进行核查: 1、 网络侧是否已经打开了切换相关开关: 重点核查参数:NRINTERRATHOPARAM.HoModeSwitch:EUTRAN_HO_SWITCH/NRINTERRATHOPARAM. EPSFBMODE 2、 对于EPS FB,切换准备失败后会直接走重定向,请参考切换准备失败章节排查切换准备失败问题; 3、 对于基于覆盖的NR2L切换,排查是否由于NR信号质量太差,或者盲A2门限配置过高,导致终端容易上报盲A2测量事件,从而发起盲重定向; 此类问题应当优化NR覆盖,或者适当降低NR盲A2门限。 4、 对于EPS FB,排查是否LTE信号质量太差,或者EPS FB B1门限配置过高,或者EPS FB保护定时器配置过短,导致终端在EPS FB保护定时器内无法测量到LTE B1测量报告,从而触发盲重定向; 此类问题应当优化LTE覆盖,或者适当降低EPS FB B1门限,或者适当抬高EPS FB保护定时器。 5、 排查B1/B2测量报告中的LTE邻区是否配置为了该NR服务小区的邻区,并且PLMN配置正确; 排查方法: (1) 通过B1测量报告中的measID可以到B1测量控制中找到对应的measobjectid,从而确定该邻区所在的频点。 (2) 找到邻区的频点,以及B1测量报告中的邻区PCI,即可以到NR配置文件中的LTE外部邻区和LTE邻区中查找该邻区是否已经配置,并且观察PLMN是否配置正确。 问题类型四:切换执行失败 对于正常的切换执行流程,信令应该如下: 对于切换成功场景,gNodeB在handover CMD之后收到的第一条消息应该是AMF下发的UE Context Rel CMD消息,对于失败场景,一般为在AMF发送handover CMD之后eNodeB的第一条消息为handover cancel或者是gNodeB在NG口等待超时后主动上发UE Context Rel Req消息。 针对切换失败类问题分析,首先同样应该在信令流程上判断流程中止在哪一步,通过对比分析隔离定界出问题的网元。一般可以分为以下两类: (1) 终端切换接入失败重建; (2) 终端已经发送RRC Reconfiguration CMP消息,但是eNodeB没有收到; 终端切换接入失败重建 终端切换接入失败会发起重建,如果重建到源小区,源gNodeB会发送handover cancel消息,如果重建到非源小区,则无handover cancel消息,终端切换接入失败通常需要终端侧进行排查,在获得不到终端帮助的情况下,建议在基站侧先进行以下核查: (1) B1测量控制中B1门限是否过低,导致终端切换到信号差小区; B1门限在测量控制中下发,实际值=显示值-140,如下所示B1门限为-111dBm。 (2) B1测量报告中的最强邻区是否已经配置了邻区关系,否则会导致终端切换到较差小区,导致切换接入失败; 可以发现在NR侧下发LTE测量控制的时候不会携带NR的邻区信息(仅CIO非0时携带),所以终端是对频点去自己搜索小区的,那么上报的小区就可能没有配置邻区关系,导致终端切换到较差小区,从而切换失败。排查此类问题的方法可以通过handover required消息中找到targetcellID,将其转化为十进制,对应在工参中找到该小区的频点和PCI。 然后根据频点和PCI找到对应的B1测量报告,观察该PCI是否为最强小区。 同时也可以排查其中的RSRQ和SINR信息,判断是否由于干扰导致,其中RSRQ实际值=(显示值-40)/2,SINR实际值=(显示值-46)/2。 需要注意的是,如果ANR功能未开启,gNodeB选择目标小区或目标频点时,若存在PCI冲突的小区时,会过滤该小区。 终端发送RRCReconfiguration CMP消息,eNodeB没有收到 此类问题较少,需要依赖复测抓取终端以及eNodeB侧L1/L2跟踪进行定位。 Fast return 问题背景和原理 Fast return的触发源是终端结束VoLTE呼叫,网络侧触发下发B1测量控制,当终端3s内上报B1测量报告时,则将终端通过重定向/切换的方式转移到NR继续享受大带宽。后续重定向/切换的流程和普通的L2NR重定向/切换没有差异,可以参考“L2NR切换问题(公共部分)”。 定位此类问题主要熟悉相应的信令流程,看异常流程出现在哪里,从而进行问题的隔离定界。以下是fast return的信令流程,供对比参考。 图 基于切换的Fast return信令流程图 图 基于重定向和Fast return信令流程图 问题类型一:网络侧不下发B1测量控制 当前版本fast return和基于业务的L2NR切换采用同一套QCI切换判断机制,即如果需要触发fast return,则当QCI1释放后,终端还携带的QCI中必须要有MUST HO的QCI,且不能有NO HO的QCI。 举例如下,当QCI1释放后,终端还有QCI5/8(可以从NR2L的切换请求和后续的ERAB建立请求中找到),可以看到QCI8对应的切换策略为NO HO,因此无法触发fast return。 二、语音连接态返回 语音业务返回主要依托于fast return,参数优化方向为让在LTE的5G客户容易返回NR。 参数 | | | InterRatHoNrParamGrp. ServBasedNrB1RsrpThld | 基于业务的E-UTRAN切换至NR B1事件RSRP触发门限 | |
需要注意的是: (1) 由于降低互操作门限相当于增加了5G的边缘客户,5G的基础指标,比如接入/掉话/速率等会有恶化; (2) 调整门限时务必确认L2NR B1门限需要高于NR A2门限或B2门限1(推荐高4dB),以防乒乓切换; L2NR切换问题(公共部分) 问题背景和原理 L2NR切换属于LNR互操作的一个公共流程,使用到该流程的特性为:基于业务的L2NR切换/基于覆盖的L2NR切换/基于切换的fast return,此章节主要描述L2NR切换公共流程中所遇到的问题定位套路。 L2NR切换的主要流程如下: 注: (1) 不同的解决方案的触发源不同,基于覆盖的L2NR移动性由A2触发,基于业务的L2NR移动性通过承载建立/变更/释放/周期性触发,fast return通过QCI1释放触发; (2) 基于覆盖的L2NR切换可以通过B1/B2进行异系统测量; (3) 基于业务的L2NR移动性和fastreturn只通过B1进行异系统测量; 路测或者投诉问题基本都是通过信令流程来观察异常点,从而进行问题的隔离定界。 L2NR切换问题通常分为以下几类: 1、 网络侧不下发B1测量控制; 2、 网络侧不发起切换准备; 3、 网络侧已经发起切换准备,但是切换准备失败; 4、 切换执行失败;
|