几天前出现的KDDI网络缺点,是KDDI史上最大、也是近年来环球稀有的网络严重缺点,值得整个通讯行业钻研和吸取经验。
本着猎奇,咱们经过搜集一些系统信息,对本次意外启动了如下剖析。因为技术水平有限,如有不当之处,请各位在留言区指出。但求抛砖引玉,惹起行业进一步的思索和探讨。
依据KDDI简报,本次意外经过如下:
不美观出,此次意外并非繁多缺点,而是由某一缺点点引发的一连串疑问造成。正因如此,缺点继续了长达60多个小时。
那疑问来了,预计一切通讯人都很猎奇,KDDI所指的“VoLTE替换机”和“用户数据库”详细是4G外围网的哪一个网元?究竟是哪些环节出了疑问?
感谢日本同行在缺点出现后对网络信令启动了跟踪与记载,从信令截图看,存在两大缺点现象。
缺点现象一:
VoLTE手机向IMS外围网动员SIP Register(SIP注册)恳求后,前往500 Cx Unable To Comply或500 Server Internal Error失误,造成IMS注册失败。
查问SIP协定,500 Server Internal Error指因主机遇到了异常状况阻止了恳求成功,客户端或许会在几秒钟后重试恳求。
Cx Unable To Comply,未查问到这一缺点代码是什么要素惹起的,但因为Cx指IMS外围网网元I/S-CSCF与HSS之间的接口,驳回Diameter信令,因此,或许标明I/S-CSCF与HSS或许两者之间的链路出现了疑问。
手机附着到LTE网络并建设自动EPS承载后,向网络动员PDN Connectivity Request以恳求后,前往PDN Connectivity Reject信息,造成无法建设QCI=5的SIP信令承载。
关上PDN Connectivity Reject信息,要素为Insufficient resources,标明因为资源无余而无法提供所恳求的服务。
这两大信令异常均会造成VoLTE用户注册失败,这合乎KDDI缺点现象,即用户无法接打VoLTE语音通话。
接上去,咱们再来对比VoLTE用户注册流程,看看详细是哪一个环节出错了?
EPS和IMS网络架构图
VoLTE用户注册流程总体包含:EPS附着和QCI5承载建设、IMS注册。
有必要先解释一下QCI5承载。
通常,VoLTE经常使用双APN架构,包含Internet APN和IMS APN。Internet APN为自动APN,手机开机后会首先与之建设一个PDN衔接,其自动EPS承载的QCI值通常为9。
当手机与Internet APN建设PDN衔接后,手时机额外启动与IMS APN的PDN衔接,其自动EPS承载的QCI值为5,关键担任传送SIP信令。
承载,就是就是指承载人、搬运工,担任将信令和数据从一点运输到另一点。在4G规范中,定义了不同承载业务对应的QCI值。其中,QCI5优先级最高,用于IMS(SIP)信令的自动承载;QCI1-4其次,可用于VoLTE语音和视频通话;QCI6-9优先级最低,只能“尽力而为”保证数据传输。
详细流程如下。
1、2、3、4、5:UE向MME发送附着恳求(Attach Request)后,MME与HSS对UE启动鉴权,并在鉴权经事先,MME向HSS失掉UE的签约数据。
6、7、8、9:MME依据用户签约数据中的自动APN和PDN签约高低文,经过Create Session Request信息向SGW/PGW恳求建设EPC自动承载(QCI普通为9),SGW/PGW向PCRF发送Credit-Control-Request(CCR) 为自动承载恳求PCC战略,PCRF依据接纳到的用户签约数据确定PCC战略,并经过Credit-Control-Answer(CCA)照应,随后SGW/PGW向MME发送Create Session Response成功GTP-C会话创立环节。
10、11:MME向UE发送 Attach Accept,并恳求激活自动EPS承载;UE经过Attach Complete信息通知MME自动EPS承载已激活。
此时,UE成功EPS附着并建设QCI9自动承载。
12、13、14、15、16:UE向MME发送PDN Connectivity Request,MME向 SGW/PGW发送Create Session Request恳求建设QCI5自动承载,SGW/PGW向PCRF发送CCR为自动承载恳求PCC战略,PCRF经过CCA照应后,SGW/PGW向MME发送Create Session Response。
17、18:MME向UE发送Activate Default EPS Bearer Context Request激活自动EPS承载,UE照应Activate Default EPS Bearer Context Accept信息通知MME自动EPS承载已被激活。
此时,UE和IMS APN之间建设了QCI值为5的自动EPS承载,接上去,一切SIP信令流量将经过QCI5承载。
19、20、21:UE经过向P-CSCF发送SIP REGISTER动员IMS注册,I-CSCF向HSS发送User-Authorization-Request(UAR) 口头用户注册形态查问,HSS授权用户经常使用IMS服务后,在User-Authorization-Answer(UAA)照应中前往该用户的S-CSCF地址。
22、23、24、25、26:I-CSCF将SIP REGISTER转发给指定的S-CSCF,S-CSCF向HSS发送Multimedia-Auth-Request(MAR)恳求鉴权信息,HSS经过Multimedia-Auth-Answer(MAA)照应后, S-CSCF经过401 UnAuthorized信息将鉴权信息发送至UE,以成功UE对网络侧鉴权。
27、28、29、30、31、32、33:UE向IMS动员第二次注册恳求和照应流程,以成功网络侧对UE鉴权,并下载用户IMS签约数据。详细步骤与第一次性注册相似。
对比信令追踪和VoLTE注册流程,此次VoLTE语音缺点要素或许出当初CSCF与HSS之间,以及S/PGW与PCRF之间。(如信令流程图中的红星标识)
对比KDDI缺点简报,其提到的“VoLTE替换机”或许是CSCF网元,而“用户数据库”或许是HSS网元,或许HSS与PCRF融合网元。
CSCF,Call Session Control Function,IMS网络架构中关键网元实体配置,其按位置和配置又分为P/S/I三种类型,其中,P-CSCF(Proxy CSCF)是IMS网络的初始接入点,一切起始和终止于SIP终端的会话均经过P-CSCF;S-CSCF(Serving CSCF)在IMS外围网中处于外围控制位置,其配合HSS网元对用户启动鉴权,从HSS下载用户签约信息,并依据用户签约的IMS触发规定启动路由触发和业务控制,以及治理基本会话路由;I-CSCF(Interrogating CSCF),IMS归属网络的入口点,在注册环节中I-CSCF经过查问HSS为用户选用一个S-CSCF。
HSS,Home Subscriber Server,归属用户主机,存储并治理用户签约数据,包含用户鉴权信息、位置信息及路由信息等。在VoLTE网络架构中,EPC HSS和IMS HSS可以融合部署。
PCRF,战略和计费控制单元,用于用户信息治理、PCC战略治理、PCC战略灵活生成及事情触发等差异化服务业务。
再来回忆KDDI缺点简报,有两点值得关注。
(1)KDDI在资讯发布会上示意,回退操作后,虽然有相当多的用户向“VoLTE替换机”动员从新衔接,但这些用户数量并不是KDDI总用户数。同时,KDDI在全国范畴内有18个“VoLTE替换机”,且相互冗余备份。KDDI也做过模拟测试,即使一切用户动员重连,也不会惹起VoLTE拥塞。因此,本次意外或许还潜伏着其他要素。
(2)“VoLTE替换机”拥塞出现后,虽然实施了接入限度、流控控制、断开局部PGW网元等措施,但“VoLTE替换机”和“用户数据库”的负荷并没有失掉充沛缓解,直到缺点继续2天多后,KDDI才进一步发现其18台“VoLTE替换机”中有6台“VoLTE替换机”向“用户数据库”一直发送“不用要的多余信令”。断开这6台“VoLTE替换机”后,其他“VoLTE替换机”和“用户数据库”的负载大幅降落到缺点出现前的水平。
所谓”VoLTE替换机“一直向”用户数据“发送”不用要的多余信令“,即CSCF网元一直向HSS(或许HSS与PCRF融合网元)发送异常信令。
在4G网络架构中,I/S-CSCF与HSS之间的为Cx接口,驳回Diameter信令。
Diameter 信令关键运行于EPC系统、战略及计费控制PCC系统和IMS域,关键用于用户鉴权、数据、战略、计费治理等。
EPC、PCC、IMS网络中经常使用Diameter信令的网元和接口包含:I/S-CSCF 与 HSS 之间的接口、PCRF与PGW之间的Gx接口、HSS与MME之间的S6a接口等。
而从前文剖析看,本次意外的缺点点均出当初与Diameter信令相关的接口和网元。
因此,疑心此次意外还潜伏着一个关键缺点:Diameter信令网异常。
当然,以上只是基于一些碎片信息的不成熟剖析,详细要素只能期待KDDI发布详细报告。
本网站的文章部分内容可能来源于网络和网友发布,仅供大家学习与参考,如有侵权,请联系站长进行删除处理,不代表本网站立场,转载联系作者并注明出处:https://duobeib.com/diannaowangluoweixiu/6467.html