这几天,大家都在关注日本电信运营商KDDI的大规模通讯缺点。
这个缺点影响很大,触及到日本全境范畴,共3915万用户。而且,缺点继续的期间很长,差不多花了两天,才算基本复原。
缺点的详细要素,我看到很多群众号都曾经写了,我就不再重复剖析了。
当天这篇文章,我想把话题加大一点,和大家深化聊聊——都2022年了,为什么咱们的通讯网络还有这么多缺点,以及,咱们究竟有没有终极处置打算。
缺点是通讯网络的自然属性。就像人会生病一样,通讯网络自降生以来,就随同着缺点。或许说,咱们就是在处置缺点的环节中,才发明了通讯网络。
贝尔老爹在处置了有数缺点后,才发明了电话
一百多年来,有数的通讯人,都在与缺点启动百折不挠的奋斗和博弈。他们致力研发了各种技术,驳回了各种手腕,和通讯缺点抗争。
从微观过去说,抗争的成果是清楚的。在阅历的不时积攒下,在工艺和技术的不时提上下,通讯网络出现缺点的概率在不时降低。
年轻的读者或许并不知道,20多年前,固定电话拨不通(有电话的家庭都不多),和停水停电一样,是经常出现现象。10多年前,手机拨不通,上网上不去,也是经常出现现象。
近十年来,这些现象变得越来越少见。偶然出现一次性,大家反而会感觉很奇异。网络断了,很多人的第一反响是手机坏了,或许欠费了,连忙重启或充值。不是吗?
咱们如今所处的信息社会,通讯网络和水电一样,是关键的基础设备。咱们的上班和生存,还有各行各业的运转,都离不放开讯网络。
在这样的前提下,通讯运营商作为国企,作为网络的树立和保养者,会一直把网络的安保稳如泰山放在第一位。
针对网络稳如泰山,工信部给运营商们设定了严厉的考核目的。假设某省某市出现了网络缺点,一把手必要求担责,仕途堪忧。
运营商指导的压力,会传递到员工身上,也会传递到设备商和外包商身上。
如今市场竞争如此强烈,一旦出事,要么就是巨额的赔款,要么就是丢掉这个省的市场份额,这是设备商和外包商无法接受的损失。
所以说,整个通讯行业关于通讯网络的安保稳如泰山,注重度必需是足够的。关键,还是才干和口头的疑问。
首先,我要和大家说一下通讯网络的安保级别定义。
依据场景不同,通讯网络的安保分为不等同级。从低到高,区分是家庭级、企业级、电信级。
通讯系统的安保等级
像咱们家里用的路由器什么的,都属于家庭级。这种设备的安保性牢靠性很低,说坏就坏,很容易造成网络终止。
企业级呢,就是单位外面用的网络设备。依据网络规模和用户数量,企业级设备有较高的安保性牢靠性,不太容易终止服务。
电信级的要求,就更高了。像移动、电信、联通,它们的网络,要为上亿的用户提供服务,相对不准许随便出现缺点。通常来说,电信级的牢靠性,要到达5个9以上的规范。
当天小枣君说的通讯网络,指的就是运营商面向群众的公共通讯网络,既包含蜂窝移动通讯网络,也包含固网宽带网络。它们都属于电信级。
蜂窝移动通讯网络和固网宽带网络的架构其实是相似的,关键区别在于接入网部分。
蜂窝移动通讯网络是无线接入网,接入设备是基站。而固网宽带网络是有线接入网,接入设备是PON设备(无源光网络设备,包含光猫)。
咱们就以蜂窝移动通讯网络为例,启动剖析。
公共通讯网络,服务的是数以亿级的用户个体,所以,通常会驳回金字塔级的架构,外围网为外围,传输网(承载网)为主干,接入网为四肢。
大家一眼就能看明确,这种架构,最大的弱点,就在于外围网和传输网(尤其是主干网)。
外围网是治理中枢,是网络的心脏和大脑,一旦挂了,就整个网络挂了。所以,外围网工程师(比如当年的我)是危险和压力最大的岗位。
外围网机房
传输网(承载网)呢,是通讯网络的血管和神经。末梢还好说,坏了最多影响一小块,然而,假设心血管和脑血管坏了,怎样办?那也是彻底瘫痪。
光传输设备
这次KDDI出现的缺点,还有2021年10月DoCoMo出现的缺点,以及2020年英国四大运营商的缺点,2020年美国CenturyLink的缺点,都和外围路由器无关。说白了,就是心脑血管出了疑问,整团体(网络)就瘫了。
相比之下,接入网这边出大疑问的概率很低。一般基站“掉站”,最多影响几百几千人,范畴很小,揭发可控。
基站设备
假设接入网出现大规模缺点,那极有或许是设备商的软件版本疑问,或许配件批次疑问。这种状况的概率极低。
那么,为了保障通讯网络的安保颠簸运转,防范缺点的出现,咱们通讯人都驳回了哪些方法呢?
(1) 首先,是顶层架构设计的完善。
网络的架构,是网络安保之本。一个好的架构,既要思考性能和容量,也要思考老本,还要思考安保和冗余。
这里请大家务必记住一点:通讯设备作为一个复杂的产品,不论你怎样设计或堆料,它都存在缺点的或许,只是概率上下、期间早晚的疑问。
关于或许出现的缺点,与其严防死守,不如重点思考出现缺点之后,该怎样办。
所以,引入备份机制,是应答缺点最有效的手腕。
备份机制
大家都学过“概率与统计”,1个设备出现概率的缺点假设是1%,那么,两个设备同时出缺点的概率,就是1%×1%=0.01%。没错吧?
为了保障相对的安保,网络架构设计时,会驳回POOL(池)组网的模式,如下图:
好几个设备独特组成池子(POOL),各自担任业务,假设有一个坏了,其它的立刻顶上,保障业务不受影响。
外围设备,通常有两个或两个以上,区分在省会市区的不同区域,物理上就离得很远。
此外,在做网络架构设计时,关键的设备网元通常会放在安保级别更高的外围机房。
外围机房
例如,移动通讯网络外面最最最关键的、担任存储和治理用户数据的HSS(就是以前的HLR,外面有每个用户的手机号码、鉴权数据、业务信息等),就寄存在省会市区的外围机房。同时,保养人员会活期启动数据的物理他乡隔离备份。
这几年,由于地质灾祸,加上抗争或恐袭等要素考量,运营商甚至开局做异省份的备份。
例如,去年郑州洪灾,过后外围机房被淹,HLR退服,就紧急启用了放在临近省份省会市区的HLR,成功业务的暂时复原。
不同的容灾级别
(2) 第二个方法,底层的主备机制。
刚才咱们说的是顶层设计的冗余机制。详细到机房、机架、单板、线缆,也都有主备的设计,可以称之为底层的主备机制。
假设去过机房,你就会发现,机柜上的机框,插着各种各样的单板。而这些单板,基本上都是成对出现的。
某厂家3G设备侧面外观
也就是说,某一类型的单板,通常都会有两块。
网线和光纤也是一样,你简直看不到单根的线缆,都是成对的。
某厂家4G设备侧面外观
这样做的要素,就是为了相互备份。假设某块单板坏了,那另一个单板就能继续上班,保障业务不受影响。同时,系统会启动报警,提示上班人员尽快改换。
电源也是一样,电信机房所无机柜设备,必需都有至少两路电源输入。
多路电源输入(一红一蓝为一路)
除了市电以为,关键机房还会设置蓄电池、UPS、发电机等应急供电设备。
机房的蓄电池组
(3) 第三,完善的治理制度和法规。
技术永远都不是影响网络安保稳如泰山的惟一要素。对通讯网络要挟最大的,其实是人,而不是技术。
关于这一点,小枣君置信每一个通讯人都会有相反的感触。
在治理流程和制度方面,在工程技术规范方面,咱们有过有数次血的经验。
为什么更新打算要重复评审?为什么工程规范要那么严厉?为什么要树立备件仓库?为什么割接步骤要double-check,甚至triple-check?为什么严重操作后要布置值守?为什么关键节假日要封网?……
这些都是先人踩雷总结上去的阅历。
对网络缺点,要时辰坚持敬畏之心
除了外部治理制度和流程规范之外,针对如今经常出现的通讯网络蓄意破坏事情,国度也树立了越来越严厉的法律法规,启动处分。
像合法施工铲断光纤、蓄意破坏基站、剪断光纤,都将遭到法律的制裁。
被恶意剪断的基站馈线
有正当的网络架构设计,有完备的主备机制,又有完善的制度和规范,为什么还会出现这么多缺点?
接上去,我来说点深档次的要素。
首先第一点,预计也是大家最认同的一点,那就是通讯行业的内卷环境。
这些年,恶意竞争、高价中标风靡,设备商和分包商既要抢单,又要维持利润,只能拼命压低老本,比如产品设计老本、用料老本、施工资料老本。更关键的是,人员工资老本。
老本不时紧缩,势必影响产品牢靠性以及工程品质。过低的工资,造成少量阅历丰盛的人才散失。分包商为了完工,只能招聘应届生,便捷培训(甚至没有培训)之后,派到现场干活。
这些人员缺乏必要的培训和通常,素质水温和技术才干无余,成为很大的危险点。
有些极一般素质低的,被压榨狠了,间接删库跑路,也不是没有或许。
前些年,为了确保一线员工不被克扣待遇,有厂商甚至和分包商签署合同,解放外包员工的支出底线。
除了高价竞争之外,影响网络运转安保的另一个关键要素,是不时参与的技术复杂度。
越先进的技术,复杂度越高,牢靠性越低。随着技术的演进,运营商的网络规模变得越来越大,组网也越来越复杂,出现疑问的概率大大参与。
通讯网络的潮汐效应是十分清楚的。闲时和忙时有时刻会有十倍甚至百倍的差异。假设出现异常事情(灾祸等),话务量激增,更或许是千倍的差异。
运营商无法能做千倍的冗余设计。所以,假设没有正当的旁路设计或阈值设计,网络出现拥塞的概率是极高的。(这几年的几次严重缺点,都有信令流量拥塞的要素。)
目前运营商的复杂组网,自己都没几团体能齐全看懂。期间久了,人员一流动,就更生疏了。
通讯网络原本就是一门玄学,疑问千奇百怪,谁敢说自己能算准每一种或许性?
第三个潜在的网络安保危险,也是小枣君最担忧的危险,那就是外部的网络攻打。例如黑客、病毒和系统破绽。
如今,通讯设备基本上都IP化、云化了,网络越来越放开,也有的间接部署在私有云上,和外界的物理隔离越来越弱,比以前更容易遭到攻打。
如今的攻打者,水平也比以前高很多,手腕也愈加多样化,对网络的要挟极大。
当然,运营商和设备商在防范网络攻打方面,投入也很大。
如今,一切厂商都关注“安保加固”这个概念。望文生义,安保加固就是封堵系统破绽,使得系统愈加稳如泰山。运营商会驳回第三方工具,或延聘第三方厂家,对现网设备启动安保扫描,寻觅安保破绽,而后要求设备商启动整改和封堵。
一切为了安保
这种“道高一尺,魔高一丈”的博弈,会常年继续下去。
然而,小枣君团体以为,目后退攻的一方,在人员安保看法、技术才干方面,都存在很大疑问。后续,咱们遇到的安保事情,会越来越多。
宿愿无关单位和部门不要把安保放在嘴边,真正花点功夫优化自己的人员素质,增强培训。不然真出了事,弥补就太迟了。
日本KDDI的缺点不是第一次性,也必需不是最后一次性。通讯网络缺点,就像击鼓传花,谁也不知道自己是不是下一个。
如今,厂商们都提出要引入AI,让人工默认来接收网络,以此降低网络的缺点率。也有的厂商,在网络云化的基础上,搞灰度更新(即部分更新),也能大幅降低网络危险。这些都是好的趋向。
我感觉,在与通讯网络缺点启动奋斗的路线上,咱们还有很长的路要走。路漫漫其修远兮,通讯人当上下而求索。
好了,以上就是今天文章的所有内容。
本网站的文章部分内容可能来源于网络和网友发布,仅供大家学习与参考,如有侵权,请联系站长进行删除处理,不代表本网站立场,转载联系作者并注明出处:https://duobeib.com/diannaowangluoweixiu/6490.html