通信人家园

标题: 老张观察:运营商自研传输网管和可能方向  [查看完整版帖子] [打印本页]

时间:  2022-11-9 16:39
作者: 通信老张     标题: 老张观察:运营商自研传输网管和可能方向

老张观察:运营商自研传输网管和可能方向

老张和从事白盒研究的一位专家探讨,为什么运营商现在热衷白盒和灰盒,除了降成本、搞创新,还有其他什么因素?他的观点很有启发,他认为基于开源软件和互联网云商的自研实践,自定义的设备接口,自研网管的难度大幅下降;有了自研的统一的网管,就对设备软硬件做白盒灰盒化,实现厂家无关;软件开发也没有那么费劲,总能运行起来,所以成了热点了。他的观点有一定的道理,也分享一些我的观察。


说到自研网管,一定会提到最早AT&T,在ONAP社比较活跃,基于Open Day Light开发了ECOMP系统,算是非常成功。ECOMP其实不是常说的设备网管系统,他是统一的编排器,是比较先进的OSS系统。国内的运营商,在厂家网管之上,也都开发自己的先进的运营系统,做到统一的跨厂家和跨专业(如果传输+IP)的协同运营系统,自研产品是比较成功的。但统一的设备网管(有的叫EMS,或叫NMS,甚至叫设备控制器),就是直管多厂家设备的网管,相对就进展较慢。


还是说回到AT&T,也曾经组建团队自研光传输的统一网管,算是OpenROADM的一部分,但经过七八年的实践,也走不下去了,还是通过ECOMP对接各个厂家的设备网管系统,以实现系统集成和自动化。AT&T每干成,我认为有两个原因:一是设备网管和厂家设备实现强相关,网管本来就是一个细琐操作为主的系统,不仅是管网元,还需要管业务,甚至管网络,不是定义标准Yang接口就可以解决的;第二是网管系统系统也大致遵循2-8原则,20%用于正常的业务配置,80%用于日常维护和异常处理,难点不在20%上,而在于80%的异常上。我和电信的专家讨论过,其实各家的网管的20%基本配置(能不能用)的差异化很小,真正的差异化在这异常处理的80%(好不好用)上,难就难在这剩下的“不起眼”的80%上。


举个例子来说,中国电信的OTN CPE统一网管UMS是较早的项目,是对接入层OTN CPE多厂家管理。早在2019年11月,C114新闻说UMS在东莞试点,成功对华为、格林威尔和瑞斯康达的设备,支持业务创建、修改和删除,通过标准化I2接口,完成了业务路由呈现,具备业务性能的监测,推测自研网管已具备商用能力。


到2020年2月,C114说自研UMS控制器对参与集采的多厂商遍历测试;随后进行了OTN CPE招标,是国内第一家进行OTN CPE集采。到7月,新闻说UMS成功上线,在5省规模商用。期间,还留意到《新一代网络运营系统2.0关键技术研发与应用项目单一来源采购公示》招标说,采购UMS系统部分模块的开发及系统的运营维护工作,电信系统集成公司中标。看来UMS进入大规模部署和运营阶段了,这个节奏和CPE集采完,进行大规模设备部署节奏差不多。


因为疫情线,线下会议少了很多,进展信息少了一些。到2021年11月,C114新闻说电信联合烽火、中兴、华为等公司,通过UMS完成了政企OTN专线跨域跨厂商(安徽—四川)OTN跨省精品专线开通。问了烽火的专家,2年前东莞试点是省内专线,这次是跨省专线,往前更近一步。


2022年1月,发布《2021年接入型OTN设备统一管控系统(UMS)建设工程项目单一来源采购公示》,也是电信系统集成公司中标,可能是UMS进行了重大升级。到3月份,新闻说UMS在内蒙资源池部署,全国部署一套,UMS满足现网运营维护实际需求,可提供符合精品OTN专线快速开通,可查可视等特征。


为电信的网管自研能力点赞,UMS网管是全国一套集约化的部署,确实比华为、中兴、烽火等传输厂家分省部署网管要先进。2022年3月,在一篇广泛传播的《在最好的时代做“顶天立地”的科创人》的采访稿,也提到UMS已实现全国部署。2022年4月,启动接入型M-OTN设备集采(支持OSU、UMS管理)的资格预审,规模超14万台,要求UMS管理。这次集采到现在还没有发标,不知道是否与UMS的进展有一定的关系。


新闻很多,问省内的实际情况,朋友说UMS没有宣传的那么好,还没有形成真正的生产力,主要是多厂家的适配和验证困难,业务模型复杂,北向对接也有差距。一个CPE的网管按理说不太难,多轮招标合作开发,也是大力投入,大量现网验证,也是OTN政企网的重要组成部门,尚需要3年多的试点和验证,如加上早期的设计、研发,周期一定会更长,可见自研设备统一网管的难度不小。


最近读到来自云深知网络的公众号的报道,说是SIGCOMM 2022最佳论文《Software-Defined Network Assimilation Bridging the Last Mile Towards Centralized Network Configuration Management With NAssim》,提出了一个辅助框架NAssim,作者来自华为、中关村实验室、北邮、济南超算等的多位专家,可以加快将新设备导入到SDN网络中。我读不懂这篇论文,从云深知网络的介绍来看,是将不同的设备用户手册解析成初步的配置模型,通过语法分析、模型验证和经验数据验证来确认模型的正确性;基于深度学习的映射算法,使用神经语言处理技术,在经过验证的配置模型和SDN控制器中的模型之间产生可理解的推荐映射。简单来说,这个NAssim通过直接从设备手册中学习,产生SDN控制器和人都能理解的数据模型,将网管开发从最乏味的多厂家的适配任务中解放出来,论文说NAssim可以将过程加快9倍,看起来确实比较先进。


如果UMS的实现难度在不同厂家的适配,那么有没有一种可能,可以通过这个NAssim,使用技术手段简化多厂家网管的开发难度问题。



时间:  2022-11-9 18:19
作者: wusiwusi

华为表示反对,别多厂家了,用一个厂家,全部都是鸿蒙底座的网管就没这烦恼了。
时间:  2022-11-9 18:38
作者: 没事来看看

wusiwusi 发表于 2022-11-9 18:19
华为表示反对,别多厂家了,用一个厂家,全部都是鸿蒙底座的网管就没这烦恼了。

华为如果不要钱,电信表示有多少要多少。
时间:  2022-11-9 18:39
作者: 没事来看看

SIGCOMM 2022最佳论文《Software-Defined Network Assimilation Bridging the Last Mile Towards Centralized Network Configuration Management With NAssim》  在哪可以看到啊?
时间:  2022-11-10 09:08
作者: tecoyi

电信应该考虑一下为了通信服务业的方向,把研发投资多用在开源提升产品服务质量和设计新产品上
时间:  2022-11-10 09:26
作者: withert

tecoyi 发表于 2022-11-10 09:08
电信应该考虑一下为了通信服务业的方向,把研发投资多用在开源提升产品服务质量和设计新产品上

其实就是运营商再想办法摆脱设备厂家的束缚
时间:  2022-11-10 11:19
作者: piview

  OTN涉及一些硬管道的东西,时隙对应,交叉连接对应,不同厂商接口对接,资源系统对接,确实比较繁琐而复杂, 而且运营商为了不被某一家厂商制约而制定了不同厂商的互联互通标准,推动CPE标准化,导致更加复杂化。现在的状况有点象FTTH光猫标准化的初期,但传输涉及长途全程全网,不同厂商确有难度。但像IPRAN,PTN,STN,SPN这些纯IP底层逻辑上模拟传输伪线PW的东西,不同厂商的互通就简单得多了,毕竟就是一个逻辑上的PW通道,省内的统一网管已经完全成熟,虽然不是自研,但是第三方能做得非常好,开通,移机,提速,停机,拆机都可自动实现,运营商已经可以完全不买厂商的自有网管了。
时间:  2022-11-10 11:57
作者: fgy719960141

wusiwusi 发表于 2022-11-9 18:19
华为表示反对,别多厂家了,用一个厂家,全部都是鸿蒙底座的网管就没这烦恼了。

现在华为在移动以及联通部署接入otn就是这个想法。
时间:  2022-11-10 11:57
作者: fgy719960141

运营商开发网管感觉电信IPRAN的还可以。
时间:  2022-11-10 11:57
作者: 一路向东3586

提示: 作者被禁止或删除 内容自动屏蔽
时间:  2022-11-10 22:10
作者: 通信老张

老张不是说所有网管都不能做统一网管,而是专业不同,底层技术不同,运维习惯不同,对网管的要求也不同的,统一网管的难度也就不同了。比如,数据专业的网管,无论是早期的ipcore,还是ip城域网,以及ipran都成熟自研了,国内运营商很少有直接用厂家的网管;IP是以协议为主,从cisco开始就是CLI(做配置)+ SNMP(做监控)的管理方式,老张还曾见过HP的统一ip网管;前一阵子还看到中国电信自研成功IPv6的SDN网管。接入网管也分化成ONT统一网管,和OLT的统一网管,在DSLAM时代就用批处理脚本进行批量配置,网管也简单一些,早实现了多厂家的统一网管。PDH和SDH等传输从一开始就是单网元的交叉、映射、复用等(这些都是其他专业不涉及的概念),基于多网元做电路的端到端算路,和网元配置就比较复杂了,因此传输网管一开始就通过图形化做网元和业务管理。当传输引入DWDM做多波复用,对光层配置调测,加调波还相互影响,就涉及更多的模拟量调测和监控了,这可能是传输网管复杂的原因,也就是老张说的“不起眼”的80%了。对于OTT自研的传输网管,管理点对点的DCI BOX设备,是把光层做成无源当成光纤复用器的方式,简化光层管理,甚至不管理光层,仅仅聚焦光电转化的OTU转化,那确实要简化很多,难度降低很多,自研比较容易,一旦涉及组网难度就会提升。

回到UMS这类OTN CPE的网管和家庭ONT不太一样,看似个小设备OTN设备,但实际原理并不简单,老张认为可能有三个原因:各厂家的硬件实现不一样、各厂家的业务模型不一样,OTN政企业务的模型不一样,因此不是简单的网元配置和告警管理系统,所以开发和验证的难度较大。如果要放到做城域大网组网设备的网管,可能难度会更高一些。
时间:  2022-11-10 22:20
作者: okboby

因为厂家对运营网络基本不理解,又总是高高在上指导运营商怎么干,运营商反正不用自己干活,你厂家说怎么就怎么呗,造成现在中国设备商跳在前面大谈运营需求,运营商在大搞一些云计算、大数据、AI智能什么的PPT。
其他我不知道,反正美国的COMCAST在做CMTS云化时是自己整研发团队做的开发,包括思科等公司都只是供硬件设备,而且硬件设备完全要符合COMCAST的云化软件技术要求,这才叫运营商,这才能引导技术发展和路线演进,不会像现在都在大写PPT,搞脑力风暴,虚浮一片。
时间:  2022-11-11 08:59
作者: zgysc

既然楼主明白一个放之四海而皆准的网管不是定义标准Yang接口就可以解决的,并且承认二八定律中 那80%才是关键,难道这个NAssim就能解决那80%的问题吗?  我看楼主对这个NAssim框架的解释是:“是将不同的设备用户手册解析成初步的配置模型,通过语法分析、模型验证和经验数据验证来确认模型的正确性;基于深度学-的映射算法,使用神经语言处理技术,在经过验证的配置模型和SDN控制器中的模型之间产生可理解的推荐映射。”   我理解这仍然属于20%。  真正的痛点可能还是没抓到
时间:  2022-11-11 15:23
作者: bfworld

最近几天正好在弄小厂家OTN设备UMS纳管。UMS网管还简陋得很,有很长的路要走。 继续下去的确有成功的可能。    小厂家接入OTN设备本身都还处于探索阶段,2019年底搞了20多台设备自组网,结果发现设备各种限制,与理想相去甚远。 当前传输专线仍然以100M以内的EOS业务为主,底层还是要走SDH。 小厂家设备普遍SDH能力弱得很。 回头说到网管,OTN光层的维护手段少得可怜,厂家自己的网管都只有基础的单站业务配置,成环的业务路径都无法呈现。 像华为那种自动算路光业务发放更是遥远。分组业务倒是能实现这些,于是我们头铁按照分组开了一百来条业务,一年大面积断网三四次,每次遇到BUG升级设备软件几乎是必出大面积故障。后来才发现这些厂家的分组和二层交换功能都是做在主控和交叉板上的,经常遇到环路问题造成大面积的业务不可用。  厂家自己的定位还是MSAP的升级版,就是挂在大厂家下做端口扩展的。 两三年过去了, 现在我们又走回头路,分组业务已经基本都改EOS了,设备定位也重新拉回MSAP的位置。 当成接入层端口扩展设备来用,还是比较稳定的。 大部分的地市几乎都是这样用,敢自组网的,都是头疼得不行。
      现在鼓吹UMS和自研盒子的人,我不知道他们有几个人是真正有现网运营维护经验的。  现在不是天天哭喊着要提升网络质量、网络安全么?  没有好的设备,好的网管,写几个PPT猛吹一通能实现么?
时间:  2022-11-12 14:57
作者: 通信老张

Bfworld是两手粘泥的专家,比老张这种坐办公室看文档写片子的人讲出来就具体很多了,你提到的问题我理解可能有3个原因:1)设备网管与设备软硬件设计强相关,每个设备供应商的设备设计都不一样,导致网管也很难统一起来;2)研究院专家基于谷歌的yang做了otn的升级适配,但谷歌在做设计的基于DC交换机和路由器的,搬到政企OTN复杂的多业务模型的特点,有点水土不服;3)常用运维特性的丰富度,网管主要是给运维人员每天用的,业务发放,故障处理和业务调整等常用功能才是最关注的新,但这块谁都不能量化,只有像你这种每天用的人才有真实的感受,好不好用,能不能用。

后面我觉得自研网管可能还会遇到2个较大的挑战,即工程上的问题,软件系统我理解还是有门道的,稳定性、保护性、兼容性、容错处理;第二呢,融入电信比较先进的自动化运营大平台/OSS等,集团和省内的两级对接、联调、接口、入资交维等等。

尽管困难重重,我还是认为电信的自研UMS会成功的,只是研发周期、投入成本、上线切换成本、功能完备性和省公司运维人力的平衡考虑,是个大帐大成本的事情。国外的运营商干不成,主要是他们都靠展会忽悠外部资源帮自己干活,喊口号的人多干活的人少;没有像中国电信一样真投钱研发团队,撸起袖子自己干。但随着不同的特性叠加,比如新增保护,新增业务类型,新的OSU,新的招标的设备商引入,开发难度会持续增加,系统也会越来越复杂,就看自研的成熟速度,是否能跑赢新增特性的速度,如果跑赢了,就能进入良性循环;如果跑不赢新增需求和特性的速度,就可能像你说的现状差距越来越大。

毕竟是自研产品,难用一点,在自研和科创的方向上,强推着省公司面前也能在一些地方用起来的,如果过度的片子宣传讲太多太好,反而可能会误导省内,其实是坑了省内的业务发展和运维同志们。
时间:  2022-11-12 23:18
作者: 枫叶荻花秋瑟瑟

网管平台实际上就是个单纯的软件,开发难度不大。运营商一般也有几十万员工,其中具备软件开发能力的也不少,完全可以搞个内部开源计划,自己开发
时间:  2022-11-14 10:41
作者: jamdel

读完整篇文章,感觉运营商还是应该聚焦上层管理比较容易或者说基于自身业务的需求去开发上层软件更有意义。南向部分还是留给设备厂家自己去管理和运维比较可靠
时间:  2022-11-14 10:50
作者: 小眼睛看世界

运营商自研网管感觉意义不大,丢给设备商,有问题也好处理,自己弄,要兼容各个厂家,其实挑战还是很大的,没有看到老张说的“80%”的工作量。简单的监控管理,业务发放是简单的,现在网络不是还有自愈功能和AI算法嘛,运营商哪儿有精力去搞这块呢
时间:  2022-11-14 10:52
作者: UFO13579

没有老张说得那么夸张吧,自己搞不会被26, 251, FH牵着鼻子走,搞一下花里胡哨的功能二次销售。
时间:  2022-11-15 09:28
作者: bfworld

枫叶荻花秋瑟瑟 发表于 2022-11-12 23:18
网管平台实际上就是个单纯的软件,开发难度不大。运营商一般也有几十万员工,其中具备软件开发能力的也不少 ...

网管软件和设备硬件强相关, 难度不大??
时间:  2022-11-15 22:30
作者: 枫叶荻花秋瑟瑟

bfworld 发表于 2022-11-15 09:28
网管软件和设备硬件强相关, 难度不大??

可采用标准网管接口?
时间:  2022-11-16 18:57
作者: bfworld

本帖最后由 bfworld 于 2022-11-16 19:00 编辑
枫叶荻花秋瑟瑟 发表于 2022-11-15 22:30
可采用标准网管接口?

你说的方法已经在做了。   搞得一头包

这是传输,不是数通,传输远比数通复杂。 传输要的是不断的技术创新,不是数通的应用创新。  从PDH到SDH,再到MSTP、OTN、MSOTN、ROADM、OXC。 每次一都是传输技术的大进步。

为什么华为的好用, 因为人家在ITU-T的标准上丰富了很多设计和功能,那是有专利的。

所谓的标准不就是要打破专利嘛。 我个人觉得并不利于传输发展。


时间:  2022-11-16 20:35
作者: 客家人

bfworld 发表于 2022-11-16 18:57
你说的方法已经在做了。   搞得一头包

这是传输,不是数通,传输远比数通复杂。 传输要的是不断的技术 ...

  一家独大会屁股坐歪了,这也是数据中心自己定制光传输和自己采购光模块的原因。
时间:  2022-11-17 08:29
作者: bfworld

客家人 发表于 2022-11-16 20:35
一家独大会屁股坐歪了,这也是数据中心自己定制光传输和自己采购光模块的原因。

运营商传输网络和远洋船舶一样是要经大风大浪还得不沉的, 可不是在风平浪静的小河沟里倒腾的数据中心。 专业的事交给专业的人做。   

数据中心的波分系统只需要大容量高带宽,不要总拿来和运营商的承载网比较, 没有可比性。
时间:  2022-11-18 07:29
作者: 通信老张

老张陆续收到一些信息,说明运营商自研的网管还是很有难度的,和老张的判断一样。
运营商投入搞通信设备网管研发的,中国电信投入的自研的资源估计是业界最大的,决心也是最大,当然取得的进展也是最大;即便如此,离真正成功还有很远;当然是否真的能成功,还不太一定。

比如,中国电信推进3年的自研UMS来说,开发的进展也不太顺利,规模投产计划估计还需要较长时间,别说追上华为、中兴和烽火的网管还早,就连瑞斯康达和格林威尔的网管都还有差距;

再比如,前一阵子,有电信研究院官微说电信基于SRv6,自研了IP SDN新型城域网控制器,大部分功能100%为研究院自己写的,实现了产品的自主可控。电信在5个省完成系统上线,具备承载现网业务的条件,今年将会在17个省的新型城域网进行部署。电信的专家说规模部署后,可实现网络建设综合成本下降超过10%,同时替代云网业务开通效率能够提升80%。这次居然才提降低10%的成本目标,看来比DCI BOX的降低建网成本的20%还少呢,老张估计这个数据也是拍出来的。

还有一个例子,中国电信自研的DCI BOX网管,这个国内阿里、腾讯有自研使用;中国电信也在自研,业界宣传也比较多,投入了2年,据说进展也不太顺利,去年招标的设备现在还管理不起来。

中国电信研究院的自研资源还是很充足的,一家运营商把传统通信业的网管基本都做了个遍,至于做的好不好,老张看不清,真正的用户(省内公司的使用人员),估计才知道实际情况和使用体验。

论坛里面有真正使用的专家,也可以看看老张说的对不对。

时间:  2022-11-18 08:39
作者: 坂田小夫妻

bfworld 发表于 2022-11-17 08:29
运营商传输网络和远洋船舶一样是要经大风大浪还得不沉的, 可不是在风平浪静的小河沟里倒腾的数据中心。  ...

是的。开放解耦网络只可能在数据中心互联及海洋传输中应用,大部分为点到点传输。运营商承载网,网络远比上述场景复杂,做不到开放解耦。
时间:  2023-3-15 13:10
作者: penlzh

withert 发表于 2022-11-10 09:26
其实就是运营商再想办法摆脱设备厂家的束缚

没有绑架,何来反抗
时间:  2023-3-15 13:18
作者: carlzhusz

penlzh 发表于 2023-3-15 13:10
没有绑架,何来反抗

我感觉老张就是华为的,或是类似大厂的,翘着脚看着运营商好戏。

他是搞技术的,哪知道消费者的苦恼。
时间:  2023-3-17 23:43
作者: zetawangwy

我说下,我了解的情况(1年多前的情况)
1、OSS 70%自研是集团目标
2、从凯通挖了不少人
3、新一代OSS 3.0是三层解耦的架构,采控+资享+上层网管。




通信人家园 (https://www.txrjy.com/) Powered by C114