通信人家园

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

  四级军士长

注册:2017-9-24132
跳转到指定楼层
1#
发表于 2024-7-24 11:10:16 |只看该作者 |倒序浏览
北京时间7月23日,美国联邦通信委员会(FCC)公布了关于AT&T全国性移动通信网络重大中断事件的详细报告。

此次中断持续至少12小时,影响遍及美国50个州、华盛顿特区、波多黎各及美属维尔京群岛,所有AT&T移动用户均无法使用语音服务和5G网络。

FCC深入调查揭示,AT&T网络中断由一系列复杂因素共同作用造成。

其中包括网元配置不当、内部流程未被严格遵守、缺乏同行评审机制、新网元安装后的测试不充分、实验室测试标准低、缺乏有效的变更审批与风险缓解策略等。

这些因素叠加,使得即使在配置错误被修正后,网络仍无法迅速恢复正常,导致中断时间延长。

事故发生在凌晨2:42,一名AT&T员工在进行常规夜间维护时,错误地将一个未经充分测试的新网元加入核心网络,旨在提升网络功能与容量。

由于缺乏必要的同行评审,错误配置未能在部署前被识别。

随后,错误配置引发连锁反应,自动安全机制误判而切断了网络连接,仅3分钟内,所有语音与5G数据处理节点被隔离,导致全国范围内服务中断。

尽管AT&T迅速采取行动,移除了问题网元并试图恢复网络,但大量用户同时尝试重新注册,超过了网络管理系统的承载极限,引起严重拥堵。

这种状况持续近10小时,即使在初步恢复后,仍有用户遭遇服务不稳定,直到数小时后性能才逐渐恢复正常。

FCC强调,此次中断不仅影响公众对紧急服务如“911”的访问,还阻碍了日常生活中的沟通需求,包括与家人、雇主、医疗服务提供者等的联系。这凸显了运营商需严格遵循最佳实践,强化网络控制,提高故障应对效率。所有网络变更必须基于内部规程和行业标准,未经审批的修改严禁上线。

本次事件发生之际,正值AT&T面临多重挑战,包括近期曝出的用户数据泄露事件,涉及长达半年的通话与短信记录。这无疑加剧了公众对该公司网络安全的信任危机。

不得不说,AT&T作为海外领先的运营商巨头,看上去很高大上,但从其组织松散、管理不规范、专业水平不高或缺乏正式体制支持等情况来看,其实也只是一个草台班子。FCC的调查揭示了一系列基础管理上的疏漏和失误,如网元配置错误、未遵守内部程序、缺乏同行评审、测试不充分、无有效控制措施等,这些都反映出AT&T在网络运维管理上存在的问题。在如此重要的通信基础设施运营中,AT&T未能展现出应有的专业水准和严格管理,导致了大规模的服务中断,对公众生活造成了严重影响。

国内运营商情况又如何呢? 通信敢言

举报本楼

本帖有 46 个回帖,您需要登录后才能浏览 登录 | 注册
您需要登录后才可以回帖 登录 | 注册 |

手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图  

GMT+8, 2024-11-22 18:53 , Processed in 0.188561 second(s), 18 queries , Gzip On.

Copyright © 1999-2023 C114 All Rights Reserved

Discuz Licensed

回顶部