柯晓燕 宋杰 天翼智库
数据基础设施的内涵和意义
全球经济社会已从信息化阶段全面转向数字化阶段,当前又向数据要素化阶段进一步演化升级,相应地,IT基础设施从信息基础设施发展到数字基础设施,并进一步转型升级为数据基础设施。数据基础设施是在网络、算力等设施的支持下,面向社会提供一体化数据汇聚、处理、流通、应用、运营、安全保障服务的一类新型基础设施,是覆盖硬件、软件、开源协议、标准规范、机制设计等在内的有机整体,包括网络、算力、流通和安全四类设施,具有数据汇聚、数据处理、数据流通、数据应用、数据运营和数据安全保障六大能力,提供“采-存-算-管-用”全生命周期的大规模数据要素流通与应用支撑能力。
一方面,数据基础设施与数据基础制度的落地和数据资源开发利用的实施一起,共同支撑解决数据要素产权确权、收益分配、交易流通、安全治理等核心问题,夯实数据“存得下、流得动、用得好”基础;另一方面数据基础设施建设对扩大数据产业规模、繁荣数据产业生态、促进数字经济高质量发展具有重要意义,刘烈宏局长在第二届全球数字贸易博览会数据要素治理与市场化论坛的致辞中指出初步估算数据基础设施每年将吸引直接投资约四千亿元,带动未来五年投资规模约两万亿元,蕴藏着巨大的新机遇。
我国数据基础设施创新探索实践
四类设施中,以5G、光纤、卫星互联网等为代表的网络设施网络持续迭代升级,居于全球领先;以通用、智能、超级算力为代表的算力设施,处于政府主导,通信运营商以及华为等科技巨头主力承建的高速发展阶段。以数据空间、区块链、高速数据网为代表的数据流通设施,以及以隐私计算、联邦学习等为代表的数据安全设施,处于各种技术路线、标准、规范和平台工具创新拓展期,是探索实践最为活跃的领域,涌现出众多的新型数据基础设施解决方案和产品。
1. 中国电信“灵泽”数据要素服务平台
“灵泽”是中国电信基于云网基础设施和安全、量子、AI能力,以及海量数据优势,打造的支撑数据集约共享、安全可信流通服务平台,覆盖数据要素的生产、加工、审核、上架、订购、交易合约、产品交付、结算支付等全流程。目前已与银行、交通科学研究院、经济和信息化局等多个企事业单位,围绕金融风控、精准洞察,公共数据流通平台建设、公共数据授权运营展开合作。
2. 中国电子数据金库
中国电子首创数据元件和数据金库,提出“物理隔离、数据托管和模型转换”存用分离思路,从城市数据治理切入打造“一库两网,三级节点”的数据流通和安全融合基础设施。数据元件是从脱敏数据中抽取场景关联字段、建模特征字段所构建的数据集,实质是高频交易标准化数据产品。“一库”指数据金库,是政府主导构建的自主安全数据中心,归集并存储影响国家及区域安全和国家长期发展战略的基础数据、个人隐私核心数据和重要数据,以及数据治理形成的数据元件。“两网”指数据金库内网和外网,数据和元件在内网自由交换和共享,按需以元件形式流入外网,实现元件之间、元件和一般数据的流通和融合应用。三级节点指市、省、国家三级,对数据和元件分类分级、分层分布存储,统一设施建设标准、明确管理责任,实现数据归集、存储和流通的全程可管可控,目前已在徐州、大理等六城市落地。
图1 中国电子数据元件与数据金库思路
(注:整理自中国电子信息产业集团党组成员、副总经理陆志鹏所做的主题演讲《打造数据金库,护航数据安全——构建以数据金库为核心的数据安全基础设施》)
3. 中国信息通信研究院可信数据流通网络(Trusted Data circulation Network,TDN)
TDN 以数据可信流通为基础原则,以“全国互联、数据可信、流通安全、全程可溯、贡献可量”的五个核心能力为目标,而构建的跨区域、跨行业、跨主体数据流通基础设施。TDN有“互联基础层、资源接入层、计算控制层、流通服务层”四层功能框架(如图2),通过建立顶级节点、枢纽节点、子节点三层拓扑结构(如图3),应用隐私计算、使用控制、信任保障和互联互通四类关键技术,支撑数据、算力、网络等互联互通和价值共享。围绕TDN落地建设,信通究院规划了TDN标准规范体系并积极组织各项具体规范编制。
图2 TDN的四层功能框架
图3 TDN的三层拓扑结构 (注:图2和图3来源:《可信数据流通网络(TDN)白皮书(2023 年)》,中国通信标准化协会大数据技术标准推进委员会隐私计算联盟)
4. 中国移动数联网(DSSN,Data Switching Service Network)
中国移动将其数联网定义为依托“连接+算力+能力”信息服务体系,基于隐私计算、区块链、低代码开发等核心技术构建的跨行业、跨区域、跨机构的下一代数据要素流通基础设施,在2023年4月提出DSSN构想、10月发布DSSN产品白皮书、11月推出数联猫。数联网在算力网络之上构建了“一网一台”,“网”实现客户就近接入、全网可达;“台”即数据流通共享平台,基于隐私计算、区块链、低代码开发等核心技术,确保数据流通全程安全可信。“数联猫”支撑客户快速网络认证接入、一体化数据交付。
四个探索案例中,“灵泽”和数据金库可以视为服务于特定应用场景的数据流通与安全融合设施;可信数据流通网络目标宏大,旨在打造全国性的横纵互联互通的数据流通基础设施;中国移动数联网是在尝试做网络、算力、流通和安全一体的共性基础设施。
但我们也要看到众多技术厂商和应用机构创新探索的另一面。其一,各自为营、点状突破,均致力于打造生态、建立护城河、争当“国家队”,对技术融合、互操作考虑较少。如:中国电子提出“加快建设形成数据金库互联网,一体化设计建设国家数据要素互联网”;信通院广泛联络行业各方,推动打造可信数网的全国一张流通网。其二,有相当多的探索实践处于方法论阶段,缺少商业化落地实践,如可信数据流通网络处于发布白皮书、标准规范阶段。中国电信研究院调研发现:现阶段数据基础设施距离高标准联通较远,缺少行业性数据交易平台和公共数据运营平台,缺少数据交易场所互联互通平台,“网算数”融合一体的低成本、高效率、可信赖的数据基础设施刚刚起步。主要表现有:各交易场所自发建设信息化平台,标准和成熟度差异大,平台间数据交换或互操作尚未实质开展;数据资产登记平台众多、且未互联互认;数据流通应用的各方结合场景私有化部署区块链、隐私计算解决方案,成本高、难互通等。这些问题的破局正是相关技术厂商和应用机构在数据基础设施建设运营的新发展机遇。
我国数据基础设施建设运营的机遇
根据我国统一大市场的“推进市场设施高标准联通”要求,以及数据流通和应用各方均需要低成本、高效率、可信赖的共性服务和保障环境的迫切需求,我国数据基础设施建设运营相关技术厂商和应用机构,一方面可积极参与数据基础设施的关键技术标准制定,以及区块链、隐私计算等技术融合应用攻坚,另一方面可着重关注以下方面的发展机遇。一是行业性数据流通应用、公共数据授权运营等平台设施,支撑央地数据相互授权运营、企业数据和公共数据融合创新开发。二是数据交易机构互联互通平台,为各级各类交易场所提供安全可信的流通环境及统一登记存证、统一信用评估、统一合规公证等公共服务。三是网(络)数(据)算(力)融合的基础设施,将区块链、隐私计算、低代码开发等数据流通关键技术纳入数字基础设施底座,打造“存力+算力+连接+安全+效能”一体的超大规模数据要素市场的可信流通技术底座。
|