查看: 4228|回复: 5

S^2：语义通信：用人工智能打败香农限？ [复制链接]

临渊羡鱼19

军衔等级：

三级军士长

注册：2020-7-7 点赞数

98

电梯直达

1^# 大中小

发表于 2022-4-8 10:55:54 |只看该作者 |倒序浏览

S2小伙伴 S2微沙龙
by hang

01

什么是语义通信

Shannon在1948年发表了那篇著名的《A Mathematical Theory of Communication》，奠定了信息论的基础。隔年，Shannon又和Weaver合作发表了《The Mathematical Theory of Communication

》，对信息论做出了补充，并第一次提出了语义通信的概念。Weaver在文中把通信分为三个层次：

LEVEL A. How accurately can the symbols of communication be transmitted? (Technicalproblem)
LEVELB. How precisely do the transmittedsymbols convey the desired meaning? (Semantic problem)
LEVELC. How effectively does the receivedmeaning affect conduct in the desired way? (Effectiveness problem)

第一个层次解决的是通信的技术问题，也就是我们传统的通信系统所研究的重点内容。Shannon在其1948年的论文中明确指出了他所提出的信息论是工程通信理论，“Semantic aspects of communication areirrelevant to the engineering problem ”，语义的作用并不被考虑入内。只有信息被完全准确无误de地传达，才能认为是一次成功的通信。

第二个层次解决的是通信的语义问题。在现实世界中，通信所传达的信息往往并非是没有意义的01比特，接收方也不需要知道与发送方完全一致的信息便可准确的知道其想表达的内容。

第三个层次解决的是通信的语用问题。通信不仅是要把信息传达出来，更关键的是要起到起相应的作用，才能算是成功的有意义的通信。显然，这不仅仅是通信的技术问题，而是一个包括了心理学、哲学等多方面内容的跨学科问题。

下面举个例子来具体说明这三个层次的通信。

发送内容：红星小学的小学生都坐公交车上学。

收到内容：红星小学的学生都坐公共汽车上学。

从通信的技术层次来说，收到内容因为少了一个“小”，同时“公交车”变成了“公共汽车”，所以是失败的；但是从语义通信的角度来说，虽然少了一个“小”，但小学的学生肯定是小学生，公共汽车和公交车也是同义词，因此对这句话并不影响接收方对这句话的理解，所以可以视为一次成功的通信；从语用角度来说，如果这句话是一个路人说的，那就是不成功的通信，如果是学校的强制规定，不坐公交就会被开除，那么这才是一次成功的通信。

传统的通信系统架构如下图所示。在系统发送端和接收端需要进行编码调制以使得信息高效准确的传输。

传统通信网络架构

语义通信系统与之类似，重点在于基于语义对数据进行信源编码甚至信道编码。而人们之所以可以通过语义进行通信，是因为收发双方有公共的认知和背景知识，能够理解一些基本语义概念（语义基元）的关系和含义。因此，语义通信与传统通信系统架构的最大不同在于语义通信系统的收发两端，需要有共享的语义知识信息库，以协助收端通过收到的语义基元恢复出原始的数据，因此与原始数据相比，只需传输更少的数据，从而获得更大的语义信道容量，从这个角度来看确实打破对香农限的限制，但是并非打破了物理信道本身的容量限制。

语义通信网络架构

02

语义通信理论基础

Shannon为经典信息论奠定了理论基础，引入熵的概念为信息量提供了定量的衡量方法，那么语义通信有完备的理论基础吗。

关于语义通信的信息论有很多，各自的出发点和衡量标准都有所不同，也都有各自的可取之处和问题。

最广为人知的语义通信信息论是1952年Bar-Hillel和Carnap提出的，先被称为ClassicalSemantic Information Theory （CSIT）。CSIT的基本原则为“Inverse Relationship Principle”，即命题的信息量与命题中语义相关的概率成反比，一句话的先验概率越大，则其包涵的语义信息越少。这一点与经典信息论是比较一致的。这一理论由于完全没考虑语义信息的真实性，只考虑了语义的信息量，因此存在著名的Bar-Hillel-Carnap悖论：自相矛盾的命题存在最多的信息量。作为不可能发生的，前后0相关性的命题，其先验概率为0，有最大的语义信息量；但同时这句话又是没有任何意义的，在语义的角度上，不应该有任何信息量。

基于这一问题，后续的语义信息论开始将信息的真实性也纳入考虑。比较著名的有如Floridi提出的Theoryof Strongly Semantic Information （TSSI），他定义了两个指标，从真伪2个角度考量语义信息量的多少。这一理论的问题在于采用2个指标定义信息量，不够统一和便捷。故而后续还出现了直接用真实性来定量表达信息量的方法，并且诸多科学家都对其进行了不同的扩展和补充。

TSSI的语义信息定量计算

Shannon的信息论还引入了信道容量，信息率失真函数的计算，为信号的信道编码和信源编码提供了理论支撑。类似的语义信息量也可以以此为基础定义相应的语义信道容量并进行基于语义的信源和信道编译码。鉴于公式并不适合出现在这里，这里只说一些定性的分析。信源编码的目的是高效传输数据，降低其传输成本；信道编码则是为了使得信源能适配信道，以便在收端尽可能恢复出信源数据。放到语义通信里，这个原则依然正确：语义的信源编码，需要使提取的语义信息与原始信息存在较好的对应关系，摒弃原始信息的冗余，才能尽可能减少语义损失的实现对信源的压缩编码，降低传输成本；而对于语义的信道编码，也需要容易从语义信息恢复出原来的数据。如何提取语义信息进行适当的语义编码也就成为了语义通信成功的关键。

03

语义通信的关键技术

根据语义通信自身的定义和特点，很容易联想到可以利用语义通信进行语言，文本，图像等多媒体业务信息的传输。通过对多媒体业务信息进行语义信息的提取并进行相应的编译码，可以极大地降低在物理信道中所需传递的数据量，进而实现更高速率的业务传输。目前，文本信息常采用长短期记忆（LSTM）算法进行语义编译码，而图像和语音往往采用CNN/GCN来实现数据的语义编译码。目前很多研究都表明，采用语义通信进行多媒体业务的传输可以获得较为理想的结果。值得一提的是，由于语义通信的目的是准确传递通信的信息而非比特信息流，故而传统通信的误码率，误块率指标在语义通信系统中未必适用，找到合理的指标作为语义通信的评判标准也是语义通信的重要问题。

语义编译码主要依靠AI手段实现，需要大量的算力和存储资源。既可以先对数据进行语义提取实现信源编码，再通过信道编码在传统的通信网络中传输，也可以利用信源信道联合编码（JSCC）的语义编码方式。无论采用哪种语义编码方式，都需要在收发两端建立可以及时更新的语义知识库。因此除了需要对利用深度学习等AI技术对语义编译码进行深入研究，还需要适当的网络系统架构，在为网络中的每个用户合理分配算力，便于实现模型的训练和更新的同时，科学存储语义信息库，可以实现语义信息库的快速更新和共享。

多媒体业务的语义通信与业务和场景相关性较高，往往需要在应用层实现语义编译码，是一种端到端学习。为了使得语义通信更具普适性，面向目标（goal-orinted）的通用语义通信也是一种思路和方案。通用语义通信（Universal Semantic Communication）概念2008年被提出，旨在信息发射端和接收端缺乏公共语言或通用协议的情况下，通过感知进行目标沟通，从而实现基于目标的通用语义通信。通用语义通信的发射端与接收端虽然可以处于不同的语境和背景，但是仍然要求收/发两端具有对于通信是否成功的统一参考标准。通用语义通信是一种更普适的语义通信方法，其关键技术包括语义过滤、语义预处理、语义重建和语义控制等。

04

语义通信与未来通信网络

语义通信可以打破传统香农限的限制，利用新的维度实现更高的传输速率，同时提高了机器通信效率，进而实现6G网络“灵”/“境”等概念的决策与交流，是未来通信网络一种潜在的提升性能手段。同时语义通信也需要网络算力提供支持以满足其AI模型的训练、存储使用，也需要分布式存储、边缘计算技术为其知识库存储和语义信息交互，正需要未来通信网络提供硬件支持。

语义通信仍存在诸多技术难点有待突破。

网络架构方面，如何在保障用户隐私和安全问题的前提下实现语义知识库共享和更新仍有待解决。分布式网络或在未来通信网络中广泛应用，面对语义通信的AI模型所需的大量算力，若将其部署在边缘服务器上，需保证其传输时延，若部署在终端上，则会对算力资源产生挑战。

利用语义通信进行多媒体业务的传输，已有很多研究证明了其可行性。但在此过程中，语义通信与其业务场景相关性较强，不同的业务类型和应用场景都需要采用不同的模型进行训练，普遍使用语义通信则会存在模型泛化问题。此外，传统的通信系统评判指标不足以对语义进行衡量，故在具体深耕算法提升语义通信性能之前，找到合理的指标衡量语义通信的质量也十分重要。

最后，笔者认为要想语义通信在未来网络中被使用，非常重要的一点是要认清语义通信的具体应用场景。采用端到端学习的方式实现语义通信，主要通过深度学习等AI算法实现，一是受限于业务内容，更适用于部分特定的通信场景，广泛应用于日常通信显然并不合适；二是这样实则完全将语义通信交给AI解决，语义通信完全变成了应用层的问题，继续利用语义进行信源信道联合编码也会与传统的通信网络结构相悖。然而若不区分业务场景，对非结构化数据利用AI算法进行语义通信，一方面目前相关算法仍有待提升，另一方面也失去了语义通信的意义，goal-oriented的通用语义通信或许更具研究前景。

语义通信的实现离不开AI技术，但是不应将其完全交给AI解决。笔者认为语义通信的核心还是通信，语义只是为通信提供了一个新的维度，AI技术只应作为其实现的一种手段。完全依赖AI技术提取出的语义信息，我们甚至也许不再能为其找到合适的物理意义，这样的语义通信固然有效，但是却背离了语义通信的本质，与其说是一个通信系统的新维度，不如说更像是AI技术的一个新应用。从通信的角度出发，更重要的是提出具有普适性的语义通信数学理论基础和通信系统模型，充分发挥AI的技术特点，才能真正在通信领域实现新的突破。

2

2 人赞过 >

0 举报本楼

本帖有 5 个回帖，您需要登录后才能浏览登录 | 注册

返回列表

手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图

GMT+8, 2024-12-4 02:06 , Processed in 0.214382 second(s), 18 queries , Gzip On.

Discuz Licensed

		自动登录	找回密码
密码			注册