通信人家园
标题: 《信息简史》节选 [查看完整版帖子] [打印本页]
时间: 2017-3-24 16:19
作者: donnar
标题: 《信息简史》节选
本帖最后由 donnar 于 2017-3-24 16:46 编辑
尽管一个门外汉也许会说,通信的基本问题是让自己被理解——传递“意思(meaning)”——香农描绘的场景则大不相同。
通信的基本问题是:在一点精确地或者近似地复制在另一点被选择到的消息(message)。
“点”是一个被精心挑选出来的词:一个消息(message)的源头和目的地可以在空间和时间上相分离;信息存储,比如黑胶唱片的情况,可以视作一次通信。同时,信息不是被创造出来的;信息是被选出来的。信息是一个选择。它可以是从一副纸牌中发出来的一张,或者从3000个可能中选择的3个十进制数字,或者一个来自固定编码本的单词组合。香农几乎不可能完全忽略“意思(meaning)”,于是他用一个科学家的定义将其梳妆打扮一番后,客气地将它请出了门:
经常地,消息(messages)都有意思(meaning):也就是说它们指的是,或者根据某些系统与特定的物理(/概念)实体有关。通信的这些语义范畴与工程问题无关。
但是,就像Weaver煞费苦心地试图向我们解释,这不是对通信的狭隘看法。恰恰相反,这是无所不包的:“不仅是书面和口头语言,还有音乐、绘画艺术、戏剧、芭蕾,和事实上所有的人类行为。”也包括非人类行为:为什么机器不会有消息(messages)需要发送呢?
香农的通信模型可以用一张简单的图形来表示。
一个通信系统必须包含下列元素:
1)信息源是生成消息(message)——可以是象一封电报或者电传所表现的一个简单的字符序列,或者可以用数学形式表达为基于时间或者其它参数的函数,f(x, y,t)——的人或者机器。香农指出,在一个诸如彩色电视机的复杂例子中,消息(message)的基本成分是一个三维连续统内的3个函数。
2)发送器“以某种方式对消息进行工作”——也就是说,对消息message编码——来产生恰当的信号signal。电话将声音压力转化成模拟电流。电报将字符编码成点、划和空格。相对更复杂的消息message可以被抽样、被压缩、被量化和被交织。
信道:“只是用来传输信号signal的媒介”。
3)接收器的工作和发射器正好相反。它解码消息message,或者说从信号signal中重建消息message。
4)目的地是另一端的人或者事物。
在日常通话场景中,这些元素是说话者的大脑、说话者的发音器官、空气、听者的耳朵,和听者的大脑。
在香农的示意图中,和其它元素一样显著的——因为对于工程师而言,这是无法逃避的——是一个标为“噪声源”的方框。这涵盖了破坏信号signal的一切,不管是可预测的还是不可预测的:不需要的附加物、明显的错误、随机扰乱、静电、“天电干扰”、干扰和失真。在任何环境下,它们都是不守规矩一族,而香农用了两种不同类型的系统来处理:连续和离散。在离散系统中,消息message和信号signal采用了单个分开的符号的形式,比如字符、数字、点和划。尽管有电报,连续系统的波形和函数是电气工程师们每天要面对的东西。每一个工程师,当被要求通过一条信道推送更多的信息时,都知道怎么做:提高功率。然而,在长距离情况下,这种方法失败了,因为一而再再而三地放大信号signal导致了严重的噪声累积。
通过将信号signal当作一串离散符号来处理,香农避开了这个难题。现在,发射器不是增强功率,而是通过使用能纠错的特别符号来克服噪声——就像一个非洲鼓手长距离传递信息的方法,不是敲得更响,而是扩展他想说的话的冗余度。香农以一种更基本的数学感觉对这种离散场景进行了思考。同时他还考虑了另一点:以离散的方式处理消息message不仅能应用于传统通信,而且还可以应用于一个新的小众领域,即计算机器理论。
附件: uuu.jpg (2017-3-24 16:46, 17.43 KB) / 下载次数 0
https://www.txrjy.com/forum.php?mod=attachment&aid=MzE2MTQ1fGFlNzBhYjcyfDE3MzI2MjM4MjR8MHww
时间: 2017-3-26 22:14
作者: donnar
本帖最后由 donnar 于 2017-3-26 22:15 编辑
于是香农又回到了电报。精确分析起来,电报并不是使用只有两个符号(点和划)的语言。在实际使用中,电报员使用点(一个单位的“电路闭合”和一个单位的“电路断开”)、划(可能三个的电路闭合和一个单位的电路断开),以及两种不同的停顿spaces:一种字母停顿(通常是三个单位的电路断开)和一种较长的单词停顿(六个单位的电路断开)。这四种符号的地位和出现概率并不相同。比如,一个停顿后面肯定不会跟另一个停顿,而一个点或者划可以跟在任何符号的后面。香农用“状态states”这个术语加以表述。根据停顿space是否是最后一个被传送的符号,系统有两种状态:如果是,那么接下来只有点或者划可以被发送,而状态总是随之改变;如果否,那么接下来任何符号都可以被发送,而只有当停顿space被发送时状态才会改变,如果发送的是点或者划,则状态不变。对此香农用下图表示:
这比一个简单的二进制编码系统复杂得多。但是,香农给出了怎样怎样推导出有关信息内容和信道容量的正确方程。更重要的是,他把注意力放在了消息message使用的语言的统计结构产生的效果。正是由于语言中存在的这种结构——字母e出现的频率大于字母q,th的出现频率大于xp,等等——我们得以借此节省了时间或者信道容量。
这在电报系统中已经得到了有限的应用 - 通过比如:用最短的信道序列,一个点,来代表最常用的字母E;而不常用的字母,Q、X、Z,则用较长的点划序列来代表。这种想法在一些商业编码中被进一步发扬光大,那里用由四、五个字母组成的编码组代表常用的言词和词组,能够大幅度地节省平均时间。如今标准化的问候和贺年电报的使用更将这种做法扩展到把一句或者两句话编码成一串相对简短的数字的程度。
为了揭示消息message的结构,香农转向了研究随机过程的物理学中使用的方法和语言:从布朗运动到恒星动力学。(他引用了天体物理学家Subrahmanyan Chandrasekhar在1943年发表在《现代物理学评论》上的划时代的论文。)一个随机stochastic过程既不是确定的(下一个事件能够被确定地计算出来),也不是杂乱无章的random(下一个事件完全不受约束)。它由一组概率支配。每个时间都有一个取决于系统当前状态和也许还有它之前的历史的概率。如果我们将事件event替换成符号symbol,那么象英语或者汉语这样的自然书面语言就是一个随机stochastic过程。数字化的语音也是如此;电视信号也是如此。
更进一步地,香农研究了用“一个消息message是如何影响下一个符号symbol的概率”的术语来表示的统计结构。答案可能是没有:每个符号symbol有其自己的概率,完全不依赖之前发生过什么。这是一阶的情形。在二阶的情形中,每个符号symbol的概率仅依赖于前一个符号symbol,但与其它符号无关。于是每个双字符组合,或者叫digram,有其自己的概率:在英语中th的概率比xp大。在三阶情形中,我们看到了三字符组合trigram,等等。除此之外,在日常文本中,以单词的层面进行考察显然比单个字符更有意义,而很多种类的统计事实开始产生影响。紧跟着单词yellow(黄色),一些单词的出现概率高于平均值,而另一些单词几乎为零。在单词an后面,出现以辅音开头的单词及其罕见。加入一个单词以u结尾,这个单词很可能是you。如果连续两个字母相同,它们很可能是ll、ee、ss或者oo。同时,这种结构可以长距离跨越:在一个包含单词cow的消息message中,即便后面隔了很多其它字符,再次出现单词cow的可能性还是比较大。单词horse也是这样。就像香农看到的那样,一条消息message能够表现得像一个动力系统,它的未来走向会受到过去历史的约束。
为了说明各阶结构之间的差异,香农写出了(实际上是计算出了)英语文本的一系列“近似”。他使用了一个包含27个字符的字母表,即26个拉丁字母加上单词之间的间隔space,然后在一个随机数表格的帮助下生成字符串。(他使用的是剑桥大学出版社刚出版的一份随机数表,其中收录了十万个随机数字,定价仅三先令九便士,并且作者“保证排列的随机性”。)虽然随机数是现成的,但是计算出这些字符串仍然需要花很多力气。这些样本文本看上去是这样的:
“零阶近似”——完全随意的字符(即每个字符的出现概率完全一样),其中不存在结构或者相关性。
XFOML RXKHRJFFJUJ ZLPWCFWKCYJ
FFJEYVKCQSGHYD GPAAMKBZAACIBZLHJGD.
“一阶近似”——每个字符的出现都彼此无关,但其出现的概率是其在自然英语中出现的概率:更多的字母e和t,更少的字母z和j,而单词长度看起来也较接近现实。
OCRO HLI RGWR NIMILWIS EU LL NBNESEBYA
TH EEI ALHENHTTPA OOBTTVA NAH BRL.
“二阶近似”——不仅单个字符,双字符组合的出现频率也符合英语的情况。(香农从密码破解者所用表格中,找到了所需的统计数据。英语中最常出现的双字符组合是th,大致每千个单词出现168次,其次是he、an、re和er。还有相当数量的双字符组合的出现概率为零。)
ON IE ANTSOUTINYS ARE T INCTORE ST BE S DEAMY ACHIN
D ILONASIVE TUCOOWE AT TEASONARE FUSO TIZIN ANDY
TOBESEACE CTISBE.
“三阶近似”——三字符组合也符合英语的情况。
IN NO IST LAT WHEY CRATICT FROURE BIRS GROCID
PONDENOME OF DEMONSTURES OF THE REPTAGIN IS
REGOACTIONA OF CRE.
附件: 1111.jpg (2017-3-26 22:12, 17.08 KB) / 下载次数 0
https://www.txrjy.com/forum.php?mod=attachment&aid=MzE2MjkwfDdiNjhlNzI4fDE3MzI2MjM4MjR8MHww
时间: 2017-3-31 13:54
作者: donnar
可以把一条消息message看成一个以离散的概率生成事件的过程的结果。然后,关于信息information的量,或者生成信息information的速率,可以说些什么呢?每一个事件都可能有几种不同选择,每种可能选择都有已知的概率(用p1、p2、p3等等表示)。香农希望用对不确定性uncertainty——“在选择事件时涉及到多少种“选择”的不确定性,或者对于结果的不确定性——的度量来定义信息的度量值(用H表示)。事件的不同选择的概率可能相同,可能不同,但是通常,更多的选择意味着更多的不确定性——更多的信息information。事件的不同选择可以被细分成若干前后相继、各有其概率的子选择,而这些子选择的概率必须具有可加性;比如,一个特定的双字符组合的概率应该是单个字符的概率的加权和。当事件是符号symbol的选择,且每次选择不同符号symbol的概率相等时,每个符号symbol传达的信息量可以简单地表示为可选的符号symbol数量的对数——Nyquist和Hartley的公式:
H = n log s
对于更现实的情况,香农为这个难题,即怎样将信息information度量为概率的函数,找到了一个优雅的解决方案:一个以概率的对数(底数为2是最方便的)为权重,对概率加权求和的方程。这计算的是消息message的未必可能性improbability的平均对数;实际上,这是对意外程度unexpectedness的度量。
H = −Σ(pi log2pi)
其中pi是每条消息message的概率。香农宣称我们一次又一次地见到这条公式:这种形式的基本量“作为信息information、选择和不确定性的度量,在信息理论中扮演了核心角色”。事实上,H无处不在,并且被方便地称为消息message的熵,或者香农熵,或者干脆,信息information。
这时需要一个新的度量单位。香农说:“这个产生的单位可以被称为“binary digits(二进制数字)”,或者简称为bits(比特)”。作为可能是最小的信息单位,一个比特代表了掷硬币猜正反面时存在的不确定性程度。掷硬币是在两种概率相同的可能性中做出选择:在这里p1和p2都是1/2,其以2为底的对数都是-1;因此H=-[0.5*(-1)+ 0.5*(-1)]=1比特。从一个包含32个字母的字母表随机选择出来的一个字符传递了更多的信息:5比特,具体来说,这是因为这里有32个可能的消息message,而32的对数是5。由1000个这样的字符组成的字符串携带了5000个比特——这不是简单的乘法,而是因为信息的量代表了不确定性的程度:可能的选择的数目。对于来自由32个字符组成的字母表的1000个字符,存在着321000个可能的消息message,而这个数字的对数是5000。
在这里,自然语言的统计结构又重新发挥了作用。如果已知这千字符消息message是英语文本,那么消息message的可能数量会减少——大大地减少。在统计结构的长度不超过8个字母的情况下的内在相互关系,香农估计英语的内在冗余度大约是50%:即一条消息message中的每个新字符传达的信息只有大约2.3比特,而不是5比特。考虑到更长范围的结构,比如句子和段落的统计效果,他将这个估计提高到75%——不过他也警告,随着长度增加,这种估计变得“更加不稳定和不确定,并且它们更严重地受制于涉及到的文本类型”。度量冗余度的一种方法是基于粗略的经验:用人物来做心理测试。这个方法“利用”了每个说一门语言的人都不自觉地具有这门语言的统计结构的丰富知识的事实。
对单词、俗语、陈词滥调和语言的熟悉使得他能够在校对工作中自动补上遗漏或者错误的字母,或者在对话中补全未说完词组。
香农应该说是“她”,因为实际上他的测试对象正是他妻子Betty。他从书架上抽出一本书(这是Raymond Chandler写的一本侦探小说,《Pickup on Noon Street》),随机指向一个短小段落,并且要Betty开始猜字母,然后是下一个字母,下一个字母。当然,她看到的文本越多,就有更大的机会猜对字母。在“A SMALL OBLONG READING LAMP ON THE”之后,她猜错了下一个字母。但是一旦知道这个字母是“D”,她就毫不费力地猜到了接下来的三个字母(四个字母合起来是desk)。香农注意到,“正如所预料得那样,错误最常出现在单词和音节的开头处,那里思路有更多的分岔可能。
以这种方法量化可预测度和冗余度是一种逆向度量信息内容的方法。如果一个字母可以通过先前的内容猜出来,它就是冗余的;既然它是冗余的,它就没有提供新的信息。如果英语的冗余度是75%,那么一条包含1000个字母的英语消息message携带的信息量,就只有由1000个随机选择的字母构成的消息message的信息量的25%。尽管听上去象诡辩,但随机消息message的确携带更多的信息。这意味着自然语言文本能够被更有效地编码,以便于传输和储存。
香农展示了一种方法来做到这一点,一个利用不同符号的不同概率的算法。他给出了一系列惊人的基本结论。其中的一个是信道容量的公式,任何通信信道的绝对速度极限(现在被简单地称为香农极限)。另一个发现是,在这个极限范围内,总有可能想出方法来克服任意程度的噪声而实现错误纠正。发送端可能不得不使用越来越多的比特来纠错,这会让传输速度越来越慢,但是消息message最后总能完成传送。香农没有说明怎样设计这样的方法;他只是证明了这是可行的,因此激发了后来计算机科学的一个新分支。“让出现错误的可能任意小?以前没有人这样想过,”他的同事Robert Fano多年后回忆道。“他如何得到这个洞见,他如何相信使自己相信这一点,我不知道。但是几乎所有的现代通信理论都是建立在这样工作的基础之上。”无论是消除冗余来提高效率,或者增加冗余以纠正错误,编码方法取决于用于编码的语言的统计结构的知识。信息与概率密切相关。一个比特,从根本上来说,就是一次掷硬币。
如果说硬币的两面是代表一个比特的一种方法,香农提供了一种更实用的硬件实例:一个有两个稳定状态的设备,比如一个继电器或者一个翻转触发器电路,能够储存一比特信息。N个这样的设备能够储存N比特,因为可能的状态总数是2^N,而log(22N)=N。香农曾经见过这样能储存几百个甚至几千个比特的设备——比如继电器阵列。这看起来很多。正当他写完信息论时,香农一天到贝尔实验室的同事William Shockley,一个30多岁的英国人那里串门。Shockley属于忙着寻找真空电子管的替代品的固态物理组,而在他办公桌上有个很小的原型产品,一片半导体晶片。“这是一个固态放大器,” Shockley告诉香农。那时它还没有名字。
时间: 2017-4-1 16:22
作者: donnar
本帖最后由 donnar 于 2017-4-1 16:26 编辑
信息是物理的。万物源自比特。能量越多,比特反转得越快。土、气、火和水归根到底由能量组成,但是其不同的形态则由信息决定。做任何事情都需要能量。要明确做什么则需要信息——Seth Lloyd (2006)。
在其短暂的历史中,量子物理学已经经受了比其它科学更多的危机、论辩、诠释(Copenhagen诠释,Bohm诠释,多个世界诠释、多个心智诠释等等)、派系纷争和一般哲学意义上的情感冲击。它似乎乐于让自己充满谜团。它愉快地漠视人类的直觉。Albert Einstein到死都不能和它的推论和解,而当Richard Feynman说没人能理解它时,并不是在开玩笑。也许对于实在的本质的争论是很自然的;量子物理学在实践中取得不同寻常的成功,在理论方面处理万物的基础,而自己的基础则不断地被重建。即便如此,这种发酵有时候看起来更像宗教争论而不是科学争论。
理论量子物理学家Christopher Fuchs认为,是时候重头开始了。扔掉现有的量子理论公理,哪怕它们又精致又数学化,转而去研究深层次的物理原则。“这些原则应该是干脆清晰的;它们应该是令人信服的。它们应该让心灵激动。”哪里可以找到这些物理原则呢?Fuchs的回答是:在量子“信息”理论”那里。“理由是简单的,和在我看来是无法回避的。” Fuchs认为。“量子力学总是与信息有关;只不过物理学社区已经忘了这一点。”
在Charles Bennett发展其“逻辑深度logical depth”想法之前很久,他就在思考有关“计算的热动力”——很独特的课题,因为大部分人把信息处理过程当作是脱离实体的。“如果任何人停下来思考这件事,很可能觉得作为一个科学研究课题,“计算的热动力”看上去并不比比如“爱的热动力”更急迫,” Bennett说。这有点象思考消耗的能量。卡路里可能被消耗,但是没人去计算到底是多少。
更奇怪的是,Bennett试图考察所有计算机中热动力最少的计算机的热动力——那个不存在的、抽象的、理想的图灵机。图灵自己从不担心他的思想实验在其执行在想象的纸带上来回移动的操作时,会消耗任何能量或者散发任何热量。但是在20世纪80年代初,Bennett就在讨论把图灵机纸带当作燃料——它们产生的卡路里值用比特度量。当然,这还是一个思想实验,但它关注的却是一个非常现实的问题:什么是逻辑操作的物理成本?“计算机,”他挑衅性地写道,“可能可以被认为是将自由能量转换成废热和数学功的机器。”熵再次浮现。一条写满数字0的纸带,或者一条写有编码后的莎士比亚著作的纸带,或者一条复述圆周率数字的纸带,有“燃料价值”。相反,一条写有随机数的纸带则没有。
Bennett在1972年加入了IBM研究院。IBM当然不生产图灵机。但是,有一天Bennett突然意识到,在自然界已经被发现有一种特殊目的的图灵机:即所谓的RNA聚合酶。这是这一种沿着基因——它的纸带——爬行的酶,抄写DNA。它左右移动;它的逻辑状态根据写在序列里的化学信息而变化;它的热动力行为可以被测量。
在20世纪70年代的计算机信息处理的现实世界,和早期的真空电子管年代相比,硬件在能耗方面已经取得了几千倍的快速提高。尽管如此,电子计算机仍然以废热的形式浪费了可观的能量。随着它们越来越接近理论上最小的能量消耗,科学家们越来越紧迫地想知道这个理论最小值是多少。和他的巨型计算机一起工作的Von Neumann早在1949年就做了一个保守的估算,提出“信息处理的每个基本动作,即每个基本的二选一决定和单位信息的每次基本发送”都会耗散一定的热量。他的结论是建立在麦克斯韦小妖在一个热动力学系统中做的分子工作的基础上,如同Leó Szilárd重新构思的那样。Von Neumann认为,信息处理的每一个基本动作——每个在两个选项中作出的选择——都要支付代价。直到20世纪70年代,这个观念被广泛接受。但是,它是错误的。
Von Neumann的错误被后来成为Bennett在IBM的导师的科学家Rolf Landauer——纳粹德国的一位流亡者——发现。为了建立信息的物理基础,Landauer贡献了他的职业生涯。“信息是物理的(Information Is Physical)”一篇著名论文的标题,意思是提醒学界,计算需要物理载体,并且遵守物理法则。唯恐有人忘记这一点,他将后面的一篇文章——竟然是他最后一篇文章——命名为“信息必然是物理的”。不管一个比特是一块石板上的记号,或者打孔卡片上的一个洞,或者一个上旋(或下旋)的粒子,他坚持认为,如果没有某种具体呈现,信息就不可能存在。在1961年,Landauer试图证明Von Neumann的那个信息处理成本公式,并且发现他做不到。相反,看起来大部分逻辑运算根本不花费熵。当一个比特从零翻转成一,或者相反时,信息被保留。这个过程是可逆的。熵没有改变;没有热量需要耗散。他认为,只有不可逆的运算才增加熵。
通过分析他能想象到的每一种计算机,现实的或者抽象的,从图灵机和信使RNA到“弹性球”计算机——利用类似弹球的东西来携带信号,Bennett继续研究Landauer的原则。他最终证实了,许多计算根本不需要消耗能量就能完成。在每一个场景中,Bennett发现,只有当信息被擦除时才发生热量耗散。擦除时不可逆的逻辑运算。当图灵机的读写头擦除纸带上某个方格,或者当一台电子计算机清空一个电容时,一个比特丢失了,而这时有热量必须耗散掉。在Szilárd思想实验中,当麦克斯韦小妖观察或者选择一个分子时,它并没有引发熵的消耗。偿付在清楚记录的时候——麦克斯韦小妖擦除一条观察记录,以便为下一条记录腾出空间——出现。
遗忘会做功。
附件: 33333.jpg (2017-4-1 16:24, 32.63 KB) / 下载次数 0
https://www.txrjy.com/forum.php?mod=attachment&aid=MzE2ODQ2fDQ2MjUwMGUxfDE3MzI2MjM4MjR8MHww
时间: 2017-4-4 10:07
作者: donnar
“你可以说这是信息理论对量子力学的报复,” Bennett说。有时候一个领域的成功想法会阻碍另一个领域的发展。在这里,这个成功的想法是不确定性原则——它让测量过程本身成为了主角。人们没法能简单地谈论如何“看”一个分子;观察者需要借助光子,并且光子必须比热背景更有能量,而复杂性就接踵而至。在量子力学中,观察行为本身会产生影响,不管执行者是一位实验室科学家还是麦克斯韦小妖。大自然对我们的实验十分敏感。
“辐射的量子理论让人们误以为每一步的计算都有不可压缩的热动力成本,” Bennett说。“另一方面,香农的信息处理理论的成功则让人们忽略了信息处理在物理层面的所有东西,并且将其视作一个纯粹数学的东西。”当通信工程师和芯片开发者越来越接近原子层次时,他们越发担心量子效应的限制会干扰到他们原先具备的清晰和古典的区分零和其它状态的能力。但是现在他们重新审视——而最后,这成了量子信息理论诞生之处。Bennett和其他人逐渐有了新的想法:这种量子效应不再是妨碍,而可能变成优势。
在他的位于Westchester的树木繁茂的山上的IBM研究实验室的办公室的靠墙之处,Bennett放了一个楔形的象嫁妆箱一样的不透光设备,叫做Martha阿姨(Martha阿姨棺材coffin的简称,coffin一个意思是重屏蔽容器,另一个意思是棺材)。除了请金工车间帮了一点忙,Bennett和他的研究助理John Smolin在1988年和1989年之间亲手打造了它:一个内壁喷涂了哑光黑漆的铝盒子,并且进一步用橡胶塞和黑色天鹅绒密封。利用一个氦氖激光器作为基准并用高压电对光子进行极化,他们发出了当时世界上第一条用量子密码编码的消息。这个实验演示了仅通过量子系统就能有效完成的信息处理任务。此后不久,量子纠错、量子隐态传输teleportation、量子计算机都出现了。
量子消息message在Alice和Bob这一对无处不在的神秘伙伴之间传递。在Alice和Bob在密码学研究中就已经出现,而现在轮到量子研究者使用他们。有时,Charlie也会参与进来。他们不断地走进不同的房间,抛掷25分硬币,并且相互传送密封好的信封。他们选择量子状态,并且执行Pauli旋转。“我们常说诸如‘Alice向Bob发了一个量子比特,然后忘记她发送的是什么,’‘Bob做了一个测试,然后告诉了Alice,’”,Barbara Terhal,Bennett的一位同事,新一代量子信息理论学者之一,解释道。Terhal她自己已经研究过是否Alice和Bob是一夫一妻monogamous关系——当然,这是量子理论的另一个专门名词。
在玛莎阿姨实验中,Alice向Bob发送信息——经过加密因此一个恶意第三方(即偷听者Eve)没法解读。如果他们都知道他们的私密密钥,Bob就能加密消息。但是一开始Alice怎么向Bob发送这个密钥呢?Bennett和Gilles Brassard,一位在Montreal的计算机科学家,是从将每个信息比特编码成一个量子对象,比如一个光子,开始的。信息位于光子的量子状态之中——比如垂直极化态或水平极化态。不同于经典物理学中的对象——通常由数十亿个粒子组成——会被拦截、监控、观察和传递,量子对象不可能这样。量子对象也不可能被复制或者克隆。观察行为本身必然会破坏消息。不管偷听着的动作多么小,他们都会被发现。遵循Bennett和Brassard想出来的一个精密复杂的协议,Alice生成了一个随机比特序列作为密钥,而Bob能够在链路另一端重建完全相同的序列。
玛莎阿姨棺材的第一个实验成功地经由32厘米的普通空气发送了量子比特。这不是“Watson先生,快来,我要见你”,而是密码史上的空前的事件:一个绝对无法破解的密钥。后来的实验尝试使用光纤作为信道。与此同时,Bennett的研究方向则转向量子隐态传输(teleportation)。
时间: 2017-4-7 09:03
作者: donnar
当IBM的市场部在一则广告中用一句“请注意:我将向你隐态传输teleport一些匈牙利菜炖牛肉”来描绘他的工作时,Bennett很快就后悔这种用词选择。但是这个说法保留了下来,因为隐态传输确实发生了。Alice没有发送匈牙利菜炖牛肉;她发送的是量子比特。
量子比特是最小的非平凡nontrivial量子系统。和经典比特一样,量子比特有两个可能的值,0或者1——也就是说,两个可以被确定地区分的状态。在一个经典系统中,原则上所有的状态是可区分的。(如果你不能区分两种颜色,只是因为你的测量设备不够完美。)但是在一个量子系统,拜Heisenberg的不确定性原则所赐,无法完美区分的情形随处可见。当你测量了量子对象的一个属性时,你就失去了测量与之互补的另一个属性的能力。你可以发现一个粒子的动量或者它的位置,但是不可能同时发现两者。其它的互补属性包括自旋的方向(比如玛莎阿姨的棺材的例子)和极性。物理学家们常用几何的方式思考这些量子状态——系统的状态对应空间(有多个可能纬度的空间)中的方向,而它们的可区分性取决于这些方向是否相互垂直(或者正交)。
正是这种不完美可区分性给了量子物理梦幻般的特征:无法在不产生干扰的前提下观察系统;无法将量子对象克隆或者广播给许多收听者。量子比特也具有这个梦幻特征。这不是简单的非此即彼。它的0值和1值由可以被确定区分的量子状态所代表——比如,水平极化和垂直极化——但是与之同时存在的是处于水平极化和垂直极化之间的连续中间状态,比如斜极化,即以不同的概率偏向0或者偏向1。因此物理学家说量子比特是状态的叠加;概率幅度的组合。这是一个内部弥漫不确定性的确定事物。但是量子比特不是一团糟;状态叠加不是大杂烩,而是概率成分的基于清晰而简洁的数学规则的组合。
“一个非随机的整体可以由随机的部分,” Bennett说。“这是量子力学最反直觉的部分,但是这遵循叠加原则,并且就我们目前所知,是大自然工作的方式。人们也许一开始不喜欢它,但是过一段时间你会习惯它,而其它的选项会糟糕得多。”
隐态传输teleportation和与之相关的众多量子信息科学的关键是所谓的量子纠缠现象entanglement。量子纠缠遵循态叠加原则,并且能贯穿空间而扩展到一对相距遥远的一对量子比特。它们作为一对有着确定的状态,尽管从单独来看,每一个量子比特都没有自己的确定测量状态。在量子纠缠被发现之前,只能先发明它,而这项任务是爱因斯坦完成的。然后,对它进行命名的不是爱因斯坦,而是薛定谔。爱因斯坦在一个被设计用来揭示他认为的当时是1935年的量子力学的瑕疵的思想实验中发明了它。他和Boris Podolsky、Nathan Rosen在一篇名为“物理实在的量子力学描述能被认为是完全的吗?”的著名论文中公开了它。这个思想实验想象有一对粒子以一种特殊的方式相互关联,例如,从同一个原子发射出来的一对光子。它们的极性是随机的,但彼此一致——只要它们存在,就永远一致。
Einstein, Podolsky和Rosen一起研究当这对光子相隔遥远,并且对其中一个光子进行测量时,会发生些什么。对于相互纠缠的两个粒子——同时被创造,且现在相隔几个光年——看上去对其中一个光子的测量会对另一个光子产生影响。在Alice测得她的光子是垂直极化状态时,Bob那里的光子也会在这个坐标轴(垂直)获得确定的极化状态,而其对角的极化状态则变得不确定。于是,这个测试的影响的传播速度超过了光速。看上去这是个悖论,而爱因斯坦对此深恶痛绝。“在空间B处实际存在的状态不应该取决于在空间A处执行的任何测量,”他写道。这篇论文坚决地总结说,“这种现象不可能在任何合理定义的现实中发生。”他还给这种现象取了一个让人印象深刻的名字spukhafte Fernwirkung——“幽灵般的超距作用。”
2003年,以色列物理学家Asher Peres为Einstein-Podolsky-Rosen (EPR)之谜提出了一个答案。他说,ERP论文严格来说没有错,但是写得太早了:早于香农发表他的信息理论,“并且又过了很多年之后,信息理论才被收纳进物理学家的工具箱。”信息是物理的。只讨论量子状态,而不考虑有关量子状态的信息,是没有意义的。
信息不仅仅是抽象的符号。信息需要物理载体,而后者(大致上)是局部的。毕竟,将信息从一部电话传输到另一个地点的另一部电话是贝尔电话公司的工作。
……当Alice测量她的粒子的自旋时,她获得的信息局限于她所在的位置,并且直到她决定广播这个信息为止都是如此。这时在Bob那里绝对没有发生任何事情……当且仅当Alice通知Bob她得到的结果(通过电子邮件、电话、无线电,或者其它任何物质载体,自然所有这些都受限于光速)时,Bob才意识到他的粒子有了一个确定的纯态……对于Bob来说,他的粒子的状态突然发生改变,不是因为有什么东西作用于该粒子,而是因为Bob收到了关于一个遥远事件的信息。量子态不是物理实体,它们只存在于我们的思维中。
附件: 11111.jpg (2017-4-7 09:02, 46.4 KB) / 下载次数 0
https://www.txrjy.com/forum.php?mod=attachment&aid=MzE3MjE5fGE0N2QxZTFjfDE3MzI2MjM4MjR8MHww
时间: 2017-4-11 14:23
作者: donnar
就此而言,Christopher Fuchs认为讨论量子状态根本没有意义。量子状态这个概念是观察者的构造物——从中产生了很多麻烦。应该退出状态states;进入信息information。“术语本身能说明一切:一个这个领域的从业者,无论她是否曾经思考过一点量子基础,都有同样的可能性提到‘量子信息’和‘量子状态’……‘量子隐态传输协议的作用是什么?’现在的标准完整回答会使:‘它将量子信息从Alice那传输到Bob那。’我们这里经历的是思维模式的转变。”
超距幽灵作用之谜没有被彻底解决。非定域性nonlocality在一系列由EPR思想实验衍生的聪明实验中被展示出来。量子纠缠被证明不仅真实,而且无处不在。在每一个氢分子H2中的原子对就是量子纠缠的。Bennett将量子纠缠应用在量子隐态传输中,并于1993年首次予以公开发表。隐态传输用一对量子纠缠粒子实现从一个第三方粒子将量子信息投射跨越任意远的距离。Alice无法直接测量这个第三方粒子;但是,她能测量它与量子纠缠粒子对中的一个粒子的某些关系。即便因为不确定性原则,Alice自己根本不知道她测量的粒子的初始(测量前)状态,但是却能够收到一个缺失的测量结果拷贝。在这个测量过程中,Alice的测量目标被破坏。通信不会超过光速,因为Alice必须向Bob发送一条经典(非量子)消息。“隐态传输的净结果相当乏味:量子物体在Alice手里消失,和一段恰当的时间之后在Bob手里的重新出现,”Bennett和他同事写道。唯一引人注目的特征是,在中间的过渡期间,信息被清楚地分成经典部分和非经典部分。”
研究者们很快想象到很多应用,比如将容易丢失的信息转移到安全的储存器或者记忆器。无论有没有传输匈牙利红炖牛肉,隐态传输是激动人心的,因为它为可望而不可即的量子计算开启了全新的可能性。
量子计算机的设想很奇特。1981年,在MIT的一次演讲——Richard Feynman第一次探讨了用一个量子系统计算量子难题的可能性——中,他就是从量子力学的奇特性开头的。Richard Feynman很清楚这种计算——用计算机模拟量子物理——的问题所在。这个问题就是概率。每一个量子变量都涉及概率,而这让计算的困难程度呈指数增长。“如果信息比特的数量和空间中的点的数量相同,而因此你不得不用诸如NN的构造来获得概率,这对我们的计算机来说数据量太大,无法掌控……因此根据已知的规则,通过计算概率来实现模拟是不可能的。”
于是他建议以毒攻毒。“另一个模拟基于概率的自然的方法,我现在称之为N,可以是用一台自身也基于概率的计算机C来模拟这个自然。”一台量子计算机将不再是图灵机,他说。这将是全新的什么东西。
“Feynman的洞见是一个量子系统在某种意义上来说,就是不停地计算自己的未来,”Bennett说。“你可以说这是一台自己有动机的模拟计算机。”研究者们很快意识到,如果一台量子计算机在模拟物理世界时具备去除问题的特殊力量,它也许也能够解决其它类型的老大难问题。
这个力量来自闪烁的、不可触碰的物体——量子比特。概率是它们的内在属性。表现为状态叠加给了量子比特比经典比特更多的力量,后者的状态只能非此即彼,非零即一,“一个二维向量的可怜标本,”就像David Mermin所说。“当我们学会用我们黏糊糊的经典小手指数数时,我们就被误导了,” Rolf Landauer不加渲染地说。“我们认为一个整数只能有一个特定和唯一的值。”但是不对——在真实的世界里不是这样——真实的世界是指量子世界。
时间: 2017-4-12 08:31
作者: donnar
在量子计算中,多个量子比特是相互纠缠的。多个量子比特一起工作不仅仅是倍增其力量;这力量是呈指数增加。在一个比特就是非此即彼的经典计算中,n个比特可以编码2n个值中的任意一个。量子比特则可以同时编码这些布尔值和它们所有可能的状态叠加。这赋予了量子计算机超强的、没有经典计算机可以匹敌的并行计算潜力。因此,量子计算机——在理论上——可以解决过去被认为不具备计算可行性的某些类型的问题。
一个例子是求一个非常大的数的质数因子。这正好是破解目前使用最广泛的加密算法,特别是RSA加密算法的关键。全球的互联网电子商务就仰赖于此。在实际应用中,这种非常大的数字是被用作加密消息的公共密钥;如果窃听者能够计算出它的质数因子(同样很大),他们就能解密这个消息。然而,将两个大质数相乘很容易,其逆运算却及其困难。这个过程就像一条信息单行道。因此,对RSA数分解质数因子一直是经典计算的一大难题。2009年12月,一个由瑞士洛桑、荷兰阿姆斯特丹、日本东京、法国巴黎、德国波恩以及美国华盛顿州Redmond的科学家们组成的团队,使用了几百台机器,用了将近两年时间才算出:“1230186684530117755130494958384962720772853569595334792197322452151726400507263657518745202199786469389956474942774063845925192557326303453731548268507917026122142913461670429214311602221240479274737794080665351419597459856902143413”是“33478071698956898786044169848212690817704794983713768568912431388982883793878002287614711652531743087737814467999489”和“36746043666799590428244633799627952632279158164343087642676032283815739666511279233373417143396810270092798736308917”的乘积。据科学家的估算,这次计算涉及到1020次运算。
时间: 2017-4-13 10:24
作者: donnar
这是一个较小的RSA数字,但是,如果这答案能更早一点算出来,他们本可以赢得RSA实验室悬赏的五万美元奖金。如果只能使用经典计算方法,这样的加密方式被认为是相当安全的。更大的数会花费呈指数增加的时间,而在某些场合,这个时间会超过宇宙的寿命。
量子计算则完全是另一回事。量子计算机同时占据很多状态的能力立刻为我们打开了全新的视野。1994年,在还没有任何人知道怎样确实地打造任何种类的量子计算机时,贝尔实验室的一位数学家就已经想出了怎样为理论上的量子计算机编程来解决质数因子分解的问题。他是Peter Shor,一个很小便在奥林匹克数学竞赛和其它数学竞赛中崭露头角的解题神童。他的为这个领域拓宽了道路聪明算法对他而言,只是简单地被称为质因数分解算法,但是所有其他人都称之为Shor算法。两年以后,同样在贝尔实验室的Lov Grover设计出了搜索大型的未排序数据库的量子算法。对于一个有着无限多信息的世界来说,这是个经典难题——象在干草垛里找针。
时间: 2017-4-14 06:21
作者: donnar
本帖最后由 donnar 于 2017-4-14 06:22 编辑
“量子计算机从根本上来说是一场革命,”希伯来大学的Dorit Aharonov在2009年的一次会议上告诉听众。“这场革命的爆发标志就是Shor算法。但是,革命出现的原因——不同于令人振奋的应用前景——在于量子计算机重新定义了什么是“容易”的问题,和什么是“困难”的问题。
赋予量子计算机以力量的特征也让它们变得及其难以操控。从一个系统提取信息意味着观察它,而观察一个系统意味着量子魔力的干扰。当众多量子比特并行处理其呈指数增长的操作时,我们是不能去观察的;测量这个错综复杂的概率会将它退化成经典比特。量子信息是脆弱的。知道计算结果的唯一办法是一直等到量子操作结束。
量子信息就像梦幻——稍纵即逝,永远不会想黑纸白字一样稳定地存在。“很多人可以阅读同一本书,并得到相同的消息,”Bennett说,“但是试图告诉别人你做的梦会你对梦的记忆,因此最后你忘记了那个梦,而只记得你对梦的描述。”反过来,量子擦除是一种真正的破坏:“可以说,甚至上帝也会遗忘。”
是John Wheeler为量子信息科学未来发展指出了方向——1份为下一代物理学家和计算机科学家留的恰当的待办事项列表:
“将弦论和爱因斯坦几何动力学的量子版本从连续体语言翻译成比特的语言,”他忠告后继者。
“充分发挥想象力,逐一梳理数学(包括数理逻辑)已经获得成功的强大工具……并改造这些技术使之进入比特的世界。”
以及,“从计算机程序的顺次演进中发掘、整理和展示每一个能揭示物理学的层层递进结构的特征。”
以及,“最后。懊悔?不,应该庆幸作为意思meaning建立的基本单位,‘比特’一词缺乏明确而清晰的定义……如果和当我们知道了如何通过组合海量数目的比特来得到我们所说的存在,那时我们就会借助比特和借助存在,更好地理解我们表达的意思meaning。”
这是那个依然存在的挑战,而且不仅仅针对科学家——意思meaning的确立:那个曾被香农客气但冷淡地请出门的家伙。
通信人家园 (https://www.txrjy.com/) |
Powered by C114 |