这一章节要探讨的更多的是“现象”,论及我们如何无意识地把我们的思想组织起来,以及我们有能力可以随时想象现实世界的种种假设的变种。这一系列的探讨直指智能的一个最重要的能力“创造力”,这在之前的笔记内容里稍微有触及到。
值得一提的是,所谓的“创造”客观来说,绝对不可能是完全无中生有的。大脑的“创造”可以理解为对于现实的分解再构筑,不论大脑想象出多么反事实的想象,这个“反事实”一定是与现实世界存在一个对照的。同时,类似于概念提炼,归纳总结等等,某种程度上来说,也可以看作是对现实的再构筑——在WJU形式系统的时候,就已经提到过了大脑的这种总结跳过步骤的行为。
这里插一句题外话,不知道是不是巧合,笔者在阅读这一章节的时候,恰巧同时在看罗老师讲刑法的课程(b站上的完整课程内容,有几十个小时,不是那些被截取的片段。结果课程听完了,书还没完全啃完)有意思的是,在听刑法课的内容的时候,很多讲课的内容反而启发了笔者阅读GEB这一章节的很多思路,所以笔者觉得这值得特地在前面提一句。
当然刑法课本身很深奥,而刑法内容仅仅只是法学的一小部分。笔者听的内容仅仅属于法考相关的内容,所以不可能说出什么有内容的东西。仅仅是拿来做个例子:有意思的地方就在这里,实际上涉及到法律方面的内容的时候,恰恰都是在大脑中运作的;不论是立法还是法理解释。同时很多情况的法律应对等等,这些其实涉及到大脑的“创作”。
而且我们都很清楚,法律的构筑不是个体行为,而是众人合力的产物。这恰恰可以成为一个很好的观测对象,因为我们在探讨的“智能”,是具有人类的共性的。所以这部分只能是探讨,而不是某种确定的论述。无论如何,形式系统必然有例外,但我们也反复说过了,这个例外并不会摧毁系统本身,而是可以成为系统的升级补丁。
当然本章节探讨的是大脑:“联想创造”能力的本质,但是很多引证旁述恐怕是不可能跳过的。因为这个概念,我们必须要依靠具体的例子来进行描述。而涉及到智能的创造力的行为例子可以说几乎涵盖了方方面面:设计、创作、解构、解读、总结……
所以关于创造力的探讨,同时也牵扯到一般概念间相互作用的深层次问题。而到了人工智能当中,这涉及到当代人工智能发展的一个重要概念——“框架”。框架可以理解为一种表征形式,让行动中的能动者可以有效和恰当地表征一个变化的、复杂的世界。这个“变化”、“复杂”,如上述所说,我们看到创造这个大脑行动,可以牵连到多少方面的的内容——现实世界本身就可以分出诸多一般性概念,而这些一般性概念之间的调动和关联的表现就可以从再构筑中显现出来。而人工智能想要做到这一步,要面对多困难的问题——“框架问题”:受限于形式而难以做到复杂表征甚至于自动更新和变化。(更新中还带有着自我判断)当然对于这个问题目前的看法,和GEB成书的那个时候已经有所不同了,但大家所面对的问题还是一样的。
而框架问题也涉及到内外表征,这和大脑的创造能力也有关联——因为我们知道这存在内外之间的关联和互动——现实世界在外,而大脑的运作在内,内外之间的关联性。在上一章节里所探讨的主题:知识在各个层次上的表述,其实就是在位这里的探讨打下基础。
这里其实已经涉及到人工智能很深层次的问题了,目前框架问题是拦在人工智能实现的道路上最大的一道阻碍,而从GEB成书到今天,我们也看到了很多新的值得补充的内容,后面将会跟着书里的内容详细说说。
这篇对话的题目《对实》,来自于两个词的结合——“对位”和“反事实”。对位是指音乐当中的作曲技法——对位法。这种技术诞生的作品就是复调音乐,关于这个的详细描述,在前十篇笔记里面有提到过。而对位法最具有代表性的复调音乐体裁就是卡农——当然也因为这种形式相对来说比较的简单直白一些。这里是借着音乐的形式来比喻侯世达教授想要讲述的论点。
那么“反事实”也值得说一下,从字面意思很容易可以理解,与现实相反,这就是指上面所说的,大脑对于现实信息的筛选在构筑的构成,进一步说,可以联系到大脑的创造力。
书中这个题目的映射应该挺明确了,首先是对位法——我们把现实,或者说我们的大脑接收到的现实信息比作一条旋律的话,那么大脑对其进行分解再构筑的处理过程就类似于对位法。因为从音乐的角度来说,一段旋律,除非是在原本的位置(可以说重复、再现)。否则只要经过处理,不论是平移到别的调、还是拉长(加装饰音)、缩短、拉开音符之间的距离等等。那么可以很明确的说,即使你听起来这个旋律还是很像原来的旋律,但它也已经不一样了。可以将其称之为原本想旋律的“变奏”,那为什么这里还要叫“对位”而不是单纯的“变奏”呢?
注意一点,是原本旋律和变奏旋律之间的关系是互相对应的,这就是侯世达教授试图以此来比喻大脑内外表征之间的关联性。所以,这里的“对实”,就是指“事实”经过对位处理得到“反事实”。当然这里说的是主题内容,但实际上它不是完全孤立的,而是在形式和内容上和很多之前提过的内容有关联——递归、信息层次、组块化、形式系统推理、推导规则生成的“定理”……
“螃蟹邀请了几个朋友来看星期六下午电视中播放的橄榄球赛。阿基里斯已经到了,可还要等等乌龟和他的朋友树懒。”(闪电!闪电!十万马力!哈……哈……哈……)
这一篇的对话内容里,充满了各种荒诞的描述,比如“两只眼睛的独眼龙”、“双轴的独轮车”(独轮王八拱?)、“两只左手弹得钢琴协奏曲”(1900有两只右手)……这些荒诞的描述,主要是为了表现“反事实”这一主题。
当然重点在后面,他们准备看的那个橄榄球赛,同时这篇对话其实是精心设计过的,头尾部分有着很有意思的关联。所以开篇部分的荒诞描述,并不仅仅只是为了表达“反事实”。
“(他走到一个有屏幕的巨大的箱子前,箱子下面有个仪表盘,复杂得跟喷气式飞机上的一样。他轻轻按了一下一个球形开关,屏幕上出现了色彩鲜亮、图像清晰的橄榄球场。)”
侯世达教授的对话部分创作,其实也可以看成他的文学创作。当中的一些描写很有时代感,尤其和现在对比起来。为什么这么说呢?因为笔者注意到,在整本书里,螃蟹拥有大量的复杂机械设备——不知道谁还记得螃蟹那个“完备唱机”的内容,以及螃蟹现在这个复杂的电视机。这不由得让人联想到计算机发展的早期,当时人们构造出的是巨大复杂的巨型计算机。而在那个时候,人们所展望的已经是今天人们都还没有企及的遥远未来了——当时就已经开始设想“强人工智能”的概念了,虽然当时的设想非常的模糊。
在阿基里斯还有螃蟹他们你一句我一嘴的时候,上半场比赛已经结束了,于是他们不得不回看一遍:
“……就这样,上半场比赛结束了。在第三个四分之一场比赛就要结束的时候,本地队决定性的时刻来到了。这时他们落后八分。这是他们第三次进攻,还一码未进,他们这时急需继续进攻的机会。”
随后解说员开始诉说比赛场景,当中的大段内容我们可以跳过,但是有一句话值得注意:“……现在让我们看一看虚拟的重放镜头……回文斯一往直前,达阵得分!啊,球迷们,要是回文斯没有跨出边线,这就是将会发生的情形。”
当然这里阿基里斯就注意到了:“等等……达阵得分这事有还是没有?”
螃蟹回答他:“哦,没有。这只是虚拟的重放镜头。这只不过是演示了一下假设而已。”
树懒在这里表示了不屑:“这是我听到过的最荒唐的事。我看他们还会发明水泥护耳皮套呢。”其实包括在前面省略掉的部分内容里,已经提示了树懒具有的某种特殊能力(基本上对话里每次出现的新角色,都是具有某种特殊能力的,这种特殊能力形象化的对应着对话的主题。比如之前出现过的“食蚁兽”):树懒酷爱炸土豆片,痛恨违背事实的假设。——这恰好对应了对话想要表现的我们的大脑能力:可以随时想象现实世界的种种假设的变种。
螃蟹:“要是你有一台虚拟电视,也没有什么特别的。……这是种可以进入虚拟状态的新型电视,特别适用于观看球赛之类的节目。这是我刚搞到的。”(螃蟹的特殊能力,可以搞到各种稀奇古怪的机械装备——也许这些都暗示了计算机系统的发展)
螃蟹继续解释他的设备:“你可以用它们来调你所需要的频道。有很多频道都在广播虚拟的节目,你能很方便地从中选择。”(实际上这里可以牵扯到关于媒体的发展,而媒体的发展实际上和计算机技术之间有着挺密切的技术关联,只不过表面看起来的方向不一样。)
阿基里斯问螃蟹:“……能告诉我使用你的虚拟电视有什么窍门吗?”
螃蟹:“没什么特别之处,尽管接着往下看,什么时候有某种几乎要成却没成的事,什么时候你希望某件事情不是这样发生的,而是换一个样子,你就摆弄摆弄那些开关,看看会发生什么事。你也许会调出些稀奇古怪的频道来,但你不会把它们弄坏的。”
之后阿基里斯尝试了一下,仍然是在看那场比赛。但是比赛的节点处,就会发生一些“假设”,阿基里斯就尝试用这个虚拟电视看一眼。树懒似乎不太喜欢这个虚拟,他只一心想着自己的有炸土豆片——此刻螃蟹正在厨房里帮他做。这里有一个小的伏笔,我们知道树懒具有某种分辨现实的能力,但它也一不小心发生了口误——是关于螃蟹递过来的炸土豆片的。树懒原本想要一百一十二片,但结果螃蟹端来了一百片。
当时树懒是这么说的:“又一个该死的假!你们怎么都陷进自己幻想的荒诞世界里去了!我要是你们,我就不会违背现实。我的格言是‘避免虚拟的谵语’。即使别人给我一百块——不,一百十二块——油炸土豆片,我也不会放弃我的格言。”(这里是个小伏笔,会在结尾处揭示)
随后阿基里斯继续向螃蟹请教:”这是件很古怪的玩意儿。我想让它重演在另一种天气下的比赛,可这玩意儿似乎自有一套想法!它不去改变天气,而是把橄榄球变得不是橄榄形的,却是西瓜形的!那么请告诉我——橄榄球怎么能不是橄榄形的?这真是自相矛盾。太荒诞了。“
当然这里有阿基里斯不会摆弄虚拟电视的原因在里面,螃蟹估计玩的比他好。但是如果把这段内容延伸一下呢?还记得主题依然是我们无意识地把我们的思想组织起来,产生了种种假设的变化。其实这些现象可以在一些看起来比较远的学科里成为研究对象——比如说:心理学。
我们不能否认梦境是我们大脑思维运行的一个非常有意思的对象,它似乎多少指向了我们意识的深层次,所以产生了很多怪诞的现象。另一个是梦境与现实的关联,且不讨论那些太玄乎的说法,梦境的一个值得注意的地方就在于,我们处于梦境状态相比于普通状态,我们的大脑是更加封闭的。然而不可否认的一点是,梦境似乎确确实实和我们经历的现实具有着某种联系——比较被广泛接受的一种说法就是:梦境的构成原材料来自于我们经历过的现实。
继续回到对话中,螃蟹开始给阿基里斯演示种种虚拟操作,把那些虚拟景象在虚拟电视里展现出来,比如他们把一场棒球赛给放到了月球上去:
“(屏幕上出现了一块孤零零的火山口样的场地,双方队员都穿着太空服定在原地不动。但很快,两队队员同时动起来,队员们跳得很高,有时都高过了其他队员的头顶。球被抛向了空中,高到几乎看不见了。然后再缓慢地落到某个身穿太空服的队员手里,球落下的地方离它被抛起的地方几乎有四分之一公里远。)
解说员:朋友们,你们现在看到的是虚拟的比赛在月球上进行时的情景。”
乌龟问道:“要是空间变成四维的,刚才那场比赛会怎么样?”
螃蟹:“哦,这可够复杂的,龟兄,不过我看我还是能够把这种构想输进仪器里面。请稍后。”
(屏幕上出现了许多混乱地绞在一起的管。一会儿变大,一会儿变小,有时又似乎在旋转。随后又变成某种奇特的蘑菇状的东西,到最后又回到管的形状。就在那些图像一会儿这样、一会儿那样,变成各种稀奇古怪的图形时,解说员又开始解说了。)
……三维的球迷们,要是球赛在四维空间里举行,这就是将会发生的情况。”
这个虚拟电视所播放出来的这些虚拟情景,来自于特定的虚拟频道。看来螃蟹似乎一直都在看这些频道,所以它对这部分非常的熟悉。
树懒:“你怎么知道哪一个频道播放哪一种节目?看报纸上的电视节目预告吗?”
螃蟹:“我不需要知道每种频道的呼叫代号,而是用编码的方法在这些开关上调出我想要的虚拟情景。用行话讲,这就叫做‘通过对实参数调用某一频道’。总是有大量频道在播放各种可能设想的情景。那些内容‘相近似’的各频道,其呼叫代号也彼此相近似。”
看得出来虚拟频道的虚拟现实,并不能产生太大的变化,不能完全的“无中生有”。树懒问螃蟹能不能用虚拟频道模拟出加法交换律失效的虚拟情景??而螃蟹却表示,这会导致太过复杂,虚拟电视无法进行这么复杂的操作,但是足够复杂的超级虚拟电视机也许能满足树懒的要求。
阿基里斯问螃蟹:“你从哪儿搞来的这么一套虚拟电视机,老蟹?"
螃蟹说这台虚拟电视机,是自己有一次和树懒一起去散步的时候,抽奖获得的。结果它和树懒开始诉说前因后果之后,它们发现实际上当时它们参加了抽奖,其实谁都没有抽中……
阿基里斯:“我整个儿一个糊涂。要是你根本就没有赢得虚拟电视机,老蟹,我们怎么能今天一下午坐在这儿看这台电视?看来我们自己好像也是呆在某个可能会存在的虚拟世界里,只要环境稍微有些变化……”(这里可以呼叫一下《黑客帝国》里的尼奥。)
各位观众,要是螃蟹赢得了虚拟电视机的话,这就是这个下午在螃蟹家将会发生的事情。但是因为他并没有中彩,所以这四个朋友事实上只是观看了一场本地队被打得落花流水的比赛,用这种方式度过了一个愉快的下午。本地队在这场比赛中以0比128失利——也许是0比256?哦,对于一场在五维空间中的冥王星上举行的西瓜球比赛,这是无关紧要的。
关于我们大脑的种种现象,到目前为止很难说得到了证明,也很难说得到了证伪。但是有一点我们很清楚,现象是本质的投影——这个比喻可以追溯到柏拉图的哲学。所以对于现象的研究绝不是没有意义的,尤其是关于我们大脑的种种有趣的现象。
从物理意义上来说,我们始终也无法做到完全的仅靠自身观测自身,我们的思想也与此类似。自己的视觉能看见的自身始终是不完全的,要借助“镜像”、“侧影”……更抽象一点,我们身处于这个世界之上,身处于社会之中,对于自我的认知也需要借助旁人的观测,然后再反馈给自己。这种种的现象,被归类出来各种讨论的主题、各种研究的学科科目:社会学、经济学、心理学、神经科学……其中探讨的主题也很多:举两个比较贴近的例子——就比如之前机核网上引起广泛关注的探讨“讨论”的那篇投稿,以及之前和之后都涉及向相关主题的探讨:包括牵扯到《乌合之众》的讨论。甚至是“知乎”平台上经常有人提出的“无聊”问题。
实际上这些表面上看起来好像没有什么太大意义的现象,如果去追根溯源,都是能够追溯到我们的“心智”的。换言之这些现象的本质,正是我们每一个个体的“心智”,在个体或是群体情况下表现出的种种有趣的现象——并且这些现象中基本都包含着这一章节探讨的核心主题:“现实再构筑”。
最直白而简单的例子:知乎这个平台上,经常有人喜欢提这样一类问题:“如果XXX会怎么样?”、“假如XXX会发生什么?”、“为什么XXX不XXX?”;或者是贴吧里喜欢“开脑洞”、“比战力”;甚至于网上到处泛滥的“撕逼”、“站队”、“为了输出自己的观点”……诸如此类。
这些现象四处泛滥,从环境上来解释、从社会学来解释,我们可以得出很多论调。但是如果进入更深的层次呢?我们把这些现象,看作是人类智能的某种外在表现的现象,虽然这种现象对于“智能本质”的探讨来说太过于肤浅,但笔者个人认为不应该忽视它们。
对于现实的臆想充斥着我们的生活,这种补正当然不是“智能”的全部,但却是“智能”的一个重要特性。我们如何能够想象到一个不具备智能的个体,可以尝试进行“假设”这一行为?而在实际上人类文明的千百年发展中,这类的“假设”所占据的比例可能超乎了大多数人的预料。
艺术创造、文学创造、历史记录、讨论……任何经过大脑处理之后获得的反馈,都来自于现实世界,又不能百分之百等于现实世界。无论如何一个人都会给自己以这种类似“假设”的方式,留下自身的印记——因为我们很清楚,每一个人做假设的方式也都取决自己。所以它一样也可以牵扯到“自我意识”之上。
这就是比较耐人寻味的地方了,且不论正确与否。至少这种反向的尝试,把所有的事情全部融合到了一起去,而且不是混乱不堪的,是仅仅有条的。只是由于内容实在太多,而我们的处理能力也有“限度”,我们能看到的联系,往往只在“二者之间”。
所以实际上,我们很难做到真正的“泾渭分明”。在关于“信息”的意义之所在的那一章节里,已经尝试过解读一个信息载体中的结构,和意义之所在。“在其一”的结论往往让我们限于矛盾和争论之中,而兼容并包的结论大多数人不愿意接受——因为人们还是更愿意把一切归结于“一点”上,从而保证完全性、统一性。
如果要找这一类问题的更专业更详细的内容,至少在三个领域又可以参考的内容:哲学、心理学、社会学。而且我们也可以注意到,这三者一般都是有重叠部分的,三个领域中的大家往往也兼顾另外两个学科,甚至可能更多——包括很多人工智能领域的研究者一般也是另外领域的研究人员。这里不就又回到了之前提过的另一个说法么?——“科学整体论”,再一次有机的,以层次结构把“百科”构建成一个体系。
往往问题在于我们还是会产生混淆,我们知道这来自于语言的不确定部分:宏观论点一般会变成一个循环论述,而且有时候并不具有足够的细节描述。(说多了不是空话就是车轱辘话)而具体的现象论述却有一个问题——不具备普适性,一旦尝试进行推广就要陷入争论当中。而更多的问题在于,很多时候的讨论混淆了二者,而且是递归结构,层层嵌套的混淆(因为我们知道“同构”存在于每一个层次),于是“讨论”变成了“争论”,永无止尽,直到我们的“硬件”帮我们“停机”。
有趣的是到底该怎么把握,这在GEB这本书当中其实尤其明显的体现了这样的问题。我们尝试把握的“实质”是万事万物背后的一种抽象的存在,它可以有很多叫法:“结构”、“规则”、“关系”……但是这些是抽象的,我们具有形体,所以我们自身的思维也会倾向于去把握一个“实在”些的存在。(这里的“实在”并非哲学上的定义,而是口语里的用法)那么有的人会倾向于现象,倾向于“台前”的实体存在,而不是抽象的“幕后”关系。另一个值得一提的是,我们“自调用”的能力:我们对现实信息处理过后在构筑的内容,还可以进一步自调用——这就又进入了递归的结构,而这样的结构总是异常的复杂,其构建的深度让我们探不到底(无穷回溯)。
可是从微观物理学上我们发现一个有趣的地方,宏观世界万事万物的不同,实际上是来自于背后抽象的构筑规则不同,而基本粒子却是相同的。这就是为什么物理学家想要找到所谓的“上帝粒子”。但目前看起来上帝给我们开了个玩笑,因为这个找寻过程让我们进入了“无穷回溯”出不来了:我们知道具有实质的存在都可以以原子构筑,但实际上还有一些特殊的“例外”。于是进一步发现原子中存在的质子和中子、正负电子、光子、介子然后在此之下进入费米子的层次,其中包括夸克和轻子、接下来还有玻色子,其中分为规范玻色子、胶子接下来还有希格斯粒子。这些还是已经被实验所证实存在的基本粒子,但我们却发现,理论的空间还能在此基础上延伸。
从基本粒子跳回宏观物质层面进行对比,就好比我们在探讨智能的一些连想构筑能力,一下子跳到了宏观的个人层面乃至社会层面。我们很清楚即使距离遥远,中间依旧有“结构”连接着。但是层次的叠加已经把我们在单一层面把握到的“实在”给消弭了,所以当我们试图论证的时候,我们首先要保证自己不能在“层次”之间乱窜,不然就在博尔赫斯的“巴别塔图书馆”里迷失了。(在那里跳楼,就等于在空气里埋葬,在坠落中消逝)。
帕斯卡的《思想录》这样说道:“自然是一个球,处处都是球心,没有哪里是球面,终于,我们的想象力会泯灭在这种思想里……”
“我的一个朋友读过《对实》之后对我说:‘我叔叔差一点就是美国总统了!’‘真的?’我问。‘敢情。’他答道,‘他当时是108号鱼雷艇艇长。’(约翰·肯尼迪曾任109号鱼雷艇艇长。)
这就是《对实》的全部意义所在。在日常思维中,从我们面临的情况、我们拥有的想法、客观发生的事件中,我们总会构造出一些精神上的‘变奏曲’,让某些性质基本保持原样,而让另一些性质发生‘滑动’,从而形成一些‘虚拟的’——我叫它们‘对实的’——情景。哪些性质是我们允许的滑动的?哪些是我们根本不会考虑让其滑动的?在某种较深的直觉层次上,哪些事件被感知成是与确实发生的事件紧密相关的?有哪些事情会被我们看作‘差一点儿’发生,或者‘本当’发生了,但它们事实上没有发生?当我们听人讲故事时,哪些可能的结局会自然而然地出现在我们的脑海里?为什么我们会觉得某些虚拟事件比其它一些‘虚拟得少点’?归根结底,没发生的事件显然就是没发生,在这里不存在一个‘未发生度’。对‘差一点儿’出现的情况也是一样。有时某个人会伤心地说‘它差一点儿就发生了’,而另一个时候他又会欣慰地说同一句话。但这种‘差一点儿’是存在于思想中的,并非存在于外界事实里。”
上述这一类最浅显的例子,其实可以上“知乎”平台去看看那些问题。虽然那些询问,估计会让很多人觉得毫无意义、荒诞不经。但是那也确实是上述这个段落里描述的“智能”的一种行为。而且也不完全是,正如后半段所言——事实上虽然不存在“未发生度”这个衡量标准,但是我们也知道有一些“虚拟”的问题,是有讨论意义的;至少我们相信有一部分这类问题确实有讨论的意义。
“我相信,那种‘差一点儿’发生的情况和潜意识中构造的主观想象,代表着洞察力的某种最丰富的潜在来源。靠这种洞察力,我们可以了解人类是怎样组织他们对世界的感知,并形成范畴的。这个观点的一个强有力的支持者是语言学家兼翻译家乔治·斯坦纳。他在他的著作《巴别塔之后》中写道:
假设、想象、条件、虚拟的句法和偶然的句法可能是人类语言的发生中心……【它们】不光是造成哲学和语言学中的一些麻烦,与它们有关的也不像有人感觉的那样仅限于将来时态。或许该把它们划归到更大的集合中,如‘假设推测’或‘可能的选择’。这些带‘如果’的命题为人类的情感机制提供了基础……
我们能够——同时也需要——对世界进行否定或‘不定’,以便以别的方式来设想和表述……我们需要找一个词来描述语言的这种威力和这种意向:即2谈论‘其他情况’的能力……或许该叫它‘替代’,以此来定义‘不同于真实的情况’、虚拟命题、想象、愿望和遁词,我们用这些东西掌管着我们的头脑,并以它们为工具为我们自己构造了一个变动不居、充满幻想的生物环境和社会环境……
从我们已有的只是推测,假如没有这种幻想的、虚拟的、反决定论的语言工具,,没有产生并存储在大脑皮质的‘多余’部分中的语义能力,并以此来想象和表达那些在单调沉闷的生物性衰退和死亡之外的各种可能性,人类几乎是不可能生存至今的。
这种‘主观想象出的世界’的构造过程产生得如此随便、自然,以至于我们几乎没注意到自己在做什么。我们从我们的幻想中选出一个世界,它在某种内在精神意义下接近于真实世界。我们把真实的东西和我们感觉‘差不多’真实的东西相互比较。这样,我们就得到了某种难以捉摸的对实在的看法……试想如果我们没有这种滑出真实世界、进入‘假如’世界之中的创造性能力,那我们的精神生活将是何等的贫乏啊!从人类思维过程研究的观点看,这种滑动时十分吸引人的,因为它大多发生于完全缺乏意识指引的情况下,这意味着对什么可以滑动、什么不能滑动的观察将为我们认识潜意识提供一个良好的窗口。”
如果沿着这个思路拓展一下,我们不举太远的例子,就以这本书本身来说。上述的思路解释了,为什么,艾舍尔和巴赫要拿过来和哥德尔并列在一起,艺术的表现和数理逻辑形式系统之间是不是存在必然的联系呢?从我们的智能角度来看毫无疑问它们至少是互相重叠的两个领域。
如果要想询问艺术创作的意义,那么这也许可以算是一种解答方式(注意,只是一种)。从一开始,这就是我们本身“智能”的部分衍生。而所有针对这些的思考:其本质是一种形式的对自身的“自省”.而我们知道,形式不会是唯一的,这取决于视角。那么实际上就有千千万万的方式,但由于我们的特性,所以时而可以看见“统一”、时而又只能看见“分歧”,而我们的情绪也常常被其调动起来。
另一个是之前提到的对于刑法的学习,或者说其实可以拓展到我们学习的本质。比较直白的例子来说,我们的数学应用题,刑法中一些假设性的例子来判别如何对于法律进行解释。这时候我们大脑的运作过程和上面描述都是可以吻合的。
这一类例子暂时就不拓展的太深了,因为那可能让人跟随着“变化的主题”不停穿越,但最后却找不到“回溯路径”,从而迷失。但是你看:
“我们逐层构造了一个情景的心智表示。其中最低层构成了环境的最深刻的方面——有时这个层次低得根本无法变动。例如,我们世界的三维性是非常根深蒂固的观念,我们中的大多数人都从没想过让它在头脑中滑动。它是一个恒定的常量。然后是这样一些层次:它们构成了情景中暂时固定的方面,虽然不是永久固定的。这些方面可以被称为背景假设——在心灵深处,你知道这些方面时可能改变的,但在大多数时候,你总是不假思索地把它们当作不变的方面。这些仍可以被称为‘常量’……再往后就是‘参量’:你认为它们有更大的可变性,但暂时把它们当作常量……可能——或很可能——存在着多层参量。最后,我们到达了你关于情景的心智表示中最不稳定的那些方面——变量……它们在脑海中很‘散漫’,你不会介意让它们在短时间内偏离其真实值。”
从这里再一次回到人工智能的领域里来,其实这段的原文内容涉及到人工智能领域里一个非常重要的部分——知识的表示。(我们对于知识的构筑、经验的总结,某种角度来说,本质上确实就是对于现实的再构筑。)
知识表示法:或者也可以叫做“知识重呈”或“知识表示”。它是认知科学和人工智能两个领域里共同存在的重要问题。在认知科学里,这一主题涉及到人类如何储存和处理自己接触到的资料。而在人工智能里,其主要目标为储存知识,让程式能够处理,达到人类智慧的水平。一直到目前为止,这一领域暂时还没有获得一个完美的答案。
从人工智能的角度来说,知识表示所涉及的问题有这么几个:
人类如何表示知识?
知识的本质是什么?如何表示它?
某种表示法应该只对应一个领域,还是说存在通用表示法(一个表示法适用全部领域)?
某种知识表达方案的表现能力如何?
表示法应该是描述性的还是程序性的?
框架表示法是一种人们发现的适应性强、概括性高、结构化良好、推理方式灵活、又能把陈述性知识与过程性知识相结合的知识表示方法。“‘框架’这个词正流行于当今的人工智能研究中。它可以被定义为‘一个环境的可计算例示’。这个词的普及应归功于马尔文·明斯基,他发表了不少关于框架的见解。”
框架表示法是明斯基于1975年提出来的,其最突出的特点是善于表示结构性知识,能够把知识的内部结构关系以及知识之间的特殊关系表示出来,并把与某个实体或实体集的相关特性都集中在一起。
框架是一种描述固定情况的数据结构,一般可以把框架看成是一个节点和关系组成的网络。框架的最高层次是固定的,并且它描述对于假定情况总是正确的事物,在框架的较低层次上有许多终端--被称为槽(Slots)。在槽中填入具体值,就可以得到一个描述具体事务的框架,每一个槽都可以有一些附加说明--被称为侧面(Facet),其作用是指出槽的取值范围和求值方法等。一个框架中可以包含各种信息:描述事物的信息,如何使用框架的信息,关于下一步将发生什么情况的期望及如果期望的事件没有发生应该怎么办的信息等等,这些信息包含在框架的各个槽或侧面中。
一个具体事物可由槽中已填入值来描述,具有不同的槽值得框架可以反映某一类事物中的各个具体事物。相关的框架链接在一起形成了一个框架系统,框架系统中由一个框架到另一个框架的转换可以表示状态的变化、推理或其它活动。不同的框架可以共享同一个槽值,这种方法可以把不同角度搜集起来的信息较好的协调起来。
这个框架结构可以和上一段的原文节选内容做一个比对,我们构造分层的心智表示的过程进行数据化之后,得到的就是这个“框架”。
框架系统的数据结构和问题求解过程与人类的思维和问题求解过程相似。
框架结构表达能力强,层次结构丰富,提供了有效的组织知识的手段,只要对其中某些细节作进一步描述,就可以将其扩充为另外一些框架。
可以利用过去获得的知识对未来的情况进行预测,而实际上这种预测非常接近人的知识规律,因此可以通过框架来认识某一类事物,也可以通过一些列实例来修正框架对某些事物的不完整描述(填充空的框架,修改默认值)。
缺乏形式理论,没有明确的推理机制保证问题求解的可行性和推理过程的严密性。
由于许多实际情况与原型存在较大的差异,因此适应能力不强。
对于大多数问题,不能这样简单地用一个框架表示出来,必须同时使用许多框架,组成一个框架系统。框架系统中各个子框架的数据结构如果不一致则会影响整个系统的清晰性,造成推理的困难。
不善于表达过程性的知识。因此,它经常与产生式表示法结合起来使用,以取得互补的效果。
“由于不同的框架可以被任意地插进其它框架的槽中,这就又发生冲突或‘碰撞’的潜在可能。那种用单一的、全局的观点对‘常量’、‘参量’、‘变量’进行分层,以形成一个整齐划一的模式的想法,未免把问题过分简单化了。事实上,每个框架自己都有一个可变性的层次结构。正因为如此,要分析我们是如何感知一个复杂事件——如一场橄榄球赛,连同它的大量子框架、子子框架等等——才成为一种混乱得令人难以置信的工作。这一大堆框架是怎样互相作用的?如果某个框架说:‘这个项是常量’,而另一个框架说:‘不,它是个变量!’,那这种冲突怎样才能得到解决呢?这是一些关于框架理论的更深更难的问题,对此我无法提供答案。关于框架到底是什么东西,以及如何在人工智能程序中实现它,至今仍没有一个完全一致的看法。我正准备在下面几节中讨论其中的一些问题,并谈谈视觉模式识别中的一些谜题,我称之为‘邦加德问题’。”
邦加德问题是俄罗斯计算机科学家米哈伊尔·莫西耶维奇·邦加德(Mikhail Moiseevich Bongard,1924-1971)在大概20世纪60年代中期发明的一种谜题类型。1967年,在他出版的《模式识别》一书中被正式发表。
这个问题提出的目的是为了对智能的“模式识别”能力进行观测,所以这一组问题的研究对象即可以是人类,也可以是人工智能。其方法是给出两组互相对照的图案(一般是十二幅图,六幅图为一组,进行组与组之间的对照),然后让测试者试着找出其中的相同之处(主要是模式上的)。
这里我们先要暂时从人工智能的主干道上偏出去一些,先要进入边上的两个领域(心理学和认知神经科学)里,了解一下“模式识别”的概念——也不算岔太远,这几门学科之间的关系非常的紧密。
在心理学和认知神经科学中:模式识别描述了一个认知过程,该过程将来自刺激的信息与来自记忆的信息相匹配。当大脑接收到来自环境的信息并输入短期记忆时,会发生模式识别,从而导致长期记忆的特定内容自动激活。
模式识别的过程涉及将所接收的信息与已经存储在大脑中的信息进行匹配。在记忆和信息之间建立连接被称鉴定,鉴定是模式识别中一个步骤。模式识别需要重复的经验。隐含地和潜意识地使用的语义记忆是与识别有关的主要记忆类型。
经过研究发现,模式识别并非是只属于人类的“高等智能”的能力,相反,这样的情况普遍存在于其它动物身上,即使是具有不太发达的思维能力的动物也具有这样的能力。比如考拉,会使用模式识别来寻找和大吃桉树叶。
人类的大脑虽然发育得更多,但与鸟类和低等哺乳动物的大脑有相似之处。人类大脑外层的神经网络的发展,使得大脑能够更好地处理视觉和听觉模式。环境中的空间定位, 记忆与发现, 以及检测危险和资源,以增加生存机会, 是人类和动物模式识别应用的例子。
在心理学中模式识别主要有六种理论:模板匹配,原型匹配,特征分析,组件理论识别,自下而上和自上而下处理,傅里叶分析 。这些理论在日常生活中的应用并不是相互排斥的。模式识别允许我们阅读单词,理解语言,识别朋友,甚至欣赏音乐。每种理论都适用于观察各种活动的领域模式识别。面部,音乐和语言识别以及系列化是这些领域中的一小部分。通过编码视觉模式进行面部识别和系列化,而音乐和语言识别使用听觉模式的编码。
那么回到计算机科学和人工智能这里来,那么模式识别到了这里的意义就是:通过计算机用数学技术方法来研究模式的自动处理和判读。
在这里我们把环境与客体统称为“模式”。随着计算机技术的发展,人类有可能研究复杂的信息处理过程。信息处理过程的一个重要形式是生命体对环境及客体的识别。对人类来说,特别重要的是对光学信息(通过视觉器官来获得)和声学信息(通过听觉器官来获得)的识别。这是模式识别的两个重要方面。目前市场上可见到的这一技术的代表性产品有光学字符识别和语音识别系统。
计算机识别的显著特点是速度快、准确性高、效率高,在将来也许完全可以取代人工录入的工作。
计算机程序的识别过程与人类的学习过程相似。比如以光学字元识别里的“汉字识别”为例:首先将汉字图像进行处理,抽取主要表达特征并将特征与汉字的代码存在计算机中。识别过程就是将输入的汉字图像经处理后与计算机中的所有字进行比较,找出最相近的字就是识别结果。这一过程叫做“匹配”。
在计算机科学中:“模式识别”这一研究课题发展至今,也已经包含了多个需要研究的技术课题,包括:计算机视觉 、医学影像分析、光学文字识别、自然语言处理 、语音识别、手写识别、生物特征识别、人脸识别、指纹识别、虹膜识别、文件分类、互联网搜索引擎、信用评分、测绘学 、摄影测量与遥感学等。
而在理论研究方面,“邦加德问题”可以算是这一研究领域的开路先锋。而这本GEB对邦加德问题的推广也起到了很重要的作用。侯世达教授在书里非常详细地论述了这个问题:
一个求解邦加德问题的程序可能会包括若干阶段,原始数据通过它得以逐步转换成描述。初级阶段相对来说灵活性不大,而高级阶段逐渐变得更灵活一些。最终的阶段具有一种我称之为’尝试性‘的性质,就是说一幅图像的表达方式总是带有尝试性的。只需出现微小的变化,后面几个阶段提供的手段就能重新构造出一个高层描述来。下面要提出的想法本身也具有一定的尝试性。
邦加德问题对于人工智能来说,还牵扯到另一个相当复杂的问题——概念表述。直白地来说,当分辨出两组图案之间的性质、规律、模式上的区别的时候,如何对其进行准确地描述也是一大重要问题,所以这其实牵扯回之前提及的知识表示问题:如何让计算机可以准确地表达出这一类抽象概念。上面提过的框架系统是知识表示的一种方式,而语义网络同样也是知识表示这一领域内的另一个重要理论,两者在一部分上还有所重叠。
其实到了这一部分,我们会注意到,很多研究领域虽然都有各自的题目和方向,但它们已经不可能是完全独立的了。它们会自然而然的互相交织起来,形成一个复杂的,互相重叠又彼此不同路的巨大网络。
比如“知识表示”是人工智能这个母题之下的一个子题,但它同时也不仅仅只属于“人工智能”;在“社会学”、“心理学”等等其它领域的研究也有所涉猎。更进一步,“知识表示”之下还能分出“框架表示”和“语义网络”。这二者又同时来自“认知科学”和“语义学”。前者能追溯到“心理学”,后者则涉及语义学:而“语义学”由属于“语言学”的一个子版块;“自然语言科学”又可以和“语言学”分类开。如果我们再往下拓展下去题目还能继续拉长,说不定会迷失在分类的无限网络里……(真是令人望而生畏。)
自然科学统一的说法这里已经不是第一次提了,与其说我们把各个学科有系统组织起来,不如说它们本身其实就是如此(一体的现实世界)。只不过因为个人能力的有限,无限的内涵受限于有限的表现形式。所以我们不得不进行虚分门别类:在描述上不得不简化甚至略过,为的是更高效率的来进行表述。(其实这篇笔记也是如此,相比于原书已经有所收缩,而原书涉及的内容又是作者本人全部知识量的一个缩影而已——而作者本人的知识面仍然还有涵盖不到的地方。)
“假设我们要解某个邦加德问题。题目被送到一台电视摄像机前,这样原始数据就被读进去了。然后对原始数据进行‘预处理’,这就是说某些显著特征可以被检测出来。这些特征的‘名字’构成了该问题的一个‘微词汇表’,而它们是从一个通用的‘显著特征词汇表’中抽取出来的。这个显著特征词汇表中的一些典型项是:
线段、曲线、水平的、垂直的、黑的、白的、大的、小的、尖的、圆的……
在预处理的第二阶段,使用了某些关于‘基本图形’的知识。如果发现了基本图形,它们的名字也要被包括进来这样,可能会选出下列的项:
三角形、圆形、矩形、凹入、凸出、直角、顶点、尖端、箭头……
至此,这幅图像已经根据某些已知的概念,在一定程序上被‘理解’了,而且完成了一些检查工作。对于十二个框中的某一个或几个,已经作出了尝试性的描述。
这些描述中的每一个都是通过一个‘过滤器’来观察这个框。脱离环境来看,其中每一个都可能是个有用的描述。但我们发现,在它们所处的特定的邦加德问题的环境中,它们全都是‘错的’。换句话说,如果你知道邦加德问题47号中第I组和第II组的区别,然后给你一个上面那样的描述,作为对某个你未见到的图像的描述,那么这种信息将无法使你断定这个图像应该属于哪一组。在这个环境中,这个框的本质特征是它包括了:
注意,如果某个人听到了这一描述,他无法据此‘重建’原始图形,但他能‘识别’某个图形是否具有这种性质。这有点像音乐的风格:你可能会准确无误的辨别出莫扎特的作品,但同时又写不出一首能让别人以为是出于莫扎特之手的曲子来。
……在我们使用语言描述事物的方式之中,存在着许多‘宽松’之处。显然,许多信息已经被扔掉了,甚至本应扔掉得更多些。想预先得知哪些该扔、哪些该留,这是很困难的。
尽最大可能使描述‘在结构上彼此相似’,这可能会是个好的策略。它们所共同具有的结构将使它们之间的比较变得容易一些。在这种理论中有两个要素与该策略有关,其一是关于‘描述模式’,或称‘模板’的想法,其二是关于‘同一性检测器’的想法。
先谈同一性检测器。它是出现在程序的各个层次上的‘特派员’。(事实上,,不同的层次上可能会有不同种类的同一性检测器。)它不断地在个别的描述之中和不同的描述之间巡视,寻找重复出现的描述词或其它东西。一旦发现了某种同一性,就会触发各种重构操作,这即可能发生在单个描述水平上,也可能同时涉及多个描述。
想现在来谈模板。在预处理完成后,首先要做的是设法构造一块模板,或者叫描述模板——一种适用于描述问题中所有框的‘统一格式’。其基本想法是:描述常常可以通过某种自然的方式被分解成子描述,然后如果需要的话还可以把它们再变成子子描述。当你碰到属于预处理层次的基本概念时,这个分解过程就终止了。现在重要的是选择描述的分解方式,以反映所有框之间的共同点,否则将会引入一些多余而且无意义的‘伪规律’。
……这个程序中最重要的模块之一是一种语义网络——‘概念网’,在这个网络中所有已知名词、形容词等等被相互联接起来了,而联接的方式就说明了它们的相互关系……概念网充满了关于词间关系的信息,例如谁和谁是相反、谁和谁是相似的、谁和谁经常同时出现,如此等等。”
语义网络是一种采用网络形式表示人类知识(语义)的方法。是出现比较早的知识表达形式,它在人工智能中得到了比较广泛的应用。
语义网络最早是1968年奎廉(Quillian)在他的博士论文中作为人类联想记忆的一个显式心理学模型提出的。1972年,西蒙正式提出语义网络的概念,讨论了它和一阶谓词的关系,并将语义网络应用到了自然语言理解的研究中。
一个语义网络是一个带标示的有向图。其中,带有标识的结点表示问题领域中的物体、概念、时间、动作或者态势。在语义网络知识表示中,结点一般划分为实例节点和类节点两种类型。结点之间带有标识的有向弧标识结点之间的语义联系,是语义网络组织知识的关键。
这里要提醒一点的是,存在两个相类似的术语,但是代表的不是一个东西。其一是我们正在讲的“语义网络”,另一个则是“语义网”。注意这两个词指代的不是同一个概念。
语义网是指:“一个由万维网联盟的蒂姆·伯纳斯-李(Tim Berners-Lee)在1998年提出的一个概念,它的核心是:通过给万维网上的文档(如:HTML)添加能够被计算机所理解的语义‘元数据’(Meta data),从而使整个互联网成为一个通用的信息交换媒介。语义万维网通过使用标准、置标语言和相关的处理工具来扩展万维网的能力。”
自然语言的运用,对于人类来说似乎是非常自然而然的事情。这种信息交流能力似乎是与生俱来的:即使是残疾的人,通过后天努力也能够进行交流。所以我们注意到,语言同时具备多种形式,而语义是可以通过这些形式(不固定)生成并传达出来的。人类的语言能力具有如此高度的复杂性,那么那些动物呢?动物之间也有类似的情况,当然要比人类的交流方式简化很多。
但是这说明了,语言交流确实是智能的一种形式上的体现——动物当然具有智能。那么就来观察一下,我们发现,对于我们来说已经是习以为常的很多语言,在其形式底下还埋藏着非常复杂的逻辑和结构——记不记得那幅信息交流的冰山图?我们的语言只是露出水面的冰山一角,而水下则是暗含在语言形式背后的庞大逻辑结构和联接信息。
“注意在网络中的而一切东西——不论是结点还是连线——均可被描述。在此意义下,网络中任何东西都不比别的东西处于更高的层次。”
“概念网络必须非常大才行。它似乎只存储静态知识,或者叫描述性知识,而实际上并非如此。它的知识也可以说是过程性的,因为网络中的相邻性起到了引导者或‘程序’的作用,可以告诉主程序如何深化它对框中图形的理解。”
人工智能发展的一个最大的难点,在于把握“智能”的灵活性究竟到了什么程度。这个问题也涉及到前面针对控制论和唯灵论对于“智能”解释的问题,究竟是我们还没有真正深入到“智能”的最深层次,没有发现真正的底部运作逻辑?还是可能真的存在我们目前理解之外的什么未知的东西?这二者由于都是超出目前所知范围内的,所以争论恐怕不会停止。
但我们还是可以在自己已知的范围内做出一定的推论,既要框定一个范围,但也同时需要这个范围具有一定的波动,可以向外扩张。在我们的智能当中,上述情况是在一种近乎与本能的过程中就完成了的。如果要细究的话,很难从表面看出来,哪怕我们详细地观察了一个人从牙牙学语到完全掌握了语言交流的全部过程。
“……我们必须具备在适当的时候使概念产生变形的能力。没有什么绝对不变的东西。在另一方面,也不能把事情弄得模棱两可,以至于根本丧失意义。关键在于要懂得该在什么时候以及用什么方式从一个概念滑向另一个概念。”
之前说过,由于语义网络的每一个节点都处在同一平面上,因此互相之间没有绝对的从属对应关系——换言之可以自由地组织语言。这类情况很常见,比如网络上的一些“网络用语”,故意的简化错用组新词,但是仍然可以传达给我们这句子原本想要传达的意思。
这值得我们将其引申,记得之前的篇章里曾经讨论过信息中的“固有意义”之所在,究竟是本身就存在于形式当中的,还是诞生于解读过程当中的?这里暂时还难以下判断,但是就目前所知道的情况来来看,意义的涵盖范围可能不仅限于单一一处。
另一点是,虽然语义网络之间处于同一“平面”,但是在构造语句语义的时候,我们可以“人为”的构造出从属结构——也就是之前多次提过的递归结构;自调用。这样的构造使得语义网络可以开始构建一些相当复杂的描述。组块化的构筑思路,在这里被再一次运用,这样原本简单的“原材料”可以创造出足够丰富的内容来。于是我们不得不从单一词汇层次上升到语句甚至文段的高层次来寻找语义逻辑了。
“语言的奇妙之处在于:我们很不准确地使用它,但仍能不出毛病……假如词汇是螺丝钉和螺丝母,人们就可以把任何一个螺丝钉穿进2任何一个螺丝母中:他们只须把前者硬压到后者中去就是了,就像在某幅超现实主义绘画中,一切东西都变软了一样。语言在人的手里几乎变成了液体,尽管它的成分很粗糙。
近来,人工智能在自然语言理解领域的研究已经在某种程度上离开了对隔离状态下的单词语句理理解,更多地转向理解简单的儿童故事这样的领域。”
这个构筑思路如果用来描述邦加德问题,给人的感觉似乎有点绕远路。但侯世达这里给出的方法重点在于,他希望他通过这个方式有效的赋予“程序”灵活性。这里已经跨入了一些非常深度的区域里了,不过早在之前的篇章里,这些思路都有被提到过。
模式识别对于语言描述的构造要求非常高,它展现了语言构筑的一种“动态”,即是往外过滤的,又是进行聚集的。有一个从混沌的词海中找出相近同类概念集合,然后逐层筛检,最后达到“精确概念描述”的过程。这个过程从人类的智能来看可能仅仅只是一瞬之间,以至于我们意识不到这当中发生的过程——太短了。不过通过“程序”来进行重建,我们才会注意到,在语言底层的这个庞大的动态的网状逻辑机构。
当然这个思路不仅限于语言上,我们知道语言和思维的关系密切,语言也是构筑思维的形式之一。所以概念的形成也可以依附于上面的论述——这也说明了概念的灵活性从何而来。
“有时,人关于世界中真实对象的经验对他描述或重新描述某些框的方式会产生微妙的影响……我们无法断定对人来说与这些谜题有关的概念子网络是否能很容易地从整个网络中被分离出来。我们更倾向于相信一个人得之于观察和把握实在对象——如梳子、火车、线绳、木块、字母、橡胶带、等等——的直觉在解决这些谜题的过程中起着一种不可见的重要引导作用。
反过来,对真实世界情景的理解肯定极大地依赖于视觉表象和空间直觉,因此,如能以灵活有效的方式表示像邦加德问题中出现的那种模式,一定会对提高思维过程的一般效率有所贡献。”
邦加德问题涉及到的重点“模式识别”,可以将之理解为一个类似具有泛用性的“代入公式”。“模式”这一概念的扩展性之强,几乎可以运用到全部的地方,不仅仅只是邦加德问题这类图形识别的内内容——邦加德问题依然有一个具体到“抽象”的过程。它同时也可以自调用,获得“模式”的模式——这一类的具体例子比如哲学中的概述、总论等等也都是类似的情况。
“因此,我相信邦加德问题所用的技巧位于离‘纯粹’智能的核心很近的地方——如果这种所谓‘纯粹’智能真的存在。因此,如果要研究发现模式或消息的‘固有意义’所需的能力,那从这里着手是很合适的。
有一些关于视觉模式识别的令人惊异的问题,我们人类似乎已将其完全‘吸收’在潜意识之中了。这些问题包括:
识别面孔(在年龄变化、表情变化、光线变化、距离变化、角度变化等之下的面孔不变性。)
在森林和山岭中识别足迹——这总以某种方式是我觉得是我们模式识别中最微妙的行为之一——动物也有这种本领。
人工智能面对的最大问题之一,就是如何拉近机器的“机械性”与人类智能的“灵活性”之间的距离。理论上的尝试我们已经看到过了,简单来说无非两个方向:要么确定存在一个我们已知之外的“临界点”,只要找对方向,我们终有一天可以跨过这个临界点(这个方向也可能包含反对人工智能能够实现的一批人,比如卢卡斯教授);另一个方向则是把人类的智能往“机械性”上拉,也就是把我们的只能解释为纯粹的物理化学反应,本质上不过是极度复杂的,极度精密的“生物机械”。这样一来只要我们的技术让我们的软硬件达到一定层次,我们就足以创造出与我们类似的“人工智能”(丹尼尔·丹尼特也许可以算这个方向上的代表)。
这两个方向看似都在拉近双方距离,但其实性质完全不同。当然也存在“折中主义”,把两边往一起拉:即认可可能存在的认知之外的“界限”,又尝试把解释往已知的范围内靠——笔者个人觉得,至少在写作GEB的时候,侯世达教授可能是这个折中的思路。当然很多尝试实践人工智能的研究也走了这个方向。
让计算机获得灵活性这个思路,几乎从这本书的第一章就开始了。当时关于欧几里得证明的推导就是一个例子。人工智能的两大基础性质:“自主性”与“灵活性”。这本书里一直在做的尝试就是构筑一个可以做到这两点的形式推理系统,而我们知道形式系统的本身其实是不具备上述的两种性质的,至少表面上来说。侯世达教授当时的思路可能是想挖掘深层次的推理演绎中,是否可能蕴含了这两个性质,至少具有可能性。之后关于人机下棋,构建符号系统等等的尝试,都是在试着论证这个思路。当时的思路是尝试依靠构建足够的“复杂度”,来让形式系统可以自动获得“自主性”和“复杂性”。这个思路至少是有一定依据的,生物分子学可以作为这个思路的旁证——想想我们都是从遗传基因变成一个完整的人的,至少这一生物过程是存在的……
“为了处理在模式识别和人工智能程序的其它应用中出现的复杂性,卡尔·海威特提出了所谓‘演员’形式。(类似于艾伦·凯等人开发的‘Smalltalk’语言)。根据这种方案,程序被写成一组相互作用的‘演员’集合,这些演员可以在彼此之间往返传送精心设计的‘消息’。从某个角度看,这有点像一个由相互调用的过程所组成的异层结构集合。主要区别在于:过程间的往返传送的参数通常数量很少,而演员之间相互交换的消息却可以任意长、任意复杂。
这种能够交换消息的演员在一定程度上成了有自主性的专职人员——事实上,甚至有点像自主计算机,而消息就象其中的程序。每个演员都可以用自己特有的方式来解释任何给定的消息,这样,一条线消息的意义将依赖于对它进行解释的演员。出现这种情况的原因是:演员都备有一段用来解释消息的程序,因此,有多少个和演员就可能有多少个解释程序。当然,可能许多演员的解释程序是相同的,但这事实上将带来更大的好处,就好像在一个细胞中至关重要的是具有大量相同的核糖体,它们飘散在细胞质中,并都以一种共同的方式来解释消息——在这种情况下,消息是由RNA带来的。
一个有趣的问题是考虑一下如何把框架这个概念和演员这个概念结合起来。让我们把那种能生成和解释复杂消息的框架称为‘符号’:
我们现在已经是在讨论怎样实现在第11章和第12章中提到的那种难以捉摸的‘活跃符号’了,因此本章中,‘符号’就是指那样的符号。……虽然这一点是人工智能中最新吸引人的发展方向之一,但也并非让人一目了然。进一步我们可以肯定,即便是对于这些概念的最佳综合,我们也将发现它的功能远弱于人脑中的实际符号。”
一直到目前为止,人工智能还处在构建一个有效的心智模型的阶段。到目前为止还没有一个具有足够能力,涵盖全部我们已知大脑所有能力的心智模型——但换个角度来说,我们对自身大脑能力的所知也依然有限。
但可参照物还是有的,生物分子学甚至于物理学都是一个非常值得参考的领域,其可信度建立在一个事实之上——我们的大脑也不是完全独立运作的,依然从属于我们所了解的生物学规律和物理规律——所以换个说法,我们的大脑的最基础构成依然还没有脱离生物分子学、物理学等的发范畴。那既然如此,它一定适用于我们已知的这些规律——这里暂时抛开唯灵论之类的理论来说。
除了DNA和RNA的生物遗传信息的过程被拿来作为人工智能程序的参照之外……
“细胞中的某些东西——特别是酶——很像演员,每种酶的活动场所都起着过滤器的作用,它只能识别某种特殊的‘底物’(即消息)。因此事实上每种酶都有一个‘地址’。酶已经被‘编了程序’(凭借其严整的结构)以完成那些对‘消息’的操作,然后再将它释放出来。通过这种方式,一旦一条消息沿化学通道从一个酶被传送到另一个酶,就可以完成很多操作。我们已经描述过那种可能在细胞中发生的精致的反馈机制(通过抑制)。这些机制表明复杂的过程控制可以通过存在于细胞质中的各种消息传递来实现。”
这里使用酶作为参考的最重要一点原因在于,酶产生反应的一个性质和程序是相类似的——它是被动的触发反应的,同时对于这种被动式触发反应的编程可以非常简单。同时其位于低层次,多种不同的触发方式可以在高层次上显现出灵活性,那么上面长篇论述的那种“动态”的结构就可以被做出来了。
“在这里重要的是下述想法:应当有许多种类不同的可触发子程序处于待触发状态。在细胞中,所有复杂的分子和细胞器都是通过一些简单步骤构成的。在这些新结构中,常常有些结构本身又是酶,,而且它们又参与构造另外一些酶,如此下去。这种酶2的递归‘多级瀑布’能够对细胞的所作所为产生巨大影响。这种简单的逐步构造过程已经被引入人工智能之中,用于构造有用的子程序。例如,重复作用可以在我们头脑的硬件种形成新电路,因此经常重复的行为会变得被编码于意识水平之下。
如果有一种类似的方法能对有效的代码片段进行综合,使它们能和在某个高层‘意识’水平上学到的东西产生同样的操作序列,那将是极其有用的。酶的阶梯将为如何做到这一点提供一个模型。(杰拉尔德·萨斯曼编写的‘海客’程序对短小的子程序进行综合和调试的方式就有点像酶的阶梯。)”
上述举的例子在今天已经被“人工神经网络”在一定程度上做到了,因为要注意的是GEB成书时,人工神经网络还没有达到今天的水平,但是在一些理论方面,在当时已经为今天打下了基础了。比如框架系统,在今天来说;“深度学习”可以看作是“框架”系统构筑的最前沿的成果。同时联想到今天的使用“深度学习”进行图形识别训练的系统来处理邦加德问题会获得什么,这也非常有意思。
可以说到今天,已经过去了小半个世纪了。GEB书中提到的一部分设想已经得到了初步的实现,但它的理论范围和研究方向在今天依旧适用.
对于底层基础结构出发连锁反应的思路,这里还拓展到了物理学方面。联想一下“聚变”和“裂变”之间的一系列连锁反应。大概对核武器有所了解的话都知道,这两个反应对于基本粒子的效果。
这里可以把这两种反应对应到概念生成方面:“裂变”——一个母题概念被拆解成几个子概念。“聚变”——几个符号被触发连锁反应之后被聚集到一起去最后形成一个复合体,而这个过程里,那些符号还触发了其它反应。参照一下我们大脑中种种念头的生成,交流过程中思维的变化,我们可以看到一些类似的反应——没错,这一系列反应并不是完全不可见的,比如在机核平台上看一篇文章或电台之后再看看下面的评论。上述的思维过程能在其中窥见一斑。
但这个设想还存在问题,“裂变”反应里,我们拆解概念到什么程度还能保持基本的意义存在?“聚变”反应中,如何能保证构成的复合概念依然是拥有意义的,而不会生成无意义的缝合怪?这说明中间依然还有一些我们可能不太清楚的过程。
这里侯世达列举了自己创作《螃蟹卡农》这篇对话的过程,来剖析自己大脑中的“符号”过程:一开始只是两个非常简单的思路,然后在后面的写作过程中,经过层层叠加不断的生成新内容,同时新内容又不断引发连锁反应,让侯世达教授吸收更多的新内容(分子生物学、音乐、美术、物理学等),来补充合成自己的思路。
可以肯定的是,这篇对话在全书中有着核心的地位。因为这篇对话在形式上触发了很多后来的讨论,同时不论是形式上和内容上也包含了书中的主要几个主题。
“上面已经或多或少地对《螃蟹卡农》的渐成过程进行了总结。整个过程可以被看作是思想性在不同的抽象层次上不断地相互映射的过程。这就是我所说的‘概念映射’,而那种联接两个不同想法的抽象结构就是‘概念骨架’。这样,就有一个关于《螃蟹卡农》的抽象观念的概念骨架:
一个结构中具有两个完全同样功能的部分,只是它们以相反的方向运动。
这就是一个具体的几何图像,我们的头脑可以像处理一个邦加德模式那样处理它。实际上,当我今天想到《螃蟹卡农》的时候,我把它看成两根相互交叉的带子,在中间被一个‘结’联接起来(这就是螃蟹的独白)。这幅栩栩如生的图像在我脑海里一下子就映射到另一幅图像上:两条同源的染色体,中间通过着丝点相互联接。这幅景象直接来自于成熟分裂,如图132所示。
实际上,,正是这幅图像启发我用成熟分裂的分期法来描述《螃蟹卡农》的演化过程——当然,,这本身又是概念映射的另一个例子。”
比较直观一点的例子,比如我们在进行讲述的时候,常常用到“比喻”的方式,来试着依靠这种概念之间的映射来试着更加清晰地表达自己的意思。其实仔细想来,这样类型的例子意外的普及和日常。当然这也是很正常的事,因为就算在睡眠的时候,我们的大脑也依然在运作着。
这一类的映射其实也可以用“同构”来解释,但这里的同构不再是像之前章节里提到的例子那样,在整体上的各个中寻找“同构”。这里的同构是一种灵活得多的,自由度更高的部分之间的,可以是不同层次之间的同构。这样的运作机制说明了,为什么我们的大脑可以具有如此强大的联想能力和构造能力——回到对话里反复提及的那种现实分解在构筑就是如此。
我们可以构造出各种荒诞的描述,各种反常识反直觉的描述。有意思的是,我们有时候却能觉得这中一反常态的词汇表达居然还自成一体,其内部的逻辑可能就来自于这种灵活的“同构”。
“我所说的‘概念骨架’是指沿某个特定角度对一个概念进行抽象后所得到的一种观点。实际上,我们一直在和概念骨架打交道,只是不常用这个名字罢了。例如。与邦加德问题有关的许多想法就可以用这个术语重新表述。如果我们发现两个或多个想法具有共同的概念骨架,这总是有趣的。”
(这大概说明了,这本书里,为什么作者要把三个领域拉到一起来的原因。当然觉得是否有意义的评判自然交给读者来理解了。)
“一个概念骨架像一个常量特征集(区别于参量和变量)——这些特征在虚拟的重放镜头或映射操作中不产生滑动。由于不含有可变的参量或变量,它可能成为若干不同想法的不变内核。它的每个‘例’,例如‘双轴独轮车’,都具有若干层变量,因此可延着不同途径‘滑动’。
虽然‘概念骨架’这个名字听起来有些刻板、专横,实际上其中有些许多活动余地。概念骨架可能存在于若干不同的抽象层次之上。”
这个原理其实也可以拿来解释我们的学习能力,如何理解学习一个自己从来没有接触过的新领域、新学科等等。其中首先发生的一定是上述情况,我们需要一个可以和自身所知像联接的部分——“共同的概念骨架”。同时这也能说明,为什么不同的人在面对同样的学科,而且经过相同的学习过程后,依然可以得到一些不同的成果。(还包括很多感想类的反应:书评、影评,包括这篇笔记本身。)
“概念骨架不仅必须存在于不同的抽象层次上,而且还必须存在于不同的概念‘维度’上。”
以此作为延伸,这也是人与人之间的“讨论”能够产生的原因(有时在讨论中还能延伸出去,把“话题”扩大):大家依据的是相同的底部常量,和多层次的不同变量和还有灵活的参量。于是“讨论”这一行为本身总是让我们觉得“眼花缭乱”。(当然这里还排除了形式上的影响力,不然还能说得更复杂。)
另外再举一个例子,是关于我们阅读时候常常会产生的联想(此处艾特一下核市奇谭):往往我们在阅读甚至于在写作一篇故事的时候,我们会产生这样一种情况。虽然文字上构建出的语句,并没有办法让我们直接找到对应,但有意思的是这些抽象的剧情描述,却可以帮助我们在脑海中构筑一些很清晰的画面——比如《哈利·波特》里提到“飞天扫帚”的魁地奇游戏的时候,有缺的是我们就是能在脑海中想象出非常具体的画面。(尤其是对于那些初次阅读的读者,这样的联想成果会让他们感到惊奇,从而被这本书深深吸引)
“现在要设法把这些东西集中一下。我已经提出了关于符号的创造、处理和比较的一系列想法,其中多数与某种形式的滑动有关,即认为概念是由一些联系得或松或紧的元素组成的,它们来自于嵌套的环境(框架)的不同层次。那些联系较松的元素可以容易地被去掉或替换,这依赖于不同的环境,能构造出‘虚拟的重放镜头’、受迫匹配或是类比。两个符号的聚变可能是来自这样一个过程,其中每个符号都有一部分被去掉,而其余部分留了下来。”
有了上述内容的铺垫,探讨已经逐步接近“人类智能”最深奥的领域——创造力。
“创造性是那种非机械的思维的本质,但每个创造性的行为又的确是机械的——对它也有解释,而且不会比对打嗝的解释更少。创造性的机械基础是我们所看不到的,但确实存在。反过来,一些非机械性的东西现在就已存在于灵活的程序之中了。这些程序不是一设计出来就有创造性的,但是一旦程序对其设计者来说不再是透明的,那时创造的过程就开始了。”(“浑然本天成,妙手偶得之”的术语化说法,这确实是一个很好的新角度。)
对于“创造”这个概念来说,常常伴随着一些成对的词,而这些都是我们对于“创造”这一活动本身而来的直观感受:“新”与“旧”、“有”与“无”、“保守”与“打破”……这些感受反过来也会影响我们对于“创造”这件事本身的看法。
举一个写作的例子,这个话题已经被无数次提到过,其中有很多值得一提的例子。比如:如何开始写作,怎么开头?为什么有好点子,却没有办法更进一步变成一个完整的故事?为什么构思阶段想好的内容到了下笔的时候却不知道该如何是好了?这些是比较具有代表性的,更高更抽象的例子还有很多。(常常有人觉得自己“创造”了新的什么,最后却发现那已经是前人玩剩下的,或者被证明是错误的——民科、民哲等等如今带有贬义的范围里,这一类的例子也很多。)
这个问题其实涉及到我们对于创造力的理解,很明显的一点是,我们显然被我们对于“创造”这一行为的直观感觉所欺骗了。但进行实践的人很快会多少意识到一些反直觉的部分——“创造”是一个渐进过程,表面看起来的爆发也是长期积累的结果。对于“新”的理解也不再如同之前那么模糊,有了更多的角度。这些都是在“创作”实践中获得的经验,在后面还会有些说法。
当然书中在探讨的其实是关于,如何试图让程序获得“创造性”,那首先就必须得了解“创造性”。
“一种流行的观念认为随机性是创造性活动中必不可少的一个成分。这或许是真的,但这与创造性的机械化——甚至程序化!——并无关系。世界上充满了随机性,一旦你把其中一部分反映到大脑中来,你大脑的内部结构就吸收了一些这种随机性。因此,符号的触发模式就可能把你引向看上去最具随机性的途径,这只不过是由于你是在和一个古怪、随机的世界打交道而已。因此此一个计算机程序也可能这样。随机性是思维的一种固有特性,而不是某种需要‘人工授精’的东西,不论是通过筛子、衰变的原子核、随机数表还是别的什么。认为人类的创造性依赖于这样一些带任意性的来源,那真是对人的一种侮辱。”
在写作这本书的时候,侯世达教授的观点偏向还是非常明显的。但对于创造力这一点来说,我们依然还不甚了解——因为这里需要提醒一下,我们讨论“创造力”本身就是陷入了自指状态。整个人工智能的研究领域其实也被笼罩其中,这就是为什么“自指”是这本书的核心主题之一。(虽然有学者之处作者在这方面过于拘泥于形式了。)
而我们知道“自指”最大的特性之一——哥德尔不完备性定理——我们了解不到全部的内容。所以从对“创造性”的论述来说,可能始终存在我们了解不到的一部分。而再次前提之下,计算机程序能不能做到真正的“创造”,我们也不知道——我们无法判定程序做到了还是没做到,因为对于“创造”的完备定义我们尚未获知。(这个结论和人工智能能不能做到也是相类似的,这二者的主题真是互相嵌套的,很有意思。)
“我选用邦加德问题作为本章的核心,这是因为当你研究这些问题时,能体会到我们人类从基因中继承的模式的难以捉摸的性质,这涉及所有的知识表示机制,包括嵌套的环境、概念骨架和概念对应、可滑动性、描述和元描述以及它们的相互作用、符号的裂变和聚变、多种表示(沿不同的维度和不同的抽象层次)、缺席预设值,以及其它方面。
目前可以断言,如果某个程序能从一个领域中取出模式,那么它在另一个领域中一定找不到对我们来说同样显然的另一种模式。你可能还记得我在第一章中提到过这句话的反面,即说计算机可以不顾疲劳地重复工作,而人则做不到这一点。例如,我们看看施德鲁对输入所会作什么反应。如果伊她·娥英想好这样一个句子:‘拿起一个大红方块然后再放下’,然后她一次又一次地键入这个句子,那么施德鲁就会愉快地以同样方式一次又一次地做出反应……如果某个模式一次又一次地出现,他就会把它取出来。施德鲁不具有形成新概念或识别模式的能力:它没有关于多余的东西和总体概貌的意识。”
“在人类的行为中,有时完全找不到受规则控制的迹象,好像人类的确不是受规则所控制的。但这是一种错觉——有点像认为晶体和金属具有刻板的内在规律,而液体和花朵则不然。”
放眼今天,虽然我们在一些方面已经做到了,甚至一定程度上超过了当时GEB成书年代人们对于人工智能的设想。但是在基础理论方面,当时的理论范围今天依旧适用,我们甚至还没有完全站到前人的肩膀上。本章节侯世达教授提出了十个问题与推测,之所以是推测而不是答案,是因为侯世达教授强调这些只是他自己的个人见解,也许未来会随着他的进一步研究和人工智能领域的前进而发生改变。(今天确实已经有所不同了)下面把这十个问题与推测简单概述一下。
推测:程序编曲已经可以做到,甚至可能做出好听的乐曲。但是在程序拥有真正的如同我们那么复杂的感情之前,它谱写不出真正“优美”的乐曲,能做到的只是“赝品”。
推测:不能,那将是荒唐的,任何对于情感的直接模拟都不可能达到人类情感的复杂性。情感是一种复杂系统的复杂过程描述,不可能被单一系统内的部分表现出来。
推测:可能不会。一旦计算机干预自身的思维活动电路,那它就会搞昏自己的CPU。所以一台可以通过图灵测试的机器做加法的速度可能和人一样慢。因此如果需要加速运算,就没必要朝里面加智能。(这一条估计能引起很多对人工智能看法的讨论,尤其是很多相信人工智能优于人类的看法。)
推测:不会,可能会出现这样一些程序,它们在下棋时能击败任何人,但它们不是只会下棋的程序。(这个推测估计放现在,阿尔法系列程序估计就直接拿出来作为反例了。但是这个答案也不一定就是绝对的。也许人类还可以继续挑战阿尔法,甚至获得胜利也未可知。所以这个推测依然有存在价值。)
5·问题:在存储器中是否有一个特定位置被用来存控制程序行为的参数,这样,如果找到并修改了它们,你就能使得该程序再灵一点或再笨一点或更有创造力或更喜欢足球?简而言之,你是否能在较低的层次摆弄它一下就可以对程序进行调整?
推测:不行,这种改变可能没有意义,就好像人体每天都要死掉几千个神经原一样。但如果折腾的太厉害,有可能伤害到它。这一点的实例可以从神经外科手术里来对照。
6·问题:你是否可能把一个人工智能程序的行为调整得像我或像你——或恰好介于我们两个中间?
推测:不能。人工智能程序和人一样依赖于记忆的稳定性,这种想法暴露了对人格复杂性的一种可笑的低估。(解离性人格综合症虽然有类似效果,但是实际上这是对人的精神产生过度冲击的结果之一,这已经超过了“调控”的度了。)
7·问题:一个人工智能程序是否有个“心脏”?还是说它只不过包含了一堆“无意义的循环和平凡操作的序列”?
推测:现在关于人工智能有两种极端主义的观点:一种认为由于本质而又什么的原因,人的心灵是无法程序化的。另一种认为你只需去汇集适当的“启发式装置——多重优化器、模式识别机器、规划代数、递归管理过程、诸如此类”,你就能得到智能。侯世达教授相信自己属于这两种极端观点中间的折中主义。
推测:不知道,不清楚是否能理解“超智能”或与它发生关系,神智不清楚这个概念是否有意义。(仅当科幻题材可能还是有意义的——笑。)至少目前还没有达到人工智能的情况下,这个问题可能没什么意义。当然如果人工智能达到了的话,这一点可能是下一个目标,但对人工智能来说也一样。
9·问题:那你的意思似乎是说人工智能程序实际上和人完全一样了。难道就一点差别也没有吗?
推测:人工智能程序和人之间的差别可能要大于大多数人之间的差别,套用维特根斯坦曾做过的一个评论:“如果狮子会说话,那我们也无法理解它。”所以即使我们能理解人工智能程序,那也会和我们很不相同(除非它和人的外貌一模一样,但何必呢?)。所以出于这个原因,到最后我们可能会难以断定我们在打交道的到底是一个真正的人工智能程序,还是说仅仅是一个“古怪”的程序。(《辐射》里的好好先生之类的玩意……)
10·问题:一旦我们造出了一个智能程序,我们是否就能理解什么是智能、意识、自由意志和“我”了?
推测:某种程度上可以这么说,但这取决于对于“理解”这个词的定义。就好像一千个人一千个哈姆雷特一样。
这是倒数第三个章节,在这之后还剩两个章节,这场持续了两年多的阅读之旅就要迎来结束了。最后了两个章节必然要涉及到最核心也最庞杂的主题,所以笔记的篇幅恐怕没办法再缩短了。也许只是巧合,在写作这篇笔记的同时,发生了很多事情正好可以成为笔记中的例子。也许是因为这个主题涵盖面太广了,所以任何例子都可以拿来说。
把这一过程比喻成“遨游”真得是很贴切的感受,每次写作笔记的时候都有这样的感觉。同时对于一切的“敬畏”之心也越来越强烈。抱持着“敬畏”真的很重要,那可以打开眼界看到更多。
感谢阅读到现在的读者们,感谢你们给予笔者冗长内容的耐心和一知半解表述的包容,谢谢!
评论区
共 2 条评论热门最新