
本章小结
从本书“导论”完成的讨论来看,NLP问题的研究确实对整个AI的研究来说具有指标性的意义。但对于该问题的哲学面向的了解,却一直没有被NLP学界充分地意识到。毋宁说,目前NLP学界研究的话题取向是完全被偶然的工程学需要所牵导的,而缺乏哲学(甚至是科学)层面上的整体谋划。更有甚者,在笔者所了解的范围内,语言哲学界目前也缺乏全面介入NLP研究的充分理论冲动。这种“两张皮互不相扰”的状态显然是不能让人满意的。此外,同样令人感到担忧的是,随着国际科技竞争与交流环境的改变,国内很多与AI相关的投资方向都被集中到了精密芯片的制造行业,与之同时,投向貌似更“虚”的AI架构研究的注意力却明显不足。殊不知工程师们对于高性能芯片算力的无休止的索求,在哲学层面上就已经预设了优秀的NLP机制与其他AI机制的运作乃是基于大数据的(因为只有海量的数据才会倒逼人们去寻找巨大的算力与之匹配)。然而,在前文的分析中我们已经看到,这一预设本身可能就是错误的,因为语言机制运作之本质,便是通过对于少量核心规则与核心词汇的掌握而具备创生海量表达式的潜能——而并非是通过对于海量现成的表达式的构建方式的模仿,建立出一个又一个“特设”(ad hoc)的语言模型,最终陷入“以有涯追无涯”的困境。从这个角度看,目前全球的NLP研究也好,整个AI工业也罢,都尚且处在“盲人摸象”的阶段,而远远没有资格戴上“成熟科学”的王冠。
而笔者撰写本书的目的,就是从哲学的角度,审视与剖析NLP研究背后的哲学预设,并为其未来的可能发展方向进行提点。相比于图书市场上的与AI相关的其他通俗类书籍,本书的内容具有如下特点:
第一,本书绝对不属于“画馅饼类”的AI科普图书,即向读者许诺美丽而空洞的AI发展的未来,以便暗中为一些其实不那么成熟的科技投资方案助力。相反,本书的用力,恰恰与其相去甚远:本书试图告诉大家,AI发展的未来到底有多少激流险滩,因此,我们的研究需要的与其说是金钱,还不如说是耐心与时间。需要指出的是,此类图书在西方世界早就有特定的生态位,美国哲学家德雷福斯的《计算机不能做什么——人工智能的极限》便是此类图书的优秀代表。19但在汉语图书市场,此类批判性的图书还是比较少见的。
第二,本书聚焦的乃是AI研究中的NLP问题,并试图从哲学的角度对NLP问题背后的哲学理论问题进行反思。考虑到语言哲学一向被视为哲学诸分支中与语言问题最相关的分支,所以很多人或许会期待英美国家的语言分析哲学在此类跨学科对话中占据显著的位置。然而,基于下面几点考虑,笔者将适当调低学院意义上的语言分析哲学在此类讨论中所占有的权重:(甲)学院意义上的语言分析哲学往往基于英语思维的霸权地位,以及对于现代数理逻辑(一阶谓词逻辑与命题逻辑)的全面依赖,而笔者既不认为英语思维具有针对各种非英语语料的覆盖力,也不认为数理逻辑是处理日常语言的合适技术工具。毋宁说,很多与语言相关的谜题之所以无法被解开,恰恰是因为相关的解决思路,长期被与数理逻辑的技术工具互为表里的“真值函项语义学”绑架,使得我们始终无法直面那些无法被外延化的语义与语用关系。而在这种情况下,对于欧陆哲学资源的适当倾斜,将为对于英美分析哲学思维的过分依赖提供某种“解毒剂”。
第三,除了对于哲学资源的依赖之外,本书也将包含一定篇幅的对于语言学问题的讨论,特别是基于认知语言学的各种分析。同时,对于日语等小语种语料的讨论,也会在本书的讨论中占据比较高的权重。这样的讨论将既增加本书所涉及的经验材料的丰富性,也会帮助读者理解人类语言现象的多样性与复杂性。而这样的处理方式,也在相当程度上与上面所提到的对于英语思维霸权的警觉心相互呼应。
不过,最后需要提醒读者注意的是,“警惕英语思维霸权”,绝不等于要放弃学习英语,因为作为学术研究基本工具的英语早就在今日的学术舞台上扮演了“现代拉丁语”的角色。实际上,那些对颠覆英语思维霸权特别有用的语言学理论——特别是认知语言学的理论——主要都是在英语学术平台上发表的,中国的研究者如果不能快速通读英语文献,对于这些理论的利用本身就会成为问题。此外,任何有过用英文发表语言学与亚洲哲学论文经历的人都知道,使用英语读者能够充分理解的语言去发表那些反对英语思维霸权的论文,在技术上完全是可行的,因为英语本身就是一种充满了各种外来语插入端口的高度多样化的表达工具。笔者个人所担心的问题毋宁说是:主流的NLP研究者懂的语言太少(有些人只懂英语),他们对人类语言的丰富性往往缺乏真正的“现象学体验”,因此,其所设计的产品,也很难会考虑到操不同母语的用户的个性化要求。而要解决这个问题,我们就应当鼓励NLP的研究者去学习英语之外的语言,而不像某些人所鼓吹的那样,“懂汉语就够了”。实际上,对于一般中国人而言,学习英语的时间与精力成本要远远小于学习日语、韩语等黏着语所带来的成本(毕竟一般中国人从小就已经熟悉了拉丁字母),倘若连学习英语都畏惧,那岂不是以汉语世界的母语偏执,取代了英语世界的母语偏执了呢?此外,再考虑到AI技术本身就非常容易沦为主流语言霸凌弱势语言的技术工具,未来的理想NLP研究者就更应当在多元文化意识方面超过一般人的水准了。
然而,令人遗憾的是,随着美国Open AI公司开发的ChatGPT技术所获得的短期成功,基于主流语言(特别是英语)的语料学习获得相关的大语言模型,貌似已经成为当下NLP研究的主流。对这一主流路径之合理性的质疑,也将构成本书的重要内容。
有鉴于对ChatGPT的迷信已经深深嵌入当下公众关于AI的主流意见,在下面的讨论中,笔者将花费两个章节的篇幅去破除这种迷信。然后,我们再转入对于前ChatGPT时代的NLP历史的讨论,由此为辩护一种别样的NLP路线提供基础。