
第1章 绪论
1.1 什么是知识
知识是人们在改造客观世界的过程中所积累的经验和总结升华的产物。将由对客观世界的描述、名称、数据、数字、经验所构成的信息进行加工整理即形成了知识。知识作为一个概念,定义起来是比较困难的,不同的人有不同的理解,例如:
费根鲍姆(Feigenbaum):知识是经过削减、塑造、解释和转换的信息[1];
伯恩斯坦(Bernstein):知识是由特定领域的描述、关系和过程组成的[2];
哈耶斯罗斯(Hayes-roth):知识是事实、信念和启发式规则[3]。
知识作为人类对客观世界认识的表达,具有相对的正确性、局限性和抽象性。没有绝对正确的真理,也没有一成不变的真理。知识受人类自身认知的限制和影响,在不同的环境和上下文中,正确性也会发生变化。同时,人类的知识也具有不完备性、不确定性和模糊性等特点。例如,篮球运动员的身高需要高,这里所谓的“高”,就是一个相对模糊和不确定的表达,同时该知识不是完备的,会有例外的情况出现。人类的智能行为在很大程度上是在知识和对知识的推理上进行的。人类在生理活动和社会实践中,通过对海量数据的采集,可获取能够形成某些概念的信息,并在与这些信息的不断交互中提炼、加工、抽象,形成一套系统性的定义、描述和公理系统。这些高端信息被存储并记忆,用于进一步指导人类的活动。这就是知识的力量。
人类最原始的知识源自人类的感知。这些知识虽然总能通过感知验证,但由于人类的感知存在错误,因此知识不总是对的。比如,依据人类的一般感知,重物体的下落速度会比轻物体快,这一通过感知得到的结果并不正确,因为物理学告诉我们,在不考虑空气阻力的情况下,轻、重物体的下落速度是完全相同的。所以,知识本身也是存在局限性的。知识作为人类在社会生产活动中产生概念化和体系化的精华信息,非常便于学习、理解、传播和推理。因此,人类把知识作为认识世界、理解世界和创造世界的重要基石,是人类智能的本质特征之一。
在人工智能领域的研究中,知识显然占有非常重要的地位。相比人类的知识,我们这里的知识特指用计算机可以表示、存储和计算的一种特殊信息,通过知识金字塔,可以表达相关的概念层次和用语,如图1-1所示。具体来说,人类社会生活产生了海量的数据。这些数据可作为人工智能模型最原始和最基础的输入。其中存在大量无用的内容和噪声,在此之上经过处理提取出的有用的、相关的数据,被称为信息。这些信息可以是结构化的、半结构化的或标签化的。如果从信息论的角度思考,这些信息是具有相对较低信息熵的数据。在此之上,对信息进一步的加工和处理所得到的普适、抽象和正确的信息,被称为知识,如某个领域的概念、概念之间的关系、概念的属性、实体的描述及规则等。更进一步能够产生其他知识的知识,如本体论、公理体系等,被称为元知识或哲学(形而上学)。本书知识图谱所涉及的知识,就是在信息层之上的更高级信息。因此,知识是蕴含在数据中的经过凝练的数据和信息,是信息中的精华。一个知识点可以覆盖很多信息。通过知识,可以更好地理解信息,可以推理更多的知识,并对未知的信息做出预测,从而体现出系统的智能性。虽然通常意义下的信息或字节流是可以编码并计算的,但知识本身是一个相对独立的符号系统,对知识的编码和数字化必须涉及其背后所代表的具体语义信息的编码,在实际应用中往往是不可计算的。知识计算要同时考虑知识的符号表征、逻辑表征和语义表征,具有较大的抽象性与复杂性,使得知识工程和知识计算在人工智能的研究中具有独特而重要的地位。

图1-1 知识金字塔[4]