计算机科学|传统的知识表示

知识图谱定义 知识图谱旨在从数据中识别、发现和推断事物与概念之间的复杂关系,是事物关系的可计算模型.知识图谱的构建涉及知识建莫、关系抽取、图存储、关系推理、实体融合等多方面的技术,而知识图谱 应用则涉及语义搜索、智能问答、语言理解、决策分析等多个领域.
工业知识图谱应用 (1) 可视化展示
基于知识图谱,可以提供数据的可视化展示,比如通过一个设备编号, 知识图谱会呈现与之相关的状态信息、其他相关的设备和人员信息"通过知 识图谱的可视化展示把复杂的信息非常直观地呈现出来,使得人们对工业生 产整体关联的情况一目了然"
(2) 生产故障诊断
工业生产制造过程在人员生产操作、机械设备运转、企业生产信息管理 三者结合的状况下,较难做出精细的防呆机制设计。因此,在生产环节的人 与设备、设备与企业生产信息管理、人与企业生产信息管理之间的交互过程 中出现的各种异常状况都可能导致生产流程中断,影响生产效率和进度。工 业知识图谱的构建过程,使得工业生产中的人员操作流、机械设备运转流、 企业生产管理信息流三者有机地融合在一起,其间形成的大规模、多层级、 立体化、标准化的数据能够帮助工业企业最大限度地建立丰富的知识图谱实 体库、属性库和实体间关联关系.借助知识图谱,制造企业的生产管理人员 可以迅速地从宏观数据层面发现故障位置,并下钻到微观数据层面,定位故 障原因
(3) 产品质量追溯
针对工业生产制造的产品生命周期,基于零部件物料采购、仓储、工艺 流程设计、生产加工、组装、包装、入库、物流、销售、维保等一系列流程 相关的数据集建立起来的知识图谱可以帮助制造企业追溯每一件产品的完整 制造过程和生命周期,建立健全产品质量追踪和改进机制,在新产品研发方 面也能发挥重大的作用。
(4) 机械设备寿命预测
生产线上的各种设备及其零部件在重复的生产中产生了海量的时间序列 数据(状态数据、运动流数据、局部和全局图像数据、视频数据)。通过大 数据技术和机器学习的相关算法,可以计算出机械设备的故障规律.每台设 备及其零部件的早期故障期、偶发故障期、严重故障期规律各不相同,把这 些实体关系纳入工业制造知识图谱后,可以帮助企业预测各台机械设备及其 零部件的使用寿命,做到提前防呆,减少机械设备故障,降低安全事故.
(5) 辅助柔性生产
制造企业想要高效地实现多品种、小批量的柔性生产,需要人、机、 料、法、环、仓等多个环节的精密配合。知识图谱的应用可以帮助企业更加 便捷地利用这些环节中大量的知识实体及其关联关系,提升生产的灵活性和 应变能力。
知识图谱表示与建模 分为基于离散符号和基于连续向量的知识表示:
基于离散符号:RDF、OWL
基于连续向量:嵌入、神经网络
向量表示的另外一个好处是将推理过程转化为向量’ 矩阵或张 量之间的计算,这摆脱了传统基于符号搜索的推理计算方式,效率更高。但 知识向量化有一个比较大的缺点是丢失了符号表示的可解释性。
例如,在自然语言处理中,可以为句子中的每个词学习一个向量表示(Word Embedding)或分布式 向量表示(Distributed Vector Representation)。在图像视频中可以为每个视觉对象学习一个向量表示。例如,一个视觉感知的「树」,怎样和大脑 中有关「树」的概念对应起来;关于「树」的大段自然语言描述又怎样和知识图谱中的「树」的概念定义联起来。
一阶谓词逻辑 谓词逻辑是命题逻辑的扩充和发展,它将一个原子命题分解成个体和谓词两个组成部分。在谓词公式 P(x) 中,P 称为谓词,x 称为个体变元,若 x 是一元的,称为一元谓词, P(x,y) 称为二元谓词。在谓词中,个体可以为常量,变量,函数。若谓词中的个体都为常量,变量或函数,则称它为一阶谓词,如果个体本身是谓词,称为二阶谓词,依次类推。
霍恩规则逻辑 霍恩子句是带有最多一个肯定文字的子句,霍恩逻辑是一阶逻辑的子集
语义网络 每个节点代表一个概念,每条边代表语义关系,相当于三元组(节点1、联想弧、节点2)
缺点:无形式化语法,就是说表达的是概念节点之间的关系,无法表示实例节点
无形式化语义,不能保证不存在二意性
框架系统 一个框架由若干个「槽」结构组 成,每个槽又可分为若干个「侧面」,槽用于描述对象某一方面的属性;侧面用于描述相应属性的一个方面;槽和侧面所具有的属性值分别称为槽值和 侧面值.
计算机科学|传统的知识表示
文章图片

计算机科学|传统的知识表示
文章图片
计算机科学|传统的知识表示
文章图片

基于符号 RDF
三元组,RDF主语是一个个体,个体是类的实例,谓语是一个属性,宾语可以是一个个体
计算机科学|传统的知识表示
文章图片

全局标识URI
计算机科学|传统的知识表示
文章图片

前缀URI
计算机科学|传统的知识表示
文章图片

空白节点
计算机科学|传统的知识表示
文章图片

RDFS
RDF用到了类以及属性描述个体之间的关系。这些类和属性由模式 (schema)定义。RDF Schema (RDF模式,简称RDFS)提供了对类和属性的 简单描述,从而给RDF数据提供词汇建模的语言。更丰富的定义则需要用 到OWL本体描述语言。
计算机科学|传统的知识表示
文章图片

计算机科学|传统的知识表示
文章图片

RDF Schema通过这样的方式描述不同词汇集的元数据之间的关系,为网络上统一格式的元数据交换打下基础。
知识被分为两类,一类是数据 层面的知识,例如haofen type Person (haofen是Person类的一个实 例),另外一类是模式层面的知识,例如speaker domain Person (speaker 属性的定义域是Person类
计算机科学|传统的知识表示
文章图片

XML
XML 被设计用来传输和存储数据,其焦点是数据的内容。HTML 被设计用来显示数据,其焦点是数据的外观。
但是 XML 不会做任何事情。XML 被设计用来结构化、存储以及传输信息。
XML 应用于 Web 开发的许多方面,常用于简化数据的存储和共享。
XML 文档形成了一种树结构,它从"根部"开始,然后扩展到"枝叶"。
计算机科学|传统的知识表示
文章图片

XML 必须包含根元素,它是所有其他元素的父元素,比如以下实例中 root 就是根元素:

.....

XML 声明文件的可选部分,如果存在需要放在文档的第一行,如下所示:

在 XML 中,省略关闭标签是非法的。所有元素都必须有关闭标签:
This is a paragraph.


XML 标签对大小写敏感。标签 与标签 是不同的。
必须使用相同的大小写来编写打开标签和关闭标签:
这是错误的 这是正确的

XML 必须正确嵌套:正确嵌套的意思是:由于 元素是在 元素内打开的,那么它必须在 元素内关闭。
XML 属性值必须加引号

Tove Jani

为了避免这个错误,请用实体引用来代替 “<” 字符:
if salary < 1000 then

< < less than > > greater than & & ampersand ' ' apostrophe " " quotation mark

XML 中的注释
XML 元素必须遵循以下命名规则:
名称可以包含字母、数字以及其他的字符
名称不能以数字或者标点符号开始
名称不能以字母 xml(或者 XML、Xml 等等)开始
名称不能包含空格
XML 属性必须加引号
属性值必须被引号包围,不过单引号和双引号均可使用。比如一个人的性别,person 元素可以这样写:

XML 元素 vs. 属性
请看这些实例:
Anna Smith

female Anna Smith

在第一个实例中,sex 是一个属性。在第二个实例中,sex 是一个元素。这两个实例都提供相同的信息。
例子:
Belgian Waffles$5.95 Two of our famous Belgian Waffles with plenty of real maple syrup 650 Strawberry Belgian Waffles【计算机科学|传统的知识表示】$7.95 Light Belgian waffles covered with strawberries and whipped cream 900 Berry-Berry Belgian Waffles$8.95 Light Belgian waffles covered with an assortment of fresh berries and whipped cream 900 French Toast$4.50 Thick slices made from our homemade sourdough bread 600 Homestyle Breakfast$6.95 Two eggs, bacon or sausage, toast, and our ever-popular hash browns 950

创建 XMLHttpRequest 对象的语法:
**xmlhttp=new XMLHttpRequest(); **

RDF
RDF(资源描述框架)是描述网络资源的 W3C 标准, ,比如网页的标题、作者、修改日期、内容以及版权信息等。
RDF 使用 Web 标识符 (URIs) 来标识资源。
RDF 使用属性和属性值来描述资源。RDF 使用 Web 标识符来标识事物,并通过属性和属性值来描述资源。对资源、属性和属性值的解释:
资源是可拥有 URI 的任何事物,比如 “https://www.runoob.com//rdf”
属性是拥有名称的资源,比如 “author” 或 “homepage”
属性值是某个属性的值,比如 “David” 或 “https://www.runoob.com/” (请注意一个属性值可以是另外一个资源)
资源、属性和属性值的组合可形成一个陈述(被称为陈述的主体、谓语和客体)。请看一些陈述的具体例子,来加深理解:
陈述:“The author of https://www.runoob.com//rdf is David.”
陈述的主体是:https://www.runoob.com//rdf
谓语是:author
客体是:David
RDF 的主要元素是 以及可表示某个资源的 元素。
rdf:RDF RDF 文档的根元素。它把 XML 文档定义为一个 RDF 文档。它也包含了对 RDF 命名空间的引用:
xmlns:rdf=“http://www.w3.org/1999/02/22-rdf-syntax-ns#”>
…Description goes here…

rdf:Description 元素 rdf:Description 元素可通过 about 属性标识一个资源。
rdf:Description 元素可包含描述资源的那些元素:
xmlns:rdf=“http://www.w3.org/1999/02/22-rdf-syntax-ns#”
xmlns:cd=“http://www.recshop.fake/cd#”>
rdf:about=“http://www.recshop.fake/cd/Empire Burlesque”>
cd:artistBob Dylan
cd:countryUSA
cd:companyColumbia
cd:price10.90
cd:year1985


artist、country、company、price 以及 year 这些元素被定义在命名空间 http://www.recshop.fake/cd# 中。此命名空间在 RDF 之外(并非 RDF 的组成部分)。RDF 仅仅定义了这个框架。而 artist、country、company、price 以及 year 这些元素必须被其他人(公司、组织或个人等)进行定义。
属性(property)来定义属性(attribute) 属性元素(property elements)也可作为属性(attributes)来被定义(取代元素):
xmlns:rdf=“http://www.w3.org/1999/02/22-rdf-syntax-ns#”
xmlns:cd=“http://www.recshop.fake/cd#”>
rdf:about=“http://www.recshop.fake/cd/Empire Burlesque”
cd:artist=“Bob Dylan” cd:country=“USA”
cd:company=“Columbia” cd:price=“10.90”
cd:year=“1985” />

rdf:Bag 元素 rdf:Bag 元素用于描述一个规定为无序的值的列表。
rdf:Bag 元素可包含重复的值。
rdf:Seq 元素 rdf:Seq 元素用于描述一个规定为有序的值的列表(比如一个字母顺序的排序)。
rdf:Bag 元素可包含重复的值。
rdf:Alt 元素 rdf:Alt 元素用于一个可替换的值的列表(用户仅可选择这些值的其中之一)。
rdf:parseType=“Collection” 属性 RDF 集合用于描述仅包含指定成员的组。
OWL
计算机科学|传统的知识表示
文章图片

(1)等价性声明.声明两个类、属性和实例是等价的C如:
exp:运动员 owl : equivalence lass exp:体育选手
exp: 获得 owl ; equivalentProperty exp: 取得
exp:运动员 A ow I : same I nd i v i dua I As exp:小明
以上三个三元组分别声明了两个类、两个属性以及两个个体是等价的, exp是命名空间http: //wvm. examp I e. or/的别称,命名空间是唯一识别的 一套名字,用来避免名字冲突,在OWL中可以是一个URL。
(2)属性传递性声明。声明一个属性是传递关系e例如,exp; ancestor rdf; type owl ; Trans i t i veProperty 指的是 exp:ancestor 是一个传递关 系。如果一个属性被声明为传递,则由a exp; ancestor b和b exp:ancestor c 可以推出 a exp:ancestor c。例如 exp:小明
exp:ancestor exp: 小林;exp: 小林 exp:ancestor exp: 小志,根据上述 声明,可以推出exp:小明exp:ancestor exp:小志。
(3)属性互逆声明。声明两个属性有互逆的关系"例如,exp ancestor owl : inverseOf exp; descendant 指的是 exp:ancestor 和 exp:descendant 是互逆的。如果exp:小明exp ancestor exp:小林,根据上述声明,可 以推出 exp:小林 exp:descendant exp:小明。
(4)属性的函数性声明"声明一个属性是函数。例如,exp:hasMother rdf; type ow I : Funct i ona I Property 指的是 exp: hasMother 是一个函数, 即一个生物只能有一个母亲.
(5)属性的对称性声明"声明一个属性是对称的"例如exp:friend rdf; type owl:Symmetr ieProperty 指的是 exp:fr iend 是一个具有对称性 的属性;如果exp:小明exp; fr iend exp:小林,根据上述声明,有 exp:小林 exp:friend exp:小明&
(6)属性的全称限定声明.声明一个属性是全称限定.如:
exp:Person owl:alIValuesFrom exp:Women
exp:Person owl; onProperty exp:hasMother
这个说明exp; hasMother在主语属于exp; Person类的条件下,宾语 的取值只能来自exp: Women类。
(7)属性的存在限定声明.声明一个属性是存在限定.如:
exp:Semant i cWebPaper owI:someVaIuesFrom exp:AAA I
exp:Semant i cWebPaper owl:onProperty exp:pub Iished In
这个说明 exp; pub I i shed In 在主语属于 exp: Semant i cWebPaper 类的 条件下,宾语的取值部分来自exp:AAAI类.上面的三元组相当于:关于语 义网的论文部分发表在AAAI上.
(8)属性的基数限定声明.声明一个属性的基数"如:
exp:Person owl; cardinaIity “1” "xsd; integer
exp:Person owl; onProperty exp:hasMother
指的是exp:hasMother在主语属于exp; Person类的条件下,宾语的 取值只能有一个,Fl J的数据类型被声明为xsd; integer,这是基数约束, 本质上属于属性的局部约束.
(9)相交的类声明。声明一个类是等价于两个类相交。如:
exp:Mother owl:intersectionOf _tmp
_tmp rdf; type rdfs; Collection
_tmp rdfs; member exp:Person
_tmp rdfs; member exp:HasChiIdren
指*mp是临时资源,它是rdfs; Col lection类型,是一个容器,它的 两个成员是exp:Person和exp: HasChi Idren。上述三元组说明 exp :Mother 是 exp: Person 和 exp; HasCh i Idren 两个类的交集。
JSON-LD
JSON文档表示一个人。人们很容易推断这里的含义:「name」是人的名 字,FhomepageJ是其主页,「image」是其某种照片。当然,机器不理解 Fname J和「image J这样的术语< JSON-LD通过引入规范的术语表示,例如 统一化表示「name」、「homepage」和「image J的UR I,使得数据交换和机 器理解成为基础"如下所示:
计算机科学|传统的知识表示
文章图片

    推荐阅读