一. 知识融合简介知识融合,即合并两个知识图谱(本体),基本的问题都是研究怎样将来自多个来源的关于同一个实体或概念的描述信息融合起来。需要确认的是: 等价实例 等价类/子类 等价属性/子属性 一个例子如上图所...
一. 图数据库简介图数据库源起欧拉和图理论(graph theory),也称为面向/基于图的数据库,对应的英文是Graph Database。图数据库的基本含义是以“图”这种数据结构存储和查询数据。它的数据模型主要是以节点和...
一. 知识挖掘知识挖掘是指从数据中获取实体及新的实体链接和新的关联规则等信息。主要的技术包含实体的链接与消歧、知识规则挖掘、知识图谱表示学习等。其中实体链接与消歧为知识的内容挖掘,知识规则挖掘属于结构挖掘,表示学习则是将知识图谱映射到...
一. 知识抽取的概念知识抽取,即从不同来源、不同结构的数据中进行知识提取,形成知识(结构化数据)存入到知识图谱。大体的任务分类与对应技术如下图所示: 1. 知识抽取的子任务 命名实体识别 检测: 北京是忙碌的城市。 [北京]: 实体...
一. 知识表示历史1. 知识的概念知识表示就是对知识的一种描述,或者说是对知识的一组约定,一种计算机可以接受的用于描述知识的数据结构。它是机器通往智能的基础,使得机器可以像人一样运用知识。 知识具有相对正确性、不确定性、可表示性以及可...
一. 本体论1. 定义维基:本体实际上就是对特定领域之中某套概念及其相互之间关系的形式化表达(formal representation)。 本体就是对那些可能相对于某一智能体(agent)或智能体群体而存在的概念和关系的一种描述。 ...
一. 简介前面使用 Silk 工具进行知识融合。但实际操作中发现,当数据量较大时,会出现内存爆掉的情况。同时由于 Silk 的 SPARQL 查询语句比较复杂,当数据量大时,获取同样的数据要慢上很多倍。因此我这里将数据分成一个一个的小...
一. 简介silk 是一个集成异构数据源的开源框架。编程语言为Python。其特点为: 提供了专门的 Silk-LSL 语言来进行具体处理。 提供图形化用户界面- Silk Workbench,用户可以很方便的进行记录链接。 Si...
一. 简介 Apache Jena是专门用于语义网本体操作的开源Java框架,其提供RDF和SPARQL API,来查询、修改本体和进行本体推理,并且提供了TDB和Fuseki来存储和管理三元组。 Fuseki是Jena提供的SP...
一. 简介Direct mapping 本质上是通过编写启发式规则将数据库中的表转换为RDF三元组, 但该方式灵活性不强。这里我们用 D2RQ 工具,它的主要功能是提供以虚拟的、只读的RDF图形式进入到关系型数据库中。也就是说比如你通...