如何应用基础教育知识图谱,打造教学资源的搜索与推荐引擎

EduBrain
2020/06/01 18:47 Comment(s)

如何应用基础教育知识图谱,打造教学资源的搜索与推荐引擎

知识图谱


知识图谱(Knowledge Graph)是计算机中进行知识表示的重要方式,是人工智能重要分支知识工程在大数据环境中的成功应用。知识图谱是一种语义网络,它利用实体、关系、属性这些基本单位,以符号的形式描述了物理世界中不同的概念和概念之间的相互关系。


基础教育知识图谱

人工智能技术在基础教育领域的应用,促使计算机必须具备基础教育知识的认知能力和理解能力,因此,如何在计算机中表示基础教育的知识成为一个挑战!知识图谱是2012年谷歌公司提出的用于表示互联网知识的技术,其本质是万维网发明人Tim Berners Lee于1998年提出的语义网(Semantic Web)的理念。知识图谱通过实体和关系来描述客观世界中的概念及其相互关系,基本组成单元是三元组“实体-关系-实体”或者“实体-属性-值”。


清华大学在国家863课题“基于大数据的类人智能关键技术与系统”的支持下,构建了面向基础教育的海量知识资源和知识图谱,把知识图谱技术用于表示基础教育领域的知识,构造出一个包含1000多个类、160万个实例、4000多种属性、2200万条三元组的基础教育知识图谱。



图1. 基础教育知识图谱

      

源自语义网的知识图谱是一个巨大的知识网络,网络中的节点表示实体,而网络中的边表示实体和实体之间的关系,实体包含概念和实例两种,每个实体还有很多属性-值对来描述实体的内在特性。三元组是知识图谱中描述知识的组织单元,以下图有关语文的部分图谱为例,三元组(《蜀道难》,作者,李白)描述了实体“李白”和“《蜀道难》”之间是一种“作者”关系,而实体“李白”和“李商隐”之间通过“三李”这个实体连接起来,另外一个三元组(李白,类型,诗人)描述了实体“李白”在基础教育知识图谱中的类别是“诗人”。通过三元组,可以把基础教育中的许多事实类知识组织成为一个巨大的知识网络,从中发现知识之间的联系。虽然知识图谱并不是计算机表示人类知识的唯一方式,但它可以把大量的事实类知识准确的表达出来,为实现计算机的认知智能提供坚实基础。


      

图2. 诗人图谱


1、知识卡片


教育场景的知识图谱更是能表征知识之间的关联度以及前序后序关系。课前可以帮助教师准备授课内容中的知识点;课中可以分析课堂教学内容的思路与关联关系,对教学内容进行评估;课后可以为学生生成所讲授知识点的知识卡片,方便学生进行复习掌握。


在教师授课过程中,通过对课堂录音文本进行语音识别,然后对知识点进行关联分析,可以有效地统计老师授课知识点的分布,以及知识点之间的相互联系。在获得知识点后,根据基础教育知识图谱可以获取每个知识点的分类、定义、内容、解释以及先验知识等,比如获取到的知识点“李白”,根据图谱可以找到李白的属性信息,如表1所示:


表1.李白在图谱中的属性信息

学课

语文

分类

人物

定义

字太白,号青莲居士,有“诗仙”之称,唐代浪漫主义诗人

内容

(701-762)唐代最伟大的浪漫主义诗人。字太白,号青莲居士,后人称其为“诗仙”,陇西成纪人。代表作有《渡荆门送别》《望天门山》《闻王昌龄左迁龙标遥有此寄》《月下独酌》《宣州谢朓楼饯别校书叔云》《行路难》等。

解释

字太白,号青莲居士,有“诗仙”之称,唐代浪漫主义诗人

时代

盛唐

根据基础教育知识图谱,可以建立一节课中知识点的卡片信息,该卡片可以作为学生学习时的参考,或者作为课前的基础笔记供学生参考。


2、 知识搜索


知识搜索应用是一个垂直领域(基础教育)的搜索,提供了类似普通搜索引擎的搜索界面,用户输入感兴趣的知识点,返回图谱中的知识信息。以下图为例,用户对“牛顿”这个知识点感兴趣并进行搜索,返回结果中,左半部是中国所有基础教育教材和教辅中包含了“牛顿”这个知识点的页面,比如“牛顿”分别出现在“物理”、“历史”、“数学”这三门课程中;一般说来,在物理和历史教材中介绍牛顿是比较普遍的,但是在数学教材中介绍牛顿并不为人所熟知,很多人并不清楚牛顿与数学的关系。这个疑问在返回结果的右半部可以找到答案,在右半部中间部分列出了以牛顿为中心的关系图谱,可以看到牛顿与微积分有关系,因为牛顿也是微积分的发明人之一,因此牛顿出现在“数学”课程中就是合理的,但是由于微积分往往到大学才学到,在中学阶段不知道牛顿与数学的关系也是情有可原。

      

图3. 知识搜索“牛顿”

      

相比在通用搜索引擎中搜索基础教育的内容,基于基础教育知识图谱的知识搜索有两个很大的优点:1)内容高度集中在基础教育领域的教材、教辅、课外读物中,不会出现不受控的内容,有利于青少年的健康成长;2)知识图谱呈现出知识点的关系图谱,帮助用户更好的进行知识关联与知识联想。


3、知识快照


知识快照是基础教育知识图谱中的子图,以图的方式呈现出部分实体与关系,其用途是帮助进行单学科以及跨学科的知识梳理。例如对于单门学科(如语文),可以将该学科一个学期内所讲授知识点组织成若干张知识快照,十分有助于老师教学与学生学习;比如说,输入一个历史知识点“江姐”,就可以在图谱中以实体“江姐”为起点生成一张图,呈现出与“江姐”有关的其他实体和关系;还可以输入两个知识点如“爱因斯坦”与“唐太宗”,利用图谱生成一张包含实体“爱因斯坦”与“唐太宗”的图。更有意思的是,可以生成跨学科的知识快照,帮助老师与学生进行知识的融汇贯通,以下图为例,总共有34个实体,涉及到语文历史地理化学政治物理等六个学科的知识点,总共46条边,涵盖了26种关系。从图中可以发现很多有意思的联系,比如“苏轼”和“诺贝尔奖”的联系、“盖亚”和“江姐”之间的联系。由于中学老师讲课都是按照单学科方式来组织,而知识快照这种实现跨学科知识关联的能力对于老师与学生极有帮助。

      

图4. 跨学科知识快照

      

4、 知识问答


知识问答是知识图谱的一种智能化应用形式,用户给出自然语言问题,问答系统将其转化为能够对知识图谱进行查询的语句如SPARQL,将查询出的知识作为答案反馈给用户。它能够充分利用知识图谱中的结构化数据为用户提供非常简洁、精确的答案,知识图谱问答常用于专家系统、智能客服助理、生活助手等场景中。以下图为例,可以用自然语言提问语文学科的事实类问题,例如问“《题西林壁》的作者是谁?”,在问答系统返回答案“苏轼”的同时,还会给出回答这个问题时用到的实体“题西林壁”。这个问答系统是基础教育垂直领域的问答技术,并可通过问答API的方式服务于其他“教育机器人”应用。

      

图5. 事实类学科知识问答

      

5、 知识链接

知识链接是把基础教育知识图谱中的实体与教材教辅或者参考书进行链接,也就是当教材等书籍的文字中出现了知识图谱中的实体时候,通过算法将其链接到图谱中的具体实体。以下图为例,课外书《中华民族遗传多样性研究》的书名中提到了生物课程的知识点“遗传”,通过实体链接算法识别到该知识点应该链接到基础教育知识图谱中的实体“遗传”,于是我们在该书籍电子版中增加了一个可点击的网络链接(见“遗传”的蓝色下划线),当读者在阅读该书电子版时,点击书名中的“遗传”就可以跳转到基础教育知识图谱中的生物实体“遗传”的知识卡片,展示出“遗传”是一种“生物现象”,它的分类信息、定义和作用等等。

      

      

图6. 图书的知识链接

      

我们将知识链接算法对一万本课外读物电子版(由国家图书馆提供)进行链接计算,把这些图书的内容链接到知识图谱的实体;同理,知识链接算法可以对任意一本电子读物进行运算,来给电子读物增加知识链接。知识链接的作用在于,当读者阅读这些添加了知识链接的图书时,可以方便的跳转到对应知识点的知识卡片中,增强了基础教育知识图谱的传播性。


内容来自《建设人工智能驱动型课堂》蓝皮书,下载蓝皮书完整版,查看更多内容。

方案详情
AI 技术体验
下载蓝皮书

关于清帆科技


清帆科技是⼀家专注于教育的⼈⼯智能公司。基于5G的超⾼速率、超⼤宽频、超低时延等优势,通过知识图谱、情感计算、⾏为分析等AI视频分析技术,为学校和企业提供两大教育应用智能解决方案:Proactive Safety™️主动安全及EduBrain ® 智慧教育。

Proactive Safety主动安全

Proactive Safety®主动安全解决方案,将安防由被动变主动。利用人体姿态识别等人工智能技术实现闯入、围栏检测、聚众、离开岗位、可疑停留、画面遮挡等主动呼入式预警,从事件发生到产生预警仅需2.6秒,为校园等公共场所实现安全保障。

EduBrain®智慧教育

EduBrain®智慧教育解决方案,利用知识图谱、情感计算、语音分析等人工智能技术,面向学校课堂、研讨型教室、及1V1在线咨询企业提供视频数据分析。帮助学校高效管理、科学决策,助推教师专业发展,提升企业管理效率和收益。


关注清帆科技微信公众号