(国标委发〔2023〕37号)的安排,国家标准《人工智能 知识图谱 知识交换协议》由全国信息技术标准化技术委员会(SAC/TC28)提出并归口,由中国电子技术标准化研究院主办,计划编号为:20230714-T-469。
一、工作简况
1、任务来源
根据“国家标准化管理委员会下达2023年第二批国家标准制修订计划的通知”
(国标委发〔2023〕37号)的安排,国家标准《人工智能 知识图谱 知识交换协议》由全国信息技术标准化技术委员会(SAC/TC28)提出并归口,由中国电子技术标准化研究院主办,计划编号为:20230714-T-469。
本文件标准化对象为知识图谱,主题是针对知识图谱供应方、知识图谱集成方、知识图谱用户、知识图谱生态合作伙伴间知识交换协议框架、知识描述规则、基于文件的知识交换、基于消息的知识交换等。
2、起草单位和起草人分工
计划下达后,中国电子技术标准化研究院、厦门渊亭信息科技有限公司、深圳赛西信息技术有限公司、江苏赛西科技发展有限公司、杭州海康威视数字技术股份有限公司、同方知网数字出版技术股份有限公司、浪潮云洲工业互联网有限公司、中国科学院工程热物理研究所、武汉科技大学、蚂蚁科技集团股份有限公司等单位负责本文件的制定工作。
本文件主要起草人:xxx、xx、xx、xxx、xxx、xxx、xxxx。
中国电子技术标准化研究院为本文件主办单位,全面负责本文件的编制和管理工作;厦门渊亭信息科技有限公司、深圳赛西信息技术有限公司、江苏赛西科技发展有限公司、杭州海康威视数字技术股份有限公司、同方知网数字出版技术股份有限公司、浪潮云洲工业互联网有限公司、中国科学院工程热物理研究所作为核心起草单位参与部分内容的起草和确认工作。
主要起草人工作分工:中国电子技术标准化研究院xxx、xx主要负责本文件立项、工作计划的总体把握、主要内容确认等工作;中国电子技术标准化研究院xx主要负责本文件的试验验证等工作。
其他起草单位和起草人参与本文件编制过程的内容讨论和意见整理等工作。
3、主要工作过程
计划下达后,起草单位组成了标准起草工作组,立刻展开标准研制工作并确定了工作方案,标准内容包括知识图谱的技术框架中的知识图谱供应方、知识图谱集成方、知识图谱用户、知识图谱生态合作伙伴的主要活动、任务组成和质量一般性能等。时间节点安排大致如下:2024年5月完成征求意见稿、2024年8月 完成送审稿、2024年10月完成报批稿。
2023年9月-2024年1月,共组织召开了4次标准讨论会,主要讨论了标准架构和标准内容,确立了间知识交换协议框架、知识描述规则、基于文件的知识交换流程、基于消息的知识交换流程等,形成了《人工智能 知识图谱 知识交换协议》标准草案。
2024年3月26日,召开中心标准内审会。内审专家对知识交换协议结构、 知识描述规则、基于文件的知识交换、基于消息的知识交换相关技术内容提出了意见,根据专家意见对相关标准内容进行了修改完善,形成了《人工智能 知识图谱 知识交换协议》征求意见稿。
在整个标准起草过程中,为了保证条款的科学性、客观性以及可实施性,编制组对产学研用各相关方进行了调研,包括20余家知识图谱供应商、集成商等厂商以及10余家安全、数据、基础设施服务商和高校、科研院校,调研内容主要涉及针对知识描述规则、知识图谱文件结构、知识图谱间知识交换流程、多方知识交换消息体结构等。
期间由电子标准院针对标准化对象做了试验验证工作。详见“三、主要试 验情况分析”。
二、标准编制原则和确定主要内容的论据及解决的主要问题
1、编制原则
本文件为自主制定标准,在起草过程中依据了GB/T 1.1-2020《标准化工作导则 第1部分:标准化文件的结构和起草规则》的规定。
本文件对知识交换协议的构成框架进行了梳理,提出了知识交换协议可用于规范知识图谱在两方或多方间的知识交换,保证了本文件的通用性;同时,编制组由知识图谱产学研用各相关方60余家单位,通过充分调研、分析与验证,在充分考虑医疗、电力、制造、交通、金融等各行业应用合理性的前提下,编制技术
条款,保证了其技术内容的先进性和指导性;最后,本文件部分技术内容充分考 虑并引用了部分已发布基础通用类标准,进而保证了本文件的兼容性和可操作性0
2、确定主要内容的依据
本文件描述了知识交换协议框架,规定了知识描述规则、基于文件的知识交换流程、基于消息的知识交换流程0本文件适用于指导知识图谱及其应用系统的构建、应用、实施与维护0主要内容包括知识交换协议框架、知识描述规则、基于文件的知识交换流程、基于消息的知识交换流程等0
本文件在规划标准结构时,收集分析了知识图谱相关政策规划资料和W3C、 ISO、IEC、ISO/IEC JTC1、IEEE等标准化组织发布的标准情况,如RDF、RDFs、 OWL等标准0进一步,明确了RDF、RDFs、OWL等标准对知识图谱间知识交换过程中知识表示、知识建模、知识存储等活动的支撑作用,对本文件起到了指导性的作用0
本文件相关的术语和定义、符号和缩略语主要以国家标准GB/T 42131-2022
《人工智能 知识图谱技术框架》为参考0
在确定技术内容时,本文件主要依据知识图谱产业发展水平、产业生态构成、市场中相关构建或应用产品的形态进行了凝练,提取出共性的利益相关方、技术路径和主要活动,并经产学研用各方协商得出,保证了国标的基础通用性0
3、解决的主要问题
当前,人工智能发展进入新阶段,其迅速发展正在深刻改变人类社会生活、改变世界,成为国际竞争的新焦点和经济发展的新引擎0其中,如何从海量数据中获取有用的信息是人工智能关注的一个重要问题0知识图谱技术提供了一种从海量文本和图像等数据中抽取结构化知识的手段,是搜索引擎、问答系统等应用的核心技术0在国务院发布的《新一代人工智能发展规划》中明确指出要发展“知识计算引擎和知识服务技术”,重点突破知识加工、深度搜索和可视交互核心技术,实现对知识持续增量的自动获取,具备概念识别、实体发现、属性预测、知识演化建模和关系挖掘能力,形成涵盖数十亿实体规模的多源、多学科和多数据类型的跨媒体知识图谱0知识图谱技术提供了一种从海量文本和图像等数据中抽取结构化知识的手段,是搜索引擎、问答系统等应用的核心技术,并在金融证券、生物医疗、交通、教育、农业、电信、电商、出版等行业已有非常丰富的应用场
景0但是,目前还缺少一套规范化的知识图谱技术框架指导相关企业,特别是中小型企业和创业公司有效开展技术研发,同时与其他行业的现有系统之间实现互联互通和信息融合0存在的问题如下:
1)知识图谱中携带了实体类型、关系类型、属性等大量的本体和语义信息,而且交换完成后的知识单元还需与已有知识图谱进行融合才能实现有效应用,知识交换与融合过程较传统数据交换更为复杂0
2)缺少一套统一的知识交换协议指导知识图谱供应方、集成方、用户和生态合作伙伴开展知识图谱间的集成与跨域融合,阻碍了知识图谱间的互联互通和知识有序游动;
3)知识描述规则描述不统一、不明确,内容划分混乱;
4)知识交换类型、交换流程及主要组成活动间关系不明确0
本文件在编制过程中,通过参考大量已经发布的国内外标准,并广泛听取产学研用相关单位的意见和建议,结合知识图谱技术水平和应用现状,对知识图谱供应方、知识图谱集成方、知识图谱用户、知识图谱生态合作伙伴等利益相关方划分进行明确,提出了各利益相关方的输入输出关系和主要活动构成等0
三、主要试验情况分析
本文件制修订过程中,中国电子技术标准化研究院同时组织参编单位开展了标准验证工作0参编单位利用 34 项企业内部实践案例,对本文件中所涉及的知识图谱概念构成、技术框架、主要活动进行了对比自查0各单位自查反馈统计情况如表 1 所示0
表 1 自查反馈情况统计表
序号 | 自查内容 | 反馈情况 |
1 | 知识交换协议架构 | 32 家单位反馈符合,2 家单位反馈知识交 换类型未反映0 |
2 | 知识描述规则 | 34 家单位反馈符合,5 家单位反馈知识描述元素缺失,建议进一步补充,并给出描 述元数据0 |
3 | 基于文件的知识交换 | 29 家单位反馈符合,2 家单位反馈文件描 述要求、知识交互流程需补充响应交互模 |
式相关流程0 | ||
4 | 基于消息的知识交换 | 33 家单位反馈符合,1 家单位反馈需求知识消息体结构应增加概述,以说明消息的 类型0 |
经过自查,参编单位的知识图谱构建或应用平台能够满足本文件的规定0在知识交换协议架构方面,根据 2 家单位反馈的知识交换类型未反映问题,编制组对知识交换协议架构图和对应说明进行了修改完善;在知识描述规则方面,根据 5 家单位反馈的知识描述元素缺失和描述元数据不足等问题,编制组对知识描述
元素组成进行了修改;在基于消息的知识交换方面,根据 1 家单位反馈需求知识消息体结构应增加概述以说明消息的类型等问题,编制组对基于消息的知识交换中知识交换消息体进行了扩充0经修订完善后,标准编制组认为现有的条款具备合理性0
四、知识产权情况说明
本文件不涉及知识产权问题0
五、产业化情况、推广应用论证和预期达到的经济效果
知识图谱作为机器认知智能实现的基础之一,是人工智能的重要组成部分,有助于实现自动化和智能化获取、挖掘和应用知识,获得了产业界和学术界的广泛关注0知识图谱是以结构化的形式描述客观世界中的概念、实体及其关系的大型知识网络,将信息表达成更接近人类认知的形式,提供了一种更好地组织、管理和理解海量信息的能力0在政策部署、技术研发、标准研制、产业化推广、前沿应用场景试点等多方面因素的共同驱动下,知识图谱逐渐实现在智慧金融、智慧医疗、智慧能源、智能制造等众多领域的落地应用和深度融合,同时在各行业的数字化转型过程中,跨领域、行业或产业的知识图谱也逐渐获得关注0
在上述背景下,本标准对目前知识图谱应用比较好的金融证券、生物医疗、交通、教育、农业、电信、电商、出版等行业的应用过程特点、需求、主要问题和未来趋势进行了归纳总结0制定本标准有助于不同类型的企业基于规范化的实施路径进行知识图谱应用的开发0同时,该标准还有利于给知识图谱研发企业提供数字化基础设施支持的人员,如云平台研发人员,信息安全工程师等理解知识图谱,从而提供更有效的技术支持0不同行业的应用企业和人员也可通过这一框
架提取出更多类型的知识,产生更多可能的应用场景0此外,本标准的研制对推动企业进行知识驱动的数字化转型升级具有重要意义,为进一步加快知识要素的规划化获取、挖掘、应用与流通奠定了基础0
六、采用国际标准和国外先进标准情况
本文件未采标0国际上目前没有从整体上对知识图谱进行相关规范的已发布标准,本文件在编制过程中充分研究了国外关于知识图谱方面的研究报告、论文等成果,总结形成了符合我国国情的知识图谱技术框架0
七、与现行相关法律、法规、规章及相关标准的协调性
本文件与《中华人民共和国个人信息保护法》、《中华人民共和国网络安全法》等现行相关法律、法规、规章及相关标准保持协调一致0
八、重大分歧意见的处理经过和依据无0
九、标准性质的建议
建议作为推荐性标准发布0十、贯彻标准的要求和措施建议
本文件是产业急需标准,希望尽快发布0十一、替代或废止现行相关标准的建议
无0
十二、其它应予说明的事项无0
编制工作组 2024 年 3 月 20 日