近日,中国信通院、中国通信标准化协会大数据技术标准推进委员会共同组织召开了「大模型驱动的智能知识图谱」 沙龙会议,邀请相关企业和专家共同探讨“人工智能时代如何高效进行知识管理”话题。
渊亭科技受邀作为嘉宾代表进行了《大模型与知识图谱互融互通技术探索与实践》的专题分享,并提供了技术落地的经验参考,助力各方加深对人工智能时代知识管理的理解。
本次分享,渊亭主要聚焦于以下话题:
▶ 在当下应用中,大模型和知识图谱分别面临哪些挑战?
▶ 大模型 知识图谱作为两种不同的知识处理技术,有哪些相互赋能的路径?
▶ 以渊亭“天机·军事大模型”为例,大模型如何增强知识图谱?
▶ 以渊亭“天机·数字战场图谱”为例,知识图谱如何增强大模型?
如今,随着互联网高速发展,数据呈爆炸式增长,如何有效地管理和利用这些复杂、异构的知识数据,以满足不断增长的专业化、个性化需求,成为一个亟待解决的问题。
尽管大模型和知识图谱作为两种重要的知识处理技术,为知识管理带来了很大便利和成效,但也面临着不少挑战。
对于大模型来说,因其语料来源广泛多样,数据的质量、准确性和可靠性各不相同,其中包含着噪声和错误。大模型经过训练后可能会习得这些错误信息,导致输出的结果存在着事实错误、逻辑矛盾或观点偏差等问题,从而降低大模型的可靠性和实用性。
区别于大模型的泛文本信息,知识图谱信息经过抽取、整合、加工形成了结构化的数据,更加严谨可靠。但在构建知识图谱过程中,往往面临着数据来源有限、人力和时间成本较高等问题。且知识图谱具有行业特性,覆盖范围小,导致知识应用的广度和深度受到限制。
基于上述应用现状,构建一个互通、互融的桥梁,链接起大模型和知识图谱的各自优势,发挥出技术合力作用意义重大。当两者相结合后,能达到以下效果:
1)知识互补:利用大模型海量开放域知识和知识图谱精确的结构化知识,形成知识互补,促进知识的延伸、补全和提取。
2)相互学习:基于知识图谱的严谨结构,融合大模型所具备的泛化、完备、推理能力,可在垂直领域构建更加智能化的解决方案。
3)能力提升:知识图谱可促进大模型提升知识质量水平,同时通过引入可解释的知识推理模型和方法,大模型在知识图谱上的推理过程也将变得更加透明和可理解。
目前,渊亭科技在上述方面已探索出一些融合路径,包括知识图谱促进模型训练、潜在概念发现、人机交互识别确认、动态推理补全知识等层面。渊亭科技还研发了基于大模型不同能力项的组建平台和产品,包括DataExa-LLM-Schema、DataExa-LLM-Check、DataExa-LLM-Reasoning等。
渊亭科技自研的“天机·军事大模型”和“天机·数字战场图谱”是大模型和知识图谱相互结合的代表性案例。
以往在构建知识图谱的过程中,存在着成本大、数据数量欠缺、数据质量不佳等因素,影响着知识图谱构建和交付周期。
经过大模型技术增强后,则可大大缩短知识图谱建设的时间和人力成本,提高效率。如,自动化的数据加工流程能通过最少的数据标注对大模型进行微调,以实现军事领域知识图谱的构建。而大模型的数据补全流程能自动识别图谱中的缺失信息,并运用图算法与军事大模型的RAG技术进行数据挖掘和填补,增强天机·数字战场图谱的完整性。
为了有效减少天机·军事大模型在输出结果时出现逻辑不自洽、观点偏差等问题,渊亭融入天机·数字战场图谱作为军事大模型的知识支撑,增强了大模型的实时性和准确性,减少幻觉问题,提高可解释性。
例如,具体到图谱问答层面上来看,有些大模型在知识训练不足的情况下,可能会出现回答不精准的现象。天机·军事大模型通过融合天机·数字战场图谱,使得系统能够深入理解和解析问句的深层语义,对问句进行智能补充和完善,从而丰富知识点库,提供准确详尽的答案,有效减少大模型在生成回答时可能出现的误导性信息。
在多模态知识图谱交互范式上,渊亭科技也有着自己的沉淀。例如当用户使用大模型时,从输出问题到系统输出结果这一中间过程,渊亭科技编排、融合了诸多现有的业务系统和平台(包括天衍·作战仿真推演以及渊亭数据中台等),进行业务能力的集合打包和系统调度,促进大模型专项知识输出、语义消歧等,最终生成用户满意的答案。这种将大模型与现有业务系统、平台相结合的方式,可为知识图谱交互领域的发展提供新的思路和方法。
作为认知决策智能领域的先行者和领导者,渊亭科技将持续投入研发力量进行技术路径的探索和创新,推动大模型和知识图谱的有机融合、互补增强,促进知识处理方式和水平的提升。
Copyright © 2024 妖气游戏网 www.17u1u.com All Rights Reserved