大模型知识图谱，如何双向融合？渊亭实践方案来了→（融合数字人）

近日，中国信通院、中国通信标准化协会大数据技术标准推进委员会共同组织召开了「大模型驱动的智能知识图谱」 沙龙会议，邀请相关企业和专家共同探讨“人工智能时代如何高效进行知识管理”话题。

渊亭科技受邀作为嘉宾代表进行了《大模型与知识图谱互融互通技术探索与实践》的专题分享，并提供了技术落地的经验参考，助力各方加深对人工智能时代知识管理的理解。

本次分享，渊亭主要聚焦于以下话题：

▶ 在当下应用中，大模型和知识图谱分别面临哪些挑战？

▶ 大模型知识图谱作为两种不同的知识处理技术，有哪些相互赋能的路径？

▶ 以渊亭“天机·军事大模型”为例，大模型如何增强知识图谱？

▶ 以渊亭“天机·数字战场图谱”为例，知识图谱如何增强大模型？

如今，随着互联网高速发展，数据呈爆炸式增长，如何有效地管理和利用这些复杂、异构的知识数据，以满足不断增长的专业化、个性化需求，成为一个亟待解决的问题。

尽管大模型和知识图谱作为两种重要的知识处理技术，为知识管理带来了很大便利和成效，但也面临着不少挑战。

对于大模型来说，因其语料来源广泛多样，数据的质量、准确性和可靠性各不相同，其中包含着噪声和错误。大模型经过训练后可能会习得这些错误信息，导致输出的结果存在着事实错误、逻辑矛盾或观点偏差等问题，从而降低大模型的可靠性和实用性。

区别于大模型的泛文本信息，知识图谱信息经过抽取、整合、加工形成了结构化的数据，更加严谨可靠。但在构建知识图谱过程中，往往面临着数据来源有限、人力和时间成本较高等问题。且知识图谱具有行业特性，覆盖范围小，导致知识应用的广度和深度受到限制。

基于上述应用现状，构建一个互通、互融的桥梁，链接起大模型和知识图谱的各自优势，发挥出技术合力作用意义重大。当两者相结合后，能达到以下效果：

1）知识互补：利用大模型海量开放域知识和知识图谱精确的结构化知识，形成知识互补，促进知识的延伸、补全和提取。

2）相互学习：基于知识图谱的严谨结构，融合大模型所具备的泛化、完备、推理能力，可在垂直领域构建更加智能化的解决方案。

3）能力提升：知识图谱可促进大模型提升知识质量水平，同时通过引入可解释的知识推理模型和方法，大模型在知识图谱上的推理过程也将变得更加透明和可理解。

目前，渊亭科技在上述方面已探索出一些融合路径，包括知识图谱促进模型训练、潜在概念发现、人机交互识别确认、动态推理补全知识等层面。渊亭科技还研发了基于大模型不同能力项的组建平台和产品，包括DataExa-LLM-Schema、DataExa-LLM-Check、DataExa-LLM-Reasoning等。

渊亭科技自研的“天机·军事大模型”和“天机·数字战场图谱”是大模型和知识图谱相互结合的代表性案例。

以往在构建知识图谱的过程中，存在着成本大、数据数量欠缺、数据质量不佳等因素，影响着知识图谱构建和交付周期。

经过大模型技术增强后，则可大大缩短知识图谱建设的时间和人力成本，提高效率。如，自动化的数据加工流程能通过最少的数据标注对大模型进行微调，以实现军事领域知识图谱的构建。而大模型的数据补全流程能自动识别图谱中的缺失信息，并运用图算法与军事大模型的RAG技术进行数据挖掘和填补，增强天机·数字战场图谱的完整性。

为了有效减少天机·军事大模型在输出结果时出现逻辑不自洽、观点偏差等问题，渊亭融入天机·数字战场图谱作为军事大模型的知识支撑，增强了大模型的实时性和准确性，减少幻觉问题，提高可解释性。

例如，具体到图谱问答层面上来看，有些大模型在知识训练不足的情况下，可能会出现回答不精准的现象。天机·军事大模型通过融合天机·数字战场图谱，使得系统能够深入理解和解析问句的深层语义，对问句进行智能补充和完善，从而丰富知识点库，提供准确详尽的答案，有效减少大模型在生成回答时可能出现的误导性信息。

在多模态知识图谱交互范式上，渊亭科技也有着自己的沉淀。例如当用户使用大模型时，从输出问题到系统输出结果这一中间过程，渊亭科技编排、融合了诸多现有的业务系统和平台（包括天衍·作战仿真推演以及渊亭数据中台等），进行业务能力的集合打包和系统调度，促进大模型专项知识输出、语义消歧等，最终生成用户满意的答案。这种将大模型与现有业务系统、平台相结合的方式，可为知识图谱交互领域的发展提供新的思路和方法。

作为认知决策智能领域的先行者和领导者，渊亭科技将持续投入研发力量进行技术路径的探索和创新，推动大模型和知识图谱的有机融合、互补增强，促进知识处理方式和水平的提升。