基于LLM 场景识别词槽实体抽取实现多轮问答（超级问答）

前言

随着人工智能技术的不断进步，大语言模型（LLM）已成为技术前沿的热点。它们不仅能够理解和生成文本，还能在多种应用场景中实现复杂的交互。本文将深入探讨一段结合了大语言模型能力、意图识别和词槽实体抽取的Python代码，这段代码展示了如何实现智能的多轮问答能力，为用户提供更加丰富和个性化的交互体验。

正文

完整代码

这段代码的核心在于集成了最新的大语言模型（LLM）能力，结合了意图识别和词槽实体抽取的技术，以实现智能的多轮问答。

import json
import re
import requests
from datetime import datetime

url = 'https://api.openai.com/v1/chat/completions'

# 替换为您自己的chatGPT API密钥
api_key = 'sk-xxxxxx'

# 调试日志
debug = False

def check_values_not_empty(JSON_data):
"""
检查是否所有元素value都不为空
"""
# 遍历JSON数据中的每个元素
for item in json_data:
# 检查value字段是否为空字符串
if item.get('value') == '':
return False # 如果发现空字符串，返回False
return True # 如果所有value字段都非空，返回True

def format_title_value_for_logging(json_data):
"""
抽取参数名称和value值
"""
log_strings = []
for item in json_data:
title = item.get('title', 'Unknown Title') # 获取title，如果不存在则使用'Unknown Title'
value = item.get('value', 'N/A') # 获取value，如果不存在则使用'N/A'
log_string = f"Title: {title}, Value: {value}"
log_strings.append(log_string)
return ' '.join(log_strings)

def extract_json_from_string(input_string):
"""
json抽取函数
返回包含JSON对象的列表
"""
try:
# 正则表达式假设JSON对象由花括号括起来
matches = re.findall(r'{.*?}', input_string, re.DOTALL)

# 验证找到的每个匹配项是否为有效的JSON
valid_jsons = []
for match in matches:
try:
json_obj = json.loads(match)
valid_jsons.append(json_obj)
except json.JSONDecodeError:
continue # 如果不是有效的JSON，跳过该匹配项

return valid_jsons
except Exception as e:
print(f"Error occurred: {e}")
return []

def send_message(message, user_input):
"""
请求LLM函数
"""
print('--------------------------------------------------------------------')
if debug:
print('用户输入:', message)
else:
print('用户输入:', user_input)
print('----------------------------------')
headers = {
"Authorization": f"Bearer {api_key}",
"Content-Type": "application/json",
}

data = {
"model": "gpt-3.5-turbo",
"messages": [
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": f"{message}"}
]
}
response = requests.post(url, headers=headers, json=data, verify=False)
if response.status_code == 200:
answer = response.json()["choices"][0]["message"]['content']
print('LLM输出:', answer)
print('--------------------------------------------------------------------')
return answer
else:
print(f"Error: {response.status_code}")
return None

# 问天气
# 参数：
# 1. 时间time（口语：今天明天、日期：10号、范围：未来一周）
# 2. 地点location（国家省市区）
# todo "transform": "时间格式转换工具？是自己做一个还是用大模型。建议自己开发一个",
dict_weather = [
{
"title": "时间",
"desc": "口语表述：昨天、今天、明天；具体日期：10号、1月1号、2月3日；范围：未来一周、最近十四天",
"transform": "时间统一转换格式，如果是时间点：yyyy-MM-dd；如果是时间段：yyyy-MM-dd#yyyy-MM-dd",
"util": "",
"value": "",
"required": True
},
{
"title": "地点",
"desc": "口语表述：建邺区、南京、河北省、江苏南通、上海虹桥、北京朝阳区",
"transform": "地点统一转换格式为省市区（如果有区）或省市，如南京市建邺区、南京市，如果提取不到市只有省份则不填写value",
"util": "",
"value": "",
"required": True
}
]

prompt_weather_info_update = """
JSON每个元素代表一个参数信息，我先给你提供一些基本介绍：
'''
title字段是参数名称，如果需要让用户填写该参数时你应该告诉用户你需要的参数名称
desc字段是参数描述，可以做为title字段的补充，更好的引导用户补充参数
transform字段是填写value字段值的格式要求说明
required字段为true表示该元素的value是必填参数，如果value为空则必须让用户补充该参数信息，如果required字段为false表示该参数不是必须补充的字段
'''

需求：
#01 根据用户输入信息提取有用的信息更新到JSON中的value字段并返回更新后的JSON
#02 仅更新value字段，其他字段都原样返回
#03 如果没有可更新的value则原样返回
#04 当前时间为{}

参考示例：
'''
JSON: [
{{
"title": "时间",
"desc": "口语表述：昨天、今天、明天；具体日期：10号、1月1号、2月3日；范围：未来一周、最近十四天",
"transform": "时间统一转换格式，如果是时间点：yyyy-MM-dd；如果是时间段：yyyy-MM-dd#yyyy-MM-dd",
"util": "",
"value": "",
"required": true
}},
{{
"title": "地点",
"desc": "口语表述：建邺区、南京、河北省、江苏南通、上海虹桥、北京朝阳区",
"transform": "地点统一转换格式为省市区（如果有区）或省市，如南京市建邺区、南京市，如果提取不到市只有省份则不填写value",
"util": "",
"value": "",
"required": true
}}
]
问：今天南京天气怎么样？
答：[
{{
"title": "时间",
"desc": "口语表述：昨天、今天、明天；具体日期：10号、1月1号、2月3日；范围：未来一周、最近十四天",
"transform": "时间统一转换格式，如果是时间点：yyyy-MM-dd；如果是时间段：yyyy-MM-dd#yyyy-MM-dd",
"util": "",
"value": "{}",
"required": true
}},
{{
"title": "地点",
"desc": "口语表述：建邺区、南京、河北省、江苏南通、上海虹桥、北京朝阳区",
"transform": "地点统一转换格式为省市区（如果有区）或省市，如南京市建邺区、南京市，如果提取不到市只有省份则不填写value",
"util": "",
"value": "南京",
"required": true
}}
]
'''

JSON：{}
问：{}
答：
"""

prompt_weather_query_user = """
JSON每个元素代表一个参数信息，我先给你提供一些基本介绍：
'''
title字段是参数名称，如果需要让用户填写该参数时你应该告诉用户你需要的参数名称
desc字段是参数描述，可以做为title字段的补充，更好的引导用户补充参数
required字段为true表示该元素的value是必填参数，如果value为空则必须让用户补充该参数信息，如果required字段为false表示该参数不是必须补充的字段
'''

需求：
#01 如果有多个未填写value的参数则可以一起向用户提问
#02 value已经填写的参数不用再次提问

参考示例：
'''
问：[
{{
"title": "时间",
"desc": "口语表述：昨天、今天、明天；具体日期：10号、1月1号、2月3日；范围：未来一周、最近十四天",
"transform": "时间统一转换格式，如果是时间点：yyyy-MM-dd；如果是时间段：yyyy-MM-dd#yyyy-MM-dd",
"util": "",
"value": "2022-01-01",
"required": true
}},
{{
"title": "地点",
"desc": "口语表述：建邺区、南京、河北省、江苏南通、上海虹桥、北京朝阳区",
"transform": "地点统一转换格式为省市区（如果有区）或省市，如南京市建邺区、南京市，如果提取不到市只有省份则不填写value",
"util": "",
"value": "",
"required": true
}}
]
答：请问你想查询天气的地点是什么？
'''

问：{}
答：
"""

# 公积金咨询
# 参数：
# 1. 事件（买房、租房、退休）
# 2. 购买房屋类型（买房事件时需要经济适用房、新房、二手房）
dict_consult = {
"event": "",
"purchase_type": ""
}

prompt_global_purpose = """
有下面多种场景，需要你根据用户输入进行判断
1. 问天气
2. 公积金咨询
3. 其他场景

参考示例：
'''
问：今天天气如何
答：问天气
'''

问：{}
答：
"""

global_purpose = ''

def multi_question(user_input):
global global_purpose
global dict_weather
current_purpose = send_message(prompt_global_purpose.format(user_input), user_input)
if current_purpose != '其他场景':
global_purpose = current_purpose
if global_purpose == '问天气':
# 先检查本次用户输入是否有信息补充，保存补充后的结果编写程序进行字符串value值diff对比，判断是否有更新
current_time = datetime.now().strftime("%Y-%m-%d")
new_info_json_raw = send_message(prompt_weather_info_update.format(current_time, current_time, json.dumps(dict_weather, ensure_ascii=False), user_input), user_input)
dict_weather = extract_json_from_string(new_info_json_raw)
# 判断参数是否已经全部补全
if check_values_not_empty(dict_weather):
print('问天气 ------ 参数已完整，详细参数如下')
print(format_title_value_for_logging(dict_weather))
print('正在请求天气查询API，请稍后……')
else:
str = json.dumps(dict_weather, ensure_ascii=False)
send_message(prompt_weather_query_user.format(str), user_input)
elif global_purpose == '公积金咨询':
pass
else:
pass
pass

def user_input():
while True:
question = input("请输入您的问题：")
multi_question(question)

# test
# multi_question("明天天气怎么样呢")
# multi_question("苏州天气怎么样呢")
# multi_question("苏州明天天气怎么样呢")

user_input()