优化意图识别模块中的字符串格式化,更新分类信息提示内容,增强可读性和准确性。

This commit is contained in:
2025-05-27 11:31:08 +08:00
parent 99017f0cb0
commit cd8e8bcad2
2 changed files with 13 additions and 7 deletions
@@ -101,9 +101,9 @@ class IntentRecognizer:
Returns:
分类结果
"""
formatted_prompt = classification_prompt.replace("{user_input}", query)
formatted_prompt = formatted_prompt.replace("{classification_info}", classification_info)
formatted_prompt = formatted_prompt.replace("{output_format}", self.classification_parser.get_format_instructions())
formatted_prompt = classification_prompt.format(user_input=query,
classification_info=classification_info,
output_format=self.classification_parser.get_format_instructions())
# 将关键词列表转换为JSON字符串
terms_dict = [term.model_dump() for term in keywords.terms]
keywords_str = json.dumps(terms_dict, ensure_ascii=False)
@@ -207,7 +207,9 @@ class IntentRecognizer:
# 准备问题改写提示
terms_dict = [term.model_dump(exclude={"description"}) for term in keywords.terms]
keywords_str = json.dumps(terms_dict, ensure_ascii=False)
formatted_prompt = query_rewrite_prompt.format(query=query, output_format=self.query_rewrite_parser.get_format_instructions(),keywords=keywords_str)
formatted_prompt = query_rewrite_prompt.format(query=query,
output_format=self.query_rewrite_parser.get_format_instructions(),
keywords=keywords_str)
# 调用LLM
+7 -3
View File
@@ -41,7 +41,11 @@ classification_info="""【垂直领域分类】:
2. 数据问题:涉及电力造价费用、造价指标等
【安装下载注册包括以下三类】:
1. 后缀名询:询问有关软件后缀名、工程文件扩展名等问题,例如:BDY3是什么文件?、用什么软件打开.BDY3文件?
1. 后缀名询:所有涉及文件扩展名的使用场景、软件关联等问题,包括但不限于:询问文件是否由特定软件打开、扩展名与软件的匹配关系、扩展名含义及关联等
示例:
"这个文件用配网软件能打开吗?(隐含扩展名关联)",
".bphq18 是什么类型的文件?",
"用哪个软件打开.BDY3文件?"
2. 软件锁类:询问软件锁信息、锁注册号查询、许可证查询、锁激活问题等软件锁相关问题
3. 安装下载类:安装下载咨询、组件(插件)选择、环境配置等
4. 问题排查类:软件安装下载失败、报错,系统兼容性问题等
@@ -62,10 +66,10 @@ classification_prompt="""
【示例】
用户输入1: 技改T1怎样新建工程
输出1:
{
{{
"vertical_classification":"软件咨询",
"sub_classification":"软件功能"
}
}}
"""
query_rewrite_prompt = """