优化意图识别模块，新增文档相关性判断功能，更新DifyQueryRetrieval类以支持多线程检索，增强数据模型，改进日志记录，调整Excel数据验证逻辑，更新多个提示词模板以提升用户体验。

2025-06-24 15:03:01 +08:00
parent d957b4374e
commit 4386cfac41
8 changed files with 737 additions and 191 deletions
@@ -10,7 +10,7 @@
            "request": "launch",
            "program": "${file}",
            "console": "integratedTerminal",
-            "justMyCode": false
+            "justMyCode": true
        },
        {
            "name": "IntentRecognition",
@@ -16,12 +16,91 @@ from tqdm import tqdm
 import time
 import sys
 import argparse
-from typing import List, Dict
+from typing import List, Dict, Any, Optional
 from langchain.output_parsers import PydanticOutputParser
 from pydantic import BaseModel, Field
 sys.path.append(os.getcwd())
 from rag2_0.intent_recognition import IntentRecognizer
 from rag2_0.dify.DifyQueryRetrieval import DifyQueryRetrieval
 from rag2_0.intent_recognition.DataModels import Classification
 from rag2_0.tool.ModelTool import OpenAiLLM
 # 加载环境变量
 load_dotenv()
 dify_query_retrieval = DifyQueryRetrieval(api_key="dataset-skLjmPVonjHo119OWNf3kAmY", base_url="http://172.20.0.145/v1")
 def is_retrieved_doc_relevant(query: str, retrieved_doc: List[Dict[str, Any]], api_key: str = None, base_url: str = None, model_name: str = None) -> Dict[str, Any]:
    """
    使用LLM判断检索出的文档是否与用户提问相关
    Args:
        query: 用户提问
        retrieved_doc: 检索出的文档列表
        api_key: API密钥，默认使用环境变量
        base_url: API基础URL，默认使用环境变量
        model_name: 模型名称，默认使用环境变量或默认模型
    Returns:
        包含相关性判断结果的字典，包括is_relevant(布尔值)和explanation(解释)
    """
    # 使用环境变量或参数值
    api_key = api_key or os.getenv("OPENAI_API_KEY")
    base_url = base_url or os.getenv("OPENAI_API_BASE")
    model_name = model_name or os.getenv("LLM_MODEL_NAME", "gpt-3.5-turbo")
    # 如果没有检索到文档，直接返回不相关
    if not retrieved_doc or len(retrieved_doc) == 0:
        return {
            "is_relevant": False,
            "explanation": "没有检索到任何文档",
            "relevance_score": 0.0
        }
    # 构建文档内容
    doc_contents = []
    for i, doc in enumerate(retrieved_doc[:3]):  # 只取前3个文档进行判断
        content = doc.get("content", "")
        title = doc.get("title", "")
        doc_contents.append(f"文档{i+1}标题: {title}\n文档{i+1}内容: {content}")
    doc_text = "\n\n".join(doc_contents)
    class TempModel(BaseModel):
        is_relevant: bool = Field(description="是否与用户提问相关")
        relevance_score: int = Field(description="相关性评分，0-100分")
        explanation: str = Field(description="解释各个文档与提问的相关性或不相关性")
    parser = PydanticOutputParser(pydantic_object=TempModel)
    # 构建提示词
    prompt = f"""请判断以下检索文档是否与用户提问相关，并给出相关性评分（0-100分）。
 用户提问: {query}
 检索文档:
 {doc_text}
 请按照以下JSON格式返回结果:
 {parser.get_format_instructions()}
 """
    try:
        # 初始化LLM并调用
        llm = OpenAiLLM(api_key=api_key, base_url=base_url, model="deepseek-ai/DeepSeek-R1", response_format={"type": "json_object"})
        response = llm.invoke(prompt)
        result = parser.parse(response.content)
        return {
            "is_relevant": result.is_relevant,
            "relevance_score": result.relevance_score,
            "explanation": result.explanation
        }
    except Exception as e:
        logging.error(f"判断文档相关性时出错: {str(e)}")
        return {
            "is_relevant": False,
            "explanation": f"判断过程出错: {str(e)}",
            "relevance_score": 0.0
        }
 # 读取Excel文件中的提问数据
 def load_questions_from_excel(file_path=None):
@@ -70,23 +149,33 @@ def process_query(recognizer: IntentRecognizer, query: str, conversation_context
                                              enable_query_expansion=True)
            # 提取分类信息
            classification = result["classification"]
            original_query = result["rewrite"]["rewrite"]
            query_list = result["query_expand"]["all"]
            soft_name = result.get("slot_filling", {}).get("filled_data", {}).get("software_name","")
            # 将字典转换为Classification对象
            classification_obj = Classification(**classification)
            retrieved_doc=dify_query_retrieval.retrieve(original_query, query_list, classification_obj, soft_name)
-            # 提取关键词信息
+            # 判断检索文档是否相关
-            keywords = result["keywords"]
+            relevance_result = {}
-            keywords_str = ""
+            if retrieved_doc:
-            if keywords and keywords.get("terms"):
+                # 获取API密钥和基础URL
-                term_details = []
+                api_key = os.getenv("OPENAI_API_KEY")
-                for term in keywords["terms"]:
+                base_url = os.getenv("OPENAI_API_BASE")
-                    term_info = {
+                model_name = os.getenv("LLM_MODEL_NAME", "gpt-3.5-turbo")
-                        "名称": term["name"],
+                # 判断文档相关性
-                        "同义词": ";".join(term["synonymous"]) if term["synonymous"] else "",
+                relevance_result = is_retrieved_doc_relevant(query, retrieved_doc, api_key, base_url, model_name)
-                        "描述": term["description"]
+            else:
                retrieved_doc_str = []
                relevance_result = {
                    "is_relevant": False,
                    "explanation": "没有检索到文档",
                    "relevance_score": 0.0
                }
                    term_details.append(term_info)
                # 将term_details转换为JSON字符串,确保中文正确显示
                keywords_str = json.dumps(term_details, ensure_ascii=False, indent=2)
            retrieved_doc_titles=[]
            if retrieved_doc:
                retrieved_doc_titles=[doc["title"].split("/")[-1] for doc in retrieved_doc]     
            # 提取槽位填充信息
            slot_filling = result.get("slot_filling", {})
            slot_filling_str = ""
@@ -101,26 +190,27 @@ def process_query(recognizer: IntentRecognizer, query: str, conversation_context
            # 处理成功，返回结果
            return {
                "提问": query,
-                "问题拆解": result["query_keys"],
+                "问题分类": f"{classification['vertical_classification']} - {classification['sub_classification']}",
                "一级分类": classification["vertical_classification"],
                "二级分类": classification["sub_classification"],
                "问题改写": result["rewrite"]["rewrite"],
-                "检索的关键词": keywords_str,
+                "槽位填充": slot_filling_str,
-                "槽位填充": slot_filling_str
+                "检索的文档": "\n".join(retrieved_doc_titles),
                "文档是否相关": "相关" if relevance_result["is_relevant"] else "不相关",
                "文档相关性解释": relevance_result["explanation"]
            }
        except Exception as e:
            logging.error(f"处理问题 '{query}' 时出错: ",exc_info=True)
            retry_count += 1
            # 如果已经重试了最大次数，则记录错误并返回错误结果
            if retry_count > max_retries:
                logging.error(f"处理问题 '{query}' 时出错: {e.__class__}{e}")
                return {
                    "提问": query,
-                    "一级分类": "处理出错",
+                    "问题分类": "处理出错",
                    "二级分类": "处理出错",
                    "问题改写": "处理出错",
-                    "检索的关键词": f"重试 {max_retries} 次后失败: {str(e)}",
+                    "槽位填充": "处理出错",
-                    "槽位填充": "处理出错"
+                    "检索的文档": f"重试 {max_retries} 次后失败: {str(e)}",
                    "文档是否相关": "处理出错",
                    "文档相关性解释": "处理出错"
                }
            else:
                # 可以在这里添加延迟，避免过快重试
@@ -172,6 +262,7 @@ def save_results_to_excel(results, output_file, is_final=False):
        worksheet.set_column('E:E', 60)  # 问题改写 60个Excel单位
        worksheet.set_column('F:F', 60)  # 检索到的关键词 60个Excel单位
        worksheet.set_column('G:G', 80)  # 槽位填充 80个Excel单位
        worksheet.set_column('H:H', 60)  # 文档相关性 60个Excel单位
        # 设置所有行高为20磅
        for i in range(len(results_df) + 1):  # +1 是为了包括表头
@@ -222,7 +313,7 @@ def parse_arguments():
                        help='API基础URL，默认使用环境变量中的配置')
    # 添加处理相关参数
-    parser.add_argument('--max_workers', '-w', type=int, default=20,
+    parser.add_argument('--max_workers', '-w', type=int, default=2,
                        help='并发处理的最大线程数，默认为20')
    parser.add_argument('--debug', '-d', action='store_true',
                        help='启用调试模式，使用示例查询而非从文件读取')
@@ -249,12 +340,12 @@ def main():
    # 读取提问数据
    current_dir = os.path.dirname(os.path.abspath(__file__))
-    data_file = args.input if args.input else os.path.join(current_dir, "..", "..", "data", "excel", "历史提问数据(dislike)_提问明确.xlsx")
+    data_file = args.input if args.input else os.path.join(current_dir, "..", "..", "data", "excel", "1500条点踩软件问题测试.xlsx")
-    output_file = args.output if args.output else os.path.join(current_dir, "..", "..", "data", "excel", "历史提问数据(dislike)_槽位(分类)填充结果.xlsx")
+    output_file = args.output if args.output else os.path.join(current_dir, "..", "..", "data", "excel", "1500条点踩软件问题_槽位(分类)填充结果.xlsx")
    # 检测是否为调试模式
    is_debug = args.debug or (hasattr(sys, 'gettrace') and sys.gettrace() is not None)
-    
+    is_debug = False
    if is_debug:
        # 如果提供了查询参数，使用它；否则使用默认示例
        if args.query:
@@ -287,12 +378,7 @@ def main():
                result = future.result()
                # 将结果放在与输入相同的位置
                results[idx] = result
                completed += 1
                # 每处理batch_size条数据保存一次
                # if completed % batch_size == 0:
                #     logging.info(f"已完成 {completed}/{len(examples)} 条，保存中间结果...")
                #     save_results_to_excel(results, output_file, is_final=False)
        # 处理完所有数据后，保存最终结果
        save_results_to_excel(results, output_file, is_final=True)
@@ -308,7 +394,7 @@ def setup_logging():
    # 配置日志输出到控制台
    logging.basicConfig(
        level=logging.INFO,
-        format='%(asctime)s - %(name)s - %(levelname)s - %(message)s',
+        format='%(asctime)s - %(name)s - [%(thread)d] - %(levelname)s - %(message)s',
        handlers=[
            logging.StreamHandler()  # 添加控制台处理器
        ]
@@ -390,7 +390,7 @@ class ExcelDataValidator:
                        return index, False, "槽位填充", error_reason, slot_confidence
            # 4. 验证检索内容
-            if retrieve_content:
+            if retrieve_content and retrieve_content != "" and pd.notna(retrieve_content):
                if self.debug:
                    logging.info(f"  验证检索内容...")
@@ -0,0 +1,164 @@
 import sys
 import os
 import json
 from threading import Thread
 from concurrent.futures import ThreadPoolExecutor, as_completed
 from typing import List, Dict, Any, Optional
 import logging
 import time
 sys.path.append(os.getcwd())
 from rag2_0.intent_recognition.DataModels import Classification
 from rag2_0.dify.dify_client.client import DifyClient, KnowledgeBaseClient
 from rag2_0.tool.ModelTool import XinferenceReRankerModel
 class DifyQueryRetrieval:
    software_to_dataset_map = {"配网工程计价通D3":["下载安装注册","配网造价知识","配网造价软件知识"], 
                               "新型储能电站建设计价通C1":["下载安装注册","储能C1计价通软件知识","新能源造价知识"],
                               "西藏电力工程计价通Z1":["下载安装注册","西藏造价知识","西藏造价软件知识"],
                               "技改检修工程计价通T1":["下载安装注册","技改检修工程计价通T1软件知识","技改造价知识"],
                               "技改检修清单计价通T1":["下载安装注册","技改检修清单计价通T1软件知识","技改造价知识"],
                               "电力建设计价通":["下载安装注册","主网造价知识","电力建设计价通（2018）软件知识"],
                               "其他":["下载安装注册","技改检修清单计价通T1软件知识",
                                     "主网造价知识","西藏造价知识","技改检修工程计价通T1软件知识",
                                     "电力建设计价通（2018）软件知识","储能C1计价通软件知识",
                                     "西藏造价软件知识","新能源造价知识","配网造价知识","技改造价知识",
                                     "配网造价软件知识"]}
    def __init__(self, api_key: str, base_url: str):
        self._api_key = api_key
        self._base_url = base_url
        self._datasets_list = self.get_datasets_list()
    def get_datasets_list(self) -> Dict[str, str]:
        client = KnowledgeBaseClient(api_key=self._api_key, base_url=self._base_url)
        datasets = client.list_datasets(page_size=50)
        datasets_json = datasets.json()
        return {dataset["name"]:dataset["id"] for dataset in datasets_json["data"]}
    def retrieve_by_dataset(self, query: str, dataset_name: str) -> List[Dict[str, Any]]:
        try:
            knowledge_base_client = KnowledgeBaseClient(api_key=self._api_key, base_url=self._base_url, dataset_id=self._datasets_list[dataset_name])
            documents = knowledge_base_client.retrieve(query)
            retrieved_documents = documents.json().get("records", [])
            # 添加数据集信息
            for retrieved_document in retrieved_documents:
                retrieved_document["dataset_id"] = self._datasets_list[dataset_name]
                retrieved_document["dataset_name"] = dataset_name
            return retrieved_documents
        except Exception as e:
            logging.error(f"检索数据集 {dataset_name} 时出错: {str(e)}", exc_info=True)
            return []
    def retrieve(self, original_query: str, query_list: List[str], classification: Classification, software_name: str) -> Optional[List[Dict[str, Any]]]:
        datasets = self.get_datasets_by_classification(classification, software_name)
        if len(datasets) == 0:
            return None
        all_documents=[]
        # 使用线程池替代无限制创建线程
        # 设置合理的最大线程数，这里使用min(32, len(query_list) * len(datasets))来限制
        time_start = time.time()
        max_workers = min(os.cpu_count() * 2, len(query_list) * len(datasets))
        with ThreadPoolExecutor(max_workers=max_workers) as executor:
            futures = []
            for query in query_list:
                for dataset in datasets:
                    if dataset not in self._datasets_list:
                        raise ValueError(f"dataset {dataset} not in datasets_list")
                    futures.append(executor.submit(self.retrieve_by_dataset, query, dataset))
            # 等待所有任务完成
            for future in as_completed(futures):
                # 处理可能的异常
                try:
                    retrieved_documents = future.result()
                    all_documents.extend(retrieved_documents)
                except Exception as e:
                    logging.error(f"检索过程中发生错误: {str(e)}", exc_info=True)
        time_end = time.time()
        logging.info(f"检索耗时: {time_end - time_start:.2f}秒")
        # 根据segment_id对文档进行去重
        unique_documents = {}
        for document in all_documents:
            segment_id = document['segment']['id']
            if segment_id not in unique_documents:
                unique_documents[segment_id] = document
        # 将去重后的文档转换为列表
        deduplicated_documents = list(unique_documents.values())
        # 对所有检索出来的文档进行重排序
        time_start = time.time()
        processed_documents = self.data_post_processor(original_query, deduplicated_documents)
        time_end = time.time()
        logging.info(f"检索后重排序耗时: {time_end - time_start:.2f}秒")
        return processed_documents
    def data_post_processor(self, query: str, all_documents: List[Dict[str, Any]]) -> List[Dict[str, Any]]:
        reranker_model = XinferenceReRankerModel()
        documents = [document['segment']['content'] for document in all_documents]
        reranked_documents = reranker_model.rerank(query, documents, top_k=5)
        new_all_documents = []
        def to_dify_document_format(document: dict)->dict:
            return {
                "metadata": {
                    "_source": "knowledge",
                    "dataset_id": document["dataset_id"],
                    "dataset_name": document["dataset_name"],
                    "document_id": document['segment']['document_id'],
                    "document_name": document["segment"]["document"]["name"],
                    "document_data_source_type": document["segment"]["document"]["data_source_type"],
                    "segment_id": document["segment"]["id"],
                    "retriever_from": "api",
                    "score": document.get("score", 0),
                    "segment_hit_count": document.get("segment", {}).get("hit_count", 0),
                    "segment_word_count": document.get("segment", {}).get("word_count", 0),
                    "segment_position": document.get("segment", {}).get("position", 0),
                    "segment_index_node_hash": document.get("segment", {}).get("index_node_hash", ""),
                    "position": document["segment"].get("position", 0)
                },
                "title": document["segment"]["document"]["name"],
                "content": document["segment"]["content"]
            }
        for reranked_document in reranked_documents:
            cur_doc_info = all_documents[reranked_document["index"]]
            cur_doc_info["score"] = reranked_document["score"]
            new_all_documents.append(to_dify_document_format(cur_doc_info))
        return new_all_documents
    def get_datasets_by_classification(self, classification: Classification, software_name: str) -> List[str]:
        if classification.vertical_classification=="软件问题" or classification.vertical_classification=="业务问题":
            software_name_list = self.software_to_dataset_map.keys()
            cur_software_name = ""
            for software_name_info in software_name_list:
                if software_name_info in software_name:
                    cur_software_name = software_name_info
                    break
            if cur_software_name == "":
                return self.software_to_dataset_map["其他"]
            else:
                return self.software_to_dataset_map[cur_software_name]
        if classification.vertical_classification == "安装下载注册":
            if classification.sub_classification in ["后缀名咨询", "软件锁类"]:
                return ["下载安装注册"]
            elif classification.sub_classification == "安装下载类":
                return []
            elif classification.sub_classification == "问题排查":
                return self.software_to_dataset_map["其他"]
        return self.software_to_dataset_map["其他"]
 if __name__ == "__main__":
    dify_query_retrieval = DifyQueryRetrieval(api_key="dataset-skLjmPVonjHo119OWNf3kAmY", base_url="https://172.20.0.145/v1")
    datasets = dify_query_retrieval.retrieve("配网工程计价通D3软件如何新建工程？", Classification(vertical_classification="软件问题", sub_classification="软件功能"), "配网工程计价通D3")
    print(datasets)
@@ -309,3 +309,24 @@ class IntentAndSlotResult(BaseModel):
        ProblemDiagnosisSlots,
        OtherSlots
    ]
 # 意图优化环节数据模型
 class StepBackPrompt(BaseModel):
    """后退提示数据模型"""
    original_query: str = Field(description="原始查询")
    step_back_query: str = Field(description="后退提示生成的抽象查询")
 class FollowUpQuestions(BaseModel):
    """后续问题数据模型"""
    original_query: str = Field(description="原始查询")
    follow_up_query: str = Field(description="基于历史对话生成的独立问题")
 class HypotheticalDocument(BaseModel):
    """假设文档数据模型"""
    original_query: str = Field(description="原始查询")
    hypothetical_answer: str = Field(description="假设性回答")
 class MultiQuestions(BaseModel):
    """多问题查询数据模型"""
    original_query: str = Field(description="原始查询")
    sub_questions: List[str] = Field(description="从不同角度生成的子问题列表")
@@ -9,6 +9,7 @@ Description: 意图分类、改写核心逻辑
 import logging
 import os
 import threading
 from langchain.output_parsers import PydanticOutputParser
 import json
 from typing import List, Tuple, Dict, Any, Optional
@@ -18,7 +19,8 @@ import time
 from .PromptTemplates import (classification_prompt, query_rewrite_prompt, 
                              extract_nouns_prompt, classification_info, 
-                              slot_filling_prompt)
+                              slot_filling_prompt, step_back_prompt, 
                              follow_up_questions_prompt, hyde_prompt, multi_questions_prompt)
 from .Multi_PromptTemplates import (
    intent_and_slot_prompt, output_example, 
@@ -29,7 +31,8 @@ from .DataModels import (
    Classification, QueryRewrite, Term, TermList,
    SoftwareFunctionSlots, SoftwareTroubleShootingSlots, ProfessionalConsultingSlots, 
    DataProblemSlots, FileExtensionConsultingSlots, SoftwareLockSlots, 
-    InstallationDownloadSlots, ProblemDiagnosisSlots, OtherSlots, IntentAndSlotResult
+    InstallationDownloadSlots, ProblemDiagnosisSlots, OtherSlots, IntentAndSlotResult,
    StepBackPrompt, FollowUpQuestions, HypotheticalDocument, MultiQuestions
 )
 from .ProfessionalNounVector import ProfessionalNounRetriever
 from rag2_0.tool.ModelTool import XinferenceReRankerModel, OpenAiLLM, SiliconFlowReRankerModel
@@ -166,7 +169,6 @@ class IntentRecognizer:
        Returns:
            提取的术语列表
        """
        try:
        # 如果使用jieba分词
        if use_jieba:
            # 先使用jieba分词
@@ -192,8 +194,7 @@ class IntentRecognizer:
            # 尝试使用Pydantic解析器解析TermList
            parsed_output = terms_list_parser.parse(response.content)
            return parsed_output.terms
-        except Exception as e:
+
            raise RuntimeError(f"无法解析LLM关键词提取响应: {e}") from e
    def _rerank_matched_terms(self, query_key: str, matched_terms: set, top_k: int = 2, rerank_score:float = 0.6) -> List[Term]:
        """
@@ -358,7 +359,8 @@ class IntentRecognizer:
    def process_query(self, query: str, conversation_context: str = "", 
                      chat_history: List[Dict[str, str]] = None, 
                      previous_slots: Dict[str, Any] = None,
-                      use_jieba: bool = False) -> Dict[str, Any]:
+                      use_jieba: bool = False,
                      enable_query_expansion: bool = False) -> Dict[str, Any]:
        """
        处理用户问题的完整流程
@@ -388,10 +390,29 @@ class IntentRecognizer:
        #         suffix_terms.append(suffix_term)
        #     return Classification(vertical_classification="安装下载", sub_classification="查询"), TermList(terms=suffix_terms), QueryRewrite(rewrite=query), matched_suffixes
        if chat_history is None:
            chat_history = []
        if previous_slots is None:
            previous_slots = {}
        # 步骤: 并行执行提问扩展
        if enable_query_expansion:
            # 创建线程和结果容器
            threads_and_results = [
                # 5.1: 后退提示
                self._run_in_thread(self._generate_step_back_prompt, args=(query, chat_history, conversation_context)),
                # 5.2: Follow Up Questions
                self._run_in_thread(self._generate_follow_up_questions, args=(query, chat_history, conversation_context)),
                # 5.3: HyDE
                self._run_in_thread(self._generate_hypothetical_document, args=(query, chat_history, conversation_context)),
                # 5.4: 多问题查询
                self._run_in_thread(self._generate_multi_questions, args=(query, chat_history, conversation_context))
            ]
        # 步骤1: 匹配关键词
        keywords_terms, query_keys = self._match_keywords(query, use_jieba)
@@ -419,6 +440,7 @@ class IntentRecognizer:
        if classification.vertical_classification not in ["其他", "闲聊"] and classification.sub_classification not in ["其他", "闲聊"]:
            slot_filling_result = self._fill_slots(rewrite.rewrite, classification, conversation_context, chat_history, previous_slots)
        if not enable_query_expansion:
            return {
                "classification": classification.model_dump(),
                "keywords": keywords_terms.model_dump(),
@@ -427,6 +449,40 @@ class IntentRecognizer:
                "slot_filling": slot_filling_result
            }
        # 等待所有线程完成
        start_time = time.time()
        for thread, _ in threads_and_results:
            thread.join()
        end_time = time.time()
        logging.info(f"问题扩展环节耗时统计 - 总耗时: {end_time - start_time:.2f}秒")
        # 收集结果
        step_back_result = threads_and_results[0][1][0] if threads_and_results[0][1] else StepBackPrompt(original_query=query, step_back_query=query)
        follow_up_result = threads_and_results[1][1][0] if threads_and_results[1][1] else FollowUpQuestions(original_query=query, follow_up_query=query)
        hyde_result = threads_and_results[2][1][0] if threads_and_results[2][1] else HypotheticalDocument(original_query=query, hypothetical_answer="")
        multi_questions_result = threads_and_results[3][1][0] if threads_and_results[3][1] else MultiQuestions(original_query=query, sub_questions=[query])
        all_questions=multi_questions_result.sub_questions
        all_questions.append(query)
        all_questions.append(step_back_result.step_back_query)
        all_questions.append(follow_up_result.follow_up_query)
        all_questions.append(hyde_result.hypothetical_answer)
        all_questions = list(set(all_questions))
        query_expand={"all":all_questions,
            "step_back":step_back_result.model_dump(),
            "follow_up":follow_up_result.model_dump(),
            "hyde":hyde_result.model_dump(),
            "multi_questions":multi_questions_result.model_dump()}
        # 返回所有结果
        return {
            "classification": classification.model_dump(),
            "keywords": keywords_terms.model_dump(),
            "rewrite": rewrite.model_dump(),
            "query_keys": query_keys,
            "slot_filling": slot_filling_result,
            "query_expand": query_expand
        }
    def _fill_slots(self, query: str, classification: Classification, conversation_context: str = "", 
                      chat_history: List[Dict[str, str]] = None, 
@@ -545,6 +601,181 @@ class IntentRecognizer:
            empty_instance = slot_model_class()
            return empty_instance
    def _generate_step_back_prompt(self, query: str, chat_history: List[Dict[str, str]] = None, conversation_context: str = "") -> StepBackPrompt:
        """
        生成后退提示
        Args:
            query: 用户原始问题
            chat_history: 历史对话记录
            conversation_context: 会话背景信息
        Returns:
            后退提示结果
        """
        step_back_start_time = time.time()
        # 准备提示词
        step_back_parser = PydanticOutputParser(pydantic_object=StepBackPrompt)
        formatted_prompt = step_back_prompt.format(
            query=query,
            chat_history=json.dumps(chat_history, ensure_ascii=False) if chat_history else "[]",
            conversation_context=conversation_context,
            output_format=step_back_parser.get_format_instructions()
        )
        try:
            # 调用LLM
            response = self._llm.invoke(formatted_prompt, False)
            # 解析输出
            parsed_output = step_back_parser.parse(response.content)
            step_back_end_time = time.time()
            step_back_time = step_back_end_time - step_back_start_time
            logging.debug(f"后退提示生成耗时统计 - 总耗时: {step_back_time:.2f}秒")
            return parsed_output
        except Exception as e:
            # 如果解析失败，返回原始查询作为后退提示
            logging.error(f"后退提示生成失败: {e}")
            return StepBackPrompt(original_query=query, step_back_query=query)
    def _generate_follow_up_questions(self, query: str, chat_history: List[Dict[str, str]] = None, conversation_context: str = "") -> FollowUpQuestions:
        """
        生成后续问题
        Args:
            query: 用户原始问题
            chat_history: 历史对话记录
            conversation_context: 会话背景信息
        Returns:
            后续问题结果
        """
        follow_up_start_time = time.time()
        # 准备提示词
        follow_up_parser = PydanticOutputParser(pydantic_object=FollowUpQuestions)
        formatted_prompt = follow_up_questions_prompt.format(
            query=query,
            chat_history=json.dumps(chat_history, ensure_ascii=False) if chat_history else "[]",
            conversation_context=conversation_context,
            output_format=follow_up_parser.get_format_instructions()
        )
        try:
            # 调用LLM
            response = self._llm.invoke(formatted_prompt, False)
            # 解析输出
            parsed_output = follow_up_parser.parse(response.content)
            follow_up_end_time = time.time()
            follow_up_time = follow_up_end_time - follow_up_start_time
            logging.debug(f"后续问题生成耗时统计 - 总耗时: {follow_up_time:.2f}秒")
            return parsed_output
        except Exception as e:
            # 如果解析失败，返回原始查询作为后续问题
            logging.error(f"后续问题生成失败: {e}")
            return FollowUpQuestions(original_query=query, follow_up_query=query)
    def _generate_hypothetical_document(self, query: str, chat_history: List[Dict[str, str]] = None, conversation_context: str = "") -> HypotheticalDocument:
        """
        生成假设性文档
        Args:
            query: 用户原始问题
            chat_history: 历史对话记录
            conversation_context: 会话背景信息
        Returns:
            假设性文档结果
        """
        hyde_start_time = time.time()
        # 准备提示词
        hyde_parser = PydanticOutputParser(pydantic_object=HypotheticalDocument)
        formatted_prompt = hyde_prompt.format(
            query=query,
            chat_history=json.dumps(chat_history, ensure_ascii=False) if chat_history else "[]",
            conversation_context=conversation_context,
            output_format=hyde_parser.get_format_instructions()
        )
        try:
            # 调用LLM
            response = self._llm.invoke(formatted_prompt, False)
            # 解析输出
            parsed_output = hyde_parser.parse(response.content)
            hyde_end_time = time.time()
            hyde_time = hyde_end_time - hyde_start_time
            logging.debug(f"假设性文档生成耗时统计 - 总耗时: {hyde_time:.2f}秒")
            return parsed_output
        except Exception as e:
            # 如果解析失败，返回空的假设性回答
            logging.error(f"假设性文档生成失败: {e}")
            return HypotheticalDocument(original_query=query, hypothetical_answer="")
    def _generate_multi_questions(self, query: str, chat_history: List[Dict[str, str]] = None, conversation_context: str = "") -> MultiQuestions:
        """
        生成多角度问题
        Args:
            query: 用户原始问题
            chat_history: 历史对话记录
            conversation_context: 会话背景信息
        Returns:
            多角度问题结果
        """
        multi_questions_start_time = time.time()
        # 准备提示词
        multi_questions_parser = PydanticOutputParser(pydantic_object=MultiQuestions)
        formatted_prompt = multi_questions_prompt.format(
            query=query,
            chat_history=json.dumps(chat_history, ensure_ascii=False) if chat_history else "[]",
            conversation_context=conversation_context,
            output_format=multi_questions_parser.get_format_instructions()
        )
        try:
            # 调用LLM
            response = self._llm.invoke(formatted_prompt, False)
            # 解析输出
            parsed_output = multi_questions_parser.parse(response.content)
            multi_questions_end_time = time.time()
            multi_questions_time = multi_questions_end_time - multi_questions_start_time
            logging.debug(f"多角度问题生成耗时统计 - 总耗时: {multi_questions_time:.2f}秒")
            return parsed_output
        except Exception as e:
            # 如果解析失败，返回原始查询作为唯一子问题
            logging.error(f"多角度问题生成失败: {e}，LLM返回内容：{response.content}")
            return MultiQuestions(original_query=query, sub_questions=[query])
    def _run_in_thread(self, func, args=(), kwargs={}):
        """
        在线程中执行函数并返回结果
        Args:
            func: 要执行的函数
            args: 函数的位置参数
            kwargs: 函数的关键字参数
        Returns:
            (thread, result_container): 线程对象和存放结果的容器
        """
        result_container = []
        def thread_target():
            try:
                result = func(*args, **kwargs)
                result_container.append(result)
            except Exception as e:
                logging.error(f"线程执行函数 {func.__name__} 时出错: {e}")
                result_container.append(None)
        thread = threading.Thread(target=thread_target)
        thread.start()
        return thread, result_container
    def _process_intent_and_slot(self, user_input: str, conversation_context: str = "", 
                              chat_history: List[Dict[str, str]] = None, 
                              previous_slots: Dict[str, Any] = None) -> Dict[str, Any]:
@@ -7,123 +7,6 @@ Date: 2025-06-13
 Description: 多轮对话下意图分类、改写核心提示词
 """
 # 首版重构提示词
 query_rewrite_prompt_pro_old="""
 # 电力造价专业问答优化工程师（升级版）
 你是一名电力造价专业问答优化工程师，负责结合历史对话背景和专业术语库，将用户的原始问题进行规范化重构，以提升知识库检索准确率。
 ## 核心任务
 基于历史对话上下文和专业术语库，将用户的原始问题进行规范化重构，提高知识库检索的准确性和专业性，同时保持对话的连贯性和语境相关性。
 ## 处理流程
 ### 第一阶段：输入解析
 1. 解析基础信息
   - 原始问题(需保留核心语义)：{query}
   - 关键词集合：{keywords}
   - 历史对话记录：{chat_history}
   - 当前聊天背景：{context}
 2. 背景分析
   - 识别历史对话中的关键主题和专业领域
   - 提取上下文中的隐含信息（如软件版本、地区、具体场景等）
   - 分析用户的提问模式和专业水平
 ### 第二阶段：上下文匹配分析
 **背景匹配规则：**
 1. 检查当前问题是否与历史对话存在关联性
 2. 识别历史对话中提到的关键信息：
   - 软件版本/系统（如Z1、D3等）
   - 地区定额（如西藏、山东等）
   - 具体功能模块
   - 用户操作习惯
 **术语匹配规则：**
 1. 检查原始问题中是否包含关键词集合中的`name`字段或`synonymous`字段中的任何词汇
 2. 结合历史对话，识别可能的隐含专业术语
 3. 统计匹配的术语数量
 4. 判断执行路径：
   - 匹配术语 ≥ 1个 或 存在明显上下文关联 → 执行重构流程
   - 匹配术语 = 0个 且 无明显上下文关联 → 直接输出原始问题
 ### 第三阶段：问题重构
 **重构原则（按优先级排序）：**
 1. **语义保真**：严格保持原问题的核心意图和诉求
 2. **上下文继承**：
   - 补充历史对话中的隐含信息（如软件名称、版本、地区等）
   - 保持对话的连贯性和逻辑性
   - 避免重复已确认的背景信息
 3. **术语规范**：
   - 将匹配到的同义词替换为对应的标准术语（name字段）
   - 对在关键词中的标准术语使用【】进行标记
   - 保留在原问题中未在关键词库中的专业术语、限定词和修饰词
 4. **结构优化**：
   - 保持原问题的语态特征5W2H
   - 保持主谓宾结构清晰
   - 保留时间、版本等限定条件
 **术语处理规则：**
 - 优先级1：基于历史对话补充缺失的背景信息
 - 优先级2：保留原问题中的专业术语、限定词和修饰词（即使不在关键词库中）
 - 优先级3：将同义词替换为标准术语并用【】标记
 - 优先级4：对原问题中已存在的标准术语添加【】标记
 **上下文处理策略：**
 - 如果当前问题与历史对话高度相关，适当补充背景信息
 - 如果用户使用代词（如"这个"、"那个"），尝试结合历史对话明确指代
 - 如果历史对话中已确定软件或系统，在当前问题中适当体现
 # 输出规范
 {output_format}
 # 示范案例库
 ▶ 案例1（有效匹配 + 上下文继承）
 历史对话：用户之前询问过"西藏定额升级的问题"
 输入：
 原始问题：怎么把旧版工程转到Z1新版
 关键词：【'老版本定额升级', '批量设置定额', '西藏造价软件Z1'】
 输出：
 {{"rewrite":"【西藏造价软件Z1】如何执行【老版本定额升级】操作？"}}
 ▶ 案例2（无效匹配 + 无上下文关联）
 历史对话：无相关内容
 输入：
 原始问题：程序界面文字显示过小如何处理？
 关键词：【'定额升级', '工程批量导入'】
 输出：
 {{"rewrite":"程序界面文字显示过小如何处理？"}}
 ▶ 案例3（部分匹配 + 上下文补充）
 历史对话：用户之前询问过"D3软件的功能"
 输入：
 原始问题：能导出清单的计算公式吗？
 关键词：【'配网工程计价通D3软件', '计算式'】
 输出：
 {{"rewrite":"【配网工程计价通D3软件】能导出清单的【计算式】吗？"}}
 ▶ 案例4（代词替换 + 上下文解析）
 历史对话：用户刚询问过"山东定额的问题"
 输入：
 原始问题：这个定额怎么批量导入？
 关键词：【'批量导入定额', '山东定额'】
 输出：
 {{"rewrite":"【山东定额】如何进行【批量导入定额】操作？"}}
 ## 质量检查清单
 执行前请确认：
 - [ ] 是否保持了原问题的核心诉求？
 - [ ] 是否合理利用了历史对话中的背景信息？
 - [ ] 是否正确执行了同义词替换？
 - [ ] 是否保留了原问题中的专业术语和限定条件？
 - [ ] 是否正确使用了【】标记？
 - [ ] 重构后的问题是否自然流畅？
 - [ ] 是否保持了对话的连贯性？
 - [ ] 是否避免了过度补充不必要的信息？
 """
 query_rewrite_prompt_pro="""
 # 电力造价问答优化工程师（精简版）
 **角色**：基于历史对话和术语库重构问题，提升知识库检索准确率。
@@ -49,7 +49,7 @@ classification_info="""【垂直领域分类】：
 "用哪个软件打开.BDY3文件？",
 "BDD3是什么"
 2. 软件锁类：询问软件锁信息、锁注册号查询、许可证查询、锁激活问题等软件锁相关问题
-3. 安装下载类：安装下载咨询、组件(插件)选择、环境配置等
+3. 安装下载类：安装下载咨询、组件(插件)选择、环境配置、安装包下载、政策文件(规范文件)下载等
 4. 问题排查类：软件安装下载失败、报错，系统兼容性问题等
 【其他】:
@@ -204,3 +204,164 @@ slot_filling_prompt = """
  "reproduction_steps": "新建工程"
 }}
 """
 # 意图优化环节提示词模板
 step_back_prompt = """
 # 后退提示生成器
 你是一个专业的电力造价领域问题抽象专家。你的任务是根据用户的具体问题，提出一个更抽象、更高层次的问题，帮助系统更好地理解用户的意图。
 ## 任务说明
 1. 分析用户的原始问题，理解其核心意图和需求
 2. 考虑历史对话和会话背景，理解用户当前问题的上下文
 3. 生成一个更抽象、更高层次的问题，称为"后退问题"
 4. 后退问题应该：
   - 更加通用和抽象
   - 涵盖原始问题的核心主题
   - 去除过于具体的限制条件（如时间、地点、特定版本等）
   - 保持在同一领域和主题范围内
   - 考虑历史对话中的相关信息
 ## 输入
 用户原始问题: {query}
 历史对话记录: {chat_history}
 会话背景: {conversation_context}
 ## 输出格式
 {output_format}
 ## 示例
 原始问题: "配网D3软件2023版本如何在Windows 11系统上导入单位工程量清单？"
 后退问题: "配网D3软件如何导入工程量清单？"
 原始问题: "技改T1软件中的某个设备更换后，如何在系统中更新对应的定额？"
 后退问题: "技改T1软件中如何更新设备对应的定额？"
 """
 follow_up_questions_prompt = """
 # 后续问题生成器
 你是一个专业的电力造价领域对话理解专家。你的任务是根据历史对话和当前问题，生成一个完整的独立问题，确保即使没有历史上下文也能理解。
 ## 任务说明
 1. 分析历史对话记录和当前用户问题
 2. 识别当前问题中可能引用了历史对话的部分（如代词、省略内容等）
 3. 生成一个完整的独立问题，该问题应该：
   - 包含历史对话中的关键上下文
   - 明确指代所有代词和省略内容
   - 保持原问题的核心意图不变
   - 即使没有历史对话也能被理解
 ## 输入
 历史对话记录: {chat_history}
 当前用户问题: {query}
 会话背景: {conversation_context}
 ## 输出格式
 {output_format}
 ## 示例
 历史对话:
 用户: "我在使用配网D3软件"
 助手: "好的，请问您遇到什么问题？"
 当前问题: "怎么导入清单？"
 生成的独立问题: "在配网D3软件中，怎么导入清单？"
 历史对话:
 用户: "技改T1软件中的设备更换功能在哪里？"
 助手: "设备更换功能在'工程管理'菜单下的'设备管理'子菜单中。"
 当前问题: "更新后如何保存？"
 生成的独立问题: "在技改T1软件中使用设备更换功能后，如何保存更新的设备信息？"
 """
 hyde_prompt = """
 # 假设性文档生成器
 你是一个专业的电力造价领域知识专家。你的任务是根据用户的问题和历史对话，生成一个假设性的回答，该回答可能包含的信息和模式将有助于在知识库中检索相关文档。
 ## 任务说明
 1. 分析用户的问题，理解其核心意图和需求
 2. 考虑历史对话和会话背景，理解用户当前问题的上下文
 3. 生成一个假设性的回答，该回答应该：
   - 尽可能准确地回答用户问题
   - 包含可能与问题相关的专业术语和概念
   - 包含可能在知识库文档中出现的模式和结构
   - 考虑历史对话中的相关信息
   - 即使你不确定答案的准确性，也要提供一个合理的假设
 ## 输入
 用户问题: {query}
 历史对话记录: {chat_history}
 会话背景: {conversation_context}
 ## 输出格式
 {output_format}
 ## 示例
 用户问题: "配网D3软件如何导入Excel清单？"
 假设性回答: "在配网D3软件中导入Excel清单的步骤如下：
 1. 打开配网D3软件，进入工程管理模块
 2. 点击菜单栏中的'导入/导出'选项
 3. 选择'导入Excel清单'功能
 4. 在弹出的对话框中选择已准备好的Excel文件
 5. 确认导入格式和映射关系
 6. 点击'确定'完成导入
 注意：导入的Excel文件需要符合特定的格式要求，建议先在软件中导出一个样例文件作为模板。"
 """
 multi_questions_prompt = """
 # 多角度问题生成器
 你是一个专业的电力造价领域问题分解专家。你的任务是根据用户的原始问题和历史对话，从不同角度生成多个子问题，以帮助系统更全面地理解和回答用户的需求。
 ## 任务说明
 1. 分析用户的原始问题，理解其核心意图和需求
 2. 考虑历史对话和会话背景，理解用户当前问题的上下文
 3. 从不同角度生成2-4个子问题，这些子问题应该：
   - 分别关注原始问题的不同方面或组成部分
   - 更加具体和直接
   - 共同覆盖原始问题的完整意图
   - 考虑历史对话中的相关信息
   - 每个子问题都应该是自包含的，可以独立回答
 ## 输入
 用户原始问题: {query}
 历史对话记录: {chat_history}
 会话背景: {conversation_context}
 ## 输出格式
 {output_format}
 ## 示例
 原始问题: "配网D3软件中如何处理定额调整和工程量清单导入？"
 子问题:
 1. "配网D3软件中如何进行定额调整？"
 2. "配网D3软件中如何导入工程量清单？"
 3. "定额调整后，是否会影响已导入的工程量清单？"
 按格式输出：
 {{
   "original_query":"配网D3软件中如何处理定额调整和工程量清单导入？"
    "sub_questions": [
        "配网D3软件中如何进行定额调整？",
        "配网D3软件中如何导入工程量清单？",
        "定额调整后，是否会影响已导入的工程量清单？"
    ]
 }}
 原始问题: "技改T1软件和配网D3软件的区别是什么？"
 子问题:
 1. "技改T1软件的主要功能和适用范围是什么？"
 2. "配网D3软件的主要功能和适用范围是什么？"
 3. "技改T1软件和配网D3软件在使用场景上有什么不同？"
 4. "如何选择使用技改T1软件还是配网D3软件？"
 按格式输出：
 {{
   "original_query":"技改T1软件和配网D3软件的区别是什么？"
   "sub_questions": [
      "技改T1软件的主要功能和适用范围是什么？",
      "配网D3软件的主要功能和适用范围是什么？",
      "技改T1软件和配网D3软件在使用场景上有什么不同？",
      "如何选择使用技改T1软件还是配网D3软件？"
   ]
 }}
 """