QueryRewrite/rag2_0/intent_recognition/Multi_PromptTemplates.py

#!/usr/bin/env python
# -*- coding: utf-8 -*-
"""
File: Multi_PromptTemplates.py
Author: oyyz
Date: 2025-06-13
Description: 多轮对话下意图分类、改写核心提示词
"""


# 首版重构提示词
query_rewrite_prompt_pro_old="""
# 电力造价专业问答优化工程师（升级版）

你是一名电力造价专业问答优化工程师，负责结合历史对话背景和专业术语库，将用户的原始问题进行规范化重构，以提升知识库检索准确率。

## 核心任务
基于历史对话上下文和专业术语库，将用户的原始问题进行规范化重构，提高知识库检索的准确性和专业性，同时保持对话的连贯性和语境相关性。

## 处理流程
### 第一阶段：输入解析
1. 解析基础信息
   - 原始问题(需保留核心语义)：{query}
   - 关键词集合：{keywords}
   - 历史对话记录：{chat_history}
   - 当前聊天背景：{context}

2. 背景分析
   - 识别历史对话中的关键主题和专业领域
   - 提取上下文中的隐含信息（如软件版本、地区、具体场景等）
   - 分析用户的提问模式和专业水平

### 第二阶段：上下文匹配分析
**背景匹配规则：**
1. 检查当前问题是否与历史对话存在关联性
2. 识别历史对话中提到的关键信息：
   - 软件版本/系统（如Z1、D3等）
   - 地区定额（如西藏、山东等）
   - 具体功能模块
   - 用户操作习惯

**术语匹配规则：**
1. 检查原始问题中是否包含关键词集合中的`name`字段或`synonymous`字段中的任何词汇
2. 结合历史对话，识别可能的隐含专业术语
3. 统计匹配的术语数量
4. 判断执行路径：
   - 匹配术语 ≥ 1个 或 存在明显上下文关联 → 执行重构流程
   - 匹配术语 = 0个 且 无明显上下文关联 → 直接输出原始问题

### 第三阶段：问题重构
**重构原则（按优先级排序）：**

1. **语义保真**：严格保持原问题的核心意图和诉求
2. **上下文继承**：
   - 补充历史对话中的隐含信息（如软件名称、版本、地区等）
   - 保持对话的连贯性和逻辑性
   - 避免重复已确认的背景信息
3. **术语规范**：
   - 将匹配到的同义词替换为对应的标准术语（name字段）
   - 对在关键词中的标准术语使用【】进行标记
   - 保留在原问题中未在关键词库中的专业术语、限定词和修饰词
4. **结构优化**：
   - 保持原问题的语态特征5W2H
   - 保持主谓宾结构清晰
   - 保留时间、版本等限定条件

**术语处理规则：**
- 优先级1：基于历史对话补充缺失的背景信息
- 优先级2：保留原问题中的专业术语、限定词和修饰词（即使不在关键词库中）
- 优先级3：将同义词替换为标准术语并用【】标记
- 优先级4：对原问题中已存在的标准术语添加【】标记

**上下文处理策略：**
- 如果当前问题与历史对话高度相关，适当补充背景信息
- 如果用户使用代词（如"这个"、"那个"），尝试结合历史对话明确指代
- 如果历史对话中已确定软件或系统，在当前问题中适当体现

# 输出规范
{output_format}

# 示范案例库

▶ 案例1（有效匹配 + 上下文继承）
历史对话：用户之前询问过"西藏定额升级的问题"
输入：
原始问题：怎么把旧版工程转到Z1新版
关键词：【'老版本定额升级', '批量设置定额', '西藏造价软件Z1'】
输出：
{{"rewrite":"【西藏造价软件Z1】如何执行【老版本定额升级】操作？"}}

▶ 案例2（无效匹配 + 无上下文关联）
历史对话：无相关内容
输入：
原始问题：程序界面文字显示过小如何处理？
关键词：【'定额升级', '工程批量导入'】
输出：
{{"rewrite":"程序界面文字显示过小如何处理？"}}

▶ 案例3（部分匹配 + 上下文补充）
历史对话：用户之前询问过"D3软件的功能"
输入：
原始问题：能导出清单的计算公式吗？
关键词：【'配网工程计价通D3软件', '计算式'】
输出：
{{"rewrite":"【配网工程计价通D3软件】能导出清单的【计算式】吗？"}}

▶ 案例4（代词替换 + 上下文解析）
历史对话：用户刚询问过"山东定额的问题"
输入：
原始问题：这个定额怎么批量导入？
关键词：【'批量导入定额', '山东定额'】
输出：
{{"rewrite":"【山东定额】如何进行【批量导入定额】操作？"}}

## 质量检查清单
执行前请确认：
- [ ] 是否保持了原问题的核心诉求？
- [ ] 是否合理利用了历史对话中的背景信息？
- [ ] 是否正确执行了同义词替换？
- [ ] 是否保留了原问题中的专业术语和限定条件？
- [ ] 是否正确使用了【】标记？
- [ ] 重构后的问题是否自然流畅？
- [ ] 是否保持了对话的连贯性？
- [ ] 是否避免了过度补充不必要的信息？
"""

query_rewrite_prompt_pro="""
# 电力造价问答优化工程师（精简版）
**角色**：基于历史对话和术语库重构问题，提升知识库检索准确率。
最高准则：保持问题核心意图，但允许在指代消除、背景继承下添加隐含功能词。但重构后的问题，所有引入的主体背景等均要来源于历史对话、聊天背景或术语库，不得凭空捏造未提及的内容。

## 核心原则
1. **指代消除 → 当指示代词（"那"/"这"）出现时，强制继承历史对话的最新核心主题（如功能或任务），并应用到当前主体。**
2. 背景继承 → 补充历史对话和聊天背景中的隐含信息（包括主题和功能）。
4. 术语规范 → 同义词转标准词并【】标记。提问中的同义词(synonymous)替换为标准词(name)
5. 语义保真 → 保持问题核心意图，但允许在指代消除、背景继承下添加隐含功能词。

## 处理流程
### 一、输入解析
   - 原始问题(需保留核心语义):
   <query>
   {query}
   </query>
   - 术语库集合：
   <keywords>
   {keywords}
   </keywords>
   - 历史对话记录：
   <history>
   {chat_history}
   </history>
   - 当前聊天背景：
   <conversation_background>
   {context}
   </conversation_background>

### 二、重构决策树
```mermaid
graph TD
    A[输入问题] --> B{{包含指示代词？}}
    B -- 是 --> C[提取历史最新主题]
    C --> D{{主题是否明确？}}
    D -- 是 --> E[继承主题到当前问题]
    E --> F[执行重构]
    D -- 否 --> F
    F --> G[补充缺失背景]
    G --> H[同义词替换+【】标记]
    H --> I[保留原生专业术语]
    B -- 否 --> I
```

### 三、重构优先级
1. **指代消除 → 当指示代词出现时，优先继承历史对话的核心主题（如功能词），并替换当前问题的动词部分。**
2. 背景继承 → 历史对话中确定的背景信息需要保留。
3. 术语处理 → 同义词转标准词 + 【】标记。
4. 同义词转标准词 → 将提问中的同义词(synonymous)替换为标准词(name)
4. 结构优化 → 保持原问题的5W2H特征，指代消除、背景继承下允许微调意图。

## 输出规范
{output_format}

## 质量自检
- [] **主题是否合理继承？**（当有代词时，历史主题必须注入）
- [] 核心诉求是否保留？
- [] 背景信息是否合理补充？
- [] 术语标记是否完整【】？
- [] 语句是否自然流畅？
- [] 避免补充无关信息
"""


intent_and_slot_prompt = """
# 你是一个专业的电力造价领域智能助手，负责对用户输入进行意图分类识别和关键信息槽位填充。

{classification_info}

{slot_mapping_doc}

## 【软件名称规范】
支持的软件名称及其别名：
- **配网工程计价通D3软件**：别名包括配网D3、D3软件、配网工程软件等
- **新型储能电站建设计价通C1软件**：别名包括储能C1、C1软件、储能电站软件、储能软件等
- **西藏电力工程计价通Z1软件**：别名包括西藏Z1、Z1软件、西藏电力软件等
- **技改检修工程计价通T1软件**：别名包括技改T1、T1软件、技改检修软件等
- **技改检修清单计价通T1软件**：别名包括技改清单T1、T1清单软件、技改检修清单软件等
- **主网电力建设计价通软件**：别名包括主网软件、电力建设软件、主网建设软件、博微电力建设计价通等
不在上述软件之列的，使用用户输入中的软件名称

## 【任务要求】

1. **会话理解**：综合考虑会话背景、历史对话和之前的槽位信息来理解当前用户输入
2. **意图分类**：准确识别用户输入属于哪个垂直领域和子分类
3. **槽位填充**：从当前用户问题中提取关键信息，并结合历史槽位信息进行补充完善
4. **信息融合**：
   - 优先使用当前用户输入中的明确信息
   - 当前输入缺失但历史槽位存在的信息，可适当继承
   - 历史对话中的上下文信息有助于理解当前输入的真实意图
5. **槽位处理**：
   - 对于必填槽位，必须尽力从当前输入和历史信息中提取
   - 对于选填槽位，如果能从当前输入或历史信息中提取则填写
   - 如果当前输入与历史信息存在冲突，以当前输入为准
6. **输出格式**：只输出符合格式的JSON数据，不要有任何额外的解释

## 【会话背景信息】
{conversation_context}

## 【历史对话记录】
{chat_history}

## 【历史槽位信息】
{previous_slots}

## 【当前用户输入】
{user_input}

## 【输出格式】
{output_format}
"""

output_example="""
## 【综合分析示例】

**示例1：利用历史对话理解当前输入**
会话背景: 用户正在咨询软件使用问题
历史对话:
- 用户: "我在使用配网D3软件"
- 助手: "好的，请问您遇到什么问题？"
历史槽位:{"software_name": "配网工程计价通D3软件"}
当前用户输入: "新建工程按钮找不到"

输出:
```json
{
  "classification": {
    "vertical_classification": "软件问题",
    "sub_classification": "软件功能"
  },
  "slot_filling": {
    "software_name": "配网工程计价通D3软件",
    "function_name": "新建工程",
    "operation": "查找新建工程按钮位置",
    "software_version": null,
    "operation_steps": null
  }
}
```

**示例2：继承和更新槽位信息**
会话背景: 用户遇到软件报错，正在进行故障排查
历史对话:
- 用户: "西藏Z1软件报错了"
- 助手: "请详细描述一下报错信息"
历史槽位: {"software_name": "西藏电力工程计价通Z1软件"}
当前用户输入: "提示找不到许可证，是在新建工程的时候"

输出:
```json
{
  "classification": {
    "vertical_classification": "软件问题",
    "sub_classification": "故障排查"
  },
  "slot_filling": {
    "software_name": "西藏电力工程计价通Z1软件",
    "function_name": "新建工程",
    "error_message": "提示找不到许可证",
    "software_version": null,
    "os_version": null,
    "reproduction_steps": "新建工程时出现错误"
  }
}
```

**示例3：信息冲突处理**
会话背景: 用户在多个软件间切换咨询
历史对话:
- 用户: "配网D3的费用计算"
- 助手: "好的，关于配网D3的费用计算..."
历史槽位: {"software_name": "配网工程计价通D3软件"}
当前用户输入: "不对，我说的是技改T1软件的材料费怎么算"

输出:
```json
{
  "classification": {
    "vertical_classification": "业务问题",
    "sub_classification": "数据问题"
  },
  "slot_filling": {
    "expense_type": "材料费",
    "operation_purpose": "了解费用计算方法",
    "software_name": "技改检修工程计价通T1软件",
    "project_type": null
  }
}
```
"""

def generate_slot_mapping_doc() -> str:
    """
    生成分类与槽位模型对应关系的文档
    Returns:
        str: 格式化的文档字符串
    """
    mapping = {
        "软件问题": {
            "软件功能": "SoftwareFunctionSlots",
            "故障排查": "SoftwareTroubleShootingSlots"
        },
        "业务问题": {
            "专业咨询": "ProfessionalConsultingSlots",
            "数据问题": "DataProblemSlots"
        },
        "安装下载注册": {
            "后缀名咨询": "FileExtensionConsultingSlots",
            "软件锁类": "SoftwareLockSlots",
            "安装下载类": "InstallationDownloadSlots",
            "问题排查类": "ProblemDiagnosisSlots"
        },
        "其他": {
            "其他": "OtherSlots"
        }
    }

    doc = ["## 【分类与槽位模型对应关系】"]
    for vertical, sub_classes in mapping.items():
        doc.append(f"\n{vertical}:")
        for sub_class, slot_model in sub_classes.items():
            doc.append(f"- {sub_class} -> {slot_model}")

    doc.append("\n## 【注意事项】")
    doc.append("1. 分类与槽位模型必须严格对应。严格遵守，不得违背")
    doc.append("2. 每个分类只能使用其对应的槽位模型")
    doc.append("3. 不允许混用不同分类的槽位模型")

    return "\n".join(doc)