合并Dev分支代码

2024-08-30 10:49:05 +08:00
parent e9ccd7db35
commit 73565b26e4
16 changed files with 486 additions and 409 deletions
@@ -80,4 +80,4 @@ SYSTEM_PROMPT="You are a weather forecast agent. You help users to get the weath
 - You can install any pip package (if it exists) by running a cell with pip install.
 "
-PRJTOJSON_URL = 'http://10.1.6.60:8092'
+PROJECT_TITLE = "您好，我是博微工程理解小助手，您可以问我有关[线路工程]工程数据的相关问题！"
@@ -111,4 +111,4 @@ SYSTEM_PROMPT="You are a weather forecast agent. You help users to get the weath
 - You can install any pip package (if it exists) by running a cell with pip install.
 "
-PRJTOJSON_URL = 'http://10.1.6.60:8092'
+PROJECT_TITLE = "您好，我是博微工程理解小助手，您可以问我有关[线路工程]工程数据的相关问题！"
@@ -1,7 +1,9 @@
 import asyncio
 import json
 import logging
 import time
 from typing import Dict, List, Any, Optional, AsyncGenerator
 from collections import deque
 from aiostream import stream
 from fastapi import APIRouter, Request,HTTPException
@@ -12,7 +14,8 @@ from llama_index.core.callbacks import CBEventType
 from llama_index.core.chat_engine.types import StreamingAgentChatResponse
 from llama_index.core.tools import ToolOutput
 from pydantic import BaseModel
-from app.api.routers.request.base import userMng, conversations,message,parameter
+from app.api.routers.request.base import userMng, conversations,message,parameter,feedback
 from app.api.routers.request.baseConfig import *
 from app.api.routers.request.models import ChatRequestData,ChatFileUploadRequest
 from app.engine import get_chat_engine
 import uuid
@@ -23,81 +26,139 @@ logger = logging.getLogger("uvicorn")
 api_router = r = APIRouter()
 v1_router = v = APIRouter()
 default_conversation_id = '82e8417f-2c3b-4bb5-ab22-2ad318bbd29a'
 class ChatCallbackEvent(BaseModel):
-    event_type: CBEventType
+    event_type: ChatEventType
    payload: Optional[Dict[str, Any]] = None
    event_id: str = ""
-    def get_retrieval_message(self) -> dict | None:
+    def get_common_param(self)-> dict:
-        if self.payload:
+        return {
-            nodes = self.payload.get("nodes")
+            'event': self.event_type.name,
-            if nodes:
+            'conversation_id':self.payload.get("conversation_id"),
-                msg = f"根据查询检索到 {len(nodes)} 源文件"
+            'message_id': self.payload.get("message_id"), 
-            else:
+            'created_at':  int(time.time()),
-                msg = f"查询检索中: '{self.payload.get('query_str')}'"
+            'task_id': self.payload.get("task_id")
-            return {
+        }
                "type": "events",
                "data": {"title": msg},
            }
        else:
            return None
-    def get_tool_message(self) -> dict | None:
+    def get_WorkflowStart_param(self) -> dict:
-        func_call_args = self.payload.get("function_call")
+        params = self.get_common_param()
-        if func_call_args is not None and "tool" in self.payload:
+        params.update({
-            tool = self.payload.get("tool")
+            'workflow_run_id':self.payload.get('workflow_run_id'),
-            return {
+            'data':{
-                "type": "events",
+                "id": self.payload.get('workflow_run_id'),
-                "data": {
+                "workflow_id": self.payload.get('workflow_id'),
-                    "title": f"调用工具 {tool.name} ，参数: {func_call_args}",
+                "sequence_number": 1709,
                "inputs": {
                    "sys.query": self.payload.get('query'),
                    "sys.files": [],
                    "sys.conversation_id": self.payload.get('conversation_id'),
                    "sys.user_id": self.payload.get('use_id')
                },
                "created_at": int(time.time())
            }
        })
        return params
-    def _is_output_serializable(self, output: Any) -> bool:
+    def get_WorkflowFinished_param(self) -> dict:
-        try:
+        params = self.get_common_param()
-            json.dumps(output)
+        params.update({
-            return True
+            'workflow_run_id':self.payload.get('workflow_run_id'),
-        except TypeError:
+            'data':{
-            return False
+                "id": self.payload.get('workflow_run_id'),
                "workflow_id": self.payload.get('workflow_id'),
                "sequence_number": 1709,
                "status": "succeeded",
                "outputs": {
                    "answer": self.payload.get('response')
                },
                "error": '',
                "elapsed_time": 36.03764106379822,
                "total_tokens": 11707,
                "total_steps": 10,
                "created_by": {
                "id": str(uuid.uuid4()),
                "user": self.payload.get('use_id')
                },
                "created_at": int(time.time()),
                "finished_at": int(time.time()),
                "files": []
            }
        })
        return params
    def get_NodeStart_param(self) -> dict:
        params = self.get_common_param()
        params.update({
            'workflow_run_id':self.payload.get('workflow_run_id'),
            'data':{
                "id": self.payload.get('nodeid'),
                "node_id": self.payload.get('nodeid'),
                "node_type": "http-request",
                "title": self.payload.get('title'),
                "index": self.payload.get('index'),
                "predecessor_node_id": self.payload.get('predecessor_node_id'),
                "inputs": '',
                "created_at": 1724398751,
                "extras": {}
            }
        })
        return params     
-    def get_agent_tool_response(self) -> dict | None:
+    def get_NodeFinished_param(self) -> dict:
-        response = self.payload.get("response")
+        params = self.get_common_param()
-        if response is not None:
+        params.update({
-            sources = response.sources
+            'workflow_run_id':self.payload.get('workflow_run_id'),
-            for source in sources:
+            'data':{
-                # Return the tool response here to include the toolCall information
+                "id": self.payload.get('nodeid'),
-                if isinstance(source, ToolOutput):
+                "node_id": self.payload.get('nodeid'),
-                    if self._is_output_serializable(source.raw_output):
+                "node_type": "http-request",
-                        output = source.raw_output
+                "title": self.payload.get('title'),
-                    else:
+                "index": self.payload.get('index'),
-                        output = source.content
+                "predecessor_node_id": self.payload.get('predecessor_node_id'),
                "inputs": '',
                "process_data": '',
                "outputs": '',
                "status": "succeeded",
                "error": '',
                "elapsed_time": 0.10402441816404462,
                "execution_metadata": '',
                "created_at": 1724398751,
                "finished_at": 1724398751,
                "files": []
            }
        })
        return params  
-                    return {
+    def get_Message_param(self) -> dict:
-                        "type": "tools",
+        params = self.get_common_param()
-                        "data": {
+        params.update({
-                            "toolOutput": {
+            'id':self.payload.get('message_id'),
-                                "output": output,
+            'answer':self.payload.get('answer')
-                                "isError": source.is_error,
+        })
-                            },
+        return params 
-                            "toolCall": {
+    
-                                "id": None,  # There is no tool id in the ToolOutput
+    def get_MessageEnd_param(self) -> dict:
-                                "name": source.tool_name,
+        params = self.get_common_param()
-                                "input": source.raw_input,
+        params.update({
-                            },
+            'id':self.payload.get('message_id'),
-                        },
+            'metadata':self.payload.get('metadata')
-                    }
+        })
        return params 
-    def to_response(self):
+    def to_response(self)-> dict|None:
        try:
            match self.event_type:
-                case "retrieve":
+                case "workflow_started":
-                    return self.get_retrieval_message()
+                    return self.get_WorkflowStart_param()
-                case "function_call":
+                case "workflow_finished":
-                    return self.get_tool_message()
+                    return self.get_WorkflowFinished_param()
-                case "agent_step":
+                case "node_started":
-                    return self.get_agent_tool_response()
+                    return self.get_NodeStart_param()
                case 'node_finished':
                    return self.get_NodeFinished_param()
                case 'message':
                    return self.get_Message_param()
                case 'message_end':
                    return self.get_MessageEnd_param()
                case _:
                    return None
        except Exception as e:
@@ -108,19 +169,34 @@ class ChatEventCallbackHandler(BaseCallbackHandler):
    _aqueue: asyncio.Queue
    is_done: bool = False
-    def __init__(
+    def __init__(self,**params):
            self,
    ):
        """Initialize the base callback handler."""
        ignored_events = [
-            CBEventType.CHUNKING,
+            # CBEventType.CHUNKING,
-            CBEventType.NODE_PARSING,
+            # CBEventType.NODE_PARSING,
-            CBEventType.EMBEDDING,
+            # CBEventType.EMBEDDING,
-            CBEventType.LLM,
+            # CBEventType.LLM,
-            CBEventType.TEMPLATING,
+            # CBEventType.TEMPLATING,
        ]
        super().__init__(ignored_events, ignored_events)
        self._aqueue = asyncio.Queue()
        self._response:str = ''
        self._params:Dict[str,Any] = params
        self._nodeStack:deque = deque()
        #添加工作流开始事件     
        data:ChatRequestData = self._params['data']
        args:Dict[str,Any] = self._params['ids']
        args.update(
            {
                'use_id': data.user,
                'query': data.query,
                'conversation_id': data.conversation_id  
            }
        )
        wf_event = ChatCallbackEvent(event_type = ChatEventType.WORKFLOW_START,payload = args)
        if wf_event.to_response() is not None:
            self._aqueue.put_nowait(wf_event)
    def on_event_start(
            self,
@@ -129,9 +205,23 @@ class ChatEventCallbackHandler(BaseCallbackHandler):
            event_id: str = "",
            **kwargs: Any,
    ) -> str:
-        event = ChatCallbackEvent(event_id=event_id, event_type=event_type, payload=payload)
+        logger.info("event_start:{} type:{} payload:{}\n".format(event_id, event_type, payload))
-        if event.to_response() is not None:
+
-            self._aqueue.put_nowait(event)
+        self._nodeStack.append(event_id)      
        nindex = self._nodeStack.count() - 1
        args:Dict[str,Any] = self._params['ids']
        args.update(
            {
                'nodeid':event_id,
                'title':event_type.name,
                'index':nindex + 1,
                'predecessor_node_id': self._nodeStack[nindex - 1] if nindex > 0 else ''
            }
        )
        nd_event = ChatCallbackEvent(event_type = ChatEventType.NODE_START,payload = args)
        if nd_event.to_response() is not None:
            self._aqueue.put_nowait(nd_event)
    def on_event_end(
            self,
@@ -140,12 +230,30 @@ class ChatEventCallbackHandler(BaseCallbackHandler):
            event_id: str = "",
            **kwargs: Any,
    ) -> None:
-        event = ChatCallbackEvent(event_id=event_id, event_type=event_type, payload=payload)
+        logger.info("event_end:{} type:{} payload:{}\n".format(event_id, event_type, payload))
-        if event.to_response() is not None:
+        
-            self._aqueue.put_nowait(event)
+        #self.response = payload.get("response","")
        args:Dict[str,Any] = self._params['ids']
        nodeID = self._nodeStack[-1]
        if nodeID == event_id:
            nindex = self._nodeStack.count() - 1
            args.update(
                {
                    'nodeid':event_id,
                    'title':event_type.name,
                    'index':nindex + 1,
                    'predecessor_node_id':self._nodeStack[nindex - 1] if nindex > 0 else ''
                }
            )
            nd_event = ChatCallbackEvent(event_type = ChatEventType.NODE_FINISHED,payload = args)
            if nd_event.to_response() is not None:
                self._aqueue.put_nowait(nd_event)
            self._nodeStack.pop()
    def start_trace(self, trace_id: Optional[str] = None) -> None:
        """No-op."""
        logger.info("trace_start:{}\n".format(trace_id))
    def end_trace(
            self,
@@ -153,6 +261,24 @@ class ChatEventCallbackHandler(BaseCallbackHandler):
            trace_map: Optional[Dict[str, List[str]]] = None,
    ) -> None:
        """No-op."""
        logger.info("trace_end:{} trace_map:{}\n".format(trace_id, trace_map))
        data:ChatRequestData = self._params['data']    
        args:Dict[str,Any] = self._params['ids']
        args.update(
            {
                'response':self._response,
                'conversation_id': data.conversation_id
            }
        )
        wf_event = ChatCallbackEvent(event_type = ChatEventType.WORKFLOW_FINISHED,payload = args)
        if wf_event.to_response() is not None:
            self._aqueue.put_nowait(wf_event)
        args:Dict[str,Any] = self._params['ids']
        msgEnt_event = ChatCallbackEvent(event_type = ChatEventType.MESSAGE_END,payload = args)
        if msgEnt_event.to_response() is not None:
            self._aqueue.put_nowait(msgEnt_event)                 
    async def async_event_gen(self) -> AsyncGenerator[ChatCallbackEvent, None]:
        while not self._aqueue.empty() or not self.is_done:
@@ -170,104 +296,38 @@ class IDManager:
            "workflow_id": str(uuid.uuid4())
        }
 class DifyChatResponseEvent(BaseModel):
    event: str
    conversation_id: str 
    message_id: str 
    created_at: int = 1724406492
    task_id: str 
 class Workflow_started_DifyChatResponseEvent(DifyChatResponseEvent):
    workflow_run_id:str 
    data:Dict[str,Any]
    def __init__(self,**args):
        args['data'] = {
            "id": args['workflow_run_id'],
            "workflow_id": args['workflow_id'],
            "sequence_number": 1709,
            "inputs": {
                "sys.query": args['query'],
                "sys.files": [],
                "sys.conversation_id":  args['conversation_id'],
                "sys.user_id": args['use_id']
            },
            "created_at": 1724406492
        }
        args['event'] = 'workflow_started'
        super().__init__(**args)
 class Workflow_finished_DifyChatResponseEvent(DifyChatResponseEvent):
    workflow_run_id:str 
    data:Dict[str,Any]
    def __init__(self,**args):
        args['event'] = 'workflow_finished'
        args['data'] =  {
 		    "id": args['workflow_run_id'],
 		    "workflow_id": args['workflow_id'],
 		    "sequence_number": 1709,
 		    "status": "succeeded",
 		    "outputs": {
 			    "answer": args['response']
 		    },
 		    "error": '',
 		    "elapsed_time": 36.03764106379822,
 		    "total_tokens": 11707,
 		    "total_steps": 10,
 		    "created_by": {
 			"id": str(uuid.uuid4()),
 			"user": args['use_id']
 		    },
 		    "created_at": 1724406492,
 		    "finished_at": 1724406528,
 		    "files": []
        }
        super().__init__(**args)
 class Message_DifyChatResponseEvent(DifyChatResponseEvent):
    id:str 
    answer:str
    def __init__(self,**args):
        args['id'] = args['message_id']
        args['event'] = 'message'
        super().__init__(**args)
 class MessageEnd_DifyChatResponseEvent(DifyChatResponseEvent):
    id:str
    metadata:Dict[str,Any] = {}
    def __init__(self,**args):
        args['id'] = args['message_id']
        args['event'] = 'message_end'
        super().__init__(**args)
 class ChatStreamResponse(StreamingResponse):
-    TEXT_PREFIX = "data:"
+    TEXT_PREFIX = "data: "
-    DATA_PREFIX = "data:"
+    DATA_PREFIX = "data: "
    ids:Dict[str,Any] = {}
    data:ChatRequestData = None
    @classmethod
-    def convert_text(cls, token: str):
+    def convert_Message(cls, token: str):
-        # Escape newlines and double quotes to avoid breaking the stream
+        params = cls.ids
-        token = json.dumps(token)
+        params.update({
-
+            'answer':token,
-        #return f"data: {{"event": "message", "conversation_id": "80d85523-de92-4b9d-aca0-c48a5eacb068", "message_id": "16a06b1b-a89b-49c0-bc15-123bd999f6d6", "created_at": 1724406492, "task_id": "802f3064-030d-42ac-a882-0e1293712d04", "id": "16a06b1b-a89b-49c0-bc15-123bd999f6d6", "answer": "{token}"}}"
+            'conversation_id':cls.data.conversation_id
-        return ""
+        })
        event = ChatCallbackEvent(event_type = ChatEventType.MESSAGE,payload = params)
        data_str = json.dumps(event.to_response())
        return f"{cls.DATA_PREFIX}{data_str}\n\n"
    @classmethod
-    def convert_data(cls, data: dict):
+    def convert_Event(cls, data: dict):
        data_str = json.dumps(data)
-        return f"{cls.DATA_PREFIX}{data_str}\n"
+        return f"{cls.DATA_PREFIX}{data_str}\n\n"
    @classmethod
    def convert_event(cls, event: DifyChatResponseEvent):
        data_str = json.dumps(event.dict())
        return f"{cls.DATA_PREFIX}{data_str}\n"
    def __init__(
            self,
            request: Request,
            event_handler: ChatEventCallbackHandler,
            response: StreamingAgentChatResponse,
-            data: ChatRequestData
+            data: ChatRequestData,
            ids:Dict[str,Any]
    ):
        ChatStreamResponse.ids = ids
        ChatStreamResponse.data = data
        content = ChatStreamResponse.content_generator(
            request, event_handler, response, data
        )
@@ -281,41 +341,26 @@ class ChatStreamResponse(StreamingResponse):
            response: StreamingAgentChatResponse,
            data: ChatRequestData
    ):
-        ids = IDManager().createID()
+        
        # Yield the text response
        async def _chat_response_generator():
            final_response = ""
            async for token in response.async_response_gen():
                final_response += token
-                args = ids
+                yield ChatStreamResponse.convert_Message(token)
                args['answer'] = token
                args['conversation_id'] = data.conversation_id
                event = Message_DifyChatResponseEvent(**args)
                yield ChatStreamResponse.convert_event(event)
                #yield ChatStreamResponse.convert_text(token)
            # 存储消息历史
            message().add(user_id=data.user,conversation_id=data.conversation_id,query=data.query,answer=final_response)
            # the text_generator is the leading stream, once it's finished, also finish the event stream
            event_handler.is_done = True
-            # 发送工作流结束事件
+       
            args = ids
            args['response'] = final_response
            args['conversation_id'] = data.conversation_id
            wf_event = Workflow_finished_DifyChatResponseEvent(**args)
            yield ChatStreamResponse.convert_event(wf_event)
            msgEnt_event = MessageEnd_DifyChatResponseEvent(**ids)
            yield ChatStreamResponse.convert_event(msgEnt_event)         
        # Yield the events from the event handler
        async def _event_generator():
            async for event in event_handler.async_event_gen():
                event_response = event.to_response()
                if event_response is not None:
-                    yield ChatStreamResponse.convert_data(event_response)
+                    yield ChatStreamResponse.convert_Event(event_response)
        combine = stream.merge(_chat_response_generator(), _event_generator())
        is_stream_started = False
@@ -324,34 +369,20 @@ class ChatStreamResponse(StreamingResponse):
                if not is_stream_started:
                    is_stream_started = True
                    # 发送工作流开始事件
                    args = ids
                    args['use_id'] = data.user
                    args['query'] = data.query
                    args['conversation_id'] = data.conversation_id
                    wf_event = Workflow_started_DifyChatResponseEvent(**args)
                    yield ChatStreamResponse.convert_event(wf_event)
                    # Stream a blank message to start the stream
                    # 发送一个空消息事件
                    #yield ChatStreamResponse.convert_text("")
                yield output
                if await request.is_disconnected():
                    break
@v.post("/chat-messages")
 async def post_conversations(request: Request, data: ChatRequestData):
    userMng.findNoExistCreate(data.user)
-    data.conversation_id = default_conversation_id if data.conversation_id is None else data.conversation_id
+    data.conversation_id = data.conversation_id if data.conversation_id else str(uuid.uuid4())
    conversaObj = conversations()
-    conversationinfo = conversaObj.get(data.user, data.conversation_id)
+    conversationinfo = conversaObj.get(data.conversation_id)
    if conversationinfo is None:
-        conversationinfo = conversaObj.add(data.user, "新建会话", data.conversation_id)
+        conversationinfo = conversaObj.add(data.conversation_id, data.user, "新建会话")
    # 生成聊天参数
    last_message_content = ChatMessage.from_str(data.query)
@@ -359,27 +390,36 @@ async def post_conversations(request: Request, data: ChatRequestData):
    params = data.inputs or {}
    # 获取聊天引擎对象
-    chat_engine = get_chat_engine(filters=filters, params=params)
+    chat_engine = get_chat_engine(filters=filters, params=params,prjFlag = data.prjFlag)
    # 启动聊天事件监听
-    event_handler = ChatEventCallbackHandler()
+    ids = IDManager().createID()
    event_handler = ChatEventCallbackHandler(ids = ids,data = data)
    chat_engine.callback_manager.handlers.append(event_handler)  # type: ignore
    # 执行异步聊天
    response = await chat_engine.astream_chat(data.query)
    # 返回异步消息回应
-    return ChatStreamResponse(request, event_handler, response, data)
+    return ChatStreamResponse(request, event_handler, response, data,ids)
@v.get("/messages")
 async def query_messages(user:str, conversation_id:str):
-    conversation_id = default_conversation_id if conversation_id is None else conversation_id
+    #conversation_id = default_conversation_id if conversation_id is None else conversation_id
    datas = []
    records = message().gets(user,conversation_id)
    if records is None:
        return {
            "limit": 20,
            "has_more": False,
            "data": []
        }
    for record in records:
        res = record.dict()
        feeds = feedback().query(res['id'])  
        res["message_files"] = []
-        res["feedback"] = ''
+        res["feedback"] = {'rating':feeds['rating'] } if feeds != None else ''
        res["retriever_resources"] = []
        res["created_at"] = 1723444905
        res["agent_thoughts"] = []
@@ -416,7 +456,7 @@ async def post_conversations(request: Request,itemid:str,params:Dict[str,Any]):
    return 'null'
@v.get("/conversations")
-async def query_conversations(user:str):
+async def query_conversations(user:str, first_id:str = None, limit:str = None, pinned:str = None):
    user_id = '' if user is None else user
    userMng.findNoExistCreate(user_id)
@@ -430,53 +470,27 @@ async def query_conversations(user:str):
 async def query_parameters(user:str):
    params = parameter().get(user)
    if len(params) == 0:
-        params = {
+        params = BaseConfig().ParamterCfg() 
                "opening_statement": "您好，我是配网D3造价软件小助手，您可以问我有关配网造价软件的相关问题！",
                "suggested_questions": [],
                "suggested_questions_after_answer": {
                    "enabled": False
                },
                "speech_to_text": {
                    "enabled": False
                },
                "text_to_speech": {
                    "enabled": False,
                    "language": "",
                    "voice": ""
                },
                "retriever_resource": {
                    "enabled": True
                },
                "annotation_reply": {
                    "enabled": False
                },
                "more_like_this": {
                    "enabled": False
                },
                "user_input_form": [],
                "sensitive_word_avoidance": {
                    "enabled": False
                },
                "file_upload": {
                    "image": {
                        "enabled": False,
                        "number_limits": 3,
                        "transfer_methods": [
                            "remote_url"
                        ]
                    }
                },
                "system_parameters": {
                    "image_file_size_limit": "10"
                }
            }  
    return params
-@r.post("")
+@v.post("/messages/{message_id}/feedbacks")
 async def post_feedbacks(request: Request,message_id:str,params:Dict[str,Any]):
    if params['rating'] =='null':
        feedback().delete(message_id)
    else:
        condition = {'id':message_id}
        results = message().query(**condition)
        if len(results) > 0:
            result = results[0]
            feedback().add(message_id=message_id,query=result['query'],
                        answer=result['answer'],rating=params['rating'])
@v.post("")
 def upload_file(request: ChatFileUploadRequest) -> List[str]:
    try:
        logger.info("Processing file")
        return FileLoadService.process_file(request.base64)
    except Exception as e:
        logger.error(f"Error processing file: {e}", exc_info=True)
-        raise HTTPException(status_code=500, detail="Error processing file")
+        raise HTTPException(status_code=500, detail="Error processing file")
@@ -18,14 +18,14 @@ class conversations:
        return datas
-    def get(self,user_id:str,id:str = ''):
+    def get(self, id:str):
-        records = dbManage.query(self._tableName,user_id = user_id,id=id)
+        records = dbManage.query(self._tableName, id=id)
        if len(records) >0:
            return records[0]
        return None
-    def add(self,user_id:str,name:str,id:str = ''):
+    def add(self,id:str, user_id:str, name:str):
-        template = BaseConfig.ConversationCfg
+        template = BaseConfig().ConversationCfg()
        template['id'] = id
        template['user_id'] = user_id
        template['name'] = name
@@ -111,7 +111,7 @@ class message:
        return datas
    def add(self,user_id:str,conversation_id:str,query:str,answer:str):
-        template = BaseConfig.MessageCfg
+        template = BaseConfig.MessageCfg()
        template['id'] = str(uuid.uuid4())
        template['user_id'] = user_id
        template['conversation_id'] = conversation_id
@@ -122,4 +122,34 @@ class message:
    def delete(self,user_id:str):
        dbManage.delete(self._tableName,user_id = user_id)
    def query(self,**condition):
        results = []
        records = dbManage.query(self._tableName,**condition)
        for record in records:
            results.append(record.dict())
        return results        
 class feedback:
    def __init__(self) -> None:
        self._tableName = 'feedbacks'
        dbManage.createTable(self._tableName)
    def add(self,message_id:str,query:str,answer:str,rating:str):
        record = {
            'message_id': message_id,
            'query': query,  
            'answer': answer,  
            'rating': rating,  
        }
        dbManage.addRecord(self._tableName,record)
    def delete(self,message_id:str):
        cond = {'message_id':message_id}
        dbManage.delete(self._tableName,**cond)
    def query(self,message_id:str):
        cond = {'message_id':message_id}
        records = dbManage.query(self._tableName,**cond)
        if len(records) > 0:
            return records[0].dict()    
        return None
@@ -1,62 +1,80 @@
 from pydantic import BaseModel
 import os
 from enum import Enum
-class BaseConfig:
+class BaseConfig(BaseModel):
-	ParamterCfg = {
+	projectInfo:str = os.getenv("PROJECT_TITLE","您好，我是博微工程理解小助手，您可以问我有关[线路工程]工程数据的相关问题！")
-		"opening_statement": "您好，我是配网D3造价软件小助手，您可以问我有关配网造价软件的相关问题！",
+
-		"suggested_questions": [],
+	def ParamterCfg(self):
-		"suggested_questions_after_answer": {
+		questions = os.getenv("CONVERSATION_STARTERS", "dev")
-			"enabled": False
+		return{
-		},
+			"opening_statement": self.projectInfo,
-		"speech_to_text": {
+			"suggested_questions": questions.split('\n'),
-			"enabled": False
+			"suggested_questions_after_answer": {
-		},
+				"enabled": False
-		"text_to_speech": {
+			},
-			"enabled": False,
+			"speech_to_text": {
-			"language": "",
+				"enabled": False
-			"voice": ""
+			},
-		},
+			"text_to_speech": {
 		"retriever_resource": {
 			"enabled": True
 		},
 		"annotation_reply": {
 			"enabled": False
 		},
 		"more_like_this": {
 			"enabled": False
 		},
 		"user_input_form": [],
 		"sensitive_word_avoidance": {
 			"enabled": False
 		},
 		"file_upload": {
 			"image": {
 				"enabled": False,
-				"number_limits": 3,
+				"language": "",
-				"transfer_methods": [
+				"voice": ""
-					"remote_url"
+			},
-				]
+			"retriever_resource": {
 				"enabled": True
 			},
 			"annotation_reply": {
 				"enabled": False
 			},
 			"more_like_this": {
 				"enabled": False
 			},
 			"user_input_form": [],
 			"sensitive_word_avoidance": {
 				"enabled": False
 			},
 			"file_upload": {
 				"image": {
 					"enabled": False,
 					"number_limits": 3,
 					"transfer_methods": [
 						"remote_url"
 					]
 				}
 			},
 			"system_parameters": {
 				"image_file_size_limit": "10"
 			}
 		},
 		"system_parameters": {
 			"image_file_size_limit": "10"
 		}
-	}
+	
 	def ConversationCfg(self):
 		return{
 			"id": "",
 			'user_id':'',
 			"name": "",
 			"inputs": {},
 			"status": "normal",
 			"introduction": self.projectInfo,
 			"created_at":''
 		}
-	ConversationCfg = {
+	@classmethod 
-		"id": "",
+	def MessageCfg(cls):
-		'user_id':'',
+		return {
 		"name": "",
 		"inputs": {},
 		"status": "normal",
 		"introduction": ParamterCfg['opening_statement'],
 		"created_at":''
 	}
 	MessageCfg = {
 		    "id": "",
 			'user_id':'',
            "conversation_id": "",
            "inputs": {},
            "query": "",
            "answer": ""
-	}
+		}
 class ChatEventType(str, Enum):
    WORKFLOW_START = "workflow_started"
    WORKFLOW_FINISHED = "workflow_finished"
    NODE_START = "node_started"
    NODE_FINISHED = "node_finished"
    MESSAGE = "message"
    MESSAGE_END = "message_end"
@@ -2,7 +2,7 @@ import os
 from typing import Dict, List, Any
 from pydantic import BaseModel
-from sqlalchemy import create_engine, Column, String, Integer, JSON
+from sqlalchemy import create_engine, Column, String, Integer, JSON,Float
 from sqlalchemy.engine.reflection import Inspector
 from sqlalchemy.orm import sessionmaker, declarative_base
@@ -24,10 +24,6 @@ class ConversationOrm(Base):
        if 'name' in data:
            self.name = data['name']
 class UserOrm(Base):
    __tablename__ = "user"
@@ -51,6 +47,14 @@ class MessagesOrm(Base):
    query = Column(String)
    answer = Column(String)
 class FeedBackOrm(Base):
    __tablename__ = "feedbacks"
    message_id = Column(String,primary_key=True)
    query = Column(String)
    answer = Column(String)
    rating = Column(String)
 #数据结构
 class ConversationModel(BaseModel):
    id: str
@@ -61,7 +65,6 @@ class ConversationModel(BaseModel):
    created_at: int
    class Config:
        #orm_mode = True
        from_attributes=True
    @classmethod
@@ -73,7 +76,6 @@ class UserModel(BaseModel):
    createtime: str
    class Config:
        #orm_mode = True
        from_attributes=True
    @classmethod
@@ -86,7 +88,6 @@ class ParametersModel(BaseModel):
    value : Dict[str, Any]
    class Config:
        #orm_mode = True
        from_attributes=True
    @classmethod
@@ -101,13 +102,25 @@ class MessagesModel(BaseModel):
    answer : str
    class Config:
        #orm_mode = True
        from_attributes=True
    @classmethod
    def orm(cls):
        return MessagesOrm
 class FeedBackModel(BaseModel):
    message_id :str
    query :str
    answer :str
    rating :str
    class Config:
        from_attributes=True
    @classmethod
    def orm(cls):
        return FeedBackOrm
 class DBManager:
    def __init__(self) -> None:
        DATABASE_URL = os.getenv("SQLITE_DATABASE_URL")
@@ -1,7 +1,7 @@
 from typing import Dict, Any
 from pydantic import BaseModel
-
+from typing import Optional
 class ChatRequestData(BaseModel):
    inputs: Dict[str,Any]
@@ -10,6 +10,9 @@ class ChatRequestData(BaseModel):
    response_mode: str
    files: Any
    conversation_id: str = None
    prjFlag:Optional[str] = ''
 class ChatFileUploadRequest(BaseModel):
-    base64: str
+    base64: str
@@ -6,7 +6,7 @@ from app.settings import init_settings
 from app.engine.loaders import get_document_Types, get_documents,getFileCacahePath
 from app.engine.vectordb import get_vector_store
 from app.engine.generate import get_doc_store,run_pipeline,persist_storage
-
+import tempfile
 STORAGE_DIR = os.getenv("STORAGE_DIR", "storage")
@@ -25,31 +25,31 @@ class FileLoadService:
            url = load_url,
            data=response1.text
        )
-
+        tempFilePath:str = tempfile.gettempdir() + f"\\{str(uuid4())}.zip"
-        with open('example.zip','wb') as file:
+        with open(tempFilePath,'wb') as file:
            file.write(response2.content)
        prjID = str(uuid4())
        filePath = getFileCacahePath() + f'/Projects/{prjID}'           
        os.makedirs(filePath)
        import zipfile
-        with zipfile.ZipFile('example.zip','r') as zip_File:
+        with zipfile.ZipFile(tempFilePath,'r') as zip_File:
            for zip_info in zip_File.infolist():
                zip_info.filename = zip_info.filename.encode('cp437').decode('gbk')
                zip_File.extract(zip_info,filePath) 
-        os.remove('example.zip')
+        os.remove(tempFilePath)
        return f'Projects_{prjID}' 
    @staticmethod
-    def process_file(base64_content: str) -> List[str]:
+    def process_file(base64_content: str) -> str:
-        docType = FileLoadService.store_and_parse_file(base64_content)
+        prjFlag = FileLoadService.store_and_parse_file(base64_content)
        #生成向量并持久化至本地
-        init_settings()
+        documents = get_documents(prjFlag)
        documents = get_documents(docType)
        for doc in documents:
            doc.metadata["private"] = "false"
-        docstore = get_doc_store(docType)
+        docstore = get_doc_store(prjFlag)
-        vector_store = get_vector_store(docType)
+        vector_store = get_vector_store(prjFlag)
        _ = run_pipeline(docstore, vector_store, documents)
        persist_storage(docstore, vector_store)
        return prjFlag
@@ -87,9 +87,7 @@ class PrivateFileService:
        nodes = pipeline.run(documents=documents)
        # Add the nodes to the index and persist it
-        indexs = get_index()
+        current_index = get_index()
        if len(indexs) > 0:
            current_index = list(indexs.values())[0]
        # Insert the documents into the index
        if isinstance(current_index, LlamaCloudIndex):
@@ -10,12 +10,11 @@ from app.engine.index import get_index
 from app.engine.tools import ToolFactory
-def get_chat_engine(filters=None, params=None):
+def get_chat_engine(filters=None, params=None,**args):
    system_prompt = os.getenv("SYSTEM_PROMPT")
    top_k = int(os.getenv("TOP_K", "3"))
    use_reranker = os.getenv("RERANK_ENABLED")
    tools = []
    # 创建SQL查询工具
 #    sql_query_engine = create_summary_query_engine(index)
    # sql_query_tool = QueryEngineTool.from_defaults(query_engine=sql_query_engine,
@@ -25,9 +24,7 @@ def get_chat_engine(filters=None, params=None):
    #tools.append(sql_query_tool)
    # Add query tool if index exists
-    indexs = get_index()
+    index = get_index(**args)
    if len(indexs) > 0:
        index = list(indexs.values())[0]
    if index is not None:
        summary_query_engine = create_summary_query_engine(index,top_k,use_reranker,filters)
        summary_query_tool = QueryEngineTool.from_defaults( query_engine=summary_query_engine, name="summary_query_tool",
@@ -5,7 +5,7 @@ load_dotenv()
 import logging
 import os
-from app.engine.loaders import get_documents
+from app.engine.loaders import get_document_Types, get_documents
 from app.engine.vectordb import get_vector_store
 from app.settings import init_settings
 from app.engine.retriever.CHBM25Retriever import CHBM25Retriever
@@ -21,12 +21,13 @@ logger = logging.getLogger()
 STORAGE_DIR = os.getenv("STORAGE_DIR", "storage")
-def get_doc_store():
+def get_doc_store(docType:str):
    # If the storage directory is there, load the document store from it.
    # If not, set up an in-memory document store since we can't load from a directory that doesn't exist.
-    if os.path.exists(STORAGE_DIR):
+    storeDir = os.path.join(STORAGE_DIR,docType)
-        return SimpleDocumentStore.from_persist_dir(STORAGE_DIR)
+    if os.path.exists(storeDir):
        return SimpleDocumentStore.from_persist_dir(storeDir)
    else:
        return SimpleDocumentStore()
@@ -71,19 +72,20 @@ def generate_datasource():
    logger.info("Generate index for the provided data")
    # Get the stores and documents or create new ones
-    documents = get_documents()
+    docTypes = get_document_Types()
-    # Set private=false to mark the document as public (required for filtering)
+    for docType in docTypes:
-    for doc in documents:
+        documents = get_documents(docType)
-        doc.metadata["private"] = "false"
+        # Set private=false to mark the document as public (required for filtering)
-    docstore = get_doc_store()
+        for doc in documents:
-    vector_store = get_vector_store()
+            doc.metadata["private"] = "false"
        docstore = get_doc_store(docType)
        vector_store = get_vector_store(docType)
-    # Run the ingestion pipeline
+        # Run the ingestion pipeline
-    _ = run_pipeline(docstore, vector_store, documents)
+        _ = run_pipeline(docstore, vector_store, documents)
-    # Build the index and persist storage
+        # Build the index and persist storage
-    persist_storage(docstore, vector_store)
+        persist_storage(docstore, vector_store)
    persist_BMRetriever(vector_store)
    logger.info("Finished generating the index")
@@ -2,22 +2,20 @@ import logging
 from llama_index.core.indices import VectorStoreIndex
 from app.engine.vectordb import get_vector_store
 from app.engine.loaders import get_document_Types
-
+from typing import Dict,Any
 logger = logging.getLogger("uvicorn")
-indexs = {}
+def get_index(**args):
-
+    logger.info("Connecting vector store...")
-def get_index(params=None):
+    prjFlags = get_document_Types()
-    global indexs
+    if len(prjFlags)<=0:
-    if len(index) <= 0:
+        return None
-        logger.info("Connecting vector store...")
+    prjFlag = args.get('prjFlag','')
-        docTypes = get_document_Types()
+    flag = prjFlags[0] if prjFlag not in prjFlags else prjFlag
-        for docType in docTypes:
+    store = get_vector_store(flag)
-            store = get_vector_store(docType)
+    # Load the index from the vector store
-            # Load the index from the vector store
+    # If you are using a vector store that doesn't store text,
-            # If you are using a vector store that doesn't store text,
+    # you must load the index from both the vector store and the document store
-            # you must load the index from both the vector store and the document store
+    index = VectorStoreIndex.from_vector_store(store)
-            index = VectorStoreIndex.from_vector_store(store)
+    logger.info("Finished load index from vector store.")
-            logger.info("Finished load index from vector store.")
+    return index
            indexs[docType] = index
    return indexs
@@ -1,10 +1,9 @@
 import os
 import yaml
 import json
 import importlib
-from cachetools import cached, LRUCache
+import os
-from llama_index.core.tools.tool_spec.base import BaseToolSpec
+
 import yaml
 from llama_index.core.tools.function_tool import FunctionTool
 from llama_index.core.tools.tool_spec.base import BaseToolSpec
 class ToolType:
@@ -46,7 +45,7 @@ class ToolFactory:
    def from_env() -> list[FunctionTool]:
        tools = []
        if os.path.exists("config/tools.yaml"):
-            with open("config/tools.yaml", "r") as f:
+            with open("config/tools.yaml", "r", encoding='UTF-8') as f:
                tool_configs = yaml.safe_load(f)
                if tool_configs != None and len(tool_configs.items()) != 0:
                    for tool_type, config_entries in tool_configs.items():
@@ -3,46 +3,46 @@ file:
  # use_llama_parse: Use LlamaParse if `true`. Needs a `LLAMA_CLOUD_API_KEY` from https://cloud.llamaindex.ai set as environment variable
  use_llama_parse: false
-#db:
+db:
  # The configuration for the database loader, only supports MySQL and PostgreSQL databases for now.
  # uri: The URI for the database. E.g.: mysql+pymysql://user:password@localhost:3306/db or postgresql+psycopg2://user:password@localhost:5432/db
  # query: The query to fetch data from the database. E.g.: SELECT * FROM table
-  #- uri: mysql+pymysql://zjinfo1:Dy2Bcr53Hm5xRkba@110.42.234.166:3306/zjinfo1
+  - uri: mysql+pymysql://zjinfo1:Dy2Bcr53Hm5xRkba@110.42.234.166:3306/zjinfo1
-    #enable: true  # 添加 enable 字段
+    enable: true  # 添加 enable 字段
-    #queries:
+    queries:
-      #- sql: select * from ProjectProperties;
+      - sql: select * from ProjectProperties;
-        #explanation: "工程属性表数据，层级关系包含在博微电力造价工程文件格式_ProjectProperties.json文件中。"
+        explanation: "工程属性表数据，层级关系包含在博微电力造价工程文件格式_ProjectProperties.json文件中。"
-      #- sql: select Id, ParentId, Level, Name, Code, Amount, Amount_Total from TotalCalculateTable;
+      - sql: select Id, ParentId, Level, Name, Code, Amount, Amount_Total from TotalCalculateTable;
-        #explanation: "总算表数据，层级关系包含在博微电力造价工程文件格式_TotalCalculateTable.json文件中。"
+        explanation: "总算表数据，层级关系包含在博微电力造价工程文件格式_TotalCalculateTable.json文件中。"
-      #- sql: select Id, ParentId, Level, SerialNumber, Name, Quantity, Rate, Sum_Price from ProjectDivision where ProfessionalType = '线路';
+      - sql: select Id, ParentId, Level, SerialNumber, Name, Quantity, Rate, Sum_Price from ProjectDivision where ProfessionalType = '线路';
-        #explanation: "专业类型为线路的项目划分表数据，层级关系包含在博微电力造价工程文件格式_ProjectDivision.json文件中。"
+        explanation: "专业类型为线路的项目划分表数据，层级关系包含在博微电力造价工程文件格式_ProjectDivision.json文件中。"
-      #- sql: select Id, ParentId, Level, SerialNumber, Name, Quantity, Rate, Sum_Price from ProjectDivision where ProfessionalType = '余物清理';
+      - sql: select Id, ParentId, Level, SerialNumber, Name, Quantity, Rate, Sum_Price from ProjectDivision where ProfessionalType = '余物清理';
-        #explanation: "专业类型为余物清理的项目划分表数据，层级关系包含在博微电力造价工程文件格式_ProjectDivision.json文件中。"
+        explanation: "专业类型为余物清理的项目划分表数据，层级关系包含在博微电力造价工程文件格式_ProjectDivision.json文件中。"
-      #- sql: select Id, ParentId, Level, SerialNumber, Name, Quantity, Rate, Sum_Price from ProjectDivision where ProfessionalType = '拆除线路';
+      - sql: select Id, ParentId, Level, SerialNumber, Name, Quantity, Rate, Sum_Price from ProjectDivision where ProfessionalType = '拆除线路';
-        #explanation: "专业类型为拆除线路的项目划分表数据，层级关系包含在博微电力造价工程文件格式_ProjectDivision.json文件中。"
+        explanation: "专业类型为拆除线路的项目划分表数据，层级关系包含在博微电力造价工程文件格式_ProjectDivision.json文件中。"
-      #- sql: select Id, ParentId, Level, Name, Code, Rate, Amount from OtherFee;
+      - sql: select Id, ParentId, Level, Name, Code, Rate, Amount from OtherFee;
-        #explanation: "其他费用表数据，层级关系包含在博微电力造价工程文件格式_OtherFee.json文件中"
+        explanation: "其他费用表数据，层级关系包含在博微电力造价工程文件格式_OtherFee.json文件中"
-      #- sql: select Name, Code, Calculation_Formula, Rate, from FeeCollectionTable where FeeCollection_Table_Name = '线路取费表'
+      - sql: select Name, Code, Calculation_Formula, Rate, from FeeCollectionTable where FeeCollection_Table_Name = '线路取费表'
-       # explanation: "取费表名称为线路取费表的取费表数据，层级关系包含在博微电力造价工程文件格式_FeeCollectionTable.json文件中"
+        explanation: "取费表名称为线路取费表的取费表数据，层级关系包含在博微电力造价工程文件格式_FeeCollectionTable.json文件中"
-      #- sql: select Name, Code, Calculation_Formula, Rate, from FeeCollectionTable where FeeCollection_Table_Name = '线路取费表(调试工程)aa'
+      - sql: select Name, Code, Calculation_Formula, Rate, from FeeCollectionTable where FeeCollection_Table_Name = '线路取费表(调试工程)aa'
-        #explanation: "取费表名称为线路取费表的取费表数据，层级关系包含在博微电力造价工程文件格式_FeeCollectionTable.json文件中"
+        explanation: "取费表名称为线路取费表的取费表数据，层级关系包含在博微电力造价工程文件格式_FeeCollectionTable.json文件中"
-      #- sql: select Name, Code, Calculation_Formula, Rate, from FeeCollectionTable where FeeCollection_Table_Name = '大型土石方取费表'
+      - sql: select Name, Code, Calculation_Formula, Rate, from FeeCollectionTable where FeeCollection_Table_Name = '大型土石方取费表'
-        #explanation: "取费表名称为线路取费表的取费表数据，层级关系包含在博微电力造价工程文件格式_FeeCollectionTable.json文件中"
+        explanation: "取费表名称为线路取费表的取费表数据，层级关系包含在博微电力造价工程文件格式_FeeCollectionTable.json文件中"
-      #- sql: select Name, Code, Calculation_Formula, Rate, from FeeCollectionTable where FeeCollection_Table_Name = '线路取费表（余物清理）'
+      - sql: select Name, Code, Calculation_Formula, Rate, from FeeCollectionTable where FeeCollection_Table_Name = '线路取费表（余物清理）'
-        #explanation: "取费表名称为线路取费表的取费表数据，层级关系包含在博微电力造价工程文件格式_FeeCollectionTable.json文件中"
+        explanation: "取费表名称为线路取费表的取费表数据，层级关系包含在博微电力造价工程文件格式_FeeCollectionTable.json文件中"
-      #- sql: select Name, Code, Calculation_Formula, Rate, from FeeCollectionTable where FeeCollection_Table_Name = '线路取费表（余物清理）(1)'
+      - sql: select Name, Code, Calculation_Formula, Rate, from FeeCollectionTable where FeeCollection_Table_Name = '线路取费表（余物清理）(1)'
-        #explanation: "取费表名称为线路取费表的取费表数据，层级关系包含在博微电力造价工程文件格式_FeeCollectionTable.json文件中"
+        explanation: "取费表名称为线路取费表的取费表数据，层级关系包含在博微电力造价工程文件格式_FeeCollectionTable.json文件中"
-      #- sql: select Name, Code, Calculation_Formula, Rate, from FeeCollectionTable where FeeCollection_Table_Name = '线路取费表（拆除）'
+      - sql: select Name, Code, Calculation_Formula, Rate, from FeeCollectionTable where FeeCollection_Table_Name = '线路取费表（拆除）'
-        #explanation: "取费表名称为线路取费表的取费表数据，层级关系包含在博微电力造价工程文件格式_FeeCollectionTable.json文件中"
+        explanation: "取费表名称为线路取费表的取费表数据，层级关系包含在博微电力造价工程文件格式_FeeCollectionTable.json文件中"
-      #- sql: select Name, Code, Calculation_Formula, Rate, from ProjectQuantities where Professional_Type = '线路'
+      - sql: select Name, Code, Calculation_Formula, Rate, from ProjectQuantities where Professional_Type = '线路'
-        #explanation: "专业类型为线路的工程量表数据，层级关系包含在博微电力造价工程文件格式_ProjectQuantities.json文件中"
+        explanation: "专业类型为线路的工程量表数据，层级关系包含在博微电力造价工程文件格式_ProjectQuantities.json文件中"
-      #- sql: select Name, Code, Calculation_Formula, Rate, from ProjectQuantities where Professional_Type = '余物清理'
+      - sql: select Name, Code, Calculation_Formula, Rate, from ProjectQuantities where Professional_Type = '余物清理'
-        #explanation: "专业类型为余物清理的工程量表数据，层级关系包含在博微电力造价工程文件格式_ProjectQuantities.json文件中"
+        explanation: "专业类型为余物清理的工程量表数据，层级关系包含在博微电力造价工程文件格式_ProjectQuantities.json文件中"
 #web:
 #  driver_arguments:
 #    # The arguments to pass to the webdriver. E.g.: add --headless to run in headless mode
@@ -17,7 +17,7 @@ aiostream = "^0.6.2"
 llama-index = "0.10.63"
 cachetools = "^5.3.3"
 protobuf = "4.25.4"
-nltk = "^3.8.2"
+nltk = "^3.9.1"
 jieba = "^0.42.1"
 #arize-phoenix = "^4.12.0"
@@ -35,6 +35,7 @@ chroma="^0.2.0"
 llama-index-vector-stores-chroma = "^0.1.10"
 llama-index-readers-json = "^0.1.5"
 llama-index-retrievers-bm25 = "^0.2.2"
 llama-index-experimental = "^0.2.0"
 duckduckgo_search = "^6.2.6"
@@ -62,6 +63,12 @@ version = "^0.8"
 version = "0.0.7"
 [[tool.poetry.source]]
 name = "mirrors"
 url = "https://pypi.tuna.tsinghua.edu.cn/simple/"
 priority = "default"
 [build-system]
 requires = [ "poetry-core" ]
 build-backend = "poetry.core.masonry.api"
@@ -19,9 +19,7 @@ def main():
    init_settings()
    init_observability()
-    indexs = get_index()
+    index = get_index()
    if len(indexs) > 0:
        index = list(indexs.values())[0]
    top_k = 5
    filters = generate_filters([])