Merge pull request '增加新的前端子模块' (#4 ) from dev into main

Reviewed-on: #4
增加新的前端子模块
2024-08-29 10:51:50 +08:00 · 2024-08-29 10:48:40 +08:00 · 2024-08-29 10:13:10 +08:00 · 2024-08-29 08:26:59 +08:00 · 2024-08-28 17:41:52 +08:00 · 2024-08-28 17:38:43 +08:00
25 changed files with 1482 additions and 226 deletions
@@ -0,0 +1,3 @@
+[submodule "webapp"]
+	path = webapp
+	url = https://git.97id.com/ly/webapp.git
@@ -2,6 +2,7 @@
 # LLAMA_CLOUD_API_KEY=
 SQL_DATABASE_URL=mysql+pymysql://zjinfo1:Dy2Bcr53Hm5xRkba@110.42.234.166:3306/zjinfo1
 #SQL_DATABASE_URL=mysql+pymysql://zjinfo2:GSKcziSdBixDXwcd@110.42.234.166:3306/zjinfo2
+SQLITE_DATABASE_URL=sqlite:///./source.db

 DASHSCOPE_API_KEY=sk-02c8540e86d84b7ca0e6f4f51bac6e60
 # The provider for the AI models to use.
@@ -49,6 +50,7 @@ VECTOR_STORE_COLLECTION=default
 # Specify this if you are using a local vector database.
 # Otherwise, use VECTOR_STORE__HOST and VECTOR_STORE__PORT config above
 VECTOR_STORE_PATH=./storage_vector
+BM_RETRIEVER_PATH =./storage_bm



@@ -2,16 +2,18 @@
 # LLAMA_CLOUD_API_KEY=
 SQL_DATABASE_URL=mysql+pymysql://zjinfo1:Dy2Bcr53Hm5xRkba@110.42.234.166:3306/zjinfo1
 #SQL_DATABASE_URL=mysql+pymysql://zjinfo2:GSKcziSdBixDXwcd@110.42.234.166:3306/zjinfo2
+SQLITE_DATABASE_URL=sqlite:///./source.db

 # The number of similar embeddings to return when retrieving documents.
 TOP_K=10
 #--------------------------
+# 是否启用混合检索
+HYBRID_ENABLED = true
+# 混合检索阈值
+HYBRID_ALPHA = 0.6
+#--------------------------
 # 是否启用检索重排功能
 RERANK_ENABLED=true
-# 是否启用混合检索
-HYBRID_ENABLED = false
-# 混合检索阈值
-HYBRID_ALPHA = 0.5
 # Rerank model
 RERANK_MODEL=bge-reranker-v2-m3
 RERANK_BASE_URL=http://10.1.16.39:9995
@@ -80,7 +82,7 @@ VECTOR_STORE_COLLECTION=default
 # Specify this if you are using a local vector database.
 # Otherwise, use VECTOR_STORE__HOST and VECTOR_STORE__PORT config above
 VECTOR_STORE_PATH=./storage_vector
-
+BM_RETRIEVER_PATH =./storage_bm


 PHOENIX_API_KEY=123456
@@ -0,0 +1,487 @@
+import asyncio
+import json
+import logging
+import time
+from typing import Dict, List, Any, Optional, AsyncGenerator
+
+from aiostream import stream
+from fastapi import APIRouter, Request
+from fastapi.responses import StreamingResponse
+from llama_index.core import BaseCallbackHandler
+from llama_index.core.base.llms.types import ChatMessage
+from llama_index.core.callbacks import CBEventType
+from llama_index.core.chat_engine.types import StreamingAgentChatResponse
+from llama_index.core.tools import ToolOutput
+from pydantic import BaseModel
+from app.api.routers.request.base import userMng, conversations,message,parameter
+from app.api.routers.request.models import ChatRequestData,ChatFileUploadRequest
+from app.engine import get_chat_engine
+import uuid
+
+logger = logging.getLogger("uvicorn")
+
+api_router = r = APIRouter()
+v1_router = v = APIRouter()
+
+class ChatCallbackEvent(BaseModel):
+    event_type: CBEventType
+    payload: Optional[Dict[str, Any]] = None
+    event_id: str = ""
+
+    def get_retrieval_message(self) -> dict | None:
+        if self.payload:
+            nodes = self.payload.get("nodes")
+            if nodes:
+                msg = f"根据查询检索到 {len(nodes)} 源文件"
+            else:
+                msg = f"查询检索中: '{self.payload.get('query_str')}'"
+            return {
+                "type": "events",
+                "data": {"title": msg},
+            }
+        else:
+            return None
+
+    def get_tool_message(self) -> dict | None:
+        func_call_args = self.payload.get("function_call")
+        if func_call_args is not None and "tool" in self.payload:
+            tool = self.payload.get("tool")
+            return {
+                "type": "events",
+                "data": {
+                    "title": f"调用工具 {tool.name} ，参数: {func_call_args}",
+                },
+            }
+
+    def _is_output_serializable(self, output: Any) -> bool:
+        try:
+            json.dumps(output)
+            return True
+        except TypeError:
+            return False
+
+    def get_agent_tool_response(self) -> dict | None:
+        response = self.payload.get("response")
+        if response is not None:
+            sources = response.sources
+            for source in sources:
+                # Return the tool response here to include the toolCall information
+                if isinstance(source, ToolOutput):
+                    if self._is_output_serializable(source.raw_output):
+                        output = source.raw_output
+                    else:
+                        output = source.content
+
+                    return {
+                        "type": "tools",
+                        "data": {
+                            "toolOutput": {
+                                "output": output,
+                                "isError": source.is_error,
+                            },
+                            "toolCall": {
+                                "id": None,  # There is no tool id in the ToolOutput
+                                "name": source.tool_name,
+                                "input": source.raw_input,
+                            },
+                        },
+                    }
+
+    def to_response(self):
+        try:
+            match self.event_type:
+                case "retrieve":
+                    return self.get_retrieval_message()
+                case "function_call":
+                    return self.get_tool_message()
+                case "agent_step":
+                    return self.get_agent_tool_response()
+                case _:
+                    return None
+        except Exception as e:
+            logger.error(f"转换回应时间时发生错误，原因: {e}")
+            return None
+
+class ChatEventCallbackHandler(BaseCallbackHandler):
+    _aqueue: asyncio.Queue
+    is_done: bool = False
+
+    def __init__(
+            self,
+    ):
+        """Initialize the base callback handler."""
+        ignored_events = [
+            # CBEventType.CHUNKING,
+            # CBEventType.NODE_PARSING,
+            # CBEventType.EMBEDDING,
+            # CBEventType.LLM,
+            # CBEventType.TEMPLATING,
+        ]
+        super().__init__(ignored_events, ignored_events)
+        self._aqueue = asyncio.Queue()
+
+    def on_event_start(
+            self,
+            event_type: CBEventType,
+            payload: Optional[Dict[str, Any]] = None,
+            event_id: str = "",
+            **kwargs: Any,
+    ) -> str:
+        logger.info("event_start:{} type:{} payload:{}\n".format(event_id, event_type, payload))
+
+        event = ChatCallbackEvent(event_id=event_id, event_type=event_type, payload=payload)
+        if event.to_response() is not None:
+            self._aqueue.put_nowait(event)
+
+    def on_event_end(
+            self,
+            event_type: CBEventType,
+            payload: Optional[Dict[str, Any]] = None,
+            event_id: str = "",
+            **kwargs: Any,
+    ) -> None:
+        logger.info("event_end:{} type:{} payload:{}\n".format(event_id, event_type, payload))
+        event = ChatCallbackEvent(event_id=event_id, event_type=event_type, payload=payload)
+        if event.to_response() is not None:
+            self._aqueue.put_nowait(event)
+
+    def start_trace(self, trace_id: Optional[str] = None) -> None:
+        """No-op."""
+        logger.info("trace_start:{}\n".format(trace_id))
+
+    def end_trace(
+            self,
+            trace_id: Optional[str] = None,
+            trace_map: Optional[Dict[str, List[str]]] = None,
+    ) -> None:
+        """No-op."""
+        logger.info("trace_end:{} trace_map:{}\n".format(trace_id, trace_map))
+
+    async def async_event_gen(self) -> AsyncGenerator[ChatCallbackEvent, None]:
+        while not self._aqueue.empty() or not self.is_done:
+            try:
+                yield await asyncio.wait_for(self._aqueue.get(), timeout=0.1)
+            except asyncio.TimeoutError:
+                pass
+
+class IDManager:
+    def createID(self):
+        return {
+            "message_id" : str(uuid.uuid4()),
+            'task_id':str(uuid.uuid4()),
+            'workflow_run_id': str(uuid.uuid4()),
+            "workflow_id": str(uuid.uuid4())
+        }
+
+class DifyChatResponseEvent(BaseModel):
+    event: str
+    conversation_id: str 
+    message_id: str 
+    created_at: int = int(time.time())
+    task_id: str 
+
+class Workflow_started_DifyChatResponseEvent(DifyChatResponseEvent):
+    workflow_run_id:str 
+    data:Dict[str,Any]
+    def __init__(self,**args):
+        args['data'] = {
+            "id": args['workflow_run_id'],
+            "workflow_id": args['workflow_id'],
+            "sequence_number": 1709,
+            "inputs": {
+                "sys.query": args['query'],
+                "sys.files": [],
+                "sys.conversation_id":  args['conversation_id'],
+                "sys.user_id": args['use_id']
+            },
+            "created_at": int(time.time())
+        }
+        args['event'] = 'workflow_started'
+        super().__init__(**args)
+       
+class Workflow_finished_DifyChatResponseEvent(DifyChatResponseEvent):
+    workflow_run_id:str 
+    data:Dict[str,Any]
+    def __init__(self,**args):
+        args['event'] = 'workflow_finished'
+        args['data'] =  {
+		    "id": args['workflow_run_id'],
+		    "workflow_id": args['workflow_id'],
+		    "sequence_number": 1709,
+		    "status": "succeeded",
+		    "outputs": {
+			    "answer": args['response']
+		    },
+		    "error": '',
+		    "elapsed_time": 36.03764106379822,
+		    "total_tokens": 11707,
+		    "total_steps": 10,
+		    "created_by": {
+			"id": str(uuid.uuid4()),
+			"user": args['use_id']
+		    },
+		    "created_at": int(time.time()),
+		    "finished_at": int(time.time()),
+		    "files": []
+        }
+        super().__init__(**args)
+
+class Message_DifyChatResponseEvent(DifyChatResponseEvent):
+    id:str 
+    answer:str
+    def __init__(self,**args):
+        args['id'] = args['message_id']
+        args['event'] = 'message'
+        super().__init__(**args)
+
+class MessageEnd_DifyChatResponseEvent(DifyChatResponseEvent):
+    id:str
+    metadata:Dict[str,Any] = {}
+    def __init__(self,**args):
+        args['id'] = args['message_id']
+        args['event'] = 'message_end'
+        super().__init__(**args)
+        
+class ChatStreamResponse(StreamingResponse):
+    TEXT_PREFIX = "data: "
+    DATA_PREFIX = "data: "
+
+    @classmethod
+    def convert_text(cls, token: str):
+        # Escape newlines and double quotes to avoid breaking the stream
+        #token = json.dumps(token)
+
+        #return f"data: {{"event": "message", "conversation_id": "80d85523-de92-4b9d-aca0-c48a5eacb068", "message_id": "16a06b1b-a89b-49c0-bc15-123bd999f6d6", "created_at": 1724406492, "task_id": "802f3064-030d-42ac-a882-0e1293712d04", "id": "16a06b1b-a89b-49c0-bc15-123bd999f6d6", "answer": "{token}"}}"
+        return "\n"
+
+    @classmethod
+    def convert_data(cls, data: dict):
+        data_str = json.dumps(data)
+        return f"{cls.DATA_PREFIX}{data_str}\n\n"
+
+    @classmethod
+    def convert_event(cls, event: DifyChatResponseEvent):
+        data_str = json.dumps(event.dict())
+        return f"{cls.DATA_PREFIX}{data_str}\n\n"
+
+    def __init__(
+            self,
+            request: Request,
+            event_handler: ChatEventCallbackHandler,
+            response: StreamingAgentChatResponse,
+            data: ChatRequestData
+    ):
+        content = ChatStreamResponse.content_generator(
+            request, event_handler, response, data
+        )
+        super().__init__(content=content)
+
+    @classmethod
+    async def content_generator(
+            cls,
+            request: Request,
+            event_handler: ChatEventCallbackHandler,
+            response: StreamingAgentChatResponse,
+            data: ChatRequestData
+    ):
+        ids = IDManager().createID()
+        # Yield the text response
+        async def _chat_response_generator():
+            final_response = ""
+            async for token in response.async_response_gen():
+                final_response += token
+                args = ids
+                args['answer'] = token
+                args['conversation_id'] = data.conversation_id
+                event = Message_DifyChatResponseEvent(**args)
+                yield ChatStreamResponse.convert_event(event)
+                #yield ChatStreamResponse.convert_text(token)
+
+            # 存储消息历史
+            message().add(user_id=data.user,conversation_id=data.conversation_id,query=data.query,answer=final_response)
+
+            # the text_generator is the leading stream, once it's finished, also finish the event stream
+            event_handler.is_done = True
+            # 发送工作流结束事件
+            args = ids
+            args['response'] = final_response
+            args['conversation_id'] = data.conversation_id
+            wf_event = Workflow_finished_DifyChatResponseEvent(**args)
+            yield ChatStreamResponse.convert_event(wf_event)
+
+            msgEnt_event = MessageEnd_DifyChatResponseEvent(**ids)
+            yield ChatStreamResponse.convert_event(msgEnt_event)         
+
+
+        # Yield the events from the event handler
+        async def _event_generator():
+            async for event in event_handler.async_event_gen():
+                event_response = event.to_response()
+                if event_response is not None:
+                    yield ChatStreamResponse.convert_text("")
+
+        combine = stream.merge(_chat_response_generator(), _event_generator())
+        is_stream_started = False
+        async with combine.stream() as streamer:
+            async for output in streamer:
+                if not is_stream_started:
+                    is_stream_started = True
+
+                    # 发送工作流开始事件
+                    args = ids
+                    args['use_id'] = data.user
+                    args['query'] = data.query
+                    args['conversation_id'] = data.conversation_id
+                    wf_event = Workflow_started_DifyChatResponseEvent(**args)
+                    yield ChatStreamResponse.convert_event(wf_event)
+
+                    # Stream a blank message to start the stream
+                    # 发送一个空消息事件
+                    #yield ChatStreamResponse.convert_text("")
+
+                yield output
+
+                if await request.is_disconnected():
+                    break
+
+
+
+@v.post("/chat-messages")
+async def post_conversations(request: Request, data: ChatRequestData):
+    userMng.findNoExistCreate(data.user)
+    data.conversation_id = data.conversation_id if data.conversation_id else str(uuid.uuid4())
+
+    conversaObj = conversations()
+    conversationinfo = conversaObj.get(data.conversation_id)
+    if conversationinfo is None:
+        conversationinfo = conversaObj.add(data.conversation_id, data.user, "新建会话")
+
+    # 生成聊天参数
+    last_message_content = ChatMessage.from_str(data.query)
+    filters = None
+    params = data.inputs or {}
+
+    # 获取聊天引擎对象
+    chat_engine = get_chat_engine(filters=filters, params=params)
+
+    # 启动聊天事件监听
+    event_handler = ChatEventCallbackHandler()
+    chat_engine.callback_manager.handlers.append(event_handler)  # type: ignore
+
+    # 执行异步聊天
+    response = await chat_engine.astream_chat(data.query)
+
+    # 返回异步消息回应
+    return ChatStreamResponse(request, event_handler, response, data)
+
+@v.get("/messages")
+async def query_messages(user:str, conversation_id:str):
+    #conversation_id = default_conversation_id if conversation_id is None else conversation_id
+    datas = []
+    records = message().gets(user,conversation_id)
+    if records is None:
+        return {
+            "limit": 20,
+            "has_more": False,
+            "data": []
+        }
+
+    for record in records:
+        res = record.dict()
+        res["message_files"] = []
+        res["feedback"] = ''
+        res["retriever_resources"] = []
+        res["created_at"] = 1723444905
+        res["agent_thoughts"] = []
+        res["status"] =  "normal"
+        res["error"] = ''
+        datas.append(res)
+
+    return {
+        "limit": 20,
+        "has_more": False,
+        "data": datas
+    }  
+    
+@v.post("/conversations/{itemid}/name")
+async def post_conversations(request: Request,itemid:str,params:Dict[str,Any]):
+    consaObj = conversations()
+    consaObj.rename(itemid,'知识问答')
+    cond = {
+        'id':itemid,
+        'user_id':params['user']
+    }
+    results = consaObj.query(**cond)
+    if len(results) > 0:
+        res = results[0]
+        return {
+            "id": res['id'],
+            "name": res['name'],
+            "inputs": res['inputs'],
+            "status": res['status'],
+            "introduction": res['introduction'],
+            "created_at": res['created_at'],
+            #"工程位置"
+        }
+    return 'null'
+
+@v.get("/conversations")
+async def query_conversations(user:str, first_id:str = None, limit:str = None, pinned:str = None):
+    user_id = '' if user is None else user
+    userMng.findNoExistCreate(user_id)
+
+    return {
+        "limit": 20,
+        "has_more": False,
+        "data": conversations().gets(user_id)
+    }    
+
+@v.get("/parameters")
+async def query_parameters(user:str):
+    params = parameter().get(user)
+    if len(params) == 0:
+        params = {
+                "opening_statement": "您好，我是配网D3造价软件小助手，您可以问我有关配网造价软件的相关问题！",
+                "suggested_questions": [],
+                "suggested_questions_after_answer": {
+                    "enabled": False
+                },
+                "speech_to_text": {
+                    "enabled": False
+                },
+                "text_to_speech": {
+                    "enabled": False,
+                    "language": "",
+                    "voice": ""
+                },
+                "retriever_resource": {
+                    "enabled": True
+                },
+                "annotation_reply": {
+                    "enabled": False
+                },
+                "more_like_this": {
+                    "enabled": False
+                },
+                "user_input_form": [],
+                "sensitive_word_avoidance": {
+                    "enabled": False
+                },
+                "file_upload": {
+                    "image": {
+                        "enabled": False,
+                        "number_limits": 3,
+                        "transfer_methods": [
+                            "remote_url"
+                        ]
+                    }
+                },
+                "system_parameters": {
+                    "image_file_size_limit": "10"
+                }
+            }  
+    return params
+
+@r.post("")
+def upload_file(request: ChatFileUploadRequest) -> List[str]:
+    pass
@@ -0,0 +1,125 @@
+from datetime import datetime
+import uuid
+from app.api.routers.request.baseConfig import BaseConfig
+from app.api.routers.request.dbOrm import DBManager
+
+dbManage = DBManager()
+
+class conversations:
+    def __init__(self) -> None:
+        self._tableName = 'conversations'
+        dbManage.createTable(self._tableName)
+
+    def gets(self,user_id:str):
+        records = dbManage.query(self._tableName,user_id = user_id)
+        datas = []
+        for record in records:
+            datas.append(record)
+
+        return datas
+
+    def get(self, id:str):
+        records = dbManage.query(self._tableName, id=id)
+        if len(records) >0:
+            return records[0]
+        return None
+
+    def add(self,id:str, user_id:str, name:str):
+        template = BaseConfig.ConversationCfg
+        template['id'] = id
+        template['user_id'] = user_id
+        template['name'] = name
+        template['created_at'] = 1724399038
+        dbManage.addRecord(self._tableName,template)
+        
+    def delete(self,id:str):
+        dbManage.delete(self._tableName,id=id)
+    
+    def rename(self,id:str,name:str):
+        data = {'name':name}
+        dbManage.update(self._tableName,data,id=id)
+
+    def query(self,**condition):
+        results = []
+        records = dbManage.query(self._tableName,**condition)
+        for record in records:
+            results.append(record.dict())
+        return results
+
+class user:
+    def __init__(self) -> None:
+        self._tableName = 'user'
+        dbManage.createTable(self._tableName)
+
+    def gets(self):
+       return dbManage.query(self._tableName)
+
+    def get(self,id:str):
+        return dbManage.query(self._tableName,id = id)
+
+    def add(self,id:str):
+        info = {
+            'id':id,
+            'createtime': datetime.now().strftime("%Y-%m-%d %H:%M:%S")
+        }
+        dbManage.addRecord(self._tableName,info)
+
+    def delete(self,id:str):
+        dbManage.delete(self._tableName,id = id)
+
+class userMng:
+    userObj = user()
+    @classmethod
+    def findNoExistCreate(cls,user_id:str):
+        userInfo = cls.userObj.get(user_id)
+        if len(userInfo) == 0:
+            cls.userObj.add(user_id)
+    
+    def remove(cls,user_id:str):
+        cls.userObj.delete(user_id)
+
+class parameter:
+    def __init__(self) -> None:
+        self._tableName = 'parameters'
+        dbManage.createTable(self._tableName)
+
+    def get(self,user_id:str):
+        records = dbManage.query(self._tableName,user_id = user_id)
+        data = {}
+        for record in records:
+            key = record['name']
+            value = record['value']
+            data[key] = value
+        return data
+
+    def set(self,user_id:str):
+        dbManage.addRecord(self._tableName,{})
+
+    def delete(self,user_id:str):
+        dbManage.delete(self._tableName,user_id = user_id)
+
+class message:
+    def __init__(self) -> None:
+        self._tableName = 'messages'
+        dbManage.createTable(self._tableName)
+
+    def gets(self,user_id:str,conversation_id:str):
+        records = dbManage.query(self._tableName,user_id = user_id,conversation_id = conversation_id)
+        datas = []
+        for record in records:
+            datas.append(record)
+        return datas
+
+    def add(self,user_id:str,conversation_id:str,query:str,answer:str):
+        template = BaseConfig.MessageCfg
+        template['id'] = str(uuid.uuid4())
+        template['user_id'] = user_id
+        template['conversation_id'] = conversation_id
+        template['query'] = query
+        template['answer'] = answer
+        dbManage.addRecord(self._tableName,template)
+
+    def delete(self,user_id:str):
+        dbManage.delete(self._tableName,user_id = user_id)
+
+
@@ -0,0 +1,62 @@
+
+class BaseConfig:
+	ParamterCfg = {
+		"opening_statement": "您好，我是配网D3造价软件小助手，您可以问我有关配网造价软件的相关问题！",
+		"suggested_questions": [],
+		"suggested_questions_after_answer": {
+			"enabled": False
+		},
+		"speech_to_text": {
+			"enabled": False
+		},
+		"text_to_speech": {
+			"enabled": False,
+			"language": "",
+			"voice": ""
+		},
+		"retriever_resource": {
+			"enabled": True
+		},
+		"annotation_reply": {
+			"enabled": False
+		},
+		"more_like_this": {
+			"enabled": False
+		},
+		"user_input_form": [],
+		"sensitive_word_avoidance": {
+			"enabled": False
+		},
+		"file_upload": {
+			"image": {
+				"enabled": False,
+				"number_limits": 3,
+				"transfer_methods": [
+					"remote_url"
+				]
+			}
+		},
+		"system_parameters": {
+			"image_file_size_limit": "10"
+		}
+	}
+
+	ConversationCfg = {
+		"id": "",
+		'user_id':'',
+		"name": "",
+		"inputs": {},
+		"status": "normal",
+		"introduction": ParamterCfg['opening_statement'],
+		"created_at":''
+	}
+
+
+	MessageCfg = {
+		    "id": "",
+			'user_id':'',
+            "conversation_id": "",
+            "inputs": {},
+            "query": "",
+            "answer": ""
+	}
@@ -0,0 +1,207 @@
+import os
+from typing import Dict, List, Any
+
+from pydantic import BaseModel
+from sqlalchemy import create_engine, Column, String, Integer, JSON
+from sqlalchemy.engine.reflection import Inspector
+from sqlalchemy.orm import sessionmaker, declarative_base
+
+Base = declarative_base()
+
+#orm类
+class ConversationOrm(Base):
+    __tablename__ = "conversations"
+
+    id = Column(String, primary_key=True)
+    user_id = Column(String)
+    name = Column(String)
+    inputs = Column(JSON)
+    status = Column(String)
+    introduction = Column(String)
+    created_at = Column(Integer)
+
+    def update(self,data:Dict[str,Any]):
+        if 'name' in data:
+            self.name = data['name']
+
+
+
+
+
+class UserOrm(Base):
+    __tablename__ = "user"
+
+    id = Column(String, primary_key=True)
+    createtime = Column(String)
+
+class ParametersOrm(Base):
+    __tablename__ = "parameters"
+
+    user_id = Column(String,primary_key=True)
+    name = Column(String)
+    value = Column(JSON)
+
+class MessagesOrm(Base):
+    __tablename__ = "messages"
+
+    id = Column(String,primary_key=True)
+    user_id = Column(String)
+    conversation_id = Column(String)
+    inputs = Column(JSON)
+    query = Column(String)
+    answer = Column(String)
+
+#数据结构
+class ConversationModel(BaseModel):
+    id: str
+    name: str
+    inputs: Dict[str, Any]
+    status: str
+    introduction: str
+    created_at: int
+
+    class Config:
+        #orm_mode = True
+        from_attributes=True
+
+    @classmethod
+    def orm(cls):
+        return ConversationOrm
+
+class UserModel(BaseModel):
+    id: str
+    createtime: str
+
+    class Config:
+        #orm_mode = True
+        from_attributes=True
+
+    @classmethod
+    def orm(cls):
+        return UserOrm
+
+class ParametersModel(BaseModel):
+    user_id : str
+    name : str
+    value : Dict[str, Any]
+
+    class Config:
+        #orm_mode = True
+        from_attributes=True
+
+    @classmethod
+    def orm(cls):
+        return ParametersOrm
+
+class MessagesModel(BaseModel):
+    id :str
+    conversation_id :str
+    inputs : Dict[str, Any]
+    query : str
+    answer : str
+
+    class Config:
+        #orm_mode = True
+        from_attributes=True
+
+    @classmethod
+    def orm(cls):
+        return MessagesOrm
+
+class DBManager:
+    def __init__(self) -> None:
+        DATABASE_URL = os.getenv("SQLITE_DATABASE_URL")
+        self._engine = create_engine(DATABASE_URL)
+        self.SessionLocal = sessionmaker(autocommit=False, autoflush=False, bind=self._engine)
+    
+    def createTable(self,tableName:str):
+        if self._engine is None:
+            return
+        if not self.exist(tableName):
+            Base.metadata.tables[tableName].create(self._engine)
+
+    def addRecord(self,tableName:str,record:Dict[str,Any]):
+        ormCls = self._get_orm(tableName)
+        if ormCls is None:
+            return 
+        session = self.SessionLocal()
+        data = ormCls(**record)
+        session.add(data)
+        session.commit()
+
+    def addRecords(self,tableName:str,records:List[Dict[str,Any]]):
+        ormCls = self._get_orm(tableName)
+        if ormCls is None:
+            return 
+        datas = []
+        session = self.SessionLocal()
+        for record in records:
+            datas.append(ormCls(**record))
+        session.add(datas)
+        session.commit()
+ 
+    def delete(self,tableName:str,**filter):
+        session = self.SessionLocal()
+        ormCls = self._get_orm(tableName)
+        if ormCls is None:
+            return 
+        records = session.query(ormCls).filter_by(**filter).all()
+        if records is not None:
+            session.delete(records)
+            session.commit()
+    
+    def update(self,tableName:str,data:Dict[str,Any],**filter):
+        if not self.exist(tableName):
+            return
+        session = self.SessionLocal()
+        ormCls = self._get_orm(tableName)
+        if ormCls is None:
+            return 
+        if len(filter) > 0:
+            records = session.query(ormCls).filter_by(**filter).all()
+        else:
+            records = session.query(ormCls).all()
+        for record in records:
+            if record is not None:
+                record.update(data)
+                session.commit()    
+
+    def query(self,tableName:str,**filter):
+        session = self.SessionLocal()
+        ormCls = self._get_orm(tableName)
+        if ormCls is None:
+            return 
+        modelCls = self._get_model(ormCls)
+        if modelCls is None:
+            return 
+        
+        if filter is not None:
+            records = session.query(ormCls).filter_by(**filter).all()
+        else:
+            records = session.query(ormCls).all() 
+
+        datas  = []
+        for record in records:
+            datas.append(modelCls.from_orm(record))
+        return datas
+
+    def exist(self,tableName:str)->bool:
+        if self._engine is None:
+            return
+        inspector = Inspector.from_engine(self._engine)
+        return inspector.has_table(tableName)
+
+    def _get_orm(self,tableName:str):
+        subClss = Base.__subclasses__()
+        for sunCls in subClss:
+            if sunCls.__tablename__ == tableName:
+                return sunCls
+        return None
+
+    def _get_model(self,orm:Any):
+        subClss = BaseModel.__subclasses__()
+        for sunCls in subClss:
+            if 'orm' in sunCls.__dict__ and sunCls.orm() == orm:
+                return sunCls
+        return None
+
@@ -0,0 +1,15 @@
+
+from typing import Dict, Any
+from pydantic import BaseModel
+
+
+class ChatRequestData(BaseModel):
+    inputs: Dict[str,Any]
+    query: str
+    user: str
+    response_mode: str
+    files: Any
+    conversation_id: str = None
+
+class ChatFileUploadRequest(BaseModel):
+    base64: str
@@ -1,154 +1,63 @@
 import os

-from llama_index.core import SQLDatabase, SummaryIndex, VectorStoreIndex
-from llama_index.core.indices.struct_store import SQLTableRetrieverQueryEngine
-from llama_index.core.objects import SQLTableNodeMapping, ObjectIndex
+from llama_index.core.agent import AgentRunner, ReActChatFormatter
 from llama_index.core.settings import Settings
-from llama_index.core.agent import AgentRunner, StructuredPlannerAgent, FunctionCallingAgentWorker
 from llama_index.core.tools.query_engine import QueryEngineTool
-from sqlalchemy import create_engine, Engine

-from app.engine.loaders.db import makeDescriptionByEngine
-from app.engine.tools import ToolFactory
+from app.engine.engine import create_query_engine, create_summary_query_engine
 from app.engine.index import get_index
-from app.settings import get_node_postprocessors
+#from app.engine.loaders.db import makeDescriptionByEngine
+from app.engine.tools import ToolFactory

-from llama_index.core.retrievers import BaseRetriever
-from llama_index.core import QueryBundle
-from llama_index.core.schema import NodeWithScore
-from typing import List, Any, Optional,Dict
-from llama_index.core.query_engine.retriever_query_engine import RetrieverQueryEngine
-
-class HybridRetriever(BaseRetriever):
-    def __init__(
-        self,
-        vector_index,
-        similarity_top_k: int = 2,
-        out_top_k: Optional[int] = None,
-        alpha: float = 0.5,
-        filters = None,
-        **kwargs: Any,
-    ) -> None:
-        from llama_index.retrievers.bm25 import BM25Retriever
-        from nltk.corpus import stopwords
-
-        super().__init__(**kwargs)
-        self._vector_index = vector_index
-        self._embed_model = vector_index._embed_model
-        self._out_top_k = out_top_k or similarity_top_k
-        self._vecRetriever = vector_index.as_retriever(
-            similarity_top_k=similarity_top_k,filters = filters
-        )
-        self._bm25Retriever = BM25Retriever.from_defaults(similarity_top_k=similarity_top_k,
-                                             nodes=self._vector_index.vector_store.get_nodes(None),
-                                             language=stopwords.words('chinese'))
-        self._alpha = alpha
-
-    def _retrieve(self, query_bundle: QueryBundle) -> List[NodeWithScore]:
-        vecNodes:List[NodeWithScore] = self._vecRetriever.retrieve(query_bundle.query_str)
-        bmNodes:List[NodeWithScore] = self._bm25Retriever.retrieve(query_bundle.query_str)
-
-        bmDic:Dict[str,NodeWithScore] = {}
-        for node in bmNodes:
-            bmDic[node.node_id] = node
-            
-        result_tups = []
-        for i in range(len(vecNodes)):
-            node = vecNodes[i]
-            bmScore = 0.0
-            if node.node_id in bmDic: 
-                bmScore = bmDic[node.node_id].score 
-                bmDic.pop(node.node_id)
-            else:
-                bmScore = 0.0
-            full_similarity = (self._alpha * node.score) + (
-                (1 - self._alpha) * bmScore
-            )
-            result_tups.append((full_similarity, node))
-        
-        for _,node in bmDic.items():
-            full_similarity = (1 - self._alpha) * node.score
-            result_tups.append((full_similarity, node))     
-
-        result_tups = sorted(result_tups, key=lambda x: x[0], reverse=True)
-        for full_score, node in result_tups:
-            node.score = full_score
-        return [n for _, n in result_tups][:self._out_top_k]
-
-def get_Retriever(index,**kwargs):
-    bEnableHybrid = True if os.getenv("HYBRID_ENABLED",False).title() == 'True' else False
-    if bEnableHybrid:
-        alpha = float(os.getenv("HYBRID_ALPHA", "0.5"))
-        retriever = HybridRetriever(index,alpha = alpha,**kwargs)
-    else:
-        retriever = index.as_retriever(**kwargs)
-    return retriever
-
-sql_database = None
-sql_obj_index = None

 def get_chat_engine(filters=None, params=None):
    system_prompt = os.getenv("SYSTEM_PROMPT")
    top_k = int(os.getenv("TOP_K", "3"))
+    use_reranker = os.getenv("RERANK_ENABLED")
    tools = []

-    global sql_obj_index
-    global sql_database
-    if sql_obj_index is None:
-        sqlengine = create_engine(os.getenv("SQL_DATABASE_URL", ""))
-        sql_database = SQLDatabase(sqlengine)
-        table_schema_objs = makeDescriptionByEngine(sql_database)
-        table_node_mapping = SQLTableNodeMapping(sql_database)
-
-        sql_obj_index = ObjectIndex.from_objects(
-            table_schema_objs,
-            table_node_mapping,
-            index_cls=VectorStoreIndex,
-        )
-
    # 创建SQL查询工具
-    sql_query_engine = SQLTableRetrieverQueryEngine(sql_database,
-                                                    sql_obj_index.as_retriever(similarity_top_k=top_k),
-                                                    verbose=True,)
-    sql_query_tool = QueryEngineTool.from_defaults(query_engine=sql_query_engine,
-                                                   name="zjdata_query_tool",
-                                                   description="来源于一个由博微公司电力造价软件编制的造价工程文件。该文件以多张表格的形式存储存储了整个工程的全部数据内容。适用于以详细的自然语言查询表格数据方式查询造价工程各项具体属性、费用的数值。请先使用“zj_query_tool”无法解决才使用本工具")
+#    sql_query_engine = create_summary_query_engine(index)
+    # sql_query_tool = QueryEngineTool.from_defaults(query_engine=sql_query_engine,
+    #                                                name="zjdata_query_tool",
+    #                                                description="来源于一个由博微公司电力造价软件编制的造价工程文件。该文件以多张表格的形式存储存储了整个工程的全部数据内容。适用于以详细的自然语言查询表格数据方式查询造价工程各项具体属性、费用的数值。请先使用“zj_query_tool”无法解决才使用本工具"
+    #                                                )
+    #tools.append(sql_query_tool)

    # Add query tool if index exists
    index = get_index()
    if index is not None:
-        summary_index = SummaryIndex(index.vector_store.get_nodes(node_ids=None))
-        summary_query_engine = summary_index.as_query_engine()
+        summary_query_engine = create_summary_query_engine(index,top_k,use_reranker,filters)
        summary_query_tool = QueryEngineTool.from_defaults( query_engine=summary_query_engine, name="summary_query_tool",
                                                            description="适用于任何需要进行全面总结、概括的要求。",
-                                                            #description="适用于任何需要对所有内容进行全面总结的请求。有关电力造价领域更具体部分的问题，请使用zj_query_engine_tool",
                                                            )
-
-        # 创建向量检索查询工具
-        postprocess = get_node_postprocessors()
-        query_engine = RetrieverQueryEngine.from_args(
-            get_Retriever(index,similarity_top_k=top_k,
-                          filters=filters),
-            node_postprocessors=postprocess,
-        )
-
+        query_engine = create_query_engine(index,top_k,use_reranker,filters,response_mode = "COMPACT")
        query_engine_tool = QueryEngineTool.from_defaults(query_engine=query_engine, name="zj_query_tool",
-                                                          description="由博微公司编制的关于电力造价知识、电力造价编制软件知识和造价工程文件结构的知识库。适用于查询电力领域、电力造价领域、博微、博微电力、博微造价等业务等内容。如果本知识库没有直接答案但有解决思路的可以返回解决办法后建议使用“zjdata_query_tool”工具。如果你不知道答案，就说你不知道，不要编造答案。",
+                                                          description="由博微公司编制的关于电力造价知识、电力造价编制软件知识和造价工程文件结构的知识库。适用于查询电力领域、电力造价领域、博微、博微电力、博微造价等业务等内容。如果本知识库没有直接答案但有解决思路的可以返回解决办法后建议使用“zjdata_query_tool”工具。",
+                                                          )
+        
+        query_engine = create_query_engine(index,top_k,use_reranker,filters,response_mode = "TREE_SUMMARIZE")
+        query_engine_tool_1 = QueryEngineTool.from_defaults(query_engine=query_engine, name="zj_query_tool_1",
+                                                          description="由博微公司编制的关于电力造价知识、电力造价编制软件知识和造价工程文件结构的知识库。适用于查询电力领域、电力造价领域、博微、博微电力、博微造价等业务等内容。如果本知识库没有直接答案但有解决思路的可以返回解决办法后，且在询问工程中单位的具体数值，例如用量，费率，合计，金额等的时候建议使用“zj_query_tool_1”工具。",
                                                          )

        tools.append(summary_query_tool)
        tools.append(query_engine_tool)
-        #tools.append(sql_query_tool)
+        tools.append(query_engine_tool_1)

    # Add additional tools
    tools += ToolFactory.from_env()

-    return AgentRunner.from_llm(
+    prefix_messages = ("""您的设计旨在帮助完成各种任务，从回答问题到提供其他类型分析的摘要。\n\n##工具\n\n你可以访问各种工具。你有责任按照你认为合适的顺序使用这些工具来完成当前的任务。\n这可能需要将任务分解为子任务，并使用不同的工具来完成每个子任务。\n\n你可以访问以下工具：\n{tool_desc}\n\n\n##输出格式\n\n请用与问题相同的语言回答，并使用以下格式：\n\n   \nThought: 用户当前的语言是：(user's language)。我需要使用工具来帮助我回答问题。\nAction: 如果使用工具,则为工具名称(one of {tool_names})。\nAction Input: 输入给工具的内容，使用JSON格式表示kwargs（例如{{\"input\": \"hello world\", \"num_beams\": 5}}）\n   \n\n请始终以Thought开始。\n\n请始终以Thought开始。\n\n请始终以Thought开始。\n\n请始终以Thought开始。\n\n切勿用Markdown代码标记包围你的响应。如果需要，可以在响应中使用代码标记。\n\n请为Action Input使用有效的JSON格式。不要这样做{{\'input\': \'hello world\', \'num_beams\': 5}}。\n\n如果使用此格式，用户将以下面的格式进行回应：\n\n   \nObservation: 工具响应\n   \n\n你应该继续重复上述格式，直到你有足够的信息来回答问题而无需使用更多工具。此时，你必须使用以下两种格式之一进行回答：\n\n   \nThought: 我可以不用任何工具来回答。我将使用用户的语言来回答。\nAnswer: [你的答案（与用户问题相同的语言）]\n   \n\n   \nThought: 我无法使用提供的工具回答问题。\nAnswer: [你的答案（与用户问题相同的语言）]\n   \n\n##如果从工具中得到的回应是Empty Response，那么只需要回答“我不知道”，不需要额外回答别的内容。## 当前对话\n\n以下是当前对话，由人类和助手的消息交替组成。\n""")
+    react_chat_formatter = ReActChatFormatter.from_defaults(prefix_messages)
+    agentrunner = AgentRunner.from_llm(
        llm=Settings.llm,
        tools=tools,
+        react_chat_formatter=react_chat_formatter,
        system_prompt=system_prompt,
        verbose=True,
    )
+    return agentrunner
    # create the function calling worker for reasoning
    # worker = FunctionCallingAgentWorker.from_tools(
    #     tools, verbose=True
@@ -156,9 +65,3 @@ def get_chat_engine(filters=None, params=None):
    #
    # # wrap the worker in the top-level planner
    # return StructuredPlannerAgent(worker, tools)
-
-
-
-
-
-
@@ -0,0 +1,109 @@
+import os
+
+from llama_index.core import SummaryIndex, SQLDatabase, VectorStoreIndex
+from llama_index.core.indices.struct_store import SQLTableRetrieverQueryEngine
+from llama_index.core.objects import SQLTableNodeMapping, ObjectIndex, SQLTableSchema
+from llama_index.core.query_engine import RetrieverQueryEngine
+from llama_index.core.response_synthesizers import ResponseMode
+from llama_index.readers.database import DatabaseReader
+from sqlalchemy import create_engine
+
+from app.engine.prompt import text_qa_template, refine_template, summary_template, simple_template
+from app.engine.retriever.HybridRetriever import HybridRetriever
+from app.settings import get_node_postprocessors
+
+def makeDescriptionByEngine(sql_database:SQLDatabase):
+    reader = DatabaseReader(sql_database)
+
+    table_names = sql_database.get_usable_table_names()
+    table_schema_objs = []
+    for table_name in table_names:
+        columns = sql_database.get_table_columns(table_name)
+        if len(columns) > 150:
+            continue
+        stats_txt = ""
+
+        if table_name == 'gongchengshuxing':
+            stats_txt = '该表中有以下属性:'
+            documents = reader.load_data(query='select name from gongchengshuxing')
+            for index in range(len(documents) if len(documents) < 30 else 30):
+                if index == 0:
+                    continue
+                elif index > 1:
+                    stats_txt += ','
+                stats_txt += documents[index].text.split(':')[1]
+
+        tbSchema = (SQLTableSchema(table_name=table_name, context_str=stats_txt))
+        table_schema_objs.append(tbSchema)
+
+    return table_schema_objs
+
+def get_Retriever(index,**kwargs):
+    strEnableHybrid = os.getenv("HYBRID_ENABLED",'False')
+    bEnableHybrid = True if strEnableHybrid is not None and strEnableHybrid.title() == 'True' else False
+    if bEnableHybrid:
+        alpha = float(os.getenv("HYBRID_ALPHA", "0.5"))
+        retriever = HybridRetriever(index,alpha = alpha,**kwargs)
+    else:
+        retriever = index.as_retriever(**kwargs)
+    return retriever
+
+
+sql_database = None
+sql_obj_index = None
+
+# Create a summary query engine
+def create_summary_query_engine(top_k=3, use_reranker=False, filters=None):
+    global sql_obj_index
+    global sql_database
+    if sql_obj_index is None or sql_database is None:
+        sqlengine = create_engine(os.getenv("SQL_DATABASE_URL", ""))
+        sql_database = SQLDatabase(sqlengine)
+        table_schema_objs = makeDescriptionByEngine(sql_database)
+        table_node_mapping = SQLTableNodeMapping(sql_database)
+
+        sql_obj_index = ObjectIndex.from_objects(
+            table_schema_objs,
+            table_node_mapping,
+            index_cls=VectorStoreIndex,
+        )
+
+    # 创建SQL查询工具
+    sql_query_engine = SQLTableRetrieverQueryEngine(sql_database,
+                                                    sql_obj_index.as_retriever(similarity_top_k=top_k),
+                                                    verbose=True,
+                                                    )
+    return sql_query_engine
+
+# Create a summary query engine
+def create_summary_query_engine(index, top_k=3, use_reranker=False, filters=None):
+    summary_index = SummaryIndex(index.vector_store.get_nodes(node_ids=None))
+    summary_query_engine = summary_index.as_query_engine(
+    response_mode=ResponseMode.TREE_SUMMARIZE,
+    use_async=True,
+    streaming=True,
+    )
+    return summary_query_engine
+
+# Create a query engine
+def create_query_engine(index, top_k=3, use_reranker=False, filters=None, response_mode=None):
+    # 创建向量检索查询工具
+    postprocess = None
+    if use_reranker:
+        postprocess = get_node_postprocessors()
+
+    query_engine = RetrieverQueryEngine.from_args(
+        get_Retriever(index,
+                      similarity_top_k=top_k,
+                      filters=filters),
+        text_qa_template=text_qa_template,
+        refine_template=refine_template,
+        summary_template = summary_template,
+        simple_template = simple_template,
+        node_postprocessors=postprocess,
+        use_async=True,
+        streaming=True,
+        ResponseMode = response_mode
+    )
+
+    return query_engine
@@ -8,6 +8,7 @@ import os
 from app.engine.loaders import get_documents
 from app.engine.vectordb import get_vector_store
 from app.settings import init_settings
+from app.engine.retriever.CHBM25Retriever import CHBM25Retriever
 from llama_index.core.ingestion import IngestionPipeline
 from llama_index.core.node_parser import SentenceSplitter
 from llama_index.core.settings import Settings
@@ -58,6 +59,13 @@ def persist_storage(docstore, vector_store):
    storage_context.persist(STORAGE_DIR)


+def persist_BMRetriever(vector_store):
+    STORAGE_DIR = os.getenv("BM_RETRIEVER_PATH", "storage_bm")
+    top_k = int(os.getenv("TOP_K", "3"))
+    bmRetriver = CHBM25Retriever.from_defaults(similarity_top_k=top_k,nodes=vector_store.get_nodes([]))
+    bmRetriver.persist(STORAGE_DIR)
+
+
 def generate_datasource():
    init_settings()
    logger.info("Generate index for the provided data")
@@ -75,6 +83,7 @@ def generate_datasource():

    # Build the index and persist storage
    persist_storage(docstore, vector_store)
+    persist_BMRetriever(vector_store)

    logger.info("Finished generating the index")

@@ -1,5 +1,4 @@
 import logging
-
 import yaml
 from app.engine.loaders.db import DBLoaderConfig, get_db_documents
 from app.engine.loaders.file import FileLoaderConfig, get_file_documents
@@ -9,7 +8,7 @@ logger = logging.getLogger(__name__)


 def load_configs():
-    with open("config/loaders.yaml") as f:
+    with open("config/loaders.yaml",encoding='UTF-8') as f:
        configs = yaml.safe_load(f)
    return configs

@@ -17,10 +16,12 @@ def load_configs():
 def get_documents():
    documents = []
    config = load_configs()
+
    if config is None or len(config.items()) == 0:
        return documents

    for loader_type, loader_config in config.items():
+        if loader_config.get('enable', True):  # 检查 enable 字段
            logger.info(
                f"Loading documents from loader: {loader_type}, config: {loader_config}"
            )
@@ -1,24 +1,15 @@
-import os
 import logging
-from typing import List
 from typing import Any, List, Optional

-from llama_index.core.readers.base import BaseReader
-from llama_index.core.schema import Document
-from llama_index.core.utilities.sql_wrapper import SQLDatabase
-from sqlalchemy import text
-from sqlalchemy.engine import Engine
 from llama_index.core import SQLDatabase, Document
-from llama_index.core.objects import SQLTableSchema, SQLTableNodeMapping
-from llama_index.core.readers.base import BaseReader
 from llama_index.readers.database import DatabaseReader
-from pydantic import BaseModel, validator
-from llama_index.core.indices.vector_store import VectorStoreIndex
-from sqlalchemy import create_engine
+from pydantic import BaseModel
+from sqlalchemy import create_engine, text
+from sqlalchemy.engine import Engine

 logger = logging.getLogger(__name__)

-class CustomDatabaseReader(BaseReader):
+class CustomDatabaseReader(DatabaseReader):
    """Simple Database reader.

    Concatenates each row into Document used by LlamaIndex.
@@ -92,18 +83,19 @@ class CustomDatabaseReader(BaseReader):
            List[Document]: A list of Document objects.
        """
        dco_str = ""  
+
        with self.sql_database.engine.connect() as connection:
            if query is None:
                raise ValueError("A query parameter is necessary to filter the data")
            else:
                result = connection.execute(text(query))

-            dco_str = ", ".join(
+            dco_str += ", ".join(
                [f"{entry}" for entry in result.keys()]
-            )
+            ) + "\n"

            for item in result.fetchall():
-                # fetch each item
+                # Fetch each item
                record_str = ", ".join(
                    [f"{entry}" for col, entry in zip(result.keys(), item)]
                )
@@ -117,71 +109,36 @@ class CustomDatabaseReader(BaseReader):

 class DBLoaderConfig(BaseModel):
    uri: str
-    queries: List[str]
+    queries: List[dict]  

-def makeDescriptionByEngine(sql_database:SQLDatabase):
-    reader = DatabaseReader(sql_database)
-
-    table_names = sql_database.get_usable_table_names()
-    table_schema_objs = []
-    for table_name in table_names:
-        columns = sql_database.get_table_columns(table_name)
-        if len(columns) > 150:
-            continue
-        stats_txt = ""
-
-        if table_name == 'gongchengshuxing':
-            stats_txt = '该表中有以下属性:'
-            documents = reader.load_data(query='select name from gongchengshuxing')
-            for index in range(len(documents) if len(documents) < 30 else 30):
-                if index == 0:
-                    continue
-                elif index > 1:
-                    stats_txt += ','
-                stats_txt += documents[index].text.split(':')[1]
-
-        tbSchema = (SQLTableSchema(table_name=table_name, context_str=stats_txt))
-        table_schema_objs.append(tbSchema)
-
-    return table_schema_objs
-
-def get_db_documents(configs: list[DBLoaderConfig]):
+def get_db_documents(configs: List[DBLoaderConfig]) -> List[Document]:
    docs = []

-    if len(configs) == 0 or configs[0].uri == "":
+    if not configs or not configs[0].uri:
        logger.warning(
            f"Failed to load database, error message: uri is empty. Return as empty document list."
        )
        return docs

    metadata = {
-        #'file_name':'',
-        'file_type':'application/booway.document.zj',
-        #'file_path':'',
-        #'file_size':'',
-        #'creation_date':'',
-        #'last_modified_date':'',
+        'file_type': 'application/booway.document.zj',
    }

-    #from llama_index.readers.database import DatabaseReader
    for entry in configs:
        engine = create_engine(entry.uri)
        sql_database = SQLDatabase(engine)

-        # table_schema_objs = makeDescriptionByEngine(sql_database)
-        # table_node_mapping = SQLTableNodeMapping(sql_database)
-        #
-        # nodes = table_node_mapping.to_nodes(table_schema_objs)
-        # for node in nodes:
-        #     node.metadata.update(metadata)
-        #
-        # docs.extend(nodes)
-
-        queries = entry.queries or []
        loader = CustomDatabaseReader(sql_database)
-        for query in queries:
+        for query_dict in entry.queries:
+            query = query_dict.get("sql", "")
+            explanation = query_dict.get("explanation", "")
            logger.info(f"Loading data from database with query: {query}")
            documents = loader.load_data(query=query)

-            docs.extend(documents)
+            # 添加解释到元数据中
+            for doc in documents:
+                doc.metadata["explanation"] = explanation
+                doc.metadata.update(metadata)  # 更新或添加额外的元数据
+                docs.append(doc)
+
    return docs
@@ -0,0 +1,95 @@
+from llama_index.core import PromptTemplate
+
+text_qa_template_str = (
+    "# 角色\n"
+    "你是一名博微造价工程数据查询助手，专精于电力工程文件中的信息。"
+    "你的职责是提供有关电力造价、造价编制软件、文件结构及相关数据的精准、客观的回答，"
+    "如同直接从文件中提取的内容。\n"
+    "知识库中已经导入一个工程的全部数据，请你站在当前工程的角度回答用户关于工程文件的问题。\n"
+    "例如：询问“此工程”指当前导入的工程。询问“此工程名称”指当前导入的工程的工程名称。\n"
+    
+    "## 技能\n"
+    "### 技能 1: 数据查询与提供\n"
+    "- 准确回答所有关于电力工程造价的相关问题。\n"
+    "- 提供具体数据，如成本估算、材料清单、劳动力需求等。\n"
+    "- 确保提供的信息严格基于工程文档中的记录。\n"
+    
+    "### 技能 2: 技术性解释\n"
+    "- 解释造价工程中的技术术语和概念。\n"
+    "- 为复杂的工程细节提供清晰易懂的说明。\n"
+    
+    "## 约束\n"
+    "- 仅回答与电力工程造价文件相关的具体问题。\n"
+    "- 不进行任何超出文件内容的猜测或假设。\n"
+    "- 所有回答均基于文件内容，采用客观和技术性的语言。\n"
+    "- 请基于这些信息回答问题。如果无法找到相关信息，请不要额外发散回答，不要回答多余的信息，只需要回答“我不知道这个问题的答案”。\n"
+    "以下为上下文信息\n"
+    "---------------------\n"
+    "{context_str}\n"
+    "---------------------\n"
+    "请根据上下文信息而非先前知识回答我的问题或回复我的指令。前面的上下文信息可能有用，也可能没用，你需要从我给出的上下文信息中选出与我的问题最相关的那些，来为你的回答提供依据。回答一定要忠于原文，简洁但不丢信息，不要胡乱编造。如果无法找到相关信息，请不要额外发散回答，不要回答多余的信息，只需要回答“我不知道这个问题的答案”。我的问题或指令是什么语种，你就用什么语种回复。\n"
+    "如果是表结构或者是数据库的相关内容，只用于推导问题，不需要告诉用户数据库或表结构等物理信息。\n"
+
+    "问题：{query_str}\n"
+    "你的回复： "
+)
+
+
+text_qa_template = PromptTemplate(text_qa_template_str)
+
+refine_template_str = (
+    "这是原本的问题： {query_str}\n"
+    "我们已经提供了回答: {existing_answer}\n"
+    "现在我们有机会改进这个回答 "
+    "使用以下更多上下文（仅当有助于改进回答时使用）\n"
+    "你需要仔细的判断新的上下文的信息与原本问题必须一个字都不差，如果有一点差别，那就不能改变我现有的回答。\n"
+    "在判断回答是否正确的时候，你应该仔细对比新的上下文中包含的信息是否与原本的问题一字不差，如果一字不差，才能当作新的正确回答。\n"
+    "如果新的上下文对回答没有影响，或者原来的回答已经正确，不要在上次回答的后边再加上多余的补充信息，直接返回原本的回答。\n"
+    "判断一下如果原回答正确，且在新的上下文仍然包含正确的回答，请将新的回答与原回答一起返回。\n"
+    "------------\n"
+    "{context_msg}\n"
+    "------------\n"
+    "如果回答中已经包含有正确答案，不要返回多余的解释等信息，只返回正确答案\n"
+    "如果是表结构或者是数据库的相关内容，仅用于推导问题，不需要告诉用户数据库或表结构等物理信息。\n"
+    "改进的回答: "
+)
+
+refine_template = PromptTemplate(refine_template_str)
+
+summary_template_str = (
+    "# 角色\n"
+    "你是一名博微造价工程数据查询助手，专精于电力工程文件中的信息。"
+    "你的职责是提供有关电力造价、造价编制软件、文件结构及相关数据的精准、客观的回答，"
+    "如同直接从文件中提取的内容。\n"
+    
+    "## 技能\n"
+    "### 技能 1: 数据查询与提供\n"
+    "- 准确回答所有关于电力工程造价的相关问题。\n"
+    "- 提供具体数据，如成本估算、材料清单、劳动力需求等。\n"
+    "- 确保提供的信息严格基于工程文档中的记录。\n"
+    
+    "### 技能 2: 技术性解释\n"
+    "- 解释造价工程中的技术术语和概念。\n"
+    "- 为复杂的工程细节提供清晰易懂的说明。\n"
+    
+    "## 约束\n"
+    "- 仅回答与电力工程造价文件相关的具体问题。\n"
+    "- 不进行任何超出文件内容的猜测或假设。\n"
+    "- 所有回答均基于文件内容，采用客观和技术性的语言。\n"
+    "- 请基于这些信息回答问题。如果无法找到相关信息，请不要额外发散回答，不要回答多余的信息，只需要回答“我不知道这个问题的答案”。\n"
+    "来自多个来源的上下文信息如下。\n"
+    "---------------------\n"
+    "{context_str}\n"
+    "---------------------\n"
+    "鉴于来自多个来源的信息而非先验知识， "
+    "回答查询。\n"
+    "如果是表结构或者是数据库的相关内容，只用于推导问题，不需要告诉用户数据库或表结构等物理信息。\n"
+    "Query: {query_str}\n"
+    "Answer: "
+)
+summary_template = PromptTemplate(summary_template_str)
+
+simple_template_str = (
+    "{query_str}"
+)
+simple_template = PromptTemplate(simple_template_str)
@@ -0,0 +1,133 @@
+import json
+import logging
+import os
+
+from typing import Any, Callable, Dict, List, Optional, cast
+
+from llama_index.core.base.base_retriever import BaseRetriever
+from llama_index.core.callbacks.base import CallbackManager
+from llama_index.core.constants import DEFAULT_SIMILARITY_TOP_K
+from llama_index.core.indices.vector_store.base import VectorStoreIndex
+from llama_index.core.schema import BaseNode, IndexNode, NodeWithScore, QueryBundle
+from llama_index.core.storage.docstore.types import BaseDocumentStore
+from llama_index.core.vector_stores.utils import (
+    node_to_metadata_dict,
+    metadata_dict_to_node,
+)
+
+import bm25s
+from app.engine.retriever.CHTokener import chTokenize
+
+CHDEFAULT_PERSIST_ARGS = {"similarity_top_k": "similarity_top_k", "_verbose": "verbose"}
+
+CHDEFAULT_PERSIST_FILENAME = "retriever.json"
+
+class CHBM25Retriever(BaseRetriever):
+    def __init__(
+        self,
+        nodes: Optional[List[BaseNode]] = None,
+        existing_bm25: Optional[bm25s.BM25] = None,
+        similarity_top_k: int = DEFAULT_SIMILARITY_TOP_K,
+        callback_manager: Optional[CallbackManager] = None,
+        objects: Optional[List[IndexNode]] = None,
+        object_map: Optional[dict] = None,
+        verbose: bool = False,
+    ) -> None:
+        self.similarity_top_k = similarity_top_k
+        if existing_bm25 is not None:
+            self.bm25 = existing_bm25
+            self.corpus = existing_bm25.corpus
+        else:
+            from nltk.corpus import stopwords
+            if nodes is None:
+                raise ValueError("Please pass nodes or an existing BM25 object.")
+
+            self.corpus = [node_to_metadata_dict(node) for node in nodes]
+
+            corpus_tokens = chTokenize(
+                [node.get_content() for node in nodes],
+                show_progress=verbose,
+            )
+            self.bm25 = bm25s.BM25()
+            self.bm25.index(corpus_tokens, show_progress=verbose)
+        super().__init__(
+            callback_manager=callback_manager,
+            object_map=object_map,
+            objects=objects,
+            verbose=verbose,
+        )
+
+    @classmethod
+    def from_defaults(
+        cls,
+        index: Optional[VectorStoreIndex] = None,
+        nodes: Optional[List[BaseNode]] = None,
+        docstore: Optional[BaseDocumentStore] = None,
+        similarity_top_k: int = DEFAULT_SIMILARITY_TOP_K,
+        verbose: bool = False,
+    ) -> "CHBM25Retriever":
+        if sum(bool(val) for val in [index, nodes, docstore]) != 1:
+            raise ValueError("Please pass exactly one of index, nodes, or docstore.")
+
+        if index is not None:
+            docstore = index.docstore
+
+        if docstore is not None:
+            nodes = cast(List[BaseNode], list(docstore.docs.values()))
+
+        assert (
+            nodes is not None
+        ), "Please pass exactly one of index, nodes, or docstore."
+
+        return cls(
+            nodes=nodes,
+            similarity_top_k=similarity_top_k,
+            verbose=verbose,
+        )
+
+    def get_persist_args(self) -> Dict[str, Any]:
+        """Get Persist Args Dict to Save."""
+        return {
+            CHDEFAULT_PERSIST_ARGS[key]: getattr(self, key)
+            for key in CHDEFAULT_PERSIST_ARGS
+            if hasattr(self, key)
+        }
+
+    def persist(self, path: str, **kwargs: Any) -> None:
+        """Persist the retriever to a directory."""
+        self.bm25.save(path, corpus=self.corpus, **kwargs)
+        with open(os.path.join(path, CHDEFAULT_PERSIST_FILENAME), "w") as f:
+            json.dump(self.get_persist_args(), f, indent=2)
+
+    @classmethod
+    def from_persist_dir(cls, path: str, **kwargs: Any) -> "CHBM25Retriever":
+        """Load the retriever from a directory."""
+        bm25 = bm25s.BM25.load(path, load_corpus=True, **kwargs)
+        with open(os.path.join(path, CHDEFAULT_PERSIST_FILENAME)) as f:
+            retriever_data = json.load(f)
+        return cls(existing_bm25=bm25, **retriever_data)
+
+    def _retrieve(self, query_bundle: QueryBundle) -> List[NodeWithScore]:
+        query = query_bundle.query_str
+        tokenized_query = chTokenize(
+            query,show_progress=self._verbose
+        )
+        indexes, scores = self.bm25.retrieve(
+            tokenized_query, k=self.similarity_top_k, show_progress=self._verbose
+        )
+
+        # batched, but only one query
+        indexes = indexes[0]
+        scores = scores[0]
+
+        nodes: List[NodeWithScore] = []
+        for idx, score in zip(indexes, scores):
+            # idx can be an int or a dict of the node
+            if isinstance(idx, dict):
+                node = metadata_dict_to_node(idx)
+            else:
+                node_dict = self.corpus[int(idx)]
+                node = metadata_dict_to_node(node_dict)
+            nodes.append(NodeWithScore(node=node, score=float(score)))
+
+        return nodes
@@ -0,0 +1,46 @@
+from typing import Any, Dict, List, Union, Callable, NamedTuple
+from bm25s.tokenization import *
+
+try:
+    from tqdm.auto import tqdm
+except ImportError:
+
+    def tqdm(iterable, *args, **kwargs):
+        return iterable
+
+
+def chinese_tokenizer(text: str) -> List[str]:
+    import jieba
+    from nltk.corpus import stopwords
+    tokens = jieba.lcut(text)
+    return [token for token in tokens if token not in stopwords.words('chinese')]
+
+def chTokenize(
+    texts,
+    show_progress: bool = True,
+    leave: bool = False,
+) -> Union[List[List[str]], Tokenized]:
+    if isinstance(texts, str):
+        texts = [texts]
+
+    corpus_ids = []
+    token_to_index = {}
+
+    for text in tqdm(
+        texts, desc="Split strings", leave=leave, disable=not show_progress
+    ):
+        
+        splitted = chinese_tokenizer(text)
+        doc_ids = []
+
+        for token in splitted:
+            if token not in token_to_index:
+                token_to_index[token] = len(token_to_index)
+
+            token_id = token_to_index[token]
+            doc_ids.append(token_id)
+
+        corpus_ids.append(doc_ids)
+
+    return Tokenized(ids=corpus_ids, vocab=token_to_index)
+
@@ -0,0 +1,67 @@
+import os
+from typing import Optional, Any, Dict, List
+
+from llama_index.core.base.base_retriever import BaseRetriever
+from llama_index.core.schema import NodeWithScore, QueryBundle
+
+from app.engine.retriever.CHBM25Retriever import CHBM25Retriever
+
+
+class HybridRetriever(BaseRetriever):
+    def __init__(
+            self,
+            vector_index,
+            similarity_top_k: int = 2,
+            out_top_k: Optional[int] = None,
+            alpha: float = 0.5,
+            filters = None,
+            **kwargs: Any,
+    ) -> None:
+        super().__init__(**kwargs)
+        self._vector_index = vector_index
+        self._embed_model = vector_index._embed_model
+        self._out_top_k = out_top_k or similarity_top_k
+        self._vecRetriever = vector_index.as_retriever(
+            similarity_top_k=similarity_top_k,filters = filters
+        )
+
+        STORAGE_DIR = os.getenv("BM_RETRIEVER_PATH", "storage_bm")
+        if os.path.exists(STORAGE_DIR) and len(os.listdir(STORAGE_DIR)) > 0:
+            self._bm25Retriever = CHBM25Retriever.from_persist_dir(STORAGE_DIR)
+        else:
+            bmRetriver = CHBM25Retriever.from_defaults(similarity_top_k=similarity_top_k,nodes=self._vector_index.vector_store.get_nodes(None))
+            bmRetriver.persist(STORAGE_DIR)
+        self._alpha = alpha
+
+
+
+    def _retrieve(self, query_bundle: QueryBundle) -> List[NodeWithScore]:
+        vecNodes:List[NodeWithScore] = self._vecRetriever.retrieve(query_bundle.query_str)
+        bmNodes:List[NodeWithScore] = self._bm25Retriever.retrieve(query_bundle.query_str)
+
+        bmDic:Dict[str,NodeWithScore] = {}
+        for node in bmNodes:
+            bmDic[node.node_id] = node
+
+        result_tups = []
+        for i in range(len(vecNodes)):
+            node = vecNodes[i]
+            bmScore = 0.0
+            if node.node_id in bmDic:
+                bmScore = bmDic[node.node_id].score
+                bmDic.pop(node.node_id)
+            else:
+                bmScore = 0.0
+            full_similarity = (self._alpha * node.score) + (
+                    (1 - self._alpha) * bmScore
+            )
+            result_tups.append((full_similarity, node))
+
+        for _,node in bmDic.items():
+            full_similarity = (1 - self._alpha) * node.score
+            result_tups.append((full_similarity, node))
+
+        result_tups = sorted(result_tups, key=lambda x: x[0], reverse=True)
+        for full_score, node in result_tups:
+            node.score = full_score
+        return [n for _, n in result_tups][:self._out_top_k]
@@ -1,10 +1,9 @@
-import os
-import yaml
-import json
 import importlib
-from cachetools import cached, LRUCache
-from llama_index.core.tools.tool_spec.base import BaseToolSpec
+import os
+
+import yaml
 from llama_index.core.tools.function_tool import FunctionTool
+from llama_index.core.tools.tool_spec.base import BaseToolSpec


 class ToolType:
@@ -46,7 +45,7 @@ class ToolFactory:
    def from_env() -> list[FunctionTool]:
        tools = []
        if os.path.exists("config/tools.yaml"):
-            with open("config/tools.yaml", "r") as f:
+            with open("config/tools.yaml", "r", encoding='UTF-8') as f:
                tool_configs = yaml.safe_load(f)
                if tool_configs != None and len(tool_configs.items()) != 0:
                    for tool_type, config_entries in tool_configs.items():
@@ -1,4 +1,5 @@
 file:
+  enable: true  # 添加 enable 字段
  # use_llama_parse: Use LlamaParse if `true`. Needs a `LLAMA_CLOUD_API_KEY` from https://cloud.llamaindex.ai set as environment variable
  use_llama_parse: false

@@ -7,14 +8,41 @@ db:
  # uri: The URI for the database. E.g.: mysql+pymysql://user:password@localhost:3306/db or postgresql+psycopg2://user:password@localhost:5432/db
  # query: The query to fetch data from the database. E.g.: SELECT * FROM table
  - uri: mysql+pymysql://zjinfo1:Dy2Bcr53Hm5xRkba@110.42.234.166:3306/zjinfo1
-  #- uri: mysql+pymysql://zjinfo:Y6EAjEEdSYmskA8B@110.42.234.166:3306/zjinfo
-#  - uri: mysql+pymysql://zjinfo2:GSKcziSdBixDXwcd@110.42.234.166:3306/zjinfo2
+    enable: true  # 添加 enable 字段
    queries:
-      - select * from ProjectProperties limit 30;
-      - select Name, Code, Amount, Amount_Total from TotalCalculateTable
-      - select SerialNumber, Name, Quantity, Rate, Sum_Price from ProjectDivision where Level = 3  limit 50;
-      - select Name, Code, Rate, Amount from OtherFee
+      - sql: select * from ProjectProperties;
+        explanation: "工程属性表数据，层级关系包含在博微电力造价工程文件格式_ProjectProperties.json文件中。"

+      - sql: select Id, ParentId, Level, Name, Code, Amount, Amount_Total from TotalCalculateTable;
+        explanation: "总算表数据，层级关系包含在博微电力造价工程文件格式_TotalCalculateTable.json文件中。"
+
+      - sql: select Id, ParentId, Level, SerialNumber, Name, Quantity, Rate, Sum_Price from ProjectDivision where ProfessionalType = '线路';
+        explanation: "专业类型为线路的项目划分表数据，层级关系包含在博微电力造价工程文件格式_ProjectDivision.json文件中。"
+      - sql: select Id, ParentId, Level, SerialNumber, Name, Quantity, Rate, Sum_Price from ProjectDivision where ProfessionalType = '余物清理';
+        explanation: "专业类型为余物清理的项目划分表数据，层级关系包含在博微电力造价工程文件格式_ProjectDivision.json文件中。"
+      - sql: select Id, ParentId, Level, SerialNumber, Name, Quantity, Rate, Sum_Price from ProjectDivision where ProfessionalType = '拆除线路';
+        explanation: "专业类型为拆除线路的项目划分表数据，层级关系包含在博微电力造价工程文件格式_ProjectDivision.json文件中。"
+
+      - sql: select Id, ParentId, Level, Name, Code, Rate, Amount from OtherFee;
+        explanation: "其他费用表数据，层级关系包含在博微电力造价工程文件格式_OtherFee.json文件中"
+
+      - sql: select Name, Code, Calculation_Formula, Rate, from FeeCollectionTable where FeeCollection_Table_Name = '线路取费表'
+        explanation: "取费表名称为线路取费表的取费表数据，层级关系包含在博微电力造价工程文件格式_FeeCollectionTable.json文件中"
+      - sql: select Name, Code, Calculation_Formula, Rate, from FeeCollectionTable where FeeCollection_Table_Name = '线路取费表(调试工程)aa'
+        explanation: "取费表名称为线路取费表的取费表数据，层级关系包含在博微电力造价工程文件格式_FeeCollectionTable.json文件中"
+      - sql: select Name, Code, Calculation_Formula, Rate, from FeeCollectionTable where FeeCollection_Table_Name = '大型土石方取费表'
+        explanation: "取费表名称为线路取费表的取费表数据，层级关系包含在博微电力造价工程文件格式_FeeCollectionTable.json文件中"
+      - sql: select Name, Code, Calculation_Formula, Rate, from FeeCollectionTable where FeeCollection_Table_Name = '线路取费表（余物清理）'
+        explanation: "取费表名称为线路取费表的取费表数据，层级关系包含在博微电力造价工程文件格式_FeeCollectionTable.json文件中"
+      - sql: select Name, Code, Calculation_Formula, Rate, from FeeCollectionTable where FeeCollection_Table_Name = '线路取费表（余物清理）(1)'
+        explanation: "取费表名称为线路取费表的取费表数据，层级关系包含在博微电力造价工程文件格式_FeeCollectionTable.json文件中"
+      - sql: select Name, Code, Calculation_Formula, Rate, from FeeCollectionTable where FeeCollection_Table_Name = '线路取费表（拆除）'
+        explanation: "取费表名称为线路取费表的取费表数据，层级关系包含在博微电力造价工程文件格式_FeeCollectionTable.json文件中"
+      
+      - sql: select Name, Code, Calculation_Formula, Rate, from ProjectQuantities where Professional_Type = '线路'
+        explanation: "专业类型为线路的工程量表数据，层级关系包含在博微电力造价工程文件格式_ProjectQuantities.json文件中"
+      - sql: select Name, Code, Calculation_Formula, Rate, from ProjectQuantities where Professional_Type = '余物清理'
+        explanation: "专业类型为余物清理的工程量表数据，层级关系包含在博微电力造价工程文件格式_ProjectQuantities.json文件中"
 #web:
 #  driver_arguments:
 #    # The arguments to pass to the webdriver. E.g.: add --headless to run in headless mode
@@ -1,3 +1,4 @@
+
 from dotenv import load_dotenv
 from llama_index.core.node_parser import SentenceSplitter

@@ -11,16 +12,20 @@ from fastapi.middleware.cors import CORSMiddleware
 from fastapi.responses import RedirectResponse
 from app.api.routers.chat import chat_router
 from app.api.routers.upload import file_upload_router
+from app.api.routers.app import v1_router
 from app.settings import init_settings
 from app.observability import init_observability
 from fastapi.staticfiles import StaticFiles
 from phoenix.trace import using_project

+
 logger = logging.getLogger("uvicorn")

+
 usPrj = using_project(os.getenv("PHOENIX_PROJECT_NAME"))
 usPrj.__enter__()

+
 init_settings()
 init_observability()

@@ -52,12 +57,12 @@ mount_static_files("data_output", "/api/files/output")
 app.include_router(chat_router, prefix="/api/chat")
 app.include_router(file_upload_router, prefix="/api/chat/upload")

-# Redirect to documentation page when accessing base URL
+app.include_router(v1_router, prefix="/v1")
+
@app.get("/")
 async def redirect_to_docs():
    return RedirectResponse(url="/docs")

-SentenceSplitter
 if __name__ == "__main__":
    app_host = os.getenv("APP_HOST", "0.0.0.0")
    app_port = int(os.getenv("APP_PORT", "8000"))
@@ -65,4 +70,3 @@ if __name__ == "__main__":
    reload = False
    uvicorn.run(app="main:app", host=app_host, port=app_port, reload=reload)

-    #usPrj.__exit__()
@@ -18,6 +18,7 @@ llama-index = "0.10.63"
 cachetools = "^5.3.3"
 protobuf = "4.25.4"
 nltk = "^3.8.2"
+jieba = "^0.42.1"

 #arize-phoenix = "^4.12.0"
 openinference-instrumentation-llama-index="2.2.3"
Author	SHA1	Message	Date
ly	72ddf46fc7	Merge pull request '增加新的前端子模块' (#4 ) from dev into main Reviewed-on: #4	2024-08-29 10:51:50 +08:00
ly	0db159ac89	增加新的前端子模块	2024-08-29 10:48:40 +08:00
ly	f57c0c84ef	Merge pull request 'dev' (#3 ) from dev into main Reviewed-on: #3	2024-08-29 10:13:10 +08:00
ly	131d6ef1d1	完善接口，实现对DIFY前端消息流传输的支持	2024-08-29 08:26:59 +08:00
ly	9b47e1a6e1	Merge branch 'dev' of https://git.97id.com/ly/zjdataai-app into dev	2024-08-28 17:41:52 +08:00
wanyaokun	20510a937b	Merge branch 'dev' of https://git.97id.com/ly/zjdataai-app into dev	2024-08-28 17:38:43 +08:00
wanyaokun	a7c79df339	修改web请求接口	2024-08-28 17:35:28 +08:00
chentianrui	327bba75d5	修改了语句错误	2024-08-28 17:24:55 +08:00
chentianrui	d1242d2080	修改了从数据库中查找取费表和工程量表，新加了一个树状搜索总结搜索引擎	2024-08-28 14:46:13 +08:00
ly	0f09551f5d	Merge branch 'dev' of https://git.97id.com/ly/zjdataai-app into dev	2024-08-28 11:49:22 +08:00
chentianrui	8a5facb5b6	增加了判断是否使用数据库	2024-08-28 09:45:01 +08:00
chentianrui	0f7c900c1e	更改了提示词	2024-08-28 09:42:12 +08:00
chentianrui	b008ad9766	更改了提示词	2024-08-28 09:39:57 +08:00
ly	56459c164e	配置文件增加UTF8编码格式支持，以免解析中文时出现问题	2024-08-28 08:04:01 +08:00
wanyaokun	07a3b2a147	修改POST和Get请求代码	2024-08-27 17:48:38 +08:00
ly	b4c571cddb	增加对接DIFY前端支持功能	2024-08-27 08:43:00 +08:00
ly	7068b058e8	调整文件格式为DOCX	2024-08-27 08:40:46 +08:00
wanyaokun	33b2281b7b	修改ID为空的问题	2024-08-26 20:16:58 +08:00
wanyaokun	1704b61609	Merge branch 'dev' of https://git.97id.com/ly/zjdataai-app into dev	2024-08-26 19:58:57 +08:00
wanyaokun	afccaf6eb5	新增Web前后端通信代码	2024-08-26 19:57:22 +08:00
ly	b052d373f1	删除误上传的文件	2024-08-26 09:54:33 +08:00
ly	7462244f01	Merge branch 'dev' of https://git.97id.com/ly/zjdataai-app into dev	2024-08-26 09:01:26 +08:00
chentianrui	a200e8adfc	优化了提示词	2024-08-23 18:35:19 +08:00
ly	2b64aca26b	修改文件格式，因为默认不支持doc格式。	2024-08-23 16:57:27 +08:00
chentianrui	7691b22274	将项目划分表按照业务拆分	2024-08-23 15:07:26 +08:00
chentianrui	d1117c73c4	将项目划分表按照业务拆分	2024-08-23 15:05:48 +08:00
ly	9ee24627c2	Merge pull request 'dev' (#2 ) from dev into main Reviewed-on: #2	2024-08-23 09:37:06 +08:00
chentianrui	5fc8375a06	Merge branch 'dev' of https://git.97id.com/ly/zjdataai-app into dev	2024-08-23 08:55:54 +08:00
chentianrui	cf1ed4e71d	解决输出频繁出现'''的问题	2024-08-23 08:53:13 +08:00
ly	8050551a53	调整创建SQL引擎函数名称	2024-08-22 21:21:37 +08:00
ly	513ce73190	Merge branch 'dev' of https://git.97id.com/ly/zjdataai-app into dev	2024-08-22 21:18:37 +08:00
chentianrui	48d10fd1f3	修复了重排的参数问题	2024-08-22 19:40:56 +08:00
ly	9cbe414a0c	调整参数顺序	2024-08-22 17:10:32 +08:00
chentianrui	4c1c67aa50	增加开启了混合检索	2024-08-22 17:06:28 +08:00
chentianrui	59ef831a41	修改了提示词	2024-08-22 16:36:37 +08:00
ly	3ceb30c375	修复缺陷	2024-08-22 16:17:10 +08:00
ly	e71da586e3	修复缺陷	2024-08-22 16:02:07 +08:00
ly	b3a575d158	调整代码结构，同时修改重定义提示词的方式。	2024-08-22 15:39:49 +08:00
chentianrui	db006985d7	修改了提示词，约束模型回答	2024-08-22 15:24:29 +08:00
wanyaokun	870af69189	新增包依赖	2024-08-22 12:09:15 +08:00
wanyaokun	3460b8410e	新增关键字缓存路径	2024-08-22 12:06:43 +08:00
wanyaokun	586bb76c9c	新增关键字检索缓存路径	2024-08-22 11:09:16 +08:00
wanyaokun	8d7190d0b6	新增关键字检索类	2024-08-22 11:07:23 +08:00
wanyaokun	043aea6cca	新增自定义关键词检索类	2024-08-22 11:06:22 +08:00