更新了依赖包

Merge branch 'dev' of https://git.97id.com/ly/zjdataai-app into dev
新增了参数评估脚本和评分脚本
2024-08-29 11:41:42 +08:00 · 2024-08-29 11:39:06 +08:00 · 2024-08-29 11:38:45 +08:00 · 2024-08-28 18:12:37 +08:00 · 2024-08-28 18:12:28 +08:00
2 changed files with 89 additions and 1 deletions
@@ -17,7 +17,7 @@ aiostream = "^0.6.2"
 llama-index = "0.10.63"
 cachetools = "^5.3.3"
 protobuf = "4.25.4"
-nltk = "^3.8.2"
+nltk = "^3.9.1"
 jieba = "^0.42.1"
 #arize-phoenix = "^4.12.0"
@@ -35,6 +35,7 @@ chroma="^0.2.0"
 llama-index-vector-stores-chroma = "^0.1.10"
 llama-index-readers-json = "^0.1.5"
 llama-index-retrievers-bm25 = "^0.2.2"
 llama-index-experimental = "^0.2.0"
 duckduckgo_search = "^6.2.6"
@@ -62,6 +63,12 @@ version = "^0.8"
 version = "0.0.7"
 [[tool.poetry.source]]
 name = "mirrors"
 url = "https://pypi.tuna.tsinghua.edu.cn/simple/"
 priority = "default"
 [build-system]
 requires = [ "poetry-core" ]
 build-backend = "poetry.core.masonry.api"
@@ -0,0 +1,81 @@
 from app.observability import init_observability
 from app.settings import init_settings
 from dotenv import load_dotenv
 import nest_asyncio
 nest_asyncio.apply()
 load_dotenv()
 from llama_index.core.node_parser import SentenceSplitter
 from llama_index.core import (
    VectorStoreIndex,
    SimpleDirectoryReader,
    Response,
 )
 from llama_index.core.evaluation import (
    FaithfulnessEvaluator, 
    DatasetGenerator, 
    CorrectnessEvaluator, 
    SemanticSimilarityEvaluator,)
 init_settings()
 init_observability()
 faith_evaluator_qwen = FaithfulnessEvaluator() #诚实度评测
 corr_evaluator_qwen = CorrectnessEvaluator() #准确率评测
 Seman_evaluator_qwen = SemanticSimilarityEvaluator()#嵌入相似度评估
 documents = SimpleDirectoryReader("D:/LLM_model/text2sql/zjdataai-app-test/backend/data-test").load_data()
 splitter = SentenceSplitter(chunk_size=512)
 vector_index = VectorStoreIndex.from_documents(
    documents, transformations=[splitter],
 )
 # # 运行评估
 # query_engine = vector_index.as_query_engine()
 # response_vector = query_engine.query("工程监理费的金额是多少？")
 # eval_result = evaluator_qwen.evaluate_response(response=response_vector)
 # print(response_vector)
 # print(eval_result)
 question_generator = DatasetGenerator.from_documents(documents)
 eval_questions = question_generator.generate_questions_from_nodes(5)
 print(eval_questions)
 import asyncio
 async def evaluate_query_engine_async(query_engine, questions):
    c = [query_engine.aquery(q) for q in questions]
    gathering_future = asyncio.gather(*c)
    results = await gathering_future
    #print(results)
    total_correct = 0
    for r in results:
        eval_result = (
            1 if faith_evaluator_qwen.evaluate_response(response=r).passing else 0
        )
        total_correct += eval_result
    return total_correct, len(results)
 def evaluate_query_engine(query_engine, questions):
    loop = asyncio.get_event_loop()
    correct, total = loop.run_until_complete(evaluate_query_engine_async(query_engine, questions))
    return correct, total
 # 使用 evaluate_query_engine 函数
 vector_query_engine = vector_index.as_query_engine()
 correct, total = evaluate_query_engine(vector_query_engine, eval_questions[:5])
 print(f"score: {correct}/{total}")
Author	SHA1	Message	Date
chentianrui	2706cf9d5a	更新了依赖包	2024-08-29 11:41:42 +08:00
chentianrui	5fa4752d6e	Merge branch 'dev' of https://git.97id.com/ly/zjdataai-app into dev	2024-08-29 11:39:06 +08:00
chentianrui	aff1793c4e	新增了参数评估脚本和评分脚本	2024-08-29 11:38:45 +08:00
chentianrui	3ee1ba529f	Merge branch 'dev' of https://git.97id.com/ly/zjdataai-app into dev	2024-08-28 18:12:37 +08:00
chentianrui	576a2ae737	增加了评估脚本	2024-08-28 18:12:28 +08:00