修改属性图节点的层级结构,新增子父级关系

This commit is contained in:
wanyaokun
2024-09-24 17:11:20 +08:00
parent e0fc5381d8
commit aace9ce292
7 changed files with 494 additions and 188 deletions
+83 -45
View File
@@ -1,12 +1,12 @@
Attribute_Prompt = (
"你是一个电力造价工程相关的项目经理,现在给你一些上下文信息,"
"你需要根据现有的上下文信息,来生成{num_questions_per_chunk}个电力造价工程相关的问题和对应的回答,"
"现在需要你针对数据中属性一列进行提问和回答。"
"问题和回答的示例应该是这种类型的,示例:工程总投资(万元),工程总投资(万元)是77469835.590045万元;尖峰及施工基面土石方量,尖峰及施工基面土石方量是8377.6;截止阀的编码,截止阀的编码是F01010203。"
"你生成的回答必须严格按照示例中的格式:('问题, 回答')。不允许有丝毫的变动,问题和回答应该在一个单引号内。"
"这种类似的问题和答案,生成的问题和答案必须一一对应,要符合文件里的内容,不要生成一些无关的问题,不要生成一些重复的问题,"
"不要生成一些过于简单的问题,不要生成一些过于复杂的问题。"
)
# Attribute_Prompt = (
# "你是一个电力造价工程相关的项目经理,现在给你一些上下文信息,"
# "你需要根据现有的上下文信息,来生成{num_questions_per_chunk}个电力造价工程相关的问题和对应的回答,"
# "现在需要你针对数据中属性一列进行提问和回答。"
# "问题和回答的示例应该是这种类型的,示例:工程总投资(万元),工程总投资(万元)是77469835.590045万元;尖峰及施工基面土石方量,尖峰及施工基面土石方量是8377.6;截止阀的编码,截止阀的编码是F01010203。"
# "你生成的回答必须严格按照示例中的格式:('问题, 回答')。不允许有丝毫的变动,问题和回答应该在一个单引号内。"
# "这种类似的问题和答案,生成的问题和答案必须一一对应,要符合文件里的内容,不要生成一些无关的问题,不要生成一些重复的问题,"
# "不要生成一些过于简单的问题,不要生成一些过于复杂的问题。"
# )
# Amount_Prompt = (
@@ -20,15 +20,6 @@ Attribute_Prompt = (
# )
###MarkDown格式的提示词
Amount_Prompt = """\
上下文信息是一张表格数据,请根据数据表中内容进行生成{num_questions_per_chunk}个和金额有关的问题。
生成规则推荐使用表中某行数据的某个值来查询“金额”字段值是多少钱的方式。
你生成的回答必须严格按照指定的格式生成,格式为:xxxx的金额是多少。其中xxxx表示的是某行的某个数据的值(金额字段的值除外)。
当文档中信息与金额无关时,请不要额外发散回答,只需要回答为' '
不要生成一些无关的问题,不要生成一些重复的问题
"""
###Json格式的提示词
# Amount_Prompt = """\
# 上下文信息是Json结构的数据,请根据数据表中内容进行生成{num_questions_per_chunk}个和金额有关的问题。
@@ -39,35 +30,82 @@ Amount_Prompt = """\
# """
Units_Prompt = (
"你是一个电力造价工程相关的项目经理,现在给你一些上下文信息,"
"你需要根据现有的上下文信息,来生成{num_questions_per_chunk}个电力造价工程相关的问题和对应的回答,"
"现在需要你针对上下文信息来进行单位转化问题提问和回答。"
"问题和回答的示例应该是这种类型的,示例:工程总投资(万元)结果用元表示,工程总投资(万元)是774698355900.45元;本体工程(元)结果用万元表示,本体工程(元)是5490494.261046万元。"
"你生成的回答必须严格按照示例中的格式:('问题, 回答')。不允许有丝毫的变动,问题和回答应该在一个单引号内。"
"这种类似的问题和答案,生成的问题和答案必须一一对应,要符合文件里的内容,不要生成一些无关的问题,不要生成一些重复的问题,"
"不要生成一些过于简单的问题,不要生成一些过于复杂的问题。"
)
# Units_Prompt = (
# "你是一个电力造价工程相关的项目经理,现在给你一些上下文信息,"
# "你需要根据现有的上下文信息,来生成{num_questions_per_chunk}个电力造价工程相关的问题和对应的回答,"
# "现在需要你针对上下文信息来进行单位转化问题提问和回答。"
# "问题和回答的示例应该是这种类型的,示例:工程总投资(万元)结果用元表示,工程总投资(万元)是774698355900.45元;本体工程(元)结果用万元表示,本体工程(元)是5490494.261046万元。"
# "你生成的回答必须严格按照示例中的格式:('问题, 回答')。不允许有丝毫的变动,问题和回答应该在一个单引号内。"
# "这种类似的问题和答案,生成的问题和答案必须一一对应,要符合文件里的内容,不要生成一些无关的问题,不要生成一些重复的问题,"
# "不要生成一些过于简单的问题,不要生成一些过于复杂的问题。"
# )
Name_Prompt = (
"你是一个电力造价工程相关的项目经理,现在给你一些上下文信息,"
"你需要根据现有的上下文信息,来生成{num_questions_per_chunk}个电力造价工程相关的问题和对应的回答,"
"现在需要你针对上下文信息中的重名问题进行提问和回答。"
"问题和回答的示例应该是这种类型的,示例:专业类型为线路的杆塔工程项目划分的合价,专业类型为线路的杆塔工程项目划分的合价是220969744.905856;专业类型为线路清理的杆塔工程项目划分的合价,电缆工程的合价是0。"
"你生成的回答必须严格按照示例中的格式:('问题, 回答')。不允许有丝毫的变动,问题和回答应该在一个单引号内。"
"这种类似的问题和答案,生成的问题和答案必须一一对应,要符合文件里的内容,不要生成一些无关的问题,不要生成一些重复的问题,"
"不要生成一些过于简单的问题,不要生成一些过于复杂的问题。"
)
# Name_Prompt = (
# "你是一个电力造价工程相关的项目经理,现在给你一些上下文信息,"
# "你需要根据现有的上下文信息,来生成{num_questions_per_chunk}个电力造价工程相关的问题和对应的回答,"
# "现在需要你针对上下文信息中的重名问题进行提问和回答。"
# "问题和回答的示例应该是这种类型的,示例:专业类型为线路的杆塔工程项目划分的合价,专业类型为线路的杆塔工程项目划分的合价是220969744.905856;专业类型为线路清理的杆塔工程项目划分的合价,电缆工程的合价是0。"
# "你生成的回答必须严格按照示例中的格式:('问题, 回答')。不允许有丝毫的变动,问题和回答应该在一个单引号内。"
# "这种类似的问题和答案,生成的问题和答案必须一一对应,要符合文件里的内容,不要生成一些无关的问题,不要生成一些重复的问题,"
# "不要生成一些过于简单的问题,不要生成一些过于复杂的问题。"
# )
All_Amount_Prompt = (
"你是一个电力造价工程相关的项目经理,现在给你一些上下文信息,"
"你需要根据现有的上下文信息,来生成{num_questions_per_chunk}个电力造价工程相关的问题和对应的回答,"
"现在需要你针对上下文信息中的总体金额进行提问和回答。"
"问题和回答的示例应该是这种类型的,示例:架空输电线路本体工程的总体金额,架空输电线路本体工程的总体金额是7.706703;工程静态投资的总体金额,工程静态投资的总体金额是100。"
"你生成的回答必须严格按照示例中的格式:('问题, 回答')。不允许有丝毫的变动,问题和回答应该在一个单引号内。"
"这种类似的问题和答案,生成的问题和答案必须一一对应,要符合文件里的内容,不要生成一些无关的问题,不要生成一些重复的问题,"
"不要生成一些过于简单的问题,不要生成一些过于复杂的问题。"
)
# All_Amount_Prompt = (
# "你是一个电力造价工程相关的项目经理,现在给你一些上下文信息,"
# "你需要根据现有的上下文信息,来生成{num_questions_per_chunk}个电力造价工程相关的问题和对应的回答,"
# "现在需要你针对上下文信息中的总体金额进行提问和回答。"
# "问题和回答的示例应该是这种类型的,示例:架空输电线路本体工程的总体金额,架空输电线路本体工程的总体金额是7.706703;工程静态投资的总体金额,工程静态投资的总体金额是100。"
# "你生成的回答必须严格按照示例中的格式:('问题, 回答')。不允许有丝毫的变动,问题和回答应该在一个单引号内。"
# "这种类似的问题和答案,生成的问题和答案必须一一对应,要符合文件里的内容,不要生成一些无关的问题,不要生成一些重复的问题,"
# "不要生成一些过于简单的问题,不要生成一些过于复杂的问题。"
# )
#----------------------------MarkDown格式的提示词-------------------------------------
Amount_Prompt = """\
上下文信息是一张表格数据,请根据数据表中内容进行生成{num_questions_per_chunk}个和金额有关的问题。
生成规则推荐使用表中某行数据的某个值来查询“金额”字段值是多少钱的方式。
你生成的问题必须严格按照指定的格式生成,格式为:名称为'aaaa'的金额是多少?
aaaa:表示的是名称的值
当文档中信息与金额无关时,请不要额外发散回答,只需要回答为' '
不要生成一些无关的问题,不要生成一些重复的问题
"""
All_Amount_Prompt = """\
上下文信息是一张表格数据,请根据数据表中内容进行生成{num_questions_per_chunk}个和总体金额有关的问题。
生成规则推荐使用表中某行数据的某个值来查询“总体金额”相关字段值是多少钱的方式。
你生成的问题必须严格按照指定的格式生成,格式为:编码为'aaaa'的总体金额是多少?
aaaa:表示的是编码的值
当文档中信息与总体金额无关时,请不要额外发散回答,只需要回答为' '
不要生成一些无关的问题,不要生成一些重复的问题
"""
Attribute_Prompt ="""\
上下文信息是一张表格数据,请根据数据表中内容进行生成{num_questions_per_chunk}个和字段有关的问题。
生成规则推荐使用表中某行数据的某个字段及值来查询另一个字段值是多少的方式。
你生成的问题必须严格按照指定的格式生成,格式为:名称为'aaaa''bbbb'是多少?
aaaa:表示的是名称的值
bbbb:除名称外的其他字段名
当文档中信息与金额无关时,请不要额外发散回答,只需要回答为' '
不要生成一些无关的问题,不要生成一些重复的问题
"""
Units_Prompt = """\
你是一个电力造价工程相关的项目经理,现在给你一些上下文信息。
你需要根据现有的上下文信息,来生成{num_questions_per_chunk}个电力造价工程相关的问题。
现在需要你针对上下文信息来进行单位转化问题提问。
问题的示例应该是这种类型的,示例:工程总投资(万元),结果用元表示;本体工程(元),结果用万元表示。
你生成的回答必须严格按照示例中的格式:问题。
当文档中信息与单位无关时,请不要额外发散回答,只需要回答为' '
不要生成一些无关的问题,不要生成一些重复的问题。
"""
Name_Prompt = """\
你是一个电力造价工程相关的项目经理,现在给你一些上下文信息。
你需要根据现有的上下文信息,来生成{num_questions_per_chunk}个电力造价工程相关的问题。
现在需要你针对上下文信息中的重名问题进行提问。
问题的示例应该是这种类型的,示例:专业类型为线路的杆塔工程项目划分的合价?"
你生成的问题必须严格按照示例中的格式,不允许有丝毫的变动。
不要生成一些无关的问题,不要生成一些重复的问题。
"""