大模型驱动的科技政策法规问答系统研究

TP391; 科技政策法规问答系统(Q&A)在帮助公众理解和应用科技法规方面发挥关键作用.大语言模型(LLM)可以显著提升科技政策法规问答系统的准确性和效率.然而,基于大语言模型的科技政策法规问答系统仍然存在以下问题:缺乏大规模高质量的科技政策法规问答数据集,且现有自动构建大规模数据集的方法在引用和整合政策法规知识方面存在不足;问答系统在处理科技政策法规问题时,专业性、准确性不足且模型知识更新滞后.为解决这些问题,提出了一种检索增强自提示的问答数据集构建方法,并构建了一个大规模高质量的科技政策法规问答数据集;同时,构建了科技政策法规问答系统,该系统结合了经过低秩自适应(LoRA)微调技...

Celý popis

Uložené v:

Podrobná bibliografia
Vydané v:	计算机科学与探索 Ročník 18; číslo 9; s. 2349 - 2360
Hlavní autori:	向小伟, 申艳光, 胡明昊, 闫天伟, 罗威, 罗准辰
Médium:	Journal Article
Jazyk:	Chinese
Vydavateľské údaje:	军事科学院军事科学信息研究中心,北京 100142%河北工程大学信息与电气工程学院,河北邯郸 056038%军事科学院军事科学信息研究中心,北京 100142%国防科技大学计算机学院,长沙 410037 01.09.2024 河北工程大学信息与电气工程学院,河北邯郸 056038
Predmet:	科技政策法规 question-and-answer dataset 问答数据集提示学习 question-and-answer system prompt learning 大语言模型 low-rank adaptive fine-tuning science and technology policy and regulation 低秩自适应微调问答系统 large language model
ISSN:	1673-9418
On-line prístup:	Získať plný text
Tagy:	Pridať tag Žiadne tagy, Buďte prvý, kto otaguje tento záznam!

Popis
Shrnutí:	TP391; 科技政策法规问答系统(Q&A)在帮助公众理解和应用科技法规方面发挥关键作用.大语言模型(LLM)可以显著提升科技政策法规问答系统的准确性和效率.然而,基于大语言模型的科技政策法规问答系统仍然存在以下问题:缺乏大规模高质量的科技政策法规问答数据集,且现有自动构建大规模数据集的方法在引用和整合政策法规知识方面存在不足;问答系统在处理科技政策法规问题时,专业性、准确性不足且模型知识更新滞后.为解决这些问题,提出了一种检索增强自提示的问答数据集构建方法,并构建了一个大规模高质量的科技政策法规问答数据集;同时,构建了科技政策法规问答系统,该系统结合了经过低秩自适应(LoRA)微调技术优化的大语言模型与科技政策法规知识库,并运用提示学习技术,来引导系统生成准确的答案.实验结果显示,构建的问答数据集在引用和整合科技政策法规知识方面,比传统方法构建的问答数据集有显著提升;相较于通用大语言模型驱动的问答系统,该问答系统在各项指标上也有明显提高.
ISSN:	1673-9418
DOI:	10.3778/j.issn.1673-9418.2406023