日本提出提升大语言模型输出简洁性和准确性的方法

日本提出提升大语言模型输出简洁性和准确性的方法

1019日,据IOS Press Ebooks网站消息,日本北陆先端科学技术大学院大学(JAIST)的研究团队开发出一种新方法ANSPRE,能够提升大语言模型输出内容的简洁性和准确性。相关研究成果以“ANSPRE: Improving Question-Answering in Large Language Models with Answer-Prefix Generation”为题,发表在第27届欧洲人工智能大会(ECAI 2024)论文集中。

大语言模型在开放领域知识问答系统中具有巨大的发展潜力。然而,当前主流大语言模型倾向于生成冗长的答案,需要耗费大量算力和时间。对此,研究人员开发出一种名为应答前缀生成(ANSPRE)的新方法,通过在大语言模型中添加特定文本,使模型不但能输出准确的答案短语,还能同时对答案准确性进行评估。开放领域问答基准测试表明,ANSPRE可以有效嵌入所有大语言模型中,并显著提升大语言模型的准确性。

© 版权声明

相关文章

学术会议云

暂无评论

none
暂无评论...