AI在历史知识领域显露短板：大型语言模型应对复杂历史问题力不从心

当前位置：首页 > 科技 > 正文

AI在历史知识领域显露短板：大型语言模型应对复杂历史问题力不从心 徐凡敬2025-01-20 10:15:47 科技

导读近期研究表明，人工智能在处理复杂历史问题上表现不佳。在NeurIPS会议上公布的研究中，OpenAI的GPT-4、Meta的Llama和谷歌的Gemini三款大型

近期研究表明，人工智能在处理复杂历史问题上表现不佳。在NeurIPS会议上公布的研究中，OpenAI的GPT-4、Meta的Llama和谷歌的Gemini三款大型语言模型在历史知识测试中的准确率均较低，其中表现最佳的GPT-4 Turbo准确率仅为46%。研究指出，这些模型在基本史实方面表现尚可，但在深入历史研究时力不从心，且在处理特定地区历史问题时表现更差，反映出训练数据可能存在的偏差。然而，研究团队对AI在历史研究中的应用前景仍持乐观态度，并正在改进测试基准以开发更优秀的模型。

研究人员认为，AI在处理细微历史细节时力不从心，倾向于从主流历史叙事中进行推断，这限制了其在历史领域的准确性。尽管AI在某些专业领域尚无法取代人类专家，但研究团队仍在努力改进，以期提升AI在历史研究中的表现。

标签：

免责声明：本文由用户上传，如有侵权请联系删除！

AI在历史知识领域显露短板：大型语言模型应对复杂历史问题力不从心

猜你喜欢

最新文章