首页 > 科技 >

OpenAI着手调查:GPT-4o及4o-mini模型性能下滑问题

发布时间:2025-01-21 01:45:14来源:

OpenAI发布事故报告,指出正在调查GPT-4o和4o-mini模型性能下降问题,并承诺尽快发布最新进展。科研人员推出LONGPROC基准测试工具,专门评估模型处理长上下文复杂信息的能力。

实验结果显示,包括GPT-4o在内的顶尖模型在复杂长文本生成任务中仍有待改进。尽管各模型宣称的上下文窗口大小超过32K tokens,但实际测试中,开源模型在2K tokens任务中便显疲态,GPT-4o等闭源模型在8K tokens任务中性能也明显下滑。实验进一步揭示了大型语言模型在生成连贯冗长内容方面的提升空间,预示着未来研究方向。

免责声明:本答案或内容为用户上传,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 如遇侵权请及时联系本站删除。