阿里云通义千问团队开源Qwen2.5-1M:百万上下文长度模型震撼登场
发布时间:2025-01-27 22:40:20来源:
阿里云通义千问团队最新推出的Qwen2.5-1M系列包含两个开源模型,分别是Qwen2.5-7B-Instruct-1M和Qwen2.5-14B-Instruct-1M。该系列模型首次支持百万Token上下文长度,无需分割处理超长文档,支持更深入的对话,实现更连贯自然的交互体验。同时,Qwen2.5-1M在复杂任务处理方面能力更强。
此外,Qwen2.5-1M的推理框架实现了重大突破,通义千问团队完全开源了基于vLLM的推理框架,集成了稀疏注意力机制,使得处理百万Token输入时速度提升3到7倍,极大地提升了实际应用场景的效率和体验。
免责声明:本答案或内容为用户上传,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 如遇侵权请及时联系本站删除。