开云kaiyun登录入口登录APP下载(中国)官方网站

开云kaiyun登录入口登录APP下载(中国)官方网站

你的位置:开云kaiyun登录入口登录APP下载(中国)官方网站 > 新闻 > ky体育官网登录入口网页版这回主打的即是守旧超长荆棘文-开云kaiyun登录入口登录APP下载(中国)官方网站

ky体育官网登录入口网页版这回主打的即是守旧超长荆棘文-开云kaiyun登录入口登录APP下载(中国)官方网站

发布日期:2024-11-29 03:07    点击次数:78

ky体育官网登录入口网页版这回主打的即是守旧超长荆棘文-开云kaiyun登录入口登录APP下载(中国)官方网站

国产大模子,最近有点卷。

这不,,Qwen2.5 系列又双叒倏得更新了——

连气儿读三本《三体》不纳闷,而况45 秒傍边就能圆善纪念出这 69 万 token 的主要内容,be like:

还真不是欺骗事儿,"大海捞针"践诺知道,这个全新的Qwen2.5-Turbo在 100 万 token 荆棘文中有全绿的进展。

也即是说,这 100 万荆棘文里,有细节 Qwen2.5-Turbo 是真能 100% 捕捉到。

没错,Qwen2.5 系列新成员Qwen2.5-Turbo,这回主打的即是守旧超长荆棘文,而况把性价比卷出了花儿:

荆棘文长度从 128k 延伸到1M,十分于 100 万个英文单词或 150 万个汉字,也即是 10 部长篇演义、150 小时语音记载、30000 行代码的量。

更快的推理速率:基于寥落小心力机制,责罚百万荆棘文时,首字复返时辰从 4.9 分钟裁减到了 68 秒,结束了4.3 倍加快。

关节是还低廉:0.3 元 /1M tokens。这意味着,在调换资本下,Qwen2.5-Turbo 不错责罚的 token 数目是 GPT-4o-mini 的 3.6 倍。

看到这波更新,不少网友径直爆出了 ***:

有东说念主直言:这样长的荆棘文这样快的速率下,RAG 已历程时了。

还有东说念主开启大赞特赞形状:目下在开源范围,Qwen 比 Llama 还值得期待了。

除了连气儿啃下 3 本长篇演义,Qwen 官方还展示了 Qwen2.5-Turbo 超长荆棘文的更多实勤勉能。

比如快速掌捏一通盘这个词代码库的信息。

如 Demo 所演示,上传包含 Qwen-Agent 仓库中通盘代码文献的文本文献(13.3 万 token),只需几秒钟,大模子就能读十足部代码并准确输出各式细节。

用户:这个存储库中有哪些 Agent 子类?提供它们的文献旅途。

Qwen2.5-Turbo:

连气儿读 7 篇论文,完成论文分类、论文撮要,也不在话下:

咱们也骨子测试了一下。不错看到,在莫得给任何辅导的情况下,Qwen2.5-Turbo 能准确掌捏不同论文的细节信息,并完成对比分析。

除了大海捞针践诺除外,Qwen 团队还在更复杂的长文本任务上测试了 Qwen2.5-Turbo 的智商。

包括:

RULER:基于大海捞针的延伸基准,任务包括在无关荆棘文中查找多"针"或恢复多个问题,或找到荆棘文中出现最多或最少的词。数据的荆棘文长度最长为 128K。

LV-Eval:条目同期意会开阔凭证片断的基准测试。Qwen 团队对 LV-Eval 原始版块中的评估目的进行了颐养,幸免因为过于严苛的匹配法则所导致的假阴性成果。数据的荆棘文长度最长为 128K。

Longbench-Chat:一个评价长文本任务中东说念主类偏好对皆的数据集。数据的荆棘文长度最长为 100K。

成果知道,在 RULER 基准测试中,Qwen2.5-Turbo 赢得了93.1 分,高出了 GPT-4o-mini 和 GPT-4。

在 LV-Eval、LongBench-Chat 等更接近信得过情况的长文本任务中,Qwen2.5-Turbo 在大都维度上迥殊了 GPT-4o-mini,而况粗略进一步延伸到高出 128 tokens 荆棘文的问题上。

值得一提的是,现存的荆棘文长度延伸决策同样会导致模子在责罚随笔本时出现比较较着的性能下落。

Qwen 团队也在随笔本任务上对 Qwen2.5-Turbo 进行了测试。

成果知道,Qwen2.5-Turbo 在大部分任务上显赫迥殊了其他荆棘文长度为 1M tokens 的开源模子。

和 GPT-4o-mini 以及 Qwen2.5-14B-Instruct 比拟,Qwen2.5-Turbo 在随笔本任务上的智商并不逊色,但同期能 hold 住 8 倍于前两个模子的荆棘文。

此外,在推理速率方面,运用寥落小心力机制,Qwen2.5-Turbo 将小心力部分的野心量压缩到了底本的 2/25,在不同硬件成立下结束了 3.2-4.3 倍的加快比。

目下,在 HuggingFace 和魔搭社区,Qwen2.5-Turbo 均提供了不错在线体验的 Demo。

API 做事也已上线阿里云大模子做事平台,跟 OpenAI API 是兼容的。

至于模子权重什么时期开源?

阿里通义开源细致东说念主林俊旸的说法是:目下还莫得开源筹谋,但正在悉力中。

归正 HuggingFace 衔接首创东说念主 Thomas Wolf 是帮咱催上了(手动狗头)。

Demo 传送门:

https://huggingface.co/spaces/Qwen/Qwen2.5-Turbo-1M-Demo

https://www.modelscope.cn/studios/Qwen/Qwen2.5-Turbo-1M-Demo

参考畅达:

https://qwenlm.github.io/zh/blog/qwen2.5-turbo/ky体育官网登录入口网页版