通义千问开源 Qwen15 六大版本:性能仅次于 GPT-4 Turbo |AI 鲜测
文字风暴
2024-05-14 10:18:02
0

春节前夕,通义千问时隔三月发布了 Qwen 模型的最新版本 Qwen1.5。

新版大模型开源了六个型号尺寸:0.5B、1.8B、4B、7B、14B 和 72B。

以下是此次更新的一些重点:

- 支持 32K 上下文长度;

- 开放了 Base + Chat 模型的 checkpoint;

- 可与 Transformers 一起本地运行;

- 同时发布了 GPTQ Int-4 / Int8、AWQ 和 GGUF 权重。

先不看跑分,硅星GenAI上手试了试,看看它跟前代(1.0 版本)、GPT-3.5 和 GPT-4 实测对比效果:

这些测试包含如数学、逻辑、文字理解的相关问题。

首先,是两道数学题:

- 概率问题:一个标准的六面骰子连续掷两次,第一次掷出6的概率是多少?(正确答案:1/6)

- 代数问题:如果一个数加上它的倒数等于10/3,求这个数?(正确答案:1/3 或者 3)

无论是Qwen1.0,还是Qwen 1.5,其数学能力都超过了 GPT-3.5,给出了准确的思考过程。但 GPT-4 更胜一筹,能给出最为准确的答案。

接着,是两道逻辑题:

- 抽象推理:A比B大,C比A大,D比C小。如果E比D大,那么最小的是?(正确答案:B)

- 条件逻辑:如果下雨,我就不去公园。如果我去了公园,是否可以推断当天没有下雨?(正确答案:可以推断,并且当天没有下雨)

看得出,无论是 GPT,还是 Qwen 的模型,对于简单逻辑(比大小)都可以进行很好的处理;

但对于复杂逻辑判断,只有 GPT-4 以及 Qwen1.5-72B 可以做出准确处理。

最后,是两道文字题:

- 文本分析:分析以下句子的意图和情感:“虽然外面的风雨如磐,但他依然决定继续前行。”

- 隐喻和比喻:在“时间是一条河流,我们是河中的游鱼”的比喻中,时间和人的关系是如何被描述的?

在这一题中,Qwen1.5-72B 竟然从中领悟到了“同情”和“敬佩”的感情,这是其他模型,甚至是我自己都没想到的点,而且细想确实有道理。

论鸡汤,我觉得还是 Qwen1.5 72B 说的最有道理。整体来看,在 GPT系列模型中,面对此问题是一种消极的态度。

而 Qwen1.5 则是一种相对积极的观点——虽然我们无法左右时间前后,但可以自己调整身位来决定自己的生活路径。

性能测试与解读

在 MT-Bench 和 Alpaca-Eval v2 上,Qwen1.5-72B-Chat 表现不错,虽然不如 GPT-4 Turbo,但超过像是 Claude-2.1、GPT-3.5-Turbo-0613、Mixtral-8x7b-instruct 和 TULU 2 DPO 70B在内的一众模型,与 Mistral Medium 基本持平。

在小模型的测试中,这次在 7B 以下的 Qwen1.5 版本,都表现不错。

目前,Qwen1.5 已经与 HuggingFace transformers 代码库进行了集成。从 4.37.0 版本开始,开发者可以直接使用 transformers 库原生代码,而不加载任何自定义代码(指定 trust_remote_code 选项)来使用 Qwen1.5。

相关内容

通义千问开源 Qwen15...
春节前夕,通义千问时隔三月发布了 Qwen 模型的最新版本 Qwe...
2024-05-14 10:18:02
沪深B股市场收盘:B股指数...
20218406372.jpg width=578 height=...
2024-03-04 19:37:22
沪深B股市场收盘:B股指数...
    截至沪深B股市场收盘,B股指数下跌0.75%,报247.9...
2024-03-04 19:37:21
11月21日投资避雷针:H...
导读:财联社11月21日投资避雷针,近日,A股及海外市场潜在风险事...
2024-03-04 19:37:20
券商晨会精华:中美关系缓和...
财联社11月16日讯,昨天大盘全天高开后震荡回落,三大指数均小幅上...
2024-03-04 19:37:19
龙源电力(001289SZ...
智通财经APP讯,龙源电力(001289.SZ)公告,公司全资子公...
2024-03-04 19:37:18

热门资讯

特斯拉人形机器人最早明年交付,...   马斯克称其可以带领特斯拉成为人工智能巨头。   1月25日,特斯拉周三盘后发布第四季度财报。在随...
2024年2月29日全国主要批... (原标题:2024年2月29日全国主要批发市场澳洲龙虾价格行情) ...
比特币春季行情躁动 站稳5万上... 智通财经APP获悉,随着加密货币行业的持续发展,许多潜在投资者都在思考是否已错过了比特币的最佳投资时...
3月13日基金净值:招商添安1... 本站消息,3月13日,招商添安1年定开债最新单位净值为1.0121元,累计净值为1.0641元,较前...
武汉临空港经开区迈向“中国网谷...   在中国建设网络强国战略目标下,国家网络安全人才与创新基地于2016年9月落户武汉临空港经开区。过...
太古地产(01972)公布20... 智通财经APP讯,太古地产(01972)公布2023年业绩,收入为146.7亿港元,同比增长6%;股...
国米夺冠庆典在米兰举行,见证中... 本赛季意甲第33轮,国际米兰2-1击败AC米兰提前夺得意甲冠军,也斩获了队史意甲第20冠。俱乐部于当...
养育儿子需知晓: 1 莫在儿子... 养育儿子需知晓:1. 莫在儿子面前示强,你若强大,他必弱小。2. 莫为儿子事事操心,你若周到,他便懒...
刘铭诚:51现货黄金价格227... 黄金实时行情分析:今天是五一假期,依然是正常工作。五月份第一个交易日的月K线收阴,回顾近四周的周K线...
特朗普称一天筹款逾5000万美... 已锁定美国共和党总统候选人提名的唐纳德·特朗普6日宣布,他当天在佛罗里达州举行的一场大型筹款活动上共...