国内这些开源大模型，哪个效果更好一些？

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 460 天前的主题，其中的信息可能已经有所发展或是发生改变。

国内也出了不少开源的了，自己部署的话，哪个效果比较好啊？有大佬们横向对比试过吗？

开源

模型

效果

9 条回复 • 2024-05-30 10:07:51 +08:00

Pteromyini

2024-05-29 17:01:42 +08:00

01 和阿里体验好一些

rrZ2C

2024-05-29 18:28:11 +08:00

抖音的豆包画画我感觉还不错

yplam

2024-05-29 18:55:32 +08:00 via Android

个人主观测试 llama3 最好，有中文训练的版本，其次是千问 1.5 与百川 2 ，反而是一些评分很高的模型感觉效果差，可能是推理框架支持不好或者调用的参数不合适

neteroster

2024-05-29 19:03:06 +08:00

等 Qwen2 ，这两周会出，不出意外的话应该会很强（推上几位相关负责人都很自信）

haiku

2024-05-29 19:06:14 +08:00 via Android

01 吧，在海外盲测的排行榜上分也挺高的

googlefans

2024-05-29 19:33:58 +08:00

@neteroster 我一直在用千问 2.5 啊官方网站不是一直可以用吗？

neteroster

2024-05-29 19:57:43 +08:00

@googlefans 那都不是一个系列的，Qwen 开源模型系列目前最新版本是 Qwen1.5 ( https://huggingface.co/Qwen )，下一个版本是 2 。

所谓通义千问 2.5 指的实际上是 Dashscope 上型号为 "qwen-max" 的闭源模型，后者目前指向 "qwen-max-0428"（ Chatbot Arena 榜上有名），而 Qwen2 开源系列将很可能超过该模型（ ref: 官方 discord ）

laminux29

2024-05-29 21:04:58 +08:00

当然是阿里的通义千问，如果笔记本配置较低，可以用 ollama 运行 34GB 的 qwen:32b-chat-v1.5-q8_0

amorhxy

2024-05-30 10:07:51 +08:00 via Android

自己部署的话零一万物的 yi1.5-34b 最好，可以下载 dolphin 版本无审查，配置要求也低，效果比 qwen-110b 更好，闭源的话 yi-large 目前 lmsys 排行榜也很高，用了下效果也不错