首页
注册
登录
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请
登录
Support
›
根据产品序列号查看状态
有用链接
›
Apple 产品更新周期
›
Other World Computing 性能升级
›
Apple 软件 Beta 测试
V2EX
›
Apple
用 M4 Max MacBook Pro + 128GB RAM 跑大模型
yibie
·
40 天前
· 922 次点击
这是一个创建于 40 天前的主题,其中的信息可能已经有所发展或是发生改变。
M4 Max MacBook Pro + 128GB RAM 跑大模型:
模型使用 70GB 大小的 QwQ-32B ,精度 16 bit
LM Studio 显示的 CPU 使用率没有跑满,不过风扇开始启动了
内存使用 63GB 左右
除了风扇启动之外,其它程序的操作没有影响
QwQ-32B 在推理方面很强,推理过程当中不停地产生新的问题,然后自问自答
M4 Max
MacBook Pro
大模型
3 条回复
1
yinmin
40 天前 via iPhone
能跑到多少 tokens/秒?另外,8bit 的 70B 模型跑的性能如何?
2
yibie
OP
40 天前
8bit 还不知道,之前跑 Gemma3 应该是 8 bit 精度的,20 token/s 吧,不过这个速度不恒定,看模型会不会自己卡,但一般超过 10 token/s
3
yibie
OP
40 天前
@
yinmin
8bit 还不知道,之前跑 Gemma3 应该是 8 bit 精度的,20 token/s 吧,不过这个速度不恒定,看模型会不会自己卡,但一般超过 10 token/s
关于
·
帮助文档
·
博客
·
API
·
FAQ
·
实用小工具
·
5655 人在线
最高记录 6679
·
Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 22ms ·
UTC 06:19
·
PVG 14:19
·
LAX 23:19
·
JFK 02:19
Developed with
CodeLauncher
♥ Do have faith in what you're doing.