V2EX › mewking 的所有回复 › 第 3 页 / 共 27 页

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

1 2 3 4 5 6 7 8 9 10 ... 27

❮

❯

2025 年 9 月 22 日

回复了 xlogion 创建的主题 › 问与答 › 我想从零开始学拳击或者自由搏击，应该从哪开始呢？

两年硬拉 55kg ，哪怕是女生也……

而且还没说是自由重量还是史密斯

这个力量基础学不了格斗

力量和体能是有书和视频可以学的，对于平均水平头脑和身体的人，半年的体能训练可以从零到完成全马，23 年到现在的力量训练至少至少也应该能硬拉 1.5 倍体重

格斗看书和视频学不了

你的力量和体能训练进度也支持不了学习格斗

没有所谓的“自由搏击”

什么格斗术厉害，看 UFC 就行了

站立来说：拳最厉害是拳击，腿和内围技术最厉害是泰拳

摔就是摔跤

地面是柔术

散打（自由搏击）是个反面例子，拳不如拳击，腿不如泰拳，摔不如摔跤，没有内围和地面技术

UFC 没人用的技术都是花架子

UFC 的话，3 年拳击，3 年泰拳，3 年摔柔，差不多 9 年出一个成手

2025 年 9 月 16 日

回复了 wenkgin 创建的主题 › Local LLM › AI 本地化部署的方式

@shuimugan 所以，就是尽量拆解问题，尽可能缩小和封闭空间（相当于减少关键字），想错都难，但这样也就跟写伪代码差不多了，模型差不多就是补全一下。ruby 那种花样繁多的可能容易 gg

2025 年 9 月 16 日

回复了 wenkgin 创建的主题 › Local LLM › AI 本地化部署的方式

@shuimugan 这个链接我是看了，所以说 Intel 活该卖大楼，一个 demo gif ，分辨率低的看不清，也不公布具体配置，还说测试数据需要审计不能公布。那个 demo 可能用了志强，8 或者 12 通道，再来个 amx 加速，桌面级 cpu 和 ddr5 双通道比不了

如果跑 Qwen3-Next-80B-A3B int8 ，是不是单单 96G DDR5 6400 就够了，不用 256G 和独立显卡吧？

102/3 = 34 tokens/s

如果 Q6 量化更快，还能留出更多内存给上下文？

我还没买硬件呢，不然就自己实测了。现在 a770 价格比三年前还高，b770 也马上来了，可能还有铭瑄那个 B60 ，ddr5 价格也涨了不少。如果 80b 和 235b 差距不大，那省不少钱呀

2025 年 9 月 16 日

回复了 wenkgin 创建的主题 › Local LLM › AI 本地化部署的方式

@shuimugan 好吧，刚才 ipex llm 项目下面看到一个 4 张 a770 ，Q3 量化的 235b ，只有 2.99 t/s ，这是哪里没搞对吧，GPU 显存 64G ，完全没利用到

2025 年 9 月 16 日

回复了 wenkgin 创建的主题 › Local LLM › AI 本地化部署的方式

@shuimugan ktransformers （合理分配好模型活跃的专家到 GPU 跑得快点）

请问，这个项目的加成能有多少？我找不到相关（目标硬件和模型）性能测试

假定是家用平台：DDR5 6400 256G RAM ，A770 16G * 2

内存带宽 102GB/s ，单卡显存带宽 560GB/s,这两张卡的带宽能叠加吗？能把上下文和激活专家平均放在两张卡上，相当于 1120GB/s 带宽？

Qwen3 235B ，int8 ，激活参数 22GB ，加上下文，应该能放在 32G 显存里？假定不发生专家交换，也无法叠加显存带宽，这时理论速度应该有 560/22=25.5 token/s ，跑 Q4 量化就有 50t/s 。可一旦发生专家交换就崩了吧，掉到 4-5t/s ？

我是想知道这套硬件跑 235b 实际平均速度到底会怎样，Intel 那个 ipex llm 项目，有人问测试分数，开发人员回应说保密……保密…………Intel 咋还没倒闭

2025 年 9 月 11 日

回复了 AresChang 创建的主题 › 生活 › 想买小摩托车，请教一点购买建议❤️

能去上安驾课，意识已经胜过 99%的驾驶员，尽量知行合一，学到的尽量做到

摔车永远都会发生

向往自由，如果长途骑行，仿赛非常累

二选一肯定 GSX

250 上高速不建议，任何排量的春风也不建议

很多年后，也可能十几年后，你会发现“科技感”都是 xx ，简单可靠少维护才好

摩托的维保和保险很便宜，可以考虑山姆或者开市客买匹配的机油自己维保

轮胎勤检查，刹车片，盘也要定期看

能赔付个人交通意外的保险要有

下一个头盔可以考虑日淘 OGK

2025 年 9 月 6 日

回复了 hmbb 创建的主题 › Local LLM › 想自己本地跑大模型，学习大模型，做一些微调等操作，目前看到一款小主机在预算内， CPU AMD Ryzen Al Max+ 395，不知道这套配置是否适合用来学习大模型跑大模型，有没有懂的兄弟可以给点建议。

@shuimugan 感谢，链接收藏了

自己水平是很差的，非 IT 从业人员，作为爱好关注一点技术皮毛

跟 GPT 免费版聊了几句这个问题，它说在它训练过的语料中，C/C++ 是行数最多的，但大多数是历史遗留，无注释的工程代码，对于它深刻理解语言无太多帮助。

它说它理解最深的是 py ，因为有注释的代码最多，教学示例最多，文档和生态最丰富，其次是 js

它还说，从人类程序员的角度，第一友好是 py ，如果综合人类友好 + 最强表达能力，最好是 C#，但是它对 C# 掌握程度不如 C/C++

go 关键字最少，最简约，目前局限大概也是语料不够丰富

2025 年 9 月 5 日

@shuimugan 感谢详细的回复。看了看 GLM 4.5 Air 4bit 部署成本还是挺高，Qwen3 Coder 30B-A3B 如果是 Q6 ，DDR5 内存应该也能跑挺快~

这些小的本地模型对于 Java 和 C# 效果如何？想来应该是不如 js 和 py

C/C++，Rust 就更差？

2025 年 9 月 5 日

@shuimugan 请问，GLM 4.5 Air 的 4bit 量化比较 Qwen3-30B-A3B BF16 如何？本地 code

2025 年 5 月 5 日

回复了 handsome198311 创建的主题 › 健康 › 媳妇脑梗， V 友帮看看有什么药可以治。

左上印章没有打码，河南没有好医院，瘸子里面拔将军，首选河医，次选省医，心脑血管这么大的问题，才 38 岁，跑来这里提问，还吃中药……

2025 年 3 月 24 日

回复了 wildlynx 创建的主题 › 京东 › 京东又在作死了，付款强制使用白条

白条因为类似原因注销过，后来因为小恩小惠又开通了，还开了自动还款，结果有一次京东提前半个多月扣款，赶紧又把自动还款关了。

现在极少用京东了，从 GZ 论坛月黑风高时期开始用，第一批 plus 用户，今年到期不再续费了

2025 年 3 月 20 日

回复了 wpy407 创建的主题 › 生活 › 想趁着房地产下行周期，换一套改善性住房，但是又有各种问题和纠结，前来求教

及时止损在任何时候都是对的

绝大多数高层也一定会成为平民窟，老金水部分省军区干休所，省直干休所，维修基金都是问题~

所以，及时止损在任何时候都是对的

对于你的情况，郑州的房子不值得买，无论投资还是肛需

2025 年 3 月 12 日