V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  mewking  ›  全部回复第 3 页 / 共 27 页
回复总数  526
1  2  3  4  5  6  7  8  9  10 ... 27  
2025 年 9 月 22 日
回复了 xlogion 创建的主题 问与答 我想从零开始学拳击或者自由搏击,应该从哪开始呢?
两年硬拉 55kg ,哪怕是女生也……

而且还没说是自由重量还是史密斯

这个力量基础学不了格斗

力量和体能是有书和视频可以学的,对于平均水平头脑和身体的人,半年的体能训练可以从零到完成全马,23 年到现在的力量训练至少至少也应该能硬拉 1.5 倍体重

格斗看书和视频学不了

你的力量和体能训练进度也支持不了学习格斗

没有所谓的“自由搏击”

什么格斗术厉害,看 UFC 就行了

站立来说:拳最厉害是拳击,腿和内围技术最厉害是泰拳

摔就是摔跤

地面是柔术

散打(自由搏击)是个反面例子,拳不如拳击,腿不如泰拳,摔不如摔跤,没有内围和地面技术

UFC 没人用的技术都是花架子

UFC 的话,3 年拳击,3 年泰拳,3 年摔柔,差不多 9 年出一个成手
2025 年 9 月 16 日
回复了 wenkgin 创建的主题 Local LLM AI 本地化部署的方式
@shuimugan 所以,就是尽量拆解问题,尽可能缩小和封闭空间(相当于减少关键字),想错都难,但这样也就跟写伪代码差不多了,模型差不多就是补全一下。ruby 那种花样繁多的可能容易 gg
2025 年 9 月 16 日
回复了 wenkgin 创建的主题 Local LLM AI 本地化部署的方式
@shuimugan 这个链接我是看了,所以说 Intel 活该卖大楼,一个 demo gif ,分辨率低的看不清,也不公布具体配置,还说测试数据需要审计不能公布。那个 demo 可能用了志强,8 或者 12 通道,再来个 amx 加速,桌面级 cpu 和 ddr5 双通道比不了

如果跑 Qwen3-Next-80B-A3B int8 ,是不是单单 96G DDR5 6400 就够了,不用 256G 和独立显卡吧?

102/3 = 34 tokens/s

如果 Q6 量化更快,还能留出更多内存给上下文?


我还没买硬件呢,不然就自己实测了。现在 a770 价格比三年前还高,b770 也马上来了,可能还有铭瑄那个 B60 ,ddr5 价格也涨了不少。如果 80b 和 235b 差距不大,那省不少钱呀
2025 年 9 月 16 日
回复了 wenkgin 创建的主题 Local LLM AI 本地化部署的方式
@shuimugan 好吧,刚才 ipex llm 项目下面看到一个 4 张 a770 ,Q3 量化的 235b ,只有 2.99 t/s ,这是哪里没搞对吧,GPU 显存 64G ,完全没利用到
2025 年 9 月 16 日
回复了 wenkgin 创建的主题 Local LLM AI 本地化部署的方式
@shuimugan ktransformers (合理分配好模型活跃的专家到 GPU 跑得快点)

请问,这个项目的加成能有多少?我找不到相关(目标硬件和模型)性能测试

假定是家用平台:DDR5 6400 256G RAM ,A770 16G * 2

内存带宽 102GB/s ,单卡显存带宽 560GB/s,这两张卡的带宽能叠加吗?能把上下文和激活专家平均放在两张卡上,相当于 1120GB/s 带宽?

Qwen3 235B ,int8 ,激活参数 22GB ,加上下文,应该能放在 32G 显存里?假定不发生专家交换,也无法叠加显存带宽,这时理论速度应该有 560/22=25.5 token/s ,跑 Q4 量化就有 50t/s 。可一旦发生专家交换就崩了吧,掉到 4-5t/s ?

我是想知道这套硬件跑 235b 实际平均速度到底会怎样,Intel 那个 ipex llm 项目,有人问测试分数,开发人员回应说保密……保密…………Intel 咋还没倒闭
2025 年 9 月 11 日
回复了 AresChang 创建的主题 生活 想买小摩托车,请教一点购买建议❤️
能去上安驾课,意识已经胜过 99%的驾驶员,尽量知行合一,学到的尽量做到




摔车永远都会发生




向往自由,如果长途骑行,仿赛非常累

二选一肯定 GSX

250 上高速不建议,任何排量的春风也不建议

很多年后,也可能十几年后,你会发现“科技感”都是 xx ,简单可靠少维护才好

摩托的维保和保险很便宜,可以考虑山姆或者开市客买匹配的机油自己维保

轮胎勤检查,刹车片,盘也要定期看

能赔付个人交通意外的保险要有

下一个头盔可以考虑日淘 OGK
@shuimugan 感谢,链接收藏了

自己水平是很差的,非 IT 从业人员,作为爱好关注一点技术皮毛

跟 GPT 免费版聊了几句这个问题,它说在它训练过的语料中,C/C++ 是行数最多的,但大多数是历史遗留,无注释的工程代码,对于它深刻理解语言无太多帮助。

它说它理解最深的是 py ,因为有注释的代码最多,教学示例最多,文档和生态最丰富,其次是 js

它还说,从人类程序员的角度,第一友好是 py ,如果综合人类友好 + 最强表达能力,最好是 C#,但是它对 C# 掌握程度不如 C/C++

go 关键字最少,最简约,目前局限大概也是语料不够丰富
@shuimugan 感谢详细的回复。看了看 GLM 4.5 Air 4bit 部署成本还是挺高,Qwen3 Coder 30B-A3B 如果是 Q6 ,DDR5 内存应该也能跑挺快~

这些小的本地模型对于 Java 和 C# 效果如何?想来应该是不如 js 和 py

C/C++,Rust 就更差?
@shuimugan 请问,GLM 4.5 Air 的 4bit 量化比较 Qwen3-30B-A3B BF16 如何?本地 code
2025 年 5 月 5 日
回复了 handsome198311 创建的主题 健康 媳妇脑梗, V 友帮看看有什么药可以治。
左上印章没有打码,河南没有好医院,瘸子里面拔将军,首选河医,次选省医,心脑血管这么大的问题,才 38 岁,跑来这里提问,还吃中药……
2025 年 3 月 24 日
回复了 wildlynx 创建的主题 京东 京东又在作死了,付款强制使用白条
白条因为类似原因注销过,后来因为小恩小惠又开通了,还开了自动还款,结果有一次京东提前半个多月扣款,赶紧又把自动还款关了。

现在极少用京东了,从 GZ 论坛月黑风高时期开始用,第一批 plus 用户,今年到期不再续费了
及时止损在任何时候都是对的

绝大多数高层也一定会成为平民窟,老金水部分省军区干休所,省直干休所,维修基金都是问题~

所以,及时止损在任何时候都是对的

对于你的情况,郑州的房子不值得买,无论投资还是肛需
2025 年 3 月 12 日
回复了 Unclev21x 创建的主题 Apple 苹果刚刚推出了新款 Mac Studio
@shuimugan 请问这个 2*770 的玩法有没有部署例子?貌似是最便宜的 16G 卡。如果 PCIE 槽一个 X16 ,一个 X4 ,会降低很多性能吗
2025 年 3 月 7 日
回复了 go522000 创建的主题 职场话题 38 岁,在今天辞职了,过程有点搞笑(苦笑)。
揭阳哪里?普宁?好吃的多筏? OP 哪里人啊
2025 年 2 月 19 日
回复了 hendry 创建的主题 问与答 滴滴等打车软件能否增加油车或电车优先功能
暂时可以先用哈啰顺风车,选独享+超值油车
@Admin8012 请问,这个“开源设备树序列”在哪里可以查看,另外,不太追求性能的话,ace3v 咋样,moto 的 G75 呢?
2024 年 11 月 23 日
回复了 NokiaForever 创建的主题 Android 有人不喜欢原生系统,就有人不喜欢国产魔改系统
@NokiaForever 这个现在好 root 吗?
1  2  3  4  5  6  7  8  9  10 ... 27  
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2931 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 120ms · UTC 05:28 · PVG 13:28 · LAX 22:28 · JFK 01:28
♥ Do have faith in what you're doing.