$V2EX
Solana
Give SOL to Copy Address
使用 SOL 向 cowcomic 打赏,数额会 100% 进入 cowcomic 的钱包。
 cowcomic's recent timeline updates
cowcomic

cowcomic

V2EX member #73524, joined on 2014-09-11 08:31:32 +08:00
小米的 Token Plan 降价+重置,给的真多
程序员  •  cowcomic  •  May 27  •  Lastly replied by cowcomic
15
美团饭卡非常之不划算,小心踩坑
生活  •  cowcomic  •  Feb 5  •  Lastly replied by donaldturinglee
2
总有人在公司厕所抽烟,烦死了
职场话题  •  cowcomic  •  Oct 22, 2025  •  Lastly replied by imba97
59
阿里新开源的 QwQ-32B-Preview 模型有啥特殊性?
机器学习  •  cowcomic  •  Nov 28, 2024  •  Lastly replied by cowcomic
4
有没有好用的 P2P 传文件的工具
问与答  •  cowcomic  •  Jun 11, 2025  •  Lastly replied by dode
15
大码牛仔裤求推荐
生活  •  cowcomic  •  Oct 8, 2024  •  Lastly replied by cowcomic
14
llama-3-sqlcoder-8b 微调效果不好,求助
问与答  •  cowcomic  •  Oct 2, 2024  •  Lastly replied by Volekingsg
6
LLama3.1 的申请被拒了
程序员  •  cowcomic  •  Sep 21, 2024  •  Lastly replied by jk2K
29
后台学前端用什么技术栈比较好
程序员  •  cowcomic  •  Jun 5, 2024  •  Lastly replied by yituanmaoxian
52
今天接了一个电话,有点儿吓人
问与答  •  cowcomic  •  Apr 12, 2024  •  Lastly replied by glouhao
27
cowcomic's recent replies
Jun 23
Replied to a topic by jiezou Local LLM 大模型小白推荐一下本地模型
@jiezou 要是跑政府或者军工的业务的话,就别上这个显卡了,直接看国产卡,通常都是一卡 2 芯一共 64G 显存,也不算贵,性能差不多 V100 水平也够用了
所以不碰股票
主要得看资源占用,不舍本逐末
Jun 22
Replied to a topic by jiezou Local LLM 大模型小白推荐一下本地模型
2080ti 的魔改版印象是 22G 显存
上 qwen3.5-9b 的 int4 量化版,上下文缩小点儿
还要留一部分显存跑 embedding 和 rerank 模型
embedding 推荐 gte-qwen2-1.5b ,能支持长上下文,RAG 神器,找个 int4 量化版本
rerank 推荐 bge-rerank-m2 ,能支持长上下文,RAG 神器
上面三个模型应该能勉勉强强装下,不够的话,就把 LLM 的上下文再缩一些,量化的话 int4 一下就不建议了

要是不非得追求私有化部署的话,买显卡的钱不如用线上模型了,现在都挺便宜的
还没用,不过顶一下支持
点赞,后面这些内容能看出都是肺腑之言啊
May 28
Replied to a topic by xiaoz 健康 鼻中隔偏曲术后第 9 天
恭喜恭喜
@runstone 我也感觉到了,感觉用量是之前的 10 倍左右
@lel020
@hailaz
哦哦,找到了
@hailaz 怎么搞啊,我这儿咋没有这个优惠
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   5477 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 45ms · UTC 01:20 · PVG 09:20 · LAX 18:20 · JFK 21:20
♥ Do have faith in what you're doing.