V2EX › clemente 的所有回复 › 第 2 页 / 共 47 页

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

For Existing Member Sign In

1 2 3 4 5 6 7 8 9 10 ... 47

❮

❯

12 天前

回复了 littlemis 创建的主题 › AI Agent 智能体 › 请问大家目前 AI 使用工具清单 🙌🧑

搜索 perplexity
长文本理解 gemini
代码 codex+cc
图片 gpt
日常豆包
录音通义听悟

12 天前

回复了 h2mpz 创建的主题 › OpenAI › chatgpt 和 Codex 要开全局才能上了，你们是这样吗？

open -a 'Claude' --args --proxy-server="http://xxxx.com:xxx" --proxy-bypass-list="localhost,127.0.0.1,::1"
open -a 'Codex' --args --proxy-server="http://xxxx.com:xxx" --proxy-bypass-list="localhost,127.0.0.1,::1"

最佳方案在这里

12 天前

回复了 HMYang33 创建的主题 › 分享发现 › 据说这是目前全世界最快的文本推理速度

其实是模型拆到硬件的 sip core 里面了通常只能定制模型

12 天前

回复了 awesomes 创建的主题 › 分享创造 › 该运动起来了程序员朋友们

少吃吃的好睡得好才是值得关注的

这是优化项里面的 top1

12 天前

回复了 deepsae 创建的主题 › Apple › vibe coding 了一个高仿的 mac 端的 paste ，完全免费。

上架流程快嘛

12 天前

回复了 followadc 创建的主题 › Local LLM › mac 64g 能部署哪个本地大模型

一般小设备都跑 nvfp4 或者 fp8

mac fp8 的话你大概跑 36 - 40+ 左右的差不多了但可能你做其他功能就卡了

12 天前

回复了 followadc 创建的主题 › Local LLM › mac 64g 能部署哪个本地大模型

我正好写过类似工具

如果是稠密模型
运行时显存需求 = 模型参数 x dtype(是什么量化版本） + 冗余量留给 kv cache

如果是 moe 的模型
实际运行时显存需求少于上面

用 13b 模型为例
格式每参数字节 13B 权重
FP16/BF16 2B ~26 GB
FP8 (E4M3) 1B ~13 GB
NVFP4 0.5B ~7 GB

kv cache 按照 1/4 冗余计算

26 * 5/4
13 * 5/4
7 * 5/4

5 月 28 日

回复了 LittleSharkDaDa 创建的主题 › 投资 › 是否存在港卡以外的其他选择？比如东南亚各国？

@conky 美国身份证？

5 月 27 日

回复了 clemente 创建的主题 › 程序员 › 除了 superpowers 还有哪些大家在用的 skill ? mattpocock/skills ? shanraisshan/claude-code-best-practice

@TerranC 最新的 claude code 内置了 superpower skill

5 月 25 日

回复了 InDom 创建的主题 › 汽车 › 花费近万元，跑了 8500km，我租车一年后的真实感受

我觉得你这个用车不如去买个二手的油车

5 月 21 日

回复了 CallmeDredd 创建的主题 › 问与答 › 一个道德困境：想跟 AI 说谢谢，但又怕浪费水和电怎么办？

从优化这门学科的角度你应该分析一下地球 top5 的浪费活动然后优化他们比你现在考虑的重要的多