V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  Theigrams  ›  全部回复第 1 页 / 共 1 页
回复总数  4
GPT4-o 或 4o-mini 都行,启用 json-mode

https://platform.openai.com/docs/guides/json-mode
> With this set of optimizations, on iPhone 15 Pro we are able to reach time-to-first-token latency of about 0.6 millisecond per prompt token, and a generation rate of 30 tokens per second.

苹果的端侧模型才 3B ,M1 随便跑无压力
142 天前
回复了 steelshadow39 创建的主题 Apple 后端开发 MacBook 求推荐
没啥问题,就是 16 寸有点大了,一般会外接显示器,用不着那么大,带着不方便。
GitHub Copilot 也能读取整个工作区的代码,devv.ai 的 GitHub 模式也能读取整个 GitHub 仓库的代码,

Copilot 是直接基于文本相似度检测,devv 是对 embedding 计算相似度
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2598 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 15ms · UTC 10:45 · PVG 18:45 · LAX 02:45 · JFK 05:45
Developed with CodeLauncher
♥ Do have faith in what you're doing.