想咨询一下各位最近使用的这几个模型体感哪个更强呢?
Agent 场景,主要是 tool using/vibe coding
入围的:
如果还有推荐的也可以写(比如 chatgpt )
由于 prompt 其实和模型是较为绑定的(这个很类似当年针对某个芯片版本写的汇编优化,当芯片/编译器版本换了,方法也就失灵了),所以希望选择一个半年内持续使用的模型。希望了解一下大家目前在 tool using/vibe coding 哪个更方便?
公司生产场景,部署在美东
目前在 openrouter 平台,有什么更好的平台也推荐。
参考:
1
yusf 22 小时 15 分钟前
Claude + Chatgpt 家的,自己模型还是要配自家的工具才厉害
|
2
SingeeKing PRO 我的选择
- 日常 GPT-5.3-Codex (xhigh) - 疑难杂症 GPT-5.2 (xhigh) - 超级疑难杂症 GPT-5.2 Pro |
3
iamnotcodinggod 22 小时 5 分钟前
Claude code default 就行了,让它灵活在 opus 和 sonnet 之间切换,碰不到 5 小时限制。如果纯用 Opus ,大概一个半小时就会碰到。
碰到了就转 Codex 5.2 最高 reasoning effort. |
4
maolon 21 小时 59 分钟前
这个都不用问的,
全自主 agent 和超长程任务(> 15hr 持续执行)用 gpt 系列( 5.2 high/xhigh and/or 5.3 codex high/xhigh ), copilot 模式(你和 agent 合作写)用 claude 的 sonnet 4.6 + opus 4.6, 另外建议搭配各家自己的套餐使用(也就是 codex 用 gpt 订阅,cc 用 claude 订阅),以及 opus 价格非常高,注意使用限制 |
5
Bad0Guy 21 小时 45 分钟前
我直接在 cli 里让 Gemini/codex/cc 通过 mcp 分工,只用 sonnet/opus 的话额度烧得很快,而且不一定能一次就达到你要的效果
|
6
doraemonki 21 小时 42 分钟前
@Bad0Guy 老哥 mcp 用的啥
|
7
mogutouer 20 小时 55 分钟前
Opus 断层领先,这一点疑问也没有
|
9
issakchill 19 小时 37 分钟前
GLM 5
Kimi k2.5 MiniMax M2.5 Chatgpt 5.3 这几个都用过 Chatgpt 5.3 比其余 3 个好太多 |
10
Tink PRO Kimi 我感觉是国内还算很不错的
|
11
andy101wong 19 小时 11 分钟前 via Android
国产 kimi 模型不错。 其他国产除了 deepseek 都是 pr 。 分析类的用 gemini ,代码有钱 claude ,没钱 gpt
|
12
Bad0Guy 7 小时 8 分钟前
|
13
Bad0Guy 7 小时 4 分钟前
@doraemonki 或者你可以直接问 grok ,twitter 上有没有类似的开发者帖子里贴出来的 mcp 项目
|
14
raycool 2 小时 28 分钟前
就用 GPT5.3-codex 感觉不错。
价格适中,也没比 claude 差太多。 |