cellsyx

cellsyx

V2EX 第 604584 号会员,加入于 2022-12-03 02:13:34 +08:00
今日活跃度排名 3198
坏了, 我成 eventloop 了
程序员  •  cellsyx  •  5 天前  •  最后回复来自 veightz
5
GPT-5.3-Codex 简单测试
程序员  •  cellsyx  •  6 天前  •  最后回复来自 MindMindMax
7
目前 AI 辅助生成学习笔记的最佳实践探讨
程序员  •  cellsyx  •  7 天前  •  最后回复来自 cellsyx
7
AI 协助编程和学习的一些体会
  •  1   
    人工智能  •  cellsyx  •  1 月 29 日
    [开心一下] AI 笑话
  •  2   
    程序员  •  cellsyx  •  1 月 29 日  •  最后回复来自 cellsyx
    23
    cellsyx 最近回复了
    1 天前
    回复了 SummerOrange 创建的主题 程序员 AI 编程后,我更累了
    @Dragonish3600 感谢。目前看见描述 AI 实践最好的文章
    4 天前
    回复了 SummerOrange 创建的主题 程序员 AI 编程后,我更累了
    古法编程还有思考-执行两个循环的过程,相当于做了负载均衡。现在 AI 极大缩减了执行的时间,就把负载全压到思考上了。
    4 天前
    回复了 kentxxq 创建的主题 程序员 google AI ultra 也有 aitigravity 周限制了?
    不是吧,我刚准备买 ultra..
    我看之前用 ultra 的人说还没碰到过 opus 的周限制,这就要改协议了?
    哈哈哈,我打断 agent 工作之后让它继续执行任务,thinking 过程里有时候会看到它觉得 frustrated ,看样子确实需要这个 skill
    确实,flash 明显比 pro 听话很多
    改 Claude 周限额之前是完美套餐,改了之后有点鸡肋,一周只有两个五小时 quota ,只能上 ultra 了。
    5 天前
    回复了 x97bgt 创建的主题 程序员 codex 的遵循性似乎不如 Claude Code?
    我用的 codex CLI ,这个指令遵循的问题我设置好 Rules 文件之后就没遇到过。
    面对 “在完成工作后向我确认,才能进入下一步” 这种需求最不听话的是 Antigravity 里的 Gemini 3 Pro ,哪怕我规则文件写明 + 每次会话初始提示词写明,上下文稍微长点,他经常就是自动给你往下执行了。
    5 天前
    回复了 cellsyx 创建的主题 程序员 坏了, 我成 eventloop 了
    主要考虑的点有两个: 成本, 以及特定需求下的输出质量

    Gemini 3 Flash 是这上面成本最低的模型, 且指令遵从性比 Gemini 3 Pro 要好的多. 从生成 commit message 中的统计文件改动数量和类型以及输出格式这个任务就可以看出来.

    Gemimi 3 Pro 是这上面成本第二低的模型, 拿来生成前端 React 代码还行, 出错不多. 但是 Debug 消耗的对话轮次和要求用户输入额外提示信息要明显多于 5.3-Codex 和 Opus 4.6. 有时候改个 3-4 轮可以解决 bug, 但是代价就是代码越改越乱. 后端代码我目前只大量生成过 Python, 但是经常会有重复代码, 偶尔遗漏修改或者误删代码. 即便有 GEMINI.md 规定代码格式要求, 还是有不遵守指令的情况, 比如 import 会无理由地放在函数内而不是文件顶部, 即时你写明了 Rules 也一样会出现. 明明没有循环引用这个问题, 它还是倾向于把改动放到一块连续的区域, 不考虑整体代码需求.

    5.3-Codex 的成本比 Opus 4.6 低, 生成后端 Python 代码的质量显著高于 Gemini 3 Pro , 而且工程的严谨性更强. 最明显的就是 5.3-Codex 写出的测试代码质量更高, 生成项目过程中的返工次数和 Bug 明显更少.

    Opus 4.6/4.5 成本最高, 我是拿他来生成框架或者解决前几个模型尝试多次都解决不了的需求. 比如在前端实现一个搜索并预览本地 PDF 文件, 预览界面需要高亮关键词. 这个需求由于要处理 PDF 中特殊的文字切分或者编码以及字体情况, Gemini 3 pro 对话 5-6 轮都实现不了, Opus 3 轮完成任务.
    Claude 系模型(4.5) 在 windows 环境下(Antigravity 中) Debug 时 Agent 执行动作的准确率不如 Gemini 3 pro, 经常是在 cmd 或者 powershell 中使用 linux 的命令格式. 4.6 的 Agent 表现我还没怎么测, 正在使用中.
    5 天前
    回复了 wsseo 创建的主题 程序员 qoder 和通义灵码是什么关系?
    通义灵码这名字有点搞,刚推广的时候很多人第一眼都是看成 通灵代码
    之前用过,类似 VSCode 的代码补全插件
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1730 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 17ms · UTC 08:03 · PVG 16:03 · LAX 00:03 · JFK 03:03
    ♥ Do have faith in what you're doing.