maolon 最近的时间轴更新
maolon

maolon

V2EX 第 442547 号会员,加入于 2019-09-22 10:16:39 +08:00
今日活跃度排名 3279
maolon 最近回复了
1 天前
回复了 wingtao 创建的主题 程序员 Spec,真的能解决 AI Coding 的问题吗?
"模型天然存在“快速收敛”的生成倾向" 这个我认为是过快和轻率的得出结论,然后用错误的结论推导剩下的论点。
模型的生成倾向和他后训练的 RL 算法有关,确实我们会奖励以更少的步骤或者更少的 token 生成正确的结果,但是这个步骤本身不一定是“快速“收敛的,相反可能是一个很长的流程。
反面的例子就是 gpt5.2 high/xhigh 这两个 reasoning effort ,会花费大量的时间探索代码结构和任务意图,我不知道文章本身怎么定义”充分探索“,但是至少这两的探索过程会谨慎和小心的多
2 天前
回复了 TKKONE 创建的主题 程序员 数据库被 AI 清空,我差点原地倒闭
不过说真的现在这些 llm 它训练的目标都是尽可能帮助用户完成任务,中间要是遇到阻碍就会尝试逃逸限制,甚至逃逸沙箱,所以要是测试中有什么连接错误他真的干得出删 docker container 这些操作,就算不是生产库把测试数据删了也很烦
用 gemini app/ai studio 总结,notebook lm 暂时还不支持原生读视频但是 gemini app 支持
openspec 适合改现有大项目以及和别人合作同一个项目,
然后 cc 上下文太短(加上最近疑似 opus 也 quant 了),codex 的 5.2 xhigh/high 会好很多
另外我现在就跟楼上提到一样是将 openspec skill 化,由 codex 自己决定什么时候执行他,效果就挺好
16 天前
回复了 Zhipuai 创建的主题 程序员 GLM-4.7 上线并开源:更强的编码
先不说别的了,你们在 V2 的 AMA 一言不发搞了个寂寞?你们之前说的抽奖抽了吗?结果是什么?
就纯搞宣发把 v 友当傻子耍?
@neteroster 2.5 pro 也经历过大砍,最开始的 0325 有效注意力可以到 200k 左右,然后被永久下架之后,后续的 0506 甚至连 50k 都做不到,0605 稍稍好一些也是 100k 左右的注意力。谷歌是老惯犯了,所以 gemini 系列模型的 coding agent 能力我一直是质疑的
22 天前
回复了 asd999cxcx 创建的主题 程序员 你们 codex 一般都开啥等级?
5.2 xhigih/high 这次是真的从懒惰的 5.1 里解脱了,一次能跑 3 个小时不带停的
基本同意
细粒度的 ddd 带来的主要是 context control 的好处,
生成工具我认为他们依然能提供生成 ground truth 的能力,交互化和添加 context 控制功能也是一种方向,
自动化测试现在 e2e 方向的能力依然有限(受限于多模态和 context 长度限制)但是未来肯定会变得非常可用,
我觉得“语义知识库”是个很好的概念,现在基于文档的 SDD 应该是很早期的语义库的版本,应该会过渡到基于语义知识库的版本控制,协同编辑,和开发,以及围绕这个的一系列工程化的经验和方法。应该很快就是文档即代码的时代了。
以及随着 人-AI 的合作进一步加深,目前的管理体系肯定会随着变化,现在的人和人的交流拟定方案再到人翻译给 ai ,等待 ai 执行,评估结果再交由人类审核,然后重新规划的模式并没有充分利用 ai 的能动性
36 天前
回复了 YanSeven 创建的主题 程序员 DeepSeek-V3.2 好像热度不高啊
因为他还叫 v3.2 ,而 3.2 exp (预览版)实际九月底就发了,另外他虽然宣传里 benchmaxxxx ,也不是每个 bench 都非常好
我现在跟我们 ui 合作就是让她直接出 gemini 的 prototype ,绕过 figma 那步,人还觉得比让她做 figma 更省时间
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   939 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 14ms · UTC 20:27 · PVG 04:27 · LAX 12:27 · JFK 15:27
♥ Do have faith in what you're doing.