V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
superhot
V2EX  ›  程序员

Claude 依然是编程最强, ChatGPT 跟 Gemini 在 Bash 这种常见语言的最基础的地方依然犯错

  •  
  •   superhot · 15 天前 · 1581 次点击

    在 Bash 里面比较反直觉的一点是,&&|| 的优先级是相同的,所以会有:

    $ true && { echo "foo"; true; } || echo "bar" && echo "baz"
    foo
    baz
    
    $ true && { echo "foo"; false; } || echo "bar" && echo "baz"
    foo
    bar
    baz
    

    这不是什么八股,而是日常工作中会出现的基本用法,然而只有 Claude 3.7 答对了,GPT 4o 跟 Gemini 2.5 pro 还在那 && 的优先级高于 || 且有短路,即 A && B || C && D 等价于 (A && B) || (C && D),所以给出第一个的结果是 foo

    冷门技术就不提了,本以为发展到今天 LLM 已经不会在 Bash 这种常见技术上出现低级的事实错误了,看来还是会有。

    6 条回复    2025-04-10 14:28:31 +08:00
    MonikaCeng
        1
    MonikaCeng  
       15 天前 via iPhone
    GPT 你不能拿 4o 写代码,用 o1 或者 o3-mini-high
    doraemonki
        2
    doraemonki  
       15 天前 via Android
    试了一下 Gemini 2.5 pro 两个都回答对了
    deplives
        3
    deplives  
       15 天前
    tywtyw2002
        4
    tywtyw2002  
       15 天前 via iPhone
    又不是面试,没事问这些问题其实没多大意义。
    与其让 ai 执行 code ,不如找个 bash 自己跑下。

    vibing code 都要求生成可读性的 code ,如果出现这类 code ,直接重新生成就行了。目前 vibing code 的意义还是在于提升了生产效率。

    以前写个 bash 脚本 不得 10 分钟起步吧,复杂一点的一个小时没了,现在 vibing code 提升效率 10 倍以上。
    FlorentinoAriza
        5
    FlorentinoAriza  
       15 天前
    o3 中思路写的是
    superhot
        6
    superhot  
    OP
       15 天前
    @MonikaCeng
    @FlorentinoAriza
    确实 o3-mini 会好些,4o 还是不行

    @doraemonki 我新开了一个重新试了一下,这回对了,有点不稳定

    @tywtyw2002 是因为我在看别人代码的时候也有点记不清了,想用 LLM 确认一下,结果发现三个模型答案不一致,又专门翻了一下手册。用来生成代码处理简单任务确实好用,但如果在这种程度的问题上都能发生事实错误,还需要对比及二次确认的话,整个过程并没有提效很多
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2161 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 16:10 · PVG 00:10 · LAX 09:10 · JFK 12:10
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.