aikilan
V2EX  ›  OpenAI

GPT 5.5 的降智是不是有点严重

  •  
  •   aikilan · 15h 13m ago · 3524 views

    最近任务往往需要引导 2 次以上,稍微复杂点的引导 3-4 次都有,太奇怪了

    31 replies    2026-05-21 16:35:10 +08:00
    sockpuppet9527
        1
    sockpuppet9527  
       14h 52m ago
    +1

    怀疑是新模型发布前后,算力被重新分配。
    aikilan
        2
    aikilan  
    OP
       14h 41m ago
    @sockpuppet9527 完全属于被服务商拿捏的
    YanSeven
        3
    YanSeven  
       14h 36m ago
    前几天一片夸 codex gpt 5.5 爆杀 claude code 的。

    看来 MaaS 这东西,比传统的各种 aaS 都要不稳定。
    MrL21
        4
    MrL21  
       14h 33m ago
    是的,变差了很多
    ximaoyang
        5
    ximaoyang  
       14h 30m ago
    gpt 聪明过吗?在 cc 面前就是个垃圾
    shunia
        6
    shunia  
       14h 29m ago
    啥问题?昨天在 vscode 和 cli 里都用了,感觉还是一样,能力上没啥变化啊?
    不过出了个新 bug 就是,有一个项目一直触发 cybersecurity 的提示,没法用。去 codex 的 issue 里看了一眼,提的 issue 都被直接关了,也不处理。
    shunia
        7
    shunia  
       14h 29m ago
    @ximaoyang #5 ??这是从何说起?
    409164
        8
    409164  
       14h 28m ago via iPhone
    @ximaoyang 确实
    lel020
        9
    lel020  
       14h 27m ago
    我以前用 medium 的,现在用 xhigh ,起码没比以前的 medium 降智,
    tanrenye
        10
    tanrenye  
       14h 24m ago
    没觉得降智,工作的任务都能胜任
    ktyang
        11
    ktyang  
       14h 24m ago
    是的,昨天一个小工具翻来覆去搞了好几遍,每次都有问题,害得我折腾了好久,以前肯定是一次成的。
    lemontrees
        12
    lemontrees  
       14h 18m ago
    感觉还好
    YangJiLei
        13
    YangJiLei  
       14h 17m ago
    昨天不是额度偷偷刷新吗,我感觉现在额度消耗的好快
    Yasuke
        14
    Yasuke  
       14h 17m ago
    @ximaoyang 你真的用过吗
    laved
        15
    laved  
       14h 12m ago
    @ximaoyang 我用 copilot 的时候用过 cc 反而觉得 cc 比不上 gpt
    sockpuppet9527
        16
    sockpuppet9527  
       13h 41m ago
    @aikilan 之前 opus 4.7 发布前夕,opus 4.6 降智也很厉害。祖传手艺了算是。
    wy315700
        17
    wy315700  
       13h 38m ago
    @YangJiLei 降智,额度变少

    都是基操了
    undefine2020
        18
    undefine2020  
       13h 37m ago
    5.4 也降了,昨天第一次碰到让它改个 shell 脚本都出问题的
    urfree
        19
    urfree  
       13h 9m ago
    5.6 要来了吧
    evemoo
        20
    evemoo  
       13h 7m ago
    +1 ,胶水代码特别多,简单功能搞得特别复杂
    yuyue001
        21
    yuyue001  
       12h 59m ago
    除了 claude ,有哪个值得推荐的模型,和 gpt 互补使用。现在降智的很难受。
    ximaoyang
        22
    ximaoyang  
       11h 55m ago
    除了 cc 其他的都别用。cc 回答简短。不知道就说不知道。gpt 那套真扛不住,回答特别长,不懂瞎回答。真的到干活的时候就来回的在一个地方打转。
    Zarhani
        23
    Zarhani  
       10h 46m ago
    连 openrouter 上的 api 也降智了
    isnullstring
        24
    isnullstring  
       10h 34m ago
    +1 ,今天写的计划和代码开始变得弱智起来,自己定的计划却不按计划来
    aikilan
        25
    aikilan  
    OP
       10h 26m ago
    @isnullstring 之前经常输出的计划能够把我没注意到的也列出来。。。现在提问频率降低,输出的东西就是一大坨
    Baymaxbowen
        26
    Baymaxbowen  
       10h 16m ago
    +1 ,一个小项目经常丢三落四的
    v2306
        27
    v2306  
       10h 15m ago
    更新完,上下文窗口的进度条怎么没有了
    fuchish112
        28
    fuchish112  
       9h 52m ago
    咋一个个跟着手机厂商学,新的出来,旧的就故意卡顿,降拍照画质等等手段
    bellx
        29
    bellx  
       9h 51m ago
    是的,之前一遍过的东西现在要返工,我用的还是 5.5 xhigh
    cirzear
        30
    cirzear  
       9h 35m ago
    @bellx 同感,同样复杂度的任务,现在总是只改差不多就说改完了,闭环逻辑也不如之前,需要‘鞭子抽它’才去一步步干
    isnullstring
        31
    isnullstring  
       8h 13m ago
    @aikilan 是的,代码里已经有相应变量,代码也是他自己写的,写计划时候又创建个相同含义的变量,那计划我审得恼火 丢给 opus 审,审出 10 个问题 5 个严重问题
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1511 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 79ms · UTC 16:48 · PVG 00:48 · LAX 09:48 · JFK 12:48
    ♥ Do have faith in what you're doing.