我给 Claude 贴了一段我写的有 Bug 的 Unity 代码,他乱改了一遍,然后我觉得是调用顺序的问题,不太熟悉 Unity 的生命周期,问它哪个事件先触发,他按照我有 Bug 的代码一本正经地胡编了一个错的顺序,别的我不知道,它把 Start 放在 Awake 前面我还是看出它在胡说了,重问还是一样。
发给 Grok ,Grok 知道要上网搜索,一下就找出了 Bug 还给出了文档地址
1
dobelee 6 天前 via iPhone
grok 总体可以的,t1 梯队,但该有的问题也不少,也是几大里交互最粗糙的。黑五刚订阅了 x 没过两天就惨遭背刺,12 月的 app 也鸽了。
|
2
GeekGao 6 天前
没感觉,还是觉得 Claude Sonnet 3.5 更胜一筹
|
3
iorilu 6 天前
模型 100 多 G 阿, 怎么跑的
|
4
yuhaofe 5 天前
Grok 某些方面确实强一些,问了一个现实中的数学问题,只有 grok 在我纠正一次之后答对,gpt4o 、sonnet3.5 、gemini1.5pro 连续引导多次给的答案还是错的
问题如下,大家也可以试试: tangle 是一种玩具,由多个弧形的塑料节段连接而成,首尾相连,每个节段可以 360 度旋转,每段是一个 1/4 圆环形状,两端有连接结构,可以和相邻段扣合,横截面是圆形。 假设它有 18 个节段,任选一个段,它与左右相邻的分别 3 个段在任意空间角度都不会在非连接面上发生相撞,与剩下的 11 个段都有可能相撞发出声音,如果我想通过包裹塑料套让它静音,我至少要包裹多少段? 正确答案是 12 ,每包裹两段空出一段 P.S. 其实第二段话的前提也不该给,只留下最后的问题,但得把 tangle 的空间特性完全描述清楚,不太现实,AI 也答不上来 |
8
tt83 5 天前
跟 twitter 绑一起很烦,分散注意力
|
9
sonu648 5 天前 via iPhone
|
10
q1102389095 5 天前 1
试了下 o1 ,第一次 18 ,我质疑后回答 12 ,再次质疑后回答仍旧 12 ,询问是否确定依然回答 12 ,当我说这是不对的时最后回答了 9 ,图片地址 http://img.oneself.icu/uploads/676f852e02589_image.png ,再次否定 9 然后又给出了 12 的答案
|
11
yuhaofe 5 天前
@q1102389095 感觉就是因为这个问题是个首尾相连的环形,需要一定的迭代思考,AI 很难一次性答对,有了一次错误的思考结果之后,才更容易推理出正确的答案。
|
12
ffgrinder 4 天前 via iPhone 1
@yuhaofe 说句实话,你这个描述和问题都挺抽象的,我看了半天,又去搜索了这个玩具的实物,才理解了你的 360 度是基于哪个轴,而且作为一个硬物体,我不理解你说的静音又是什么,我更倾向于你的问题出的有问题
|
13
yuhaofe 4 天前
@ffgrinder 理解问题也是 AI 能力的一环,AI 的训练数据里关于 tangle 的信息也不少,而且我第二段给出的信息其实也足够了,就算不是 tangle 也应该能算出来
最理想的情况下我问出“我想通过包裹塑料套让 tangle 玩具静音,我至少要包裹多少段?”这个一句话,AI 就应该能答上来 |
14
yuhaofe 4 天前
@ffgrinder 我的问题其实来自于很实际的场景,tangle 可以在 18 个段的连接下任意扭曲,扭曲过程中硬塑料段就可能碰到一起发出声音(忽略轻微关节旋转噪音的情况下),在图书馆、办公室场景下就不合适拿出来把玩
tangle 官方有推出包裹硅胶的静音版,段相撞时几乎没有声音,但在国内没有直接卖的,我就想到了这个问题,不过确实是有实物拿在手里才好验证 AI 的答案,很难凭空想象 |
15
yuhaofe 3 天前
@GeekGao
@sonu648 @q1102389095 @ffgrinder 完了,12 好像也不是正确答案,至少这个方案不对😰😰 目前唯一能确定的是连续包裹 14 段是可行的,剩下的 4 段互相不会相撞,与包裹了的 14 段相撞时也不会发出声音 |
17
yuhaofe 3 天前
@ffgrinder 我抽象成下面这个问题还是没有 AI 能直接完全答对,而且看它们对问题本身的理解都是没问题的 😂
一个环形由 18 个段构成,每个段都和其前 3 段、后 3 段不存在吸引关系,与剩下的 11 个段存在互相吸引关系,通过标记一个段可以使其丧失与其他所有段的互相吸引关系,至少需要标记多少段才可以让所有段之间都不存在吸引关系? |
18
sonu648 3 天前 via iPhone 1
@yuhaofe 笑死,结果还是最开始问的 o1 可能对了
![o1]( https://telegraph-image-92x.pages.dev/file/147f62e6dfef1dd91c543-21b6ada65378dfaf76.png) |
19
q1102389095 2 天前
《实践是检验真理的唯一标准》
|