V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
SilentDepth
V2EX  ›  AlphaGo

好奇 AlphaGo 用完了所有时间会有什么反应?

  •  
  •   SilentDepth · 2016-03-12 15:33:14 +08:00 · 1461 次点击
    这是一个创建于 3181 天前的主题,其中的信息可能已经有所发展或是发生改变。
    AlphaGo 对比赛时间有概念吗?会不会 AlphaGo 本身对时间无概念,赛方计算到时后直接忽略 AlphaGo 的后续动作?
    如果要给 AlphaGo 添加时间相关规则,会不会让它在时间有限的情况下采取快速落子的策略,这算不算是一种 AI 「紧张」的表现?
    8 条回复    2016-03-12 21:33:00 +08:00
    kn007
        1
    kn007  
       2016-03-12 15:42:31 +08:00
    ...你没看第 2 场么?

    alphago 消耗完 2 小时,有 3 次 60 秒读秒,他基本每 30 秒左右必下一步。
    SilentDepth
        2
    SilentDepth  
    OP
       2016-03-12 15:45:36 +08:00
    @kn007 确实没看第二场。那这种时间有限的应对策略,是 AlphaGo 自己学习到的呢,还是科学家人为添加的规则?
    Tink
        3
    Tink  
       2016-03-12 15:49:07 +08:00
    有读秒的啊,怎么可能用完呢?进入读秒阶段机器人也是在 60s 内落子啊
    zhujinliang
        4
    zhujinliang  
       2016-03-12 16:51:39 +08:00
    可能算法里带有时间预期判断,将耗时、剩余时间等也作为参数带入决策部分
    实际表现看,像是人为地对参数进行调优,像 PBKDF2 似的,调整递归次数,将计算耗时控制在一定范围内
    再者,进入读秒已经是中后盘了,计算量已经下来了

    之前欧洲的比赛有提到,樊麾和 AlphaGo 除了常规比赛外,还下了 5 盘快棋,樊麾胜 2 盘
    chlx
        5
    chlx  
       2016-03-12 17:05:11 +08:00
    没有什么时间概念。寻找落子位置就是个优化的过程,时间少的话求解的结果就没那么好
    chlx
        6
    chlx  
       2016-03-12 17:06:35 +08:00
    也可以理解为时间是一个超参数,人为设置的。比如给 30s 让机器去优化, 30s 到了给出个当前最优解
    wuhanchu
        7
    wuhanchu  
       2016-03-12 17:07:28 +08:00
    可能他有个清单吧,如果时间到没有更好的方案出来,就选择已有最好的方案。
    chiangdm
        8
    chiangdm  
       2016-03-12 21:33:00 +08:00
    我更好奇让两台 alphago 互搏是什么结果
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5056 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 03:56 · PVG 11:56 · LAX 19:56 · JFK 22:56
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.