V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
lishoujun
V2EX  ›  程序员

哪些问答机器人的数据比较新?

  •  
  •   lishoujun · 2023-08-23 10:57:57 +08:00 · 1139 次点击
    这是一个创建于 485 天前的主题,其中的信息可能已经有所发展或是发生改变。

    想了解一些 k8s 领域的新知识,找了几个看普遍都是 21 年的。

    是有什么伦理技术规范,要求必须要 n 年之前么?

    5 条回复    2023-08-23 15:14:13 +08:00
    lincanbin
        1
    lincanbin  
       2023-08-23 11:03:38 +08:00   ❤️ 1
    字节跳动的豆包,训练的语料素材截止到 23 年 5 月。

    用旧数据只是因为便宜,重新标注数据和重新训练的成本非常非常高,一批旧数据会物尽其用到没办法再用。
    AoEiuV020JP
        2
    AoEiuV020JP  
       2023-08-23 11:18:14 +08:00
    21 年我记得 chatgpt 那个 gpt3 就是 21 年的数据,其他 21 年估计底层调的都是 gpt?
    Arthur2e5
        3
    Arthur2e5  
       2023-08-23 12:00:17 +08:00
    这年头不流行旧机器人调新搜索引擎吗? 21 年 LLM 问世,之后网上数据就已经被污染了。更早之前的“小编体”至少还容易过滤。
    lishoujun
        4
    lishoujun  
    OP
       2023-08-23 14:19:48 +08:00
    @lincanbin 豆包似乎只有 app ,pc 端学习不是很方便,我装下体验看看。谢谢啦
    WashFreshFresh
        5
    WashFreshFresh  
       2023-08-23 15:14:13 +08:00   ❤️ 1
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2092 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 00:46 · PVG 08:46 · LAX 16:46 · JFK 19:46
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.