V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Davy
V2EX  ›  Google

Bard (Gemini Pro)排名已升至第 2

  •  
  •   Davy · 2024-01-27 06:29:04 +08:00 · 8889 次点击
    这是一个创建于 368 天前的主题,其中的信息可能已经有所发展或是发生改变。
    Bard (Gemini Pro)的 elo 排名已升至第 2 ,仅次于 GTP-4-Turbo ,高于 GTP-4-0314 和 GTP-4-0613 。
    https://huggingface.co/spaces/lmsys/chatbot-arena-leaderboard
    43 条回复    2024-01-29 13:58:13 +08:00
    disorientatefree
        1
    disorientatefree  
       2024-01-27 06:41:46 +08:00
    Bard 用起来是不错,不过感觉 Google 应该挺省的

    日常感觉大多数问题都没进 LLM ,一瞬间就出结果了。。。 偶尔小众问题他可能没见过会慢一点才像是 LLM
    dnfQzjPBXtWmML
        2
    dnfQzjPBXtWmML  
       2024-01-27 07:03:35 +08:00
    @disorientatefree 可能只是用的人少,所以每个人分到的算力多😂
    Canglin
        3
    Canglin  
       2024-01-27 07:24:13 +08:00 via Android
    为啥我问点问题它都是会显示各种 csdn 链接或者图片
    takato
        4
    takato  
       2024-01-27 07:53:39 +08:00
    之前用 Bard 的时候感觉 Bard 的错误率明显高于 ChatGPT 3.5 。
    注意我的感受有一定主观性。
    ViolaH
        5
    ViolaH  
       2024-01-27 08:14:39 +08:00 via iPhone
    GPT 不是 GTP
    disorientatefree
        6
    disorientatefree  
       2024-01-27 08:24:01 +08:00
    @dnfQzjPBXtWmML 是行为很像 cache ,问题打进去一瞬间就一大段
    cyio
        7
    cyio  
       2024-01-27 08:35:20 +08:00
    懂的可以解读下这个评测依据,这个 bard votes 数据低,是不是数据相对不足
    icy37785
        8
    icy37785  
       2024-01-27 09:02:07 +08:00 via iPhone   ❤️ 1
    只能说每个人的使用场景不同,这种排名不能代表实际体验。在我的使用场景下体验 gemini pro 甚至感觉不如 gpt3.5 。真的个体差异还挺大的。
    coffeesun
        9
    coffeesun  
       2024-01-27 10:10:07 +08:00 via Android
    bard 我给常把它问死,chatgpt 较少
    Sosocould
        10
    Sosocould  
       2024-01-27 10:14:36 +08:00 via Android
    gemini pro 非常菜,比如 gpt3.5 ,可能英文下稍好一定
    miyuki
        11
    miyuki  
       2024-01-27 10:55:31 +08:00
    bard 经常问死+1 ,不如 chatgpt 3.5
    miyuki
        12
    miyuki  
       2024-01-27 10:55:59 +08:00
    @miyuki 补充,相同的问题 chatgpt 3.5 能多少给出一些结果,bard 是完全拒绝回答
    s4d
        13
    s4d  
       2024-01-27 11:23:15 +08:00
    bard 没有 iOS app 吗?
    ronman
        14
    ronman  
       2024-01-27 11:27:46 +08:00 via iPhone
    但实际体验感觉很垃圾
    hcx0
        15
    hcx0  
       2024-01-27 11:34:06 +08:00
    bard 只有企业版才是 Gemini Pro 啊,楼上这些点评的都是用企业版?
    hcx0
        16
    hcx0  
       2024-01-27 11:34:31 +08:00
    甚至企业版都是少数企业试用
    Davy
        17
    Davy  
    OP
       2024-01-27 11:34:59 +08:00
    @cyio Bard 是去年 12 月 6 日切换到 Gemini Pro 的,所以只有一个多月的数据。
    Davy
        18
    Davy  
    OP
       2024-01-27 11:36:03 +08:00
    @hcx0 现在 Bard 都是 Gemini Pro 了
    Davy
        19
    Davy  
    OP
       2024-01-27 11:37:31 +08:00
    @coffeesun 问死的时候可以叫他 take a deep breath, you can do that.
    houhaibushihai
        20
    houhaibushihai  
       2024-01-27 11:45:50 +08:00
    就日常编程问题而言(就之前问 stackoverflow 的问题,后来改用 3.5 了,再后来试了 bard ,bard 给的结果还不如 3.5 ,当然我是用中文搜的,英文不知道),我的实际体验 bard 不如 3.5
    hanqian
        21
    hanqian  
       2024-01-27 12:37:53 +08:00 via iPhone
    个人使用(英文对话提问)下来最多可以说略胜 gpt3.5 ,但肯定远逊于 gpt4
    coffeesun
        22
    coffeesun  
       2024-01-27 13:02:47 +08:00
    @Davy #19 反正关于质疑宗教的问题他都不咋回答
    Dragonphy
        23
    Dragonphy  
       2024-01-27 13:04:36 +08:00
    @takato 一样,不太行
    NoOneNoBody
        24
    NoOneNoBody  
       2024-01-27 14:27:50 +08:00
    web 版,bard 不等于 Gemini Pro
    试试用中文和英文问一下它是什么模型,我这里中文回答是 bard ,英文回答是 Gemini Pro
    android app 版我没装
    mingtdlb
        25
    mingtdlb  
       2024-01-27 15:40:40 +08:00
    感觉不如 gpt3.5 ,另外 3.5 和 4 我也用不出差别,都大差不差。3.5 不行的,4 也差不多。
    youmilk
        26
    youmilk  
       2024-01-27 18:20:27 +08:00

    一派胡言
    alading11
        27
    alading11  
       2024-01-27 18:24:10 +08:00
    bard 使用起来明显不如 gpt3.5 ,差的很多
    ronman
        28
    ronman  
       2024-01-27 18:36:35 +08:00 via Android
    @youmilk 笑死 我刚去问他 直接回答:周树人没有打鲁迅。
    hotbaidu
        29
    hotbaidu  
       2024-01-27 18:59:56 +08:00 via Android
    https://poe.com/Gemini-Pro
    在 poe 体验,算在其他额度
    aptupdate
        30
    aptupdate  
       2024-01-27 21:27:12 +08:00 via iPhone
    用 Gemeni Pro 感受就是速度是真的快。
    GeekGao
        31
    GeekGao  
       2024-01-27 21:59:23 +08:00
    我用 Gemeni Pro 和 Bard 上直接问这个问题,回答的不一样,发现 Gemeni Pro 是准确的。
    @youmilk
    disorientatefree
        32
    disorientatefree  
       2024-01-28 04:00:21 +08:00
    @mingtdlb 是 4 越来越差了,才出的时候很惊艳。 Bard 也是越来越无视上下文

    个人体感是它们都在试图省钱
    justincnn
        33
    justincnn  
       2024-01-28 08:15:47 +08:00
    @Davy 这个确认么?感觉 bard 还是蛮蠢的
    forgetandnew
        34
    forgetandnew  
       2024-01-28 09:37:49 +08:00 via iPhone
    中文版 bard 就是一坨大便
    privateproxies
        35
    privateproxies  
       2024-01-28 10:59:08 +08:00
    你们可以通过 chatgemini.net 感受一下...
    pendulum
        36
    pendulum  
       2024-01-28 11:37:13 +08:00
    用中文提问 bard 应该不是 gemini pro ,除非用 API
    abersheeran
        37
    abersheeran  
       2024-01-28 12:25:58 +08:00
    Gemini Pro 确实可以的,我为了方便用它,写了三个 BOT ,分别可以在 QQ 群、微信公众号和 Telegram 上用。开哪个方便就直接开了。
    cnbatch
        38
    cnbatch  
       2024-01-28 22:28:09 +08:00
    Bard 同样也是一本正经地胡说八道,最终还不如自己搜索
    sud0day
        39
    sud0day  
       2024-01-29 10:18:53 +08:00
    程序方面的问题,感觉还是 Claude 好用
    KorenKrita
        40
    KorenKrita  
       2024-01-29 11:09:12 +08:00
    @privateproxies 非常难绷
    privateproxies
        41
    privateproxies  
       2024-01-29 11:21:19 +08:00
    @KorenKrita 这 GEMINI PRO API....
    KorenKrita
        42
    KorenKrita  
       2024-01-29 11:41:02 +08:00
    @privateproxies #41 所以说一本正经胡说八道啊 之前还有说自己是文心一言百度的来着我记得 就离谱
    kestrelBright
        43
    kestrelBright  
       2024-01-29 13:58:13 +08:00
    不行啊,蓝牙耳机的问题都不会回答
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   736 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 22:51 · PVG 06:51 · LAX 14:51 · JFK 17:51
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.