Bard (Gemini Pro)排名已升至第 2

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

› Google Play

› Google Fi

› Google Developers Channel

› Google 全球透明度报告

› 9to5Google

这是一个创建于 633 天前的主题，其中的信息可能已经有所发展或是发生改变。

Bard (Gemini Pro)的 elo 排名已升至第 2 ，仅次于 GTP-4-Turbo ，高于 GTP-4-0314 和 GTP-4-0613 。
https://huggingface.co/spaces/lmsys/chatbot-arena-leaderboard

43 条回复 • 2024-01-29 13:58:13 +08:00

disorientatefree

2024-01-27 06:41:46 +08:00

Bard 用起来是不错，不过感觉 Google 应该挺省的

日常感觉大多数问题都没进 LLM ，一瞬间就出结果了。。。偶尔小众问题他可能没见过会慢一点才像是 LLM

dnfQzjPBXtWmML

2024-01-27 07:03:35 +08:00

@disorientatefree 可能只是用的人少，所以每个人分到的算力多😂

Canglin

2024-01-27 07:24:13 +08:00 via Android

为啥我问点问题它都是会显示各种 csdn 链接或者图片

takato

2024-01-27 07:53:39 +08:00

之前用 Bard 的时候感觉 Bard 的错误率明显高于 ChatGPT 3.5 。
注意我的感受有一定主观性。

x52S60GIsMZHtJPN

2024-01-27 08:14:39 +08:00 via iPhone

GPT 不是 GTP

disorientatefree

2024-01-27 08:24:01 +08:00

@dnfQzjPBXtWmML 是行为很像 cache ，问题打进去一瞬间就一大段

cyio

2024-01-27 08:35:20 +08:00

懂的可以解读下这个评测依据，这个 bard votes 数据低，是不是数据相对不足

icy37785

2024-01-27 09:02:07 +08:00 via iPhone

只能说每个人的使用场景不同，这种排名不能代表实际体验。在我的使用场景下体验 gemini pro 甚至感觉不如 gpt3.5 。真的个体差异还挺大的。

coffeesun

2024-01-27 10:10:07 +08:00 via Android

bard 我给常把它问死，chatgpt 较少

Sosocould

2024-01-27 10:14:36 +08:00 via Android

gemini pro 非常菜，比如 gpt3.5 ，可能英文下稍好一定

miyuki

2024-01-27 10:55:31 +08:00

bard 经常问死+1 ，不如 chatgpt 3.5

miyuki

2024-01-27 10:55:59 +08:00

@miyuki 补充，相同的问题 chatgpt 3.5 能多少给出一些结果，bard 是完全拒绝回答

s4d

2024-01-27 11:23:15 +08:00

bard 没有 iOS app 吗？

ronman

2024-01-27 11:27:46 +08:00 via iPhone

但实际体验感觉很垃圾

Aethyr

2024-01-27 11:34:06 +08:00

bard 只有企业版才是 Gemini Pro 啊，楼上这些点评的都是用企业版？

Aethyr

2024-01-27 11:34:31 +08:00

甚至企业版都是少数企业试用

Davy

2024-01-27 11:34:59 +08:00

@cyio Bard 是去年 12 月 6 日切换到 Gemini Pro 的，所以只有一个多月的数据。

Davy

2024-01-27 11:36:03 +08:00

@hcx0 现在 Bard 都是 Gemini Pro 了

Davy

2024-01-27 11:37:31 +08:00

@coffeesun 问死的时候可以叫他 take a deep breath, you can do that.

houhaibushihai

2024-01-27 11:45:50 +08:00

就日常编程问题而言（就之前问 stackoverflow 的问题，后来改用 3.5 了，再后来试了 bard ，bard 给的结果还不如 3.5 ，当然我是用中文搜的，英文不知道），我的实际体验 bard 不如 3.5

XnEnokq9vkvVq4

2024-01-27 12:37:53 +08:00 via iPhone

个人使用（英文对话提问）下来最多可以说略胜 gpt3.5 ，但肯定远逊于 gpt4

coffeesun

2024-01-27 13:02:47 +08:00

@Davy #19 反正关于质疑宗教的问题他都不咋回答

Dragonphy

2024-01-27 13:04:36 +08:00

@takato 一样，不太行

NoOneNoBody

2024-01-27 14:27:50 +08:00

web 版，bard 不等于 Gemini Pro
试试用中文和英文问一下它是什么模型，我这里中文回答是 bard ，英文回答是 Gemini Pro
android app 版我没装

mingtdlb

2024-01-27 15:40:40 +08:00

感觉不如 gpt3.5 ，另外 3.5 和 4 我也用不出差别，都大差不差。3.5 不行的，4 也差不多。

youmilk

2024-01-27 18:20:27 +08:00

一派胡言

alading11

2024-01-27 18:24:10 +08:00

bard 使用起来明显不如 gpt3.5 ，差的很多

ronman

2024-01-27 18:36:35 +08:00 via Android

@youmilk 笑死我刚去问他直接回答：周树人没有打鲁迅。

hotbaidu

2024-01-27 18:59:56 +08:00 via Android

https://poe.com/Gemini-Pro
在 poe 体验，算在其他额度

aptupdate

2024-01-27 21:27:12 +08:00 via iPhone

用 Gemeni Pro 感受就是速度是真的快。

R4rvZ6agNVWr56V0

2024-01-27 21:59:23 +08:00

我用 Gemeni Pro 和 Bard 上直接问这个问题，回答的不一样，发现 Gemeni Pro 是准确的。
@youmilk

disorientatefree

2024-01-28 04:00:21 +08:00

@mingtdlb 是 4 越来越差了，才出的时候很惊艳。 Bard 也是越来越无视上下文

个人体感是它们都在试图省钱

justincnn

2024-01-28 08:15:47 +08:00

@Davy 这个确认么？感觉 bard 还是蛮蠢的

forgetandnew

2024-01-28 09:37:49 +08:00 via iPhone

中文版 bard 就是一坨大便

privateproxies

2024-01-28 10:59:08 +08:00

你们可以通过 chatgemini.net 感受一下...

pendulum

2024-01-28 11:37:13 +08:00

用中文提问 bard 应该不是 gemini pro ，除非用 API

abersheeran

2024-01-28 12:25:58 +08:00

Gemini Pro 确实可以的，我为了方便用它，写了三个 BOT ，分别可以在 QQ 群、微信公众号和 Telegram 上用。开哪个方便就直接开了。

cnbatch

2024-01-28 22:28:09 +08:00

Bard 同样也是一本正经地胡说八道，最终还不如自己搜索

sud0day

2024-01-29 10:18:53 +08:00

程序方面的问题，感觉还是 Claude 好用

KorenKrita

2024-01-29 11:09:12 +08:00

@privateproxies

非常难绷

privateproxies

2024-01-29 11:21:19 +08:00

@KorenKrita 这 GEMINI PRO API....

KorenKrita

2024-01-29 11:41:02 +08:00

@privateproxies #41 所以说一本正经胡说八道啊之前还有说自己是文心一言百度的来着我记得就离谱

kestrelBright

2024-01-29 13:58:13 +08:00

不行啊，蓝牙耳机的问题都不会回答