1
lhbc 2022-12-10 14:12:15 +08:00 via Android 2
你想多了,又不是随便找的训练语料
你看 ChatGPT 的中文有用 zf ,M 帝,D 品,自 S ,S 亡这种词汇吗? 别把自己给毒死了 |
2
registerrr 2022-12-10 14:23:21 +08:00
图啥呢😅
自己训练不出来,给别人搞搞破坏?美帝亡我之心不死啊 |
3
sblid 2022-12-10 14:23:55 +08:00 1
别说 AI ,人类也是可以被投毒把智商搞没的。
|
4
Unik 2022-12-10 14:23:58 +08:00
你能跟训练出跟他流畅对话还能顺便投毒的 AI 为啥还去干投毒
|
5
FishGrazier 2022-12-10 14:29:08 +08:00 1
它能投毒,毒是哪来的?还不是人类自己的?建议看看 4 chan ,号称全网最大下水道,没把 AI 拉到那里去训练算好的了
|
6
runze 2022-12-10 14:32:28 +08:00
可以,你忘了微软的 Tay 了?
https://en.wikipedia.org/wiki/Tay_(bot) |
7
charlie21 2022-12-10 16:05:16 +08:00 1
全网最大下水道可以的
|
8
emberzhang 2022-12-10 21:03:23 +08:00 via iPhone
这玩意是训练完了拿来回答你问题的,根本没说你跟它的对话会被它拿去训练用吧,我记得它连隐私警告什么都没让我确认过。
|
9
systemcall 2022-12-10 22:06:16 +08:00
感觉应该不行吧。用来训练的语料肯定是经过筛选的,很多都是非常官方的
|
10
meeop 2022-12-10 22:12:21 +08:00 1
不能,最多是制造困难:
1 数据不是直接拿来用,需要人工标注 投毒的数据也是有意义的,可以用来做反例(ai 你看好了,这种数据属于投毒数据) 2 有风控和数据分析部门的存在 他们的工作就是找出内容中有害的,垃圾的,清除掉 |
11
meeop 2022-12-10 22:14:20 +08:00
机器学习有点像炼金术,从垃圾堆提取有价值的东西,垃圾多一点本身不是问题,只是影响成本
|
12
swulling 2022-12-10 22:55:05 +08:00 via iPhone
chatgpt 貌似没有学习功能。他们还没有做
据说下一步就是结合 webgpt ,实现不间断的从互联网上学习。 |