最近站点做起来了,有人已经开始找我买用户数据了,这个很容易闹成法律纠纷,我这边果断还是拒绝了
之前的帖子里面讲了,模型蒸馏产业链、以及用中转站的注意事项 https://cn.v2ex.com/t/1196011
大家还是使用中转的时候 还是要多多留意,关键 key 跟私钥 一定要放置到 agent 不能读取的目录里面,防止被坏人利用
1
wyntalgeer 20 小时 28 分钟前
真有人用中转写代码?
|
2
kfpenn 20 小时 25 分钟前
@wyntalgeer 额,那用中转做什么?大部分中转好像只能 cc 用
|
3
106npo 20 小时 24 分钟前 via Android
用中转站就做好会用来被蒸馏的打算呗
|
4
freak118 20 小时 24 分钟前
这玩意儿是不是搞个用户协议就完全免责了
|
5
daimaosix 20 小时 20 分钟前
用开源程序自建的中转自用应该 OK 的吧
|
6
harlen 20 小时 20 分钟前
我还以为你会告诉我们,你们服务,这种数据服务器马上就删了,根本没得卖
|
7
JoeDH 20 小时 8 分钟前
我就说现在怎么那么多免费公益中转站,额度全跟不要钱式的往外送,特别是隔壁冒出来一大堆
|
8
gdkttt 19 小时 49 分钟前
还是不能贪便宜用中转站,还是老实去买官方的
|
9
xFrye 19 小时 46 分钟前
都用中转了,默认数据就是被人拿来用的,以及中转服务随时跑路
|
10
LunaSeki 19 小时 44 分钟前
用中转都默认会被偷数据吧
一些 coding plan 也会默认授权用于训练 |
11
augustcc 19 小时 35 分钟前
emm 无所谓的项目用中转。其他我都是用 team
|
12
evamayy 19 小时 35 分钟前
中转一般数据都会上传的吧
|
13
lujiaosama 19 小时 13 分钟前
中转就不说了. TRAE, CURSOR,CODEBUDDY 这种 AI IDE 会不会有被拿去训练的风险呢?
|
14
Lockroach 19 小时 10 分钟前
总结一下上面内容就是:用中转就做好数据被出售的预期。
|
15
akakcolin 19 小时 8 分钟前
你只要用大模型了,数据就给大模型了,直连是这样的,用中转也是一样的,默认数据就是被人拿来用
|
16
VeteranCat 19 小时 7 分钟前
现阶段,这些免费供你使用的模型哪个不是打算偷你的数据呢?
这些中转站更是卖起来毫无心理负担。 |
17
Shielber 19 小时 5 分钟前
我说我的 tg 号怎么用着好好的被封了
|
18
p2007 18 小时 56 分钟前
中转站基本没有任何信誉,不跑路就已经很难得了
|
19
everettjf 18 小时 49 分钟前
开源项目写一些倒是无所谓。。。
|
20
tommyshelbyV2 18 小时 41 分钟前
用吧用吧,反正也不值钱,价格便宜就好。官方一样是要被拿去蒸馏,卖谁不是卖
|
22
calmbinweijin 18 小时 34 分钟前
我可没有,我纯白,目前已亏 500R
|
23
jiirouwei 18 小时 23 分钟前
用了别人的东西就得做好用户数据被拿来做其他事的可能,退一步来说,都是公司的代码,就算是泄露了,与我个人也没什么关系😄
|
24
cat 18 小时 22 分钟前
openrouter 和 vercel ai gateway 呢?
|
25
freak118 18 小时 21 分钟前
@calmbinweijin 这还能亏吗 中转的成本是啥
|
27
a1exlism 18 小时 19 分钟前
用中转就怕这个,所以能自建一定是自建优先的
|
28
yuexiahaowu 18 小时 13 分钟前
官司的破代码,心里有数,无所谓的
|
29
PC9528 18 小时 12 分钟前
我用第三方中转已经默认会被拿去训练了...
|
30
crime1024 18 小时 11 分钟前
没事 用来养虾额
|
31
lovelive1024 18 小时 9 分钟前
中转都是默认没隐私
|
32
calmbinweijin 18 小时 6 分钟前
@freak118 服务器、域名、搞纯 cc 还得自己搞账号、自己进行二次开发也得消耗 token 、运营送的 token 。对于一个刚起步的中转站真的挺难的
|
33
poorcai 17 小时 49 分钟前
话说 team 账号现在怎么开通啊?官网没看到
|
34
kfpenn 17 小时 20 分钟前
@lujiaosama 有啊,cursor 的 share data 还不允许取消
|
35
ano 17 小时 17 分钟前
@lujiaosama 想什么呢,包被拿去训练的,900%。
区别就是你的数据最终经过了几个人手中,二道贩子,三道贩子,最终还是递给了源头手上。 |
36
timeance 17 小时 14 分钟前
幸好我用中转都是翻译黄油
|
37
sommio 17 小时 9 分钟前
像 OpenAI 除了 API 和企业版 Codex ,就没明确“不用于训练”的承诺,
能降低 API 价格和同时增强国产模型的结果也算还可以了( |
38
penisulaS 16 小时 56 分钟前 我的代码怀疑都是污染大模型的
|
39
nbndco 16 小时 55 分钟前
中转就是默认蒸馏啊,只要不在乎就挺好的
|
40
dko 16 小时 42 分钟前
拿去训练是好事儿,如果是专门窃取数据的那就麻烦了。
|
41
dockerhub 16 小时 39 分钟前
擦,我怎么没人找我。我的服务器两天的日志都存不下 😆
|
43
Meteora626 16 小时 24 分钟前
@lujiaosama 会随机抽,但是大厂训练会脱敏的,大厂的数据处理还是很完善的,
|
44
catazshadow 15 小时 50 分钟前 via Android
岂止训练,起手就是 grep 'pwd|pubkey|cred' 🤣
|
45
isnullstring 14 小时 54 分钟前
用谁都一样,中转卖、官方的自己用
|
46
rfv2 14 小时 20 分钟前 via Android
官方为什么不加类似 https 的内容加密,在推理前解密,很好的卖点。虽然基本上都不允许大家中转
|
47
unusualcat 14 小时 9 分钟前
1USDT 50 条会话?这玩意这么值钱啊!
|
48
v2exgo OP @unusualcat 要那种单次对话的
|
49
aarontian 11 小时 22 分钟前
能用中转的都不会是啥好的训练数据吧。。。真正有价值的训练数据都直接通过正规渠道给 claude 了
|
50
goodboy95 10 小时 56 分钟前 via Android
我连用官方的都默认数据全交出去了
|
51
ideard 10 小时 52 分钟前
还好我是自建,免费的东西代价太大了
|
52
JoshTheLegend 10 小时 2 分钟前
别说中转了,用官方的不都是默认全交的吗...
|
53
unixcs 8 小时 26 分钟前 via Android
比起我的数据,我更想省点 token 的钱
|
54
unusualcat 3 小时 11 分钟前
没事别用中转。用户在多轮对话中(比如发代码报错日志、写工作总结、甚至倾诉心理问题)极容易泄露公司机密、个人隐私或真实身份。一旦这些数据被原封不动地喂给新的大模型,新模型在未来回答别人问题时,极有可能把你的隐私直接背诵出来
|
55
v2exgo OP @unusualcat #54 这个我倒不担心,如果模型能力差到这种地步,连数据清洗都不做,这个 LLM 公司离倒闭也差不多了,我担心的是 利用私钥、机密信息犯罪,卖数据如果涉及到这些就直接进去了
|
56
LowBi 1 小时 25 分钟前
官方交,用 cursor 、trae 这些也交,中转也交,焦虑啥啊这是,除非你搭建本地的模型,而且是超越了这些大厂的模型,不然你就啥线上模型都不要用了,从你使用的那一刻,你的对话肯定会到对方服务器上的。
|
57
MoozLee 1 小时 4 分钟前
我的破代码被拿去蒸馏了,我有什么损失吗?
|
58
dabingbing 38 分钟前
在乎这个?
|