V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
v2exgo
V2EX  ›  程序员

用中转站的千万要小心,已经有人在 tg 大量购买用户数据用于训练

  •  3
     
  •   v2exgo · 22 小时 10 分钟前 · 7578 次点击

    最近站点做起来了,有人已经开始找我买用户数据了,这个很容易闹成法律纠纷,我这边果断还是拒绝了

    之前的帖子里面讲了,模型蒸馏产业链、以及用中转站的注意事项 https://cn.v2ex.com/t/1196011

    大家还是使用中转的时候 还是要多多留意,关键 key 跟私钥 一定要放置到 agent 不能读取的目录里面,防止被坏人利用

    59 条回复    2026-03-12 10:04:57 +08:00
    wyntalgeer
        1
    wyntalgeer  
       20 小时 28 分钟前
    真有人用中转写代码?
    kfpenn
        2
    kfpenn  
       20 小时 25 分钟前
    @wyntalgeer 额,那用中转做什么?大部分中转好像只能 cc 用
    106npo
        3
    106npo  
       20 小时 24 分钟前 via Android
    用中转站就做好会用来被蒸馏的打算呗
    freak118
        4
    freak118  
       20 小时 24 分钟前
    这玩意儿是不是搞个用户协议就完全免责了
    daimaosix
        5
    daimaosix  
       20 小时 20 分钟前
    用开源程序自建的中转自用应该 OK 的吧
    harlen
        6
    harlen  
       20 小时 20 分钟前
    我还以为你会告诉我们,你们服务,这种数据服务器马上就删了,根本没得卖
    JoeDH
        7
    JoeDH  
       20 小时 8 分钟前
    我就说现在怎么那么多免费公益中转站,额度全跟不要钱式的往外送,特别是隔壁冒出来一大堆
    gdkttt
        8
    gdkttt  
       19 小时 49 分钟前
    还是不能贪便宜用中转站,还是老实去买官方的
    xFrye
        9
    xFrye  
       19 小时 46 分钟前
    都用中转了,默认数据就是被人拿来用的,以及中转服务随时跑路
    LunaSeki
        10
    LunaSeki  
       19 小时 44 分钟前
    用中转都默认会被偷数据吧
    一些 coding plan 也会默认授权用于训练
    augustcc
        11
    augustcc  
       19 小时 35 分钟前
    emm 无所谓的项目用中转。其他我都是用 team
    evamayy
        12
    evamayy  
       19 小时 35 分钟前
    中转一般数据都会上传的吧
    lujiaosama
        13
    lujiaosama  
       19 小时 13 分钟前
    中转就不说了. TRAE, CURSOR,CODEBUDDY 这种 AI IDE 会不会有被拿去训练的风险呢?
    Lockroach
        14
    Lockroach  
       19 小时 10 分钟前
    总结一下上面内容就是:用中转就做好数据被出售的预期。
    akakcolin
        15
    akakcolin  
       19 小时 8 分钟前
    你只要用大模型了,数据就给大模型了,直连是这样的,用中转也是一样的,默认数据就是被人拿来用
    VeteranCat
        16
    VeteranCat  
       19 小时 7 分钟前
    现阶段,这些免费供你使用的模型哪个不是打算偷你的数据呢?

    这些中转站更是卖起来毫无心理负担。
    Shielber
        17
    Shielber  
       19 小时 5 分钟前
    我说我的 tg 号怎么用着好好的被封了
    p2007
        18
    p2007  
       18 小时 56 分钟前
    中转站基本没有任何信誉,不跑路就已经很难得了
    everettjf
        19
    everettjf  
       18 小时 49 分钟前
    开源项目写一些倒是无所谓。。。
    tommyshelbyV2
        20
    tommyshelbyV2  
       18 小时 41 分钟前
    用吧用吧,反正也不值钱,价格便宜就好。官方一样是要被拿去蒸馏,卖谁不是卖
    009694
        21
    009694  
       18 小时 36 分钟前 via iPhone
    @freak118 灰产 随时可以跑路 需要什么用户协议😂
    calmbinweijin
        22
    calmbinweijin  
       18 小时 34 分钟前
    我可没有,我纯白,目前已亏 500R
    jiirouwei
        23
    jiirouwei  
       18 小时 23 分钟前
    用了别人的东西就得做好用户数据被拿来做其他事的可能,退一步来说,都是公司的代码,就算是泄露了,与我个人也没什么关系😄
    cat
        24
    cat  
       18 小时 22 分钟前
    openrouter 和 vercel ai gateway 呢?
    freak118
        25
    freak118  
       18 小时 21 分钟前
    @calmbinweijin 这还能亏吗 中转的成本是啥
    v2exgo
        26
    v2exgo  
    OP
       18 小时 21 分钟前
    @freak118 #25 cdn 服务器 都要钱的
    a1exlism
        27
    a1exlism  
       18 小时 19 分钟前
    用中转就怕这个,所以能自建一定是自建优先的
    yuexiahaowu
        28
    yuexiahaowu  
       18 小时 13 分钟前
    官司的破代码,心里有数,无所谓的
    PC9528
        29
    PC9528  
       18 小时 12 分钟前
    我用第三方中转已经默认会被拿去训练了...
    crime1024
        30
    crime1024  
       18 小时 11 分钟前
    没事 用来养虾额
    lovelive1024
        31
    lovelive1024  
       18 小时 9 分钟前
    中转都是默认没隐私
    calmbinweijin
        32
    calmbinweijin  
       18 小时 6 分钟前
    @freak118 服务器、域名、搞纯 cc 还得自己搞账号、自己进行二次开发也得消耗 token 、运营送的 token 。对于一个刚起步的中转站真的挺难的
    poorcai
        33
    poorcai  
       17 小时 49 分钟前
    话说 team 账号现在怎么开通啊?官网没看到
    kfpenn
        34
    kfpenn  
       17 小时 20 分钟前
    @lujiaosama 有啊,cursor 的 share data 还不允许取消
    ano
        35
    ano  
       17 小时 17 分钟前
    @lujiaosama 想什么呢,包被拿去训练的,900%。
    区别就是你的数据最终经过了几个人手中,二道贩子,三道贩子,最终还是递给了源头手上。
    timeance
        36
    timeance  
       17 小时 14 分钟前
    幸好我用中转都是翻译黄油
    sommio
        37
    sommio  
       17 小时 9 分钟前
    像 OpenAI 除了 API 和企业版 Codex ,就没明确“不用于训练”的承诺,
    能降低 API 价格和同时增强国产模型的结果也算还可以了(
    penisulaS
        38
    penisulaS  
       16 小时 56 分钟前   ❤️ 1
    我的代码怀疑都是污染大模型的
    nbndco
        39
    nbndco  
       16 小时 55 分钟前
    中转就是默认蒸馏啊,只要不在乎就挺好的
    dko
        40
    dko  
       16 小时 42 分钟前
    拿去训练是好事儿,如果是专门窃取数据的那就麻烦了。
    dockerhub
        41
    dockerhub  
       16 小时 39 分钟前
    擦,我怎么没人找我。我的服务器两天的日志都存不下 😆
    v2exgo
        42
    v2exgo  
    OP
       16 小时 31 分钟前
    @dockerhub 尼玛的,卖数据被抓到要直接进去的,倒卖 api 最多非法经营,
    Meteora626
        43
    Meteora626  
       16 小时 24 分钟前
    @lujiaosama 会随机抽,但是大厂训练会脱敏的,大厂的数据处理还是很完善的,
    catazshadow
        44
    catazshadow  
       15 小时 50 分钟前 via Android
    岂止训练,起手就是 grep 'pwd|pubkey|cred' 🤣
    isnullstring
        45
    isnullstring  
       14 小时 54 分钟前
    用谁都一样,中转卖、官方的自己用
    rfv2
        46
    rfv2  
       14 小时 20 分钟前 via Android
    官方为什么不加类似 https 的内容加密,在推理前解密,很好的卖点。虽然基本上都不允许大家中转
    unusualcat
        47
    unusualcat  
       14 小时 9 分钟前
    1USDT 50 条会话?这玩意这么值钱啊!
    v2exgo
        48
    v2exgo  
    OP
       13 小时 42 分钟前
    @unusualcat 要那种单次对话的
    aarontian
        49
    aarontian  
       11 小时 22 分钟前
    能用中转的都不会是啥好的训练数据吧。。。真正有价值的训练数据都直接通过正规渠道给 claude 了
    goodboy95
        50
    goodboy95  
       10 小时 56 分钟前 via Android
    我连用官方的都默认数据全交出去了
    ideard
        51
    ideard  
       10 小时 52 分钟前
    还好我是自建,免费的东西代价太大了
    JoshTheLegend
        52
    JoshTheLegend  
       10 小时 2 分钟前
    别说中转了,用官方的不都是默认全交的吗...
    unixcs
        53
    unixcs  
       8 小时 26 分钟前 via Android
    比起我的数据,我更想省点 token 的钱
    unusualcat
        54
    unusualcat  
       3 小时 11 分钟前
    没事别用中转。用户在多轮对话中(比如发代码报错日志、写工作总结、甚至倾诉心理问题)极容易泄露公司机密、个人隐私或真实身份。一旦这些数据被原封不动地喂给新的大模型,新模型在未来回答别人问题时,极有可能把你的隐私直接背诵出来
    v2exgo
        55
    v2exgo  
    OP
       3 小时 3 分钟前
    @unusualcat #54 这个我倒不担心,如果模型能力差到这种地步,连数据清洗都不做,这个 LLM 公司离倒闭也差不多了,我担心的是 利用私钥、机密信息犯罪,卖数据如果涉及到这些就直接进去了
    LowBi
        56
    LowBi  
       1 小时 25 分钟前
    官方交,用 cursor 、trae 这些也交,中转也交,焦虑啥啊这是,除非你搭建本地的模型,而且是超越了这些大厂的模型,不然你就啥线上模型都不要用了,从你使用的那一刻,你的对话肯定会到对方服务器上的。
    MoozLee
        57
    MoozLee  
       1 小时 4 分钟前
    我的破代码被拿去蒸馏了,我有什么损失吗?
    dabingbing
        58
    dabingbing  
       38 分钟前
    在乎这个?
    viking602
        59
    viking602  
       22 分钟前
    @freak118 #4 中转站本身就不是什么正经营生 爱用就用的那种基本上
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   5992 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 02:27 · PVG 10:27 · LAX 19:27 · JFK 22:27
    ♥ Do have faith in what you're doing.