V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
faceair
V2EX  ›  分享创造

r1mix: R1 思维链让普通 AI 更聪明

  •  6
     
  •   faceair ·
    faceair · 12 天前 · 4845 次点击

    经常体验不同大模型的朋友都知道,deepseek r1 的思维链质量非常高,脑子非常聪明并且情商高,但在实际使用的时候:

    1. 指令遵循的能力较差,不能完全按照要求输出
    2. 写作辞藻非常华丽和刻意,写出的文字总能一眼 R1,阅读体验和沉浸感感都比较差

    其他的普通模型,在指令遵循和写作文风上都有更优异的表现,但是脑子又弱一点。

    根据 aider 做的模型评测 deepseek-r1 的思维链 + claude 3.5 模型的执行力 就可以达到 SOTA 级别的效果,而价格比 claude-3-7-sonnet-20250219:thinking 便宜更多。

    我们最近实测 deepseek-r1+deepseek/deepseek-chat-v3-0324 的混合模型在写代码上也有非常优异的表现。

    最近我们做了一个 r1mix 的模型混合的网站,可以让你用 deepseek-r1 去加持任意的模型,不管是在写代码、写作其他各自通用任务上都有绝佳的表现。

    常见的推荐组合是:

    1. r1v3:新版 DeepSeek-V3 显著增强了代码能力和文学创作能力,在加持 DeepSeek-R1 后可以在最优的价格下实现 SOTA 级性能。
    2. r1claude:Claude 系列模型的代码能力是当前的 No. 1 ,在加持 DeepSeek-R1 后可以以更优的价格达到 Claude 3.7 Sonnet Thinking 的效果。
    3. r1grok:Grok-3 的文学创作能力是 Top 级别的,在加持 DeepSeek-R1 后故事的剧情会更加合理,表达也更富有层次感。
    4. r1gemini:Gemini 2.0 系列知识面非常广泛、能力也很全面,在加持 DeepSeek-R1 后可以轻松应对各种复杂需求。

    常见的模型都有,可以根据需求自己任意组合。也可以绑定你的 openrouter 账号,使用 openrouter 上的免费模型的时候我们不收费。

    https://r1mix.ai

    19 条回复    2025-04-02 16:01:29 +08:00
    maximdx
        1
    maximdx  
       12 天前
    有意思,这种多个模型搭配使用的原理是什么?
    faceair
        2
    faceair  
    OP
       12 天前   ❤️ 2
    @maximdx #1 先调用思考模型,获取到思维链以后停止请求,把思维链拼到原始请求里请求第二个模型
    DigitaIOcean
        3
    DigitaIOcean  
       12 天前
    有趣,关注
    xyfan
        4
    xyfan  
       12 天前
    LLM 的客户端 chatwise 好像也增加了类似的功能,调用一个模型的 thinking ,并应用于另一个模型
    listenfree
        5
    listenfree  
       12 天前
    按你这样说,qwq32B+qwen2.5code 也是 SOTA 级别哟,就是不知道如何流程化试用
    faceair
        6
    faceair  
    OP
       12 天前
    @listenfree #5 我们暂时没有 qwen2.5 code 模型的供应,你可以绑定你的 openrouter 账号,然后两个模型名用加号连接就可以调用了
    iyaozhen
        7
    iyaozhen  
       12 天前
    我充值试了下,感觉还行。不过也没解决 R1 本身的幻觉问题,就是 R1 强是强,但是不太稳定
    ovtfkw
        8
    ovtfkw  
       12 天前 via iPhone
    @faceair #2 就这?岂不是很简单
    pakro888
        9
    pakro888  
       12 天前
    市场上早已经有人开发出来了:
    1. https://github.com/ErlichLiu/DeepClaude(支持模型自由组合)
    2. https://github.com/getasterisk/deepclaude (上方项目的灵感来源)
    rqYzyAced2NbD8fw
        10
    rqYzyAced2NbD8fw  
       12 天前
    @xyfan #4 chatwise 能火纯粹是 openwebui 的作者太傻逼。Deepseek 都出来多久了还以 ‘OAI 没有 API 实现’ 为理由拒绝显示思考过程的 PR 。核心功能不做,莫名其妙的垃圾功能做一堆,还自我感觉良好。要不是因为我也是个傻逼我真想 Fork 一个自己开发
    SkywalkerJi
        11
    SkywalkerJi  
       12 天前 via Android
    主楼说的模型特点是中文写作吗,还是说外文也一样。
    Lee90
        12
    Lee90  
       12 天前
    邮箱登录好评
    paopjian
        13
    paopjian  
       12 天前
    赛博换脑, r1 的思维脑接上 claude 的嘴
    Seayon
        14
    Seayon  
       12 天前
    Cline 在写代码的时候也是先 PLAN 后 ACT ,我现在都用 deepseek-r1 去 思考计划,然后切换到 claude 再去 ACT
    anjingdexiaocai
        15
    anjingdexiaocai  
       11 天前 via Android
    这就是 deepClaude 吧,很早就有了
    hugowangnz
        16
    hugowangnz  
       11 天前
    @LanhuaMa 太对了,这么流行的功能不做,目前只能自己写函数支持思维链显示了
    LinSP
        17
    LinSP  
       11 天前
    这不是变形版蒸馏
    flcwk
        18
    flcwk  
       10 天前
    @faceair 对的,相当于用思考模型做规划,然后让实践能力强的模型进行操作,之前的 deepclaude 和 deepgemini 都是这个思路,进一步的可以引入多个思考模型进行专家会审,效果更佳
    faceair
        19
    faceair  
    OP
       10 天前
    @flcwk #18 多思考模型的话算是 agent 的思路了,做 API 的话延迟太大了 token 数跟效果也成正比的话,用户不买账
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2582 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 20ms · UTC 04:08 · PVG 12:08 · LAX 21:08 · JFK 00:08
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.