r1mix: R1 思维链让普通 AI 更聪明 - V2EX

Home Sign Up Sign In

爱意满满的作品展示区。

This topic created in 463 days ago, the information mentioned may be changed or developed.

经常体验不同大模型的朋友都知道，deepseek r1 的思维链质量非常高，脑子非常聪明并且情商高，但在实际使用的时候：

指令遵循的能力较差，不能完全按照要求输出
写作辞藻非常华丽和刻意，写出的文字总能一眼 R1，阅读体验和沉浸感感都比较差

其他的普通模型，在指令遵循和写作文风上都有更优异的表现，但是脑子又弱一点。

根据 aider 做的模型评测 deepseek-r1 的思维链 + claude 3.5 模型的执行力就可以达到 SOTA 级别的效果，而价格比 claude-3-7-sonnet-20250219:thinking 便宜更多。

我们最近实测 deepseek-r1+deepseek/deepseek-chat-v3-0324 的混合模型在写代码上也有非常优异的表现。

最近我们做了一个 r1mix 的模型混合的网站，可以让你用 deepseek-r1 去加持任意的模型，不管是在写代码、写作其他各自通用任务上都有绝佳的表现。

常见的推荐组合是：

r1v3：新版 DeepSeek-V3 显著增强了代码能力和文学创作能力，在加持 DeepSeek-R1 后可以在最优的价格下实现 SOTA 级性能。
r1claude：Claude 系列模型的代码能力是当前的 No. 1 ，在加持 DeepSeek-R1 后可以以更优的价格达到 Claude 3.7 Sonnet Thinking 的效果。
r1grok：Grok-3 的文学创作能力是 Top 级别的，在加持 DeepSeek-R1 后故事的剧情会更加合理，表达也更富有层次感。
r1gemini：Gemini 2.0 系列知识面非常广泛、能力也很全面，在加持 DeepSeek-R1 后可以轻松应对各种复杂需求。

常见的模型都有，可以根据需求自己任意组合。也可以绑定你的 openrouter 账号，使用 openrouter 上的免费模型的时候我们不收费。

https://r1mix.ai

19 replies • 2025-04-02 16:01:29 +08:00

1

maximdx

Mar 31, 2025

有意思，这种多个模型搭配使用的原理是什么？

2

faceair

OP

Mar 31, 2025

2

@maximdx #1 先调用思考模型，获取到思维链以后停止请求，把思维链拼到原始请求里请求第二个模型

3

DigitaIOcean

Mar 31, 2025

有趣，关注

4

xyfan

Mar 31, 2025

LLM 的客户端 chatwise 好像也增加了类似的功能，调用一个模型的 thinking ，并应用于另一个模型

5

listenfree

Mar 31, 2025

按你这样说，qwq32B+qwen2.5code 也是 SOTA 级别哟，就是不知道如何流程化试用

6

faceair

OP

Mar 31, 2025

@listenfree #5 我们暂时没有 qwen2.5 code 模型的供应，你可以绑定你的 openrouter 账号，然后两个模型名用加号连接就可以调用了

7

iyaozhen

Mar 31, 2025

我充值试了下，感觉还行。不过也没解决 R1 本身的幻觉问题，就是 R1 强是强，但是不太稳定

8

ovtfkw

Mar 31, 2025 via iPhone

@faceair #2 就这？岂不是很简单

9

pakro888

Mar 31, 2025

市场上早已经有人开发出来了：
1. https://github.com/ErlichLiu/DeepClaude(支持模型自由组合)
2. https://github.com/getasterisk/deepclaude (上方项目的灵感来源)

10

rqYzyAced2NbD8fw

Mar 31, 2025

@xyfan #4 chatwise 能火纯粹是 openwebui 的作者太傻逼。Deepseek 都出来多久了还以 ‘OAI 没有 API 实现’ 为理由拒绝显示思考过程的 PR 。核心功能不做，莫名其妙的垃圾功能做一堆，还自我感觉良好。要不是因为我也是个傻逼我真想 Fork 一个自己开发

11

SkywalkerJi

Apr 1, 2025 via Android

主楼说的模型特点是中文写作吗，还是说外文也一样。

12

Lee90

Apr 1, 2025

邮箱登录好评

13

paopjian

Apr 1, 2025

赛博换脑, r1 的思维脑接上 claude 的嘴

14

Seayon

Apr 1, 2025

Cline 在写代码的时候也是先 PLAN 后 ACT ，我现在都用 deepseek-r1 去思考计划，然后切换到 claude 再去 ACT

15

anjingdexiaocai

Apr 1, 2025 via Android

这就是 deepClaude 吧，很早就有了

16

hugowangnz

Apr 1, 2025

@LanhuaMa 太对了，这么流行的功能不做，目前只能自己写函数支持思维链显示了

17

LinSP

Apr 1, 2025

这不是变形版蒸馏

18

flcwk

Apr 2, 2025

@faceair 对的，相当于用思考模型做规划，然后让实践能力强的模型进行操作，之前的 deepclaude 和 deepgemini 都是这个思路，进一步的可以引入多个思考模型进行专家会审，效果更佳

19

faceair

OP

Apr 2, 2025

@flcwk #18 多思考模型的话算是 agent 的思路了，做 API 的话延迟太大了 token 数跟效果也成正比的话，用户不买账

About · Help · Advertise · Blog · API · FAQ · Solana · 2048 Online Highest 6679 ·

Select Language

创意工作者们的社区

World is powered by solitude

VERSION: 3.9.8.5 · 63ms · UTC 16:13 · PVG 00:13 · LAX 09:13 · JFK 12:13
♥ Do have faith in what you're doing.