codingmiao's recent timeline updates
codingmiao

codingmiao

V2EX member #582929, joined on 2022-05-27 09:19:04 +08:00
Today's activity rank 12540
codingmiao's recent replies
知识库本身只是提供个工具,开源的随便弄弄,大头做好业务梳理,做好合理的分门别类,不然还是一坨放在那没什么大用
这玩意真能作为加解密方法吗?即使明天你把答案发出来,也没有一个快速验证的方法验证你发的答案对不对。反之如果你有快速验证的方法并公布出来,那这个加解密方法也会像 MD5 彩虹表那样迅速被破解掉
这玩意越高水越深,所以我们简单的需求 langchain4j(因为我们有好多 java 的基建),复杂的直接套壳 claude code 😄
这个中转似乎非流式请求有点问题,下面这个请求,"stream"为 false 时就没有输出"content",为 true 时是正常的

curl "https://www.hi-code.cc/v1/chat/completions" \
-H "Content-Type: application/json" \
-H "Authorization: Bearer sk-xxx" \
-d '{
"model":"gpt-5.4",
"stream": false,
"messages":[
{"role":"user","content":"你好"}
]
}'


{"id":"resp_0f935c87f6d1df2d0169e7013c67c08196abb8a696e0191e21","object":"chat.completion","created":1776746813,"model":"gpt-5.3","choices":[{"index":0,"message":{"role":"assistant"},"finish_reason":"stop"}],"usage":{"prompt_tokens":18,"completion_tokens":41,"total_tokens":59}}
生成出来乍一看效果挺唬人,仔细看很多经不起推敲,我现在是让 claude code 自己去 arxiv 和 github 上搜了总结了,比直接 deep research 可控一点
@spribree 已补充微调脚本至[sft/run_sft.sh]( https://github.com/codingmiao/qwen35-short-cot/blob/main/sft/run_sft.sh)

用了 ms-swift 这个框架来做 lora 微调的,没写代码😄,配下参数一行命令就跑起来了😄。
Mar 24
Replied to a topic by cat9life Local LLM qwen3.5 过度思考的问题
这个似乎是 qwen3.5 系列太喜欢过度思考了,我这几天搞了点 deepseek-r1 的数据去微调它,让它学习 ds 的思考套路,效果好了不少 https://github.com/codingmiao/qwen35-short-cot
Mar 18
Replied to a topic by Ayanokouji Java JDK 26 发布,非 lts 版本
向量 API 还是没孵化出来,用这玩意写了个 RAG 的玩具,速度确实可以
~/.claude.json 这个下面写了 zp mcp 了吧
Jan 26
Replied to a topic by xiaofire 职场话题 有没有面试专用的 AI?
不是现在作弊还能说的这么理直气壮?我面试都问项目经验了,还是有些脑瘫在那念 AI 人机回复,纯纯浪费时间
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3705 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 20ms · UTC 04:41 · PVG 12:41 · LAX 21:41 · JFK 00:41
♥ Do have faith in what you're doing.