codingmiao's recent timeline updates

codingmiao

V2EX member #582929, joined on 2022-05-27 09:19:04 +08:00

Today's activity rank 19510

codingmiao 提问技术话题好玩工作信息交易信息城市相关

gpu and data is all you need —— 记一次 qwen3.5 的思维链微调

程序员 • codingmiao • Mar 27 • Lastly replied by spribree

今天整了个活，用纯 http post 做了一个反向代理/内网穿透的工具

Java • codingmiao • Jun 16, 2024 • Lastly replied by codingmiao

» More topics by codingmiao

codingmiao's recent replies

Jun 30

Replied to a topic by weberCd › 生活 › 经济下行，我做了这些事情来节省开支，然后发现对生活品质几乎没有影响……欢迎补充

快剪和不开车这两项降低开支不仅没降低生活质量反而提升了。

快剪十来分钟剪完还不用听托尼老师推销办卡。

电驴/地铁/打车不用去找车位，就是上次去保养师傅说我电池有点亏点了要多开开。。

Jun 11

Replied to a topic by mndlr › 推广 › 领赛博鸡蛋啦，自建中转，持续拉新，注册送额度 + 邀请好友首充双方返利。支持 GPT 5.5 / Claude Fable 5 / Gemini 3.5 Flash 等全系列主流模型，免费送 $50 刀永久额度

用户 ID 197 感谢老板

Jun 8

Replied to a topic by Flagship9945 › Local LLM › 需要购买国产显卡本地部署大模型，哪家的比较好

用过海光、昇腾、平头哥。昇腾自建生态加上文档稀烂，体验就是一坨。另外两家 cuda 上能跑的代码随便改改就能跑起来，但比起 n 卡来性能和体验还是要差不少。

May 31

Replied to a topic by hairenjun › 教育 › 和 Gemini 聊了四个小时，现在感觉在大学去上课就是浪费时间

@huanxianghao 计算机相关的东西还是挺容易规避 AI 扯淡的，我前段时间补 transformer 的知识，直接先把 github 上 transformer 代码拉下来，让 claude code 给我出个学习教程，每一章节找对应的代码把我当傻子给我讲，边跑 demo 边问，它不厌其烦地回答我，有代码卡着也不会跑偏，感觉很好。

May 19

Replied to a topic by SilenceLL › 程序员 › 请教下，我们现在有十来年的各种文档，想要建企业知识库，该如何做

知识库本身只是提供个工具，开源的随便弄弄，大头做好业务梳理，做好合理的分门别类，不然还是一坨放在那没什么大用

May 18

Replied to a topic by iqoo › 程序员 › 只有 3 个运算操作的解密函数，破解奖励一杯咖啡

这玩意真能作为加解密方法吗？即使明天你把答案发出来，也没有一个快速验证的方法验证你发的答案对不对。反之如果你有快速验证的方法并公布出来，那这个加解密方法也会像 MD5 彩虹表那样迅速被破解掉

May 12

Replied to a topic by unt › 程序员 › 2026 年年中了，现在开发大型企业级智能体用什么架构方案

这玩意越高水越深，所以我们简单的需求 langchain4j(因为我们有好多 java 的基建)，复杂的直接套壳 claude code 😄

Apr 21

Replied to a topic by izv › 推广 › 简单稳定的 codex 中转， 0.1 倍率，送 10+10 刀额度

这个中转似乎非流式请求有点问题，下面这个请求，"stream"为 false 时就没有输出"content"，为 true 时是正常的

curl "https://www.hi-code.cc/v1/chat/completions" \
-H "Content-Type: application/json" \
-H "Authorization: Bearer sk-xxx" \
-d '{
"model":"gpt-5.4",
"stream": false,
"messages":[
{"role":"user","content":"你好"}
]
}'

{"id":"resp_0f935c87f6d1df2d0169e7013c67c08196abb8a696e0191e21","object":"chat.completion","created":1776746813,"model":"gpt-5.3","choices":[{"index":0,"message":{"role":"assistant"},"finish_reason":"stop"}],"usage":{"prompt_tokens":18,"completion_tokens":41,"total_tokens":59}}

Apr 20

Replied to a topic by seraphlz › OpenAI › deep research 生成的研究报告效果如何？

生成出来乍一看效果挺唬人，仔细看很多经不起推敲，我现在是让 claude code 自己去 arxiv 和 github 上搜了总结了，比直接 deep research 可控一点

Mar 25

Replied to a topic by codingmiao › 程序员 › gpu and data is all you need —— 记一次 qwen3.5 的思维链微调

@spribree 已补充微调脚本至[sft/run_sft.sh]( https://github.com/codingmiao/qwen35-short-cot/blob/main/sft/run_sft.sh)

用了 ms-swift 这个框架来做 lora 微调的，没写代码😄，配下参数一行命令就跑起来了😄。

» More replies by codingmiao