在网上搜了 3 天了,对于如何在本地 运行模型 的教程很多,基本都是保姆级的很详细的教程,我看了一遍就运行起来了。
但是对于如何在 Windows 端本地 微调模型 的教程,却都很复杂。我连着搜了 3 天的微调教程,每天基本上有 6 个小数都在浏览器前面,还是看不明白。
目前我电脑上有 本地模型文件 和 数据集的 json 文件。
我有Ollama 格式、gguf 格式、.safetensors 格式
,这三种格式的模型。
也有一问一答的 json 数据集,一共有五百条,例如:
{"instruction":"你是谁?","input":"","output":"我是 ChatGPT 。"}
{"instruction":"我是谁?","input":"","output":"你是向我提问的人。"}
那么我该如何用这一个 json 数据集,在 Windows 端本地微调我的模型并生成一个新的模型文件?
求推荐保姆一点的教程,就是告诉我第一步应该做什么,然后第二步应该做什么的那种教程。
![]() |
1
Fdyo 3 天前
Qwen 不是在阿里云上有在线调试的窗口吗?你看看?
|
2
NianBroken OP @Fdyo 阿里云百炼在线调试的窗口好像没办法下载模型吧?
|
![]() |
3
Fdyo 3 天前
@NianBroken 确实没法下载,抱歉,我略过了本地的需求(但不确定本地的和在线的模型是否在微调结果上能保持一致?)
|
![]() |
4
frankyzf 2 天前
https://github.com/hiyouga/LLaMA-Factory 可以尝试按 readme 试下,加下微信群,遇到问题在群里问
|
5
diroverflow 2 天前
本地微调需要什么硬件?怎么有人说一张 4090 都不行啊
|
6
panda1001 1 天前 via Android
|