Llama3.1 8B 本地部署抢先体验， win&mac 一键启动整合包，图形化界面+知识库

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 422 天前的主题，其中的信息可能已经有所发展或是发生改变。

一键启动整合包下载地址： https://flashai.com.cn

Llama 3.1 于 2024 年 7 月 24 日重磅推出，包括 405B ，70B ，8B 三个模型，将上下文长度扩展到 128K 、增加了对八种语言的支持。

8B 模型在 5 月初发布的 3.0 基础上能力有了大幅提升，超越 gemma2 9B 成为 10B 以下模型的 SOTA

这款 Llama3.1 8B 整合包，下载解压后开箱即用，无需任何安装配置，包括了 ollama ，Llama3.1 8B 大模型文件，图形化界面，知识库，向量模型，知识树，文档翻译，中文优化等，体积 5.7G

最低配置：8G 以上空闲内存，支持 avx2 的 CPU （近 10 年主流 CPU 都支持）

推荐配置：8G 显存的 N 卡 GPU

Flashai

Llama3 8b

第 1 条附言 · 2024-07-25 13:44:59 +08:00

Mac版已经上传，强烈推荐M系同学下载使用，很流畅 flashai llama3.1 8B

Llama3.1

整合包

24 条回复 • 2025-02-21 05:40:57 +08:00

B4a1n

2024-07-25 01:05:34 +08:00

![472faf57407e307a5d4c2d685fe06060.png]( https://ice.frostsky.com/2024/07/25/472faf57407e307a5d4c2d685fe06060.png)

B4a1n

2024-07-25 01:07:31 +08:00

[img]https://ice.frostsky.com/2024/07/25/472faf57407e307a5d4c2d685fe06060.png[/img]

B4a1n

2024-07-25 01:08:14 +08:00

https://ice.frostsky.com/2024/07/25/472faf57407e307a5d4c2d685fe06060.png

mumbler

2024-07-25 01:22:12 +08:00

@B4a1n 官方没有说正式支持中文，可能中文语料训练得少，国产模型大都基于 llama3 训练的，很快会出来一堆。10B 以下模型里中文能力目前最好的是 gemma2 9B ，英翻中特别厉害

gzlock

2024-07-25 04:27:08 +08:00

https://ollama.com/library/llama3.1
我会用知名度更高的 ollama 去体验 llama3.1
不是说不知名的软件啊整合包啊就该埋入土了，我本意是用更知名的出品代表有更多人盯着有没有作恶

jeffwcx

2024-07-25 04:48:54 +08:00 via iPhone

@mumbler qwen 也是基于 ollama ？

yekern

2024-07-25 06:40:49 +08:00

去 huggingface 找 llama3-8b-chinese-chat-ollama-q4 已经支持 ollama 了可以直接用微调中文的

walkingmoonwell

2024-07-25 08:40:49 +08:00

@yekern 对这些不是很了解，我想问问比如这些模型做成知识库或者其他什么的，是已经很成熟可以当成产品了吗？还是只是本地部署自己玩玩？

mumbler

2024-07-25 08:58:25 +08:00 via Android

@gzlock ollama 只是一个命令行，要用图形界面需要安装 webui ，要用知识库需要安装 anything ，对普通人太麻烦，flashai 底层也是 ollama ，集成了图形界面，知识库，不用一个个去安装了，更方便不是吗

mumbler

2024-07-25 09:03:17 +08:00 via Android

@jeffwcx
llama2 有 7b 13b 33b 70b,qwen1.5 有 7b,14b,34b,72b
llama3 有 8b 70b,qwen2 有 7b ，72b
是不是一样的

mumbler

2024-07-25 09:05:57 +08:00 via Android

@walkingmoonwell 知识库已经很成熟了，可以用 flashai 免费体验一下，硬件有个 gpu 体验更好

mumbler

2024-07-25 09:26:18 +08:00 via Android

@yekern 赶紧再微调一个 3.1 的，基座比 3 强了不少

andykuen959595

2024-07-25 10:38:55 +08:00

试了一下 3.1 ，中文貌似还是不如 qwen2 ？其它方面还是弱点

sunnysab

2024-07-25 10:44:02 +08:00

@mumbler 多少参数是按显卡算力来定的，跟“基于”无关。

mumbler

2024-07-25 10:54:28 +08:00 via Android

@sunnysab 从零训练一个大模型，是很贵的，开源模型的大爆发就是从 llama 发布开始的，如果 qwen2 是从 0 训练的，也应该跟 1.5 一样有 14B ，32B 这些参数，为什么没有? 因为 llama3 没有

wanghui22718

2024-07-25 12:11:30 +08:00

竟然是直接从主站下载？
大哥服务器没问题吗？
正在下，感谢

mumbler

2024-07-25 12:29:51 +08:00

@wanghui22718 下载也是用户体验的一部分，我们初心就是极致的大模型本地部署体验，在任何电脑上开箱即用，不依赖环境，不用具备相关技术知识，all in one

xoxo419

2024-07-25 13:28:15 +08:00

Mac M1 16g 可以部署吗

mumbler

2024-07-25 13:32:22 +08:00

@xoxo419 当然可以，8B 模型只需要 6G 内存，有 M 芯片加持，速度飞快，mac 包刚刚通过苹果做审核，现在可以下载了

jeffwcx

2024-07-25 14:17:19 +08:00 via iPhone

@mumbler 。。。靠参数规模来判断哪个是不是基于哪个，您太牛了

yekern

2024-07-25 14:24:00 +08:00

@mumbler 已经有了去搜下就好了, 下载下来转换下就可以用了

mumbler

2024-07-25 18:09:37 +08:00

@jeffwcx 合理推论，国产模型训练都用 llama 不是什么秘密

kangfenmao

2024-07-26 16:47:43 +08:00

再推荐一个我开发的 Cherry Studio 支持 Ollama: https://github.com/kangfenmao/cherry-studio

yuandidi

211 天前

这个真是个好工具，感谢。