多人使用时不需要排队,是否可以支持,要设置什么参数之类的吗
1
gzlock 2023-05-25 00:11:27 +08:00
可以试试秋叶启动器里有一个停用 gradio 内置队列的选项
但是禁用队列后我有疑问就是,如果用户 A 在用大模型 A 在出图中,而用户 B 这时候选择大模型 B 出图,那大模型 A 和 B 是不是都需要加载到显存里?那再来一个用户 C 选择大模型 C 呢? 没有队列后,是不是显存就需要无穷大了? |
2
lzghades 2023-05-25 08:43:24 +08:00
不用队列应该不行,多个用户同时画图的话,显存应该不够。
|
3
jifengg 2023-05-25 09:39:07 +08:00
单机应该不行,本来一个任务就全力跑了,不排队的话大家都慢。
如果 api 有可以获取队列信息话,可以考虑在它前面套一个自己维护的负载,webui 部署多台机器,自己做任务分配。 |
4
hyperzlib 2023-05-25 13:30:52 +08:00
多进程队列,我现在就是这么做的。不同进程可以加载不同的模型。
|
5
dabingbing 2023-08-05 16:36:50 +08:00
@hyperzlib 你好,你的方案需要魔改吗?
|
6
hyperzlib 2023-08-11 11:37:00 +08:00
@dabingbing 不用,启动参数可以指定加载的模型和端口,不同模型开在不同端口上就行了。然后自己写一个调度中间件。
|