ns2250225

怎样加快 onnx 模型在 cpu 上的推理速度啊

  •  
  •   ns2250225 · Dec 6, 2025 · 1976 views
    This topic created in 158 days ago, the information mentioned may be changed or developed.

    我已经问过 AI 了,已经把 onnx 模型进行了剪枝,进行了 int8 动态量化,开启了 cpu 多线程推理,速度由原来的 3s 优化到现在的 1.3s ,感觉到极限了,可是老板的要求是 500ms ,大佬快救救孩子

    gargar
        1
    gargar  
       Dec 7, 2025
    让老板出钱换更好的 CPU 、GPU
    ns2250225
        2
    ns2250225  
    OP
       Dec 7, 2025 via Android
    @gargar 哈哈哈,这样老板要换掉我了
    frayesshi1
        3
    frayesshi1  
    PRO
       Dec 8, 2025
    可以推理加速啊
    ns2250225
        4
    ns2250225  
    OP
       Dec 9, 2025
    @frayesshi1 #3 怎么搞,求指导
    frayesshi1
        5
    frayesshi1  
    PRO
       Dec 9, 2025
    @ns2250225 #4 硬件加速啊,trt 开启后 bf16 的 onnx 在 nano 板子随便跑
    ns2250225
        6
    ns2250225  
    OP
       Dec 9, 2025 via Android
    @frayesshi1 好滴,我试试,感谢
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3300 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 60ms · UTC 11:46 · PVG 19:46 · LAX 04:46 · JFK 07:46
    ♥ Do have faith in what you're doing.