Suinn's recent timeline updates
Suinn

Suinn

V2EX member #481792, joined on 2020-04-05 17:57:27 +08:00
最新的 PaddleOCR-VL 模型大家有尝试过吗
问与答  •  Suinn  •  Oct 28, 2025  •  Lastly replied by Suinn
3
知乎挂了吗
 •  Suinn  •  Oct 17, 2025
大模型本地部署显存计算的问题
Local LLM  •  Suinn  •  Sep 28, 2025  •  Lastly replied by Suinn
2
这样是否可以保证 OCR 识别率接近百分之 100
程序员  •  Suinn  •  Sep 23, 2025  •  Lastly replied by Suinn
48
百万数据下的大模型校验应用
程序员  •  Suinn  •  Apr 30, 2025  •  Lastly replied by Suinn
4
关于 Rag 本地知识库落地的问题求助
  •  2   
    问与答  •  Suinn  •  Apr 29, 2025  •  Lastly replied by Suinn
    9
    前辈们, Java 程序员转嵌入式有可操作性吗
    程序员  •  Suinn  •  Jul 16, 2020  •  Lastly replied by Suinn
    9
    Suinn's recent replies
    @fox0001 感谢,DINOv3 我前段时间也试过了,可能是我的场景类内相似度有点高,所以准确率不是特别好,我再研究研究
    @fox0001 大佬求教,最近我也在做这个方向但是效果不是很好,除了 dino 提取特征后进行相似度比较外,还有其他优化的方向吗
    Oct 28, 2025
    Replied to a topic by Suinn 问与答 最新的 PaddleOCR-VL 模型大家有尝试过吗
    @Sh1xin 😂我又仔细看了下评测,PaddleOCR-VL 是 qwen2.5 比的,没和 qwen3 比。我这边目前用的是 30B-A3B 那个
    Sep 28, 2025
    Replied to a topic by Suinn Local LLM 大模型本地部署显存计算的问题
    @hmbb 非常感谢,感觉这个比 huggingface 上的强了不止一点
    @kuanat 感谢分享,我图像处理和 vlm 学的还行,但确实没从事过真正生产端的 ocr 开发,你提到的需求场景几乎都采用人工复核的方式,我思考的点正是源自于是否能提供另一种模式,仅在服务不提供输出时再进行人工复核,对于输出部分的内容可以百分百信任
    @showonder 其实还是不太一样,说到底 ocr 本质基本是特征提取+分类,但 vlm 是有语义空间的,这种融合的说服力其实比单纯 ocr 的叠加要强上不少
    @retrocode o(* ̄▽ ̄*)ブ感谢分享,这个思路确实很新颖
    @billbob 目前这个方案虽然无限降低了召回率,但几乎也过滤了所有假阳性的情况,现在比较头疼的点确实在于没法论证能达到百分百的准确率,直觉上来说总感觉就是无限逼近 100%😂
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   4691 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 30ms · UTC 10:06 · PVG 18:06 · LAX 03:06 · JFK 06:06
    ♥ Do have faith in what you're doing.