Suinn's recent timeline updates

Suinn

V2EX member #481792, joined on 2020-04-05 17:57:27 +08:00

程序员 • Suinn • Jan 17 • Lastly replied by Do1phln

问与答 • Suinn • Oct 28, 2025 • Lastly replied by Suinn

机器学习 • Suinn • Nov 24, 2025 • Lastly replied by CharlesJUJU

水 • Suinn • Oct 17, 2025

Local LLM • Suinn • Sep 28, 2025 • Lastly replied by Suinn

程序员 • Suinn • Sep 23, 2025 • Lastly replied by Suinn

程序员 • Suinn • Apr 30, 2025 • Lastly replied by Suinn

问与答 • Suinn • Apr 29, 2025 • Lastly replied by Suinn

程序员 • Suinn • Jul 16, 2020 • Lastly replied by Suinn

Suinn's recent replies

Jan 22

@fox0001 感谢，DINOv3 我前段时间也试过了，可能是我的场景类内相似度有点高，所以准确率不是特别好，我再研究研究

Jan 20

@fox0001 大佬求教，最近我也在做这个方向但是效果不是很好，除了 dino 提取特征后进行相似度比较外，还有其他优化的方向吗

Oct 28, 2025

@Sh1xin 😂我又仔细看了下评测，PaddleOCR-VL 是 qwen2.5 比的，没和 qwen3 比。我这边目前用的是 30B-A3B 那个

Sep 28, 2025

@hmbb 非常感谢，感觉这个比 huggingface 上的强了不止一点

Sep 23, 2025

@kuanat 感谢分享，我图像处理和 vlm 学的还行，但确实没从事过真正生产端的 ocr 开发，你提到的需求场景几乎都采用人工复核的方式，我思考的点正是源自于是否能提供另一种模式，仅在服务不提供输出时再进行人工复核，对于输出部分的内容可以百分百信任

Sep 22, 2025

@showonder 其实还是不太一样，说到底 ocr 本质基本是特征提取+分类，但 vlm 是有语义空间的，这种融合的说服力其实比单纯 ocr 的叠加要强上不少

Sep 22, 2025

@retrocode o(*￣▽￣*)ブ感谢分享，这个思路确实很新颖

Sep 22, 2025

@billbob 目前这个方案虽然无限降低了召回率，但几乎也过滤了所有假阳性的情况，现在比较头疼的点确实在于没法论证能达到百分百的准确率，直觉上来说总感觉就是无限逼近 100%😂