V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
hugo2233
V2EX  ›  分享创造

AI 开发了个《武林外传》全台词检索对应截图网站

  •  
  •   hugo2233 · 4 天前 · 846 次点击

    https://wulinwaizhuan.hugo2233.dpdns.org/ 文本提取:PaddleOCR (PaddlePaddle 引擎) 暴力破解硬字幕。 数据归档:构建台词-时间戳-图片路径的索引。 抽帧处理:FFmpeg 获取关键帧。 图像预处理:OpenCV + NumPy 提高识别率。

    难题攻克: 针对 TV 录制版没有软字幕的问题,OCR 是唯一解。通过批量推理,将 80 集海量素材转化为可检索的 JSON 文件

    一开始 win 直接运行代码好慢 80min 一集 现在在 wsl 上运行 5-8min 一集舒服了

    参考项目 github 的 Cicada000/VV 感谢指导

    5 条回复    2026-02-09 16:27:03 +08:00
    duuu
        1
    duuu  
       4 天前
    厉害~学习了
    0xo
        2
    0xo  
       4 天前
    是谁杀了我而我又杀了谁
    第 65 集
    34:18
    ---
    这个好像不对
    xkwdm
        3
    xkwdm  
       4 天前
    ![]( )
    hugo2233
        4
    hugo2233  
    OP
       4 天前
    @xkwdm 对的很多 子曰 都是子日
    没有校对
    cadl
        5
    cadl  
       21 小时 4 分钟前
    哈哈点子太好玩了,点赞。前几天看到你的帖子,昨天教不会写代码的老婆尝试 claude code ,就是拿这个当例子,搞了个《马大帅》版本的。

    https://biaoleme.llpsh.com/
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   3134 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 20ms · UTC 05:31 · PVG 13:31 · LAX 21:31 · JFK 00:31
    ♥ Do have faith in what you're doing.