V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
18870715400
V2EX  ›  Python

有图像识别的大佬么

  •  
  •   18870715400 · 2019-05-06 12:20:47 +08:00 · 3039 次点击
    这是一个创建于 2021 天前的主题,其中的信息可能已经有所发展或是发生改变。

    就是想做一个能识别出当前界面是广告界面,还是登陆界面,还是弹窗的功能程序。其中一种思路是将图片中的文字识别出来,根据文字来判断,第二种直接是根据图像转换成 ndarray,请问一下第二种有什么比较好的思路推荐么,感觉用 SVM,KNN,Logistic 什么的准确率好低,有什么更好的方法么?

    13 条回复    2019-05-06 14:51:50 +08:00
    vedawang
        1
    vedawang  
       2019-05-06 12:26:18 +08:00 via iPhone   ❤️ 2
    这种工作不应该由图像识别来做,速度慢,要做成普适性的算力要求又高。个人意见:根据 html 标签和元数据去识别更合适吧
    dinghow
        2
    dinghow  
       2019-05-06 12:32:30 +08:00   ❤️ 1
    楼上加 1,OCR 关键词>图像分类,但是这种类型图像识别数据自己搞太麻烦,也不知道有没有公开数据集
    18870715400
        3
    18870715400  
    OP
       2019-05-06 12:34:10 +08:00
    @vedawang 上面的要这样,我也没有太多办法。
    airqj
        4
    airqj  
       2019-05-06 12:36:29 +08:00
    这是为了融资强行 AI 啊.....
    Shingekinoshinji
        5
    Shingekinoshinji  
       2019-05-06 12:44:54 +08:00
    有大数据集直接上神经网络大力出奇迹吧,没有数据集老老实实 OCR
    111qqz
        6
    111qqz  
       2019-05-06 12:45:49 +08:00 via Android
    数据量有多大呢?
    photon006
        7
    photon006  
       2019-05-06 13:59:46 +08:00
    分类就 3 种不是很难,关键得有样本数据集,而且以后业务场景出现的同类新图不能差异太大
    18870715400
        8
    18870715400  
    OP
       2019-05-06 13:59:56 +08:00
    @111qqz 数据集大概只有 7、8 百张吧
    DrPikaduo
        9
    DrPikaduo  
       2019-05-06 14:05:20 +08:00
    @18870715400 这点数据量的话,还是用 OCR 关键词吧
    18870715400
        10
    18870715400  
    OP
       2019-05-06 14:13:02 +08:00
    就是广告弹窗什么的图像没有太大的特征性,直接用普通算法识别准确率肯定不是很好,关键是各种类型图片的文字看图就比较明显,所以才会直接根据文本来建立相关的模型。
    lsvih
        11
    lsvih  
       2019-05-06 14:16:50 +08:00   ❤️ 1
    强行创新不可取,把简单问题复杂化了
    KKbu
        12
    KKbu  
       2019-05-06 14:41:04 +08:00 via Android
    SVM 效果按说对这种简单分类人物效果已经很不错了,感觉像是特征没选对
    dearmymy
        13
    dearmymy  
       2019-05-06 14:51:50 +08:00
    不知道你需求是什么?三张 png 图片要识别么?感觉你把东西复杂化了。你需求可能用别的方法实现更简单
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2906 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 07:59 · PVG 15:59 · LAX 23:59 · JFK 02:59
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.