试了一下 pytesseract 模块,好像很多文字都识别不了,只有一些纯色背景并且颜色反差比较大的才比较容易识别出来。
用百度的文字识别 api 接口大部分文字都能识别出来,效果挺好的,但有点担心图片内容的安全问题。
利用程序识别最多只能达到 pytesseract 模块这种程度的效果了吗?
101
zictos OP @lakehylia #96 你从哪里看出我怪 python 了?我有说 python 很垃圾吗?
那按语文的阅读理解来说是不会得出你这样的结论的,你得出来这样结论,还是我的问题? |
102
hutoer 2021-12-06 16:34:30 +08:00 1
哪些个指责楼主的人,说白了还是自己心眼太小
|
103
anjianshi 2021-12-06 16:35:46 +08:00 1
楼主挽尊,这年头想说话不被带节奏不被喷是真难。因为回复的人,大部分都并没有想提供有价值的信息,只是想抒发自己的情绪而已。
|
104
zictos OP @anjianshi #103 嗯,其实网上也不是什么非常正式的场合,有的时候语言真的要那么严谨吗?其实有时候在网上看一些东西的时候也经常可以找到别人话语的漏洞,但如果一定要去说的话是会被人认为抬杠的,有时候为了简单省事肯定言语不可能很严谨。其实我这个情况是非常类似的,跟其他言语漏洞没有太多本质区别,最关键是因为涉及到了编程语言,毕竟一般情况下说哪门编程语言不好是会被喷的,拿两门编程语言比较也是算引战。
其实知道意思就行了,稍微有点疑问,后面有解释了,其他楼层就没必要那样了。 就跟看到有人打了一个错别字一样,真没必要那么严谨,就算有人提一句也问题不大,可以解释一下不小心打错了。但总不至于大部分楼层都一直在说错别字这个事。 |
106
enrolls 2021-12-06 16:49:17 +08:00
Python 识别图片文字的效果是不是很差?
C 识别图片文字的效果是不是很差? Java 识别图片文字的效果是不是很差? C++ 识别图片文字的效果是不是很差? C# 识别图片文字的效果是不是很差? Visual Basic 识别图片文字的效果是不是很差? JavaScript 识别图片文字的效果是不是很差? Assembly 识别图片文字的效果是不是很差? SQL 识别图片文字的效果是不是很差? Swift 识别图片文字的效果是不是很差? (数据来源 TIOBE) |
107
twinsant 2021-12-06 16:56:58 +08:00
回复楼主,Python OCR 文字识别效果非常好,请看我使用 Pythonista 调用苹果设备神经网络能力的代码:
https://gist.github.com/twinsant/8737fa611fe71b4ab436b43605b71776 |
108
twinsant 2021-12-06 17:02:39 +08:00
|
109
zhw2590582 2021-12-06 17:09:27 +08:00
哈哈,我想 10 个人里有 9.5 个人看了楼主你的标题,都会以为你在说 Python 不行,而不是 pytesseract 不行
|
111
zictos OP @zhw2590582 #109 难道只看标题吗?
标题不是一个观点,而是一个疑问,至于为什么会有疑问,描述中就已经用 pytesseract 解释了。所以连贯起来结合上下文自然就是在说 pytesseract |
112
jy02201949 2021-12-06 17:39:17 +08:00
牛逼牛逼,楼主舌战群雄
|
113
Kelan 2021-12-06 17:47:15 +08:00 5
都闲的吧,lz 只因为是新手,并且恰好是一个喜欢存在感的新手。你们在这里认真解释什么。
越回复 lz 越兴奋啊。 |
114
2i2Re2PLMaDnghL 2021-12-06 19:23:03 +08:00 4
@zictos 我只是夸张、诙谐且生动形象地描写,在理解机器学习且理解了你说的是什么的情况下,你说的话显得有多可笑。
不过打火机烤肉确实有可行性的,但对于食材有限制,外加不能直接上明火罢了(不完全燃烧的碳颗粒很多),这块是比较粗糙的比方,或许用太阳灶作比方会好一点。 但你实在要抓住这个不够精确的比喻,真的『有故意杠的意思了』(原样引自 #9 ) 我就明说了,其实众人与你抬杠了这么多楼,主要的原因是你在拼命咬文嚼字,却又阻止别人咬文嚼字。 |
115
irainsoft 2021-12-06 19:31:19 +08:00 1
为什么标题不能写 [pytesseract 识别图片文字的效果是不是很差?]
|
116
alexchinatests 2021-12-06 19:39:46 +08:00
这群人闲的,搁我早就不回复了,楼主可以的。上面那群人戾气太重
|
119
mxT52CRuqR6o5 2021-12-06 20:37:50 +08:00 2
什么叫 [难道只看标题吗]
知道标题党为什么讨人厌吗 |
121
zictos OP @2i2Re2PLMaDnghL #114
你这样绕来绕去就没意思了。 别人不针对我咬文嚼字,我会针对他咬文嚼字吗?我就活该被怼得一败涂地?就算我咬文嚼字也是有一个前提的。 我前面开始的几个楼层解释了那么多,其他人听了吗?会就此打住吗?如果我不回复一点,这样我只会被骂得更惨。我回复相当于是一种震慑,其他回复的人就得掂量掂量,小心被回怼。其实在 v2 上经常看到有楼主被骂得很惨的帖子,那些楼主就什么都不回复了,结果就被骂得惨不惹睹。 你用那个比喻试图证明我的话很可笑,那我不能反驳了?你到底理不理解“杠”的意思?你不开始,那我难道还主动找上你?主动打人和被打还手是一个概念吗?虽说你举的例子有一定相似性,但实在过于夸张了。事实上一开始我还真的感觉无话可反驳,后面想了一下才找到一点突破口,但是也没别的恶意,就是相互辩论一下嘛。其实被回复不是挺好的吗?中途那么多回帖我都没回复,刚好到你那个回帖我才又开始回复,其实从另一个角度来说是对你的言论一种肯定啊!因为其他的人都话并没太多亮点。 |
122
q409195961 2021-12-06 23:23:55 +08:00 1
网上有人推荐 cnocr 这个库,试试看
不得不说,苹果 iOS15 那个 OCR 功能真的是 YYDS |
123
LPeJuN6lLsS9 2021-12-07 10:09:22 +08:00
imn1 的回复说的好,看这楼主杠他的回复,自己缺乏常识还打死不承认,反而说别人抬杠,打一堆字在那绕来绕去,
|
124
zxCoder 2021-12-07 10:52:27 +08:00
你可以用 python 调公开接口啊。。。。那识别率杠杆的,这样 python 不就 nb 起来了。。。
|
125
zxCoder 2021-12-07 10:58:16 +08:00
或者可以自己用 python 训练一个像百度一样的模型程序,这样 python 也就硬起来了
|
126
zhw2590582 2021-12-07 12:32:02 +08:00
你不要那么激动嘛,假如你在后面回复个标题写得不准确,然后更正一个新标题,大家都不会扯那么远了
|
127
Kinnice 2021-12-07 15:21:04 +08:00
是
对的,程序识别只能做到这样,在高一点就得人工识别了 :) |
128
qiany 2021-12-08 10:03:39 +08:00
python 做这种识别的都很差 java 也不太行 好一点的应该都是 c 语言写的
|
129
GrayXu 2021-12-17 14:28:06 +08:00
@zhw2590582 所以只是纯钛合金嘴而已。。
|