如果包含表格线,OCR 的识别就降低,请教下大侠,如何剔除图片中的表格线
1
littlewing 2021-03-25 12:31:22 +08:00 via iPhone
ps 橡皮擦?
|
2
PoorBe 2021-03-25 12:32:07 +08:00
画图,选择
|
3
ch2 2021-03-25 12:46:08 +08:00
首先,把图像旋转,旋转正以后分别计算整个图像每一行每一列的像素值之和 sum
由于黑色是全 0,把那些 sum 值过低的行或者列挑出来,改成全 1 这样表格线就消除了,难点是如何判断已经旋转正了 |
4
TimePPT 2021-03-25 13:06:32 +08:00 via Android
有专门的表格 OCR
|
5
rozbo 2021-03-25 13:09:30 +08:00
卷积 L
|
6
laqow 2021-03-25 20:01:25 +08:00 via Android 1
转正,取阈值,然后横向一个比文本宽的 kernal open 一下得到横线,纵向 kernel open 一下得到纵线,两个并集得到表格的 mask,再减一下
|
7
alexbigbigworld 2021-03-26 00:21:29 +08:00 via iPhone
感觉算法滤波可以去除
|
8
daijinming OP @laqow 厉害,感谢了朋友
|