在某社交平台给好友发图被提示内容违规了, 图片内容是自己手机在新浪微博 APP 上的截图, 截取的是一条微博的评论, 所以猜想应该是图片中的文字违规了吧。 然后就很好奇有什么简单的办法可以避免图片里面的文字被 OCR 识别出来吗? 比如换一种奇怪的字体?
1
uclort Dec 14, 2021 增加 OCR 难度势必会影响到阅读难度。
|
2
AlexLokhart Dec 14, 2021 可以猜测一下新浪的 OCR 训练集里面都是什么东西,训练集决定了 OCR 能适应怎样的数据(图片),然后反其道而行,换字体估计没啥用,加删除线之类的东西试试
|
3
Alchemistboy Dec 14, 2021 画几条彩线,参考那些恶心的验证码
|
4
SenLief Dec 14, 2021 via Android 加个水印?
|
5
HankAviator Dec 14, 2021 via Android 传统艺能火星文啊
|
6
root99527 Dec 14, 2021 添加一定的形变(如果有变形字体检测的话此条无效)
添加一定的水印(具体看水印的形式,比如叠加一定的字在上面,不影响阅读的前提下设置一下透明度和大小) 替换一定的字符(比如火星文,一般字符识别的字典不会覆盖这么全) |
7
vocaloid Dec 14, 2021 |
8
wolfie Dec 14, 2021 拱桥形状
|
9
tabris17 Dec 14, 2021 gif 动态图片,栅格化刷新
|
10
vocaloid Dec 14, 2021 |
11
zxcslove Dec 14, 2021 用草书字体的火星文
|
12
Ackvincent Dec 14, 2021 这不就是火星文吗?
|
13
Kagari Dec 14, 2021 qq 的 ocr 也挺强的,可以把 #10 的图放进去试试
|
14
hervey0424 Dec 14, 2021 把文字随机打乱, 然后在后面加上顺序编号
|
15
hutng Dec 14, 2021 via Android 一律写成拼音,它能 OCR 出来我算它牛逼
|
16
qsmd42 Dec 14, 2021 治标不治本 不如换个沟通渠道吧 网球新闻都是用 imessage 或者 tg 发给朋友的
|
17
shakoon Dec 14, 2021 @tabris17 #9 我觉得你这个靠谱,每一帧都很短,不影响人眼识别,但可轻易干翻机器。但是问题是,现在已经有使用这种方式截图的软件了吗(无论手机 app 还是 pc 软件)?
|
18
Zy143L Dec 14, 2021 via Android 把图片转过来,再打上几条斜纹。 然后正过来再写一些无关痛痒的文字。
|
20
ekidona Dec 14, 2021 via iPhone 做过一段时间 OCR , 比较容易实现的 attack 是改变文字的阅读方向,比如从下往上读,从右往左读。当然这种方法要求你的文字有多排。
|
21
1002xin Dec 14, 2021 敏感的东西,去 TG 聊吧
|
22
Jooooooooo Dec 14, 2021 人能读的东西机器总是可以读的, 成本问题.
|
23
Muniesa Dec 14, 2021 via Android 文字中间插入其它字,用不同颜色区分有效文字和无效文字
|
24
KaronV Dec 14, 2021 via Android 把图片转成 base64 发出去(
|
25
fqzz Dec 14, 2021 没有针对 ocr 的对抗网络吗
|
26
kkocdko Dec 14, 2021 via Android 记得之前百度贴吧上有广告机器人,为了逃避审查把图片旋转一个随机角度
|
27
virtual2019 Dec 14, 2021 via iPhone 事证实明,文字的序顺不响影阅读
|
28
qsmd42 Dec 14, 2021 @shakoon
@tabris17 试了下手动制作的效果 https://imgur.com/4BmLIJr 两张图 交替竖向盖住两行字 设置的一般 gif 支持的最高 50 帧 每帧 20ms 网页上显示效果感觉帧率完全达不到 保存到手机上看帧率是够了 但是 blingbling 的还是有点辣眼 不知道用视频的会不会好一点 |
29
johnsona Dec 14, 2021 via iPhone 避免难 加什么噪点 我完全可以用加了噪点的有监督数据训练 但是应该能增加识别难度
|
30
meilaoban945 Dec 14, 2021 高级点的玩法 加对抗噪声
|
31
ciaoly Dec 14, 2021 via Android 对抗噪声+1
|
33
kujio Dec 14, 2021 打乱顺序,但人能一眼看出来内容的比如:
打 但 眼 内 如 [防]乱 人 看 容 : [止文]顺 能 出 的 [字识别]序 一 来 比 |
34
wa143825 Dec 14, 2021 我 lol 被封,截图发 QQ 空间都发不出去,采用了降低分辨率,部分字高斯模糊,发出去了。
试过反色,倾斜,没什么用 |
35
zhoulin Dec 14, 2021 一个笨办法,把图片放到 Excel 表格里面,再把表格发给要看的人
|
36
chibop Dec 14, 2021 就咪让咪压咪力咪
喘咪一咪口咪气咪 给咪它咪机咪会咪 跟咪着咪音咪乐咪 将咪爱咪写咪成咪 一咪段咪过咪去咪 只咪留咪下咪对咪的咪记咪忆 嘿 |
37
JensenQian Dec 14, 2021 发自己的图床上,发链接给别人呗
|
38
jatsz Dec 14, 2021 记得看过一个 AI Introduction ,说是有一些图片可以让基于机器学习的图片识别失败。随手搜索了一下: https://www.theverge.com/2017/4/12/15271874/ai-adversarial-images-fooling-attacks-artificial-intelligence
可以考虑在图片里加上加上这些示例图片,看看能不能骗过 AI 。 |
39
Eytoyes Dec 14, 2021 研表究明,汉字的顺序并不定一能影阅响读,比如当你看完这句话后,才发现这里的字全是都乱的
|
40
z1113456051 Dec 14, 2021 去除大部分字的下面一半
|
41
GeruzoniAnsasu Dec 14, 2021 |
42
murmur Dec 14, 2021 以前都是把图倒转 180 度发,现在不知道了,再以后是 gif 不循环播放扔最后一帧,再就是拼图了,整个拼图指向一个微信公众号
|
43
yaphets666 Dec 14, 2021 换奇怪字体即可,OCR 也是训练出来的,训练的模型里没有你选用字体的语料即可
|
44
IGJacklove Dec 14, 2021 换平台是最好的选择,在这斗智斗勇最后发现只是在浪费时间罢了.建议尝试一下 telegram.
|
45
gps949 Dec 14, 2021 加密?
|
46
cmdOptionKana Dec 14, 2021 不要企图用技术解决非技术问题,以免赢了技术,炸了账号。
|
47
tabris17 Dec 14, 2021 |
49
gps949 Dec 14, 2021 t/661350
|
50
zlowly Dec 14, 2021 文字带下划线可以极大增加 ocr 识别的错误率
|
51
littlewing Dec 14, 2021 参考各种验证码
|
52
k8ser Dec 14, 2021 shi z bu 行 你 jiujiujiujiujiu zhe Yang :< BI 敬 Direct PhD in (你 XX 我 xx eng 哈哈) Elementary School
|
53
haiironezumi Dec 14, 2021 建议找黑盒对抗攻击的顶会论文代码,复现代码,对某社交平台进行对抗攻击。你这样不仅可以不被 OCR 识别出来,你甚至还能发一个 workshop ,针对 xxx 平台的黑盒对抗攻击。
|
54
lakehylia Dec 14, 2021
最简单,发密文就行了啊。用 zip 压缩加密一下,把文件和密码发给你朋友
|
55
Thiece Dec 14, 2021 镂空字永远的神
 |
56
1343EFF Dec 14, 2021 谐和反试⼀试
|
57
EchoDeveloper Dec 14, 2021 我觉浮你们啊,你们
溅藤觉你们新阗界还槩学 子-个,你们非常熟然西方的这- value 。你们空意还 too syeaLlrs9 ,万食这忘 戮笀 诉你行我是身经三城了,级得多了!啊, 西方购娜 -个國家我没去过?媒佐他们 你们要知道,美壁的华菜式,河行出光(你们了不务 道高劉 哪垒去了。啊,强娱俯 笑风金!两以讠 还是要炱高会二的知识水平!衡戏的忘乐 而 1 識得附? macos 自带 ocr 识别内容 |
58
EchoDeveloper Dec 14, 2021 |
59
unco020511 Dec 14, 2021 你避免 ocr,那用户体验也会变差啊
|
61
zhuawadao Dec 14, 2021 |
62
Greatshu Dec 14, 2021 这有何难,倾斜虚焦拍屏
https://s6.jpg.cm/2021/12/14/LVScKw.jpg |
63
yankebupt Dec 14, 2021 都不要争了,不从根本(制度)上解决问题,小聪明永远玩不过的
整个5毛钱的神经网络判断下可能是文字的图片 再整个5毛钱的 OCR 加5毛钱的判断看能不能读出任何白名单文字 不符条件的全部拒收 上述办法全都得失效。 |
64
yankebupt Dec 14, 2021 好在现在人还比较理性觉得不值得为审核率这种破事花一块五。
|
65
marcojbk Dec 14, 2021 via iPhone 转换成双拼码,ulpb 。nihcya ,wouiuabi
|
66
Overfill3641 Dec 14, 2021 @Greatshu #62 👍,只要人也看不清,软件就无从下手。😆
|
67
Zien Dec 14, 2021 via iPhone 很难,我测试过倒着、镜像、换字体都不行,有时候加个彩线自我安慰吧, 即使不审查,被他们整天 OCR 也怪恶心的,万一图片里有私人信息,不知道是不是又被他们收集乱放泄漏了。
|
68
dream7758522 Dec 14, 2021 via Android ┏━┯━┯━┯━┯━┯━┓
┃在│,│文│,│把│竖┃ ┃朋│竖│字│你│文│排┃ ┃友│排│长│可│字│文┃ ┃圈│文│度│以│变│字┃ ┃。│字│与│自│成│生┃ ┃ │主│边│定│竖│成┃ ┃ │要│框│义│排│器┃ ┃ │应│类│竖│效│帮┃ ┃ │用│型│排│果│你┃ ┗━┷━┷━┷━┷━┷━┛ |
69
ByteCat Dec 14, 2021 把图片反过来(
|
70
khaki Dec 14, 2021 对抗攻击了解一下
|
71
feigle Dec 15, 2021 via Android Windows 自带画图工具,水平翻转 180 度,对方收到后,再做同样操作即可
|
72
ihciah Dec 15, 2021 所有现在 work 的方法都可以做成生成器拿去喂网络,基本无解的。
从另一种角度理解,前面的图像处理的 trick 算是加密算法本身,而根据密码学的常识,不能试图通过保密算法本身是行不通的。 可以和朋友约定一个 pre-shared key (比如搞两张图,叠起来看才是最终图像,其中一张就是 key ),或者每次协商一下== |
73
dartabe Dec 15, 2021 你们就不怕这是个钓鱼的问题 ...
|
74
rb6221 Dec 15, 2021 最简单的就是翻转 180 度 微博上很多人发图就是这么干的
|
75
shakoon Dec 15, 2021 @tabris17 #9 @qsmd42 #28 我也试了一下,发现 gif 是支持最短 10ms 一帧的。但是受限于设备的处理速度,即便设置 10ms ,理论上已经是 100fps 了,但是人眼看起来依然严重不流畅(我还发现手机的显示效果意外的优于 PC )。当然如果深入研究,对栅格的绘制和帧率进行优化,应该会有较大的质量提升
https://s2.loli.net/2021/12/15/4qlHjLSu1sh9x5o.gif https://s2.loli.net/2021/12/15/UbJ89IM6GkxNKg7.gif |
78
huohei Dec 15, 2021 via iPhone
幻影坦克 ocr 里图 但是人看的是表图
|
79
mostkia Dec 15, 2021
研表究明,汉字的序顺不一定能响影读阅的体验
|
80
qinxi Dec 15, 2021
就怕没提示, 然后被带走.何止账号炸,人都炸了
|
81
sl0000 Dec 17, 2021
对于苹果设备,可以利用这个漏洞 https://www.da.vidbuchanan.co.uk/widgets/pngdiff/
|
82
sl0000 Dec 17, 2021
这个 Apple 通过 OCR 识别不是 Apple
|
83
S1ngleton Mar 6, 2022
可以试一下这个: https://github.com/Leisurelybear/ocr-bye
虽然界面简陋,后续准备加更多内容,包括点线之类的 这是 Demo 页面: https://leisurelybear.github.io/pages/ocr-bye/index.html |