首页
注册
登录
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请
登录
V2EX 提问指南
广告
V2EX
›
问与答
1000 万中文数据去匹配 4000 个关键字的问题
1cming
·
2022-02-18 19:59:59 +08:00
· 1248 次点击
这是一个创建于 1015 天前的主题,其中的信息可能已经有所发展或是发生改变。
如果 1000 万里的一条数据命中任意一个关键字则触发一段逻辑
要求性能跟效率足够好,大家有什么经验之谈吗?
经验之谈
触发
关键
命中
3 条回复
•
2022-02-19 04:12:06 +08:00
1
flysp
2022-02-18 21:48:30 +08:00
敏感词屏蔽的方案就够了,4000 个关键字建立一棵搜索树;再用数据去搜索就🆗
2
hannibalm
2022-02-18 21:52:03 +08:00 via Android
数据量不大,4000 关键字做 set ,循环读 1000 万去 set 查找
3
ooh
2022-02-19 04:12:06 +08:00
分词 字典树
关于
·
帮助文档
·
博客
·
API
·
FAQ
·
实用小工具
·
2765 人在线
最高记录 6679
·
Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 24ms ·
UTC 09:44
·
PVG 17:44
·
LAX 01:44
·
JFK 04:44
Developed with
CodeLauncher
♥ Do have faith in what you're doing.