这是一个创建于 2755 天前的主题,其中的信息可能已经有所发展或是发生改变。
有 500 条中文字符串需要在 13 万条的备选数据里检索相似度最高的五条,请教大佬们有好的实现方法吗?目前的思路是用 bk tree 来做,不知道是否可行?
3 条回复 • 2017-05-12 00:43:10 +08:00
|
|
1
valkyrja 2017-05-11 22:25:17 +08:00 via Android
标题好像打错了😂是中文近似匹配
|
|
|
2
luxinxin 2017-05-12 00:33:06 +08:00 via iPhone
得看近似是什么样的近似了,编辑距离是一种近似,同义词也是近似,两者实现的难度完全不一样
|
|
|
3
valkyrja 2017-05-12 00:43:10 +08:00 via Android
@ luxinxin 谢谢大佬 我指的就是编辑距离 不需要同义词 所以想到了 bk 树 不知道中文用这个方法靠谱吗
|