V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
snowhs
V2EX  ›  问与答

几条垃圾短信,想听听大家的意见如何从中提取关键词

  •  
  •   snowhs · 2014-03-26 22:46:04 +08:00 · 2727 次点击
    这是一个创建于 3889 天前的主题,其中的信息可能已经有所发展或是发生改变。
    关键词是给我的自用反垃圾短信应用 https://github.com/snow/sahara 用的

    1号
    ---
    在3.15国际消费者权益日到来之际,向您致以节日的问候!新消法,新权益,新责任。倡导文明消费,增强消费维权能力,期待大家行动起来。省消协

    2号
    ---
    [成] [发]
    [都] [票]
    13612969603 陈


    其中,省消协就只发过这一次,下次发恐怕是明年,所以提取"省消协"作为关键词,也不是不可以...
    而2号,我现在用的匹配模式是短信内容中有"票" && 有电话号码或者URI. 但是曾经遇到过spamer用"嘌"来代替"嘌"。

    大家有没有更好的想法?

    PS: 有没有比`问与答`更适合这个topic的节点?
    6 条回复    1970-01-01 08:00:00 +08:00
    wklken
        1
    wklken  
       2014-03-26 23:25:28 +08:00
    跟邮件spam差不多吧?
    感觉还是去弄个全一点的垃圾短信集合,贝叶斯搞一把
    ETiV
        2
    ETiV  
       2014-03-26 23:28:05 +08:00 via iPhone
    非通讯录里的号码发来的含有手机号的消息,进黑名单?
    creamiced
        3
    creamiced  
       2014-03-27 00:13:28 +08:00
    赞同一楼 单纯的关键字容易误伤,还是参考垃圾邮件处理比较好。
    另外感觉现成的一些app做得比较好,因为用户基数大,可以靠用户举报。
    casparchen
        4
    casparchen  
       2014-03-27 04:26:19 +08:00 via iPad   ❤️ 1
    第一条,倡导
    snowhs
        5
    snowhs  
    OP
       2014-03-27 19:51:16 +08:00
    @ETiV 消息含有某个关键词并且含有手机号或链接,才被过滤。
    snowhs
        6
    snowhs  
    OP
       2014-03-27 19:53:28 +08:00
    @wklken 值得一试。

    @creamiced 反垃圾短信应用需要一些很关键的权限,我不太想把这些权限授予不开源应用。


    @casparchen 已添加。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3780 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 10:32 · PVG 18:32 · LAX 02:32 · JFK 05:32
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.