V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
jingwentian
V2EX  ›  问与答

问一个关于垃圾信息过滤的问题

  •  
  •   jingwentian · 2014-02-10 08:36:09 +08:00 · 2296 次点击
    这是一个创建于 3958 天前的主题,其中的信息可能已经有所发展或是发生改变。
    比如在发帖或者回复中出现一些垃圾信息:

    1. 我要上春晚场外抽奖活动是真的吗(欢迎致电)℡ 0105-6705152分别由人工接听!网上预订值得您的信赖!为方便旅客取票,铁路部门在全国较大车站设置专门取票窗口,其他车站和代售点也将采取增加窗口、设置专门窗口等举措。

    2.(400-0117077)订票,改签,退票: (400-0117077) 受 理 :改签,改期,退票,特价预订火车退票价格查询业务

    3. 爸爸去哪儿发来消息说我的手机账号被抽中二等獎真的吗→颁獎热线(400-0117077分别由颁奖负责人王经理接听全程为您监督! )-记者拨打热线也已证实到!活动期间有很多不法分子正在冒充本栏目客服当中、获奖用户在进行领奖时请勿拨打其他均为陌生客服、 以免您被受骗!

    如果手工审核的话太麻烦, 有什么办法可以过滤掉呢?
    3 条回复
    jingwentian
        1
    jingwentian  
    OP
       2014-02-10 10:58:56 +08:00
    通过bad words 关键词过滤比较简单 但是灌水的人一般会用一些特殊符号之类的 有什么好办法么亲们?
    binux
        2
    binux  
       2014-02-10 11:07:25 +08:00
    你有多少数据?没有的话,就提高发帖回复门槛吧。。
    jingwentian
        3
    jingwentian  
    OP
       2014-02-10 11:10:25 +08:00
    @binux 是门户 资讯类的信息.. 数据很多 只能在已有数据的基础上 各种: 发-票 找-小-姐
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2337 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 21ms · UTC 15:43 · PVG 23:43 · LAX 07:43 · JFK 10:43
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.