V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
这是一个专门讨论 idea 的地方。

每个人的时间,资源是有限的,有的时候你或许能够想到很多 idea,但是由于现实的限制,却并不是所有的 idea 都能够成为现实。

那这个时候,不妨可以把那些 idea 分享出来,启发别人。
RangerWolf
V2EX  ›  奇思妙想

一个 idea: 用机器学习过滤掉你不想看的邮件

  •  
  •   RangerWolf · 2015-11-06 21:10:46 +08:00 · 3757 次点击
    这是一个创建于 3337 天前的主题,其中的信息可能已经有所发展或是发生改变。
    现在大部分邮件提供商已经过滤掉一部分的广告邮件, 但是很多时候还是收到很多自己不会进去看的邮件~

    自己做了一些机器学习跟 NLP 的项目,感觉可以训练一些模型,根据用户历史看过( y=1 )跟没看过(y=0)的邮件作为训练集训练出一个模型,过滤掉一部分用户不会点击看的邮件~


    不知道这种功能有人会喜欢吗?
    19 条回复    2015-11-07 19:11:13 +08:00
    9hills
        1
    9hills  
       2015-11-06 21:11:29 +08:00
    不看的邮件你收它干嘛。。
    zhangwei
        2
    zhangwei  
       2015-11-06 21:12:41 +08:00
    谷歌有个大概 400 人的团队在做这个事情。。。你一个人搞定了么 TAT
    RangerWolf
        3
    RangerWolf  
    OP
       2015-11-06 21:15:45 +08:00
    @zhangwei google 搞的是 for 全人类的,我做的只针对某个人 哈哈~
    主要是 google 要处理的东西很多, 这个东西调用一些开源类库的 api 就好了。 我已经站在巨人的肩上了
    RangerWolf
        4
    RangerWolf  
    OP
       2015-11-06 21:16:33 +08:00
    @9hills 反正我的网易邮箱各种推送消息啊~ 比如脸书也会跟我推送~
    yylzcom
        5
    yylzcom  
       2015-11-06 21:19:08 +08:00
    Google 应该已经实现了这样的功能,就是不知道效果是否符合楼主的预期
    因为在某邮件里看到“这封邮件在垃圾文件夹里因为你曾经放入垃圾文件夹里”/“这封邮件不在垃圾箱里因为你曾经阅读(打开?)类似的邮件”,用词肯定不准确,不是原话,但是大致如此哈。

    当时看到挺震惊的,国内的服务商连最基本的内容过滤都还做不好(光靠关键词进行内容过滤肯定做不好)。
    RangerWolf
        6
    RangerWolf  
    OP
       2015-11-06 21:30:33 +08:00
    @yylzcom 其实我虽然常用 gmail ,但是为了方便一直让网易代收进来的
    确实不知道 google 有这种功能~ 多谢!
    wissen
        7
    wissen  
       2015-11-06 23:47:10 +08:00
    就是和 Gmail 的 Important 标签差不多吧
    oott123
        8
    oott123  
       2015-11-07 00:29:58 +08:00 via Android
    _(:з」∠)_ 难道不是直接贝叶斯完事
    pupboss
        9
    pupboss  
       2015-11-07 00:47:27 +08:00
    阮一峰在 11 年就做完了,这算什么 idea
    chairuosen
        11
    chairuosen  
       2015-11-07 00:55:25 +08:00   ❤️ 1
    地球人会想 “万一过滤错了呢” ,所以每天还是要到垃圾箱翻一翻
    RangerWolf
        12
    RangerWolf  
    OP
       2015-11-07 08:21:47 +08:00
    @oott123 算是方法之一啊
    RangerWolf
        13
    RangerWolf  
    OP
       2015-11-07 08:22:24 +08:00
    @pupboss 自己的想法放出来就是怕这种自己孤陋寡闻再造轮子 多谢
    RangerWolf
        14
    RangerWolf  
    OP
       2015-11-07 08:22:44 +08:00
    @chairuosen 那 google 网易的邮件过滤 也有相同的问题啊
    haog
        15
    haog  
       2015-11-07 08:26:47 +08:00
    不看的退订或者过滤。这叫 human learning
    azuginnen
        16
    azuginnen  
       2015-11-07 09:26:40 +08:00 via Android   ❤️ 1
    pg02 年的贝爷撕
    zonghua
        17
    zonghua  
       2015-11-07 10:45:09 +08:00 via iPhone
    一点都不智能
    yiciyuansky
        18
    yiciyuansky  
       2015-11-07 18:36:22 +08:00
    这种算法只能过滤掉一部分订阅的邮件吧(就是有频率的那种),但是推送的广告才是大家真正不愿意看的邮件。。
    Changxu
        19
    Changxu  
       2015-11-07 19:11:13 +08:00
    感觉这个工作像在灌水(科研的角度),当然了一般也就广告不愿意看
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5458 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 30ms · UTC 08:29 · PVG 16:29 · LAX 00:29 · JFK 03:29
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.