V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
FlyingBackscratc
V2EX  ›  程序员

手机 APP 会监听用户对话用来做大数据推荐的现实例证

  •  1
     
  •   FlyingBackscratc · 310 天前 · 8808 次点击
    这是一个创建于 310 天前的主题,其中的信息可能已经有所发展或是发生改变。

    说实话我以前也是完全不相信手机会通过监听的方式来进行大数据推荐的,但是今天是不服不行了。

    今天快下班的时候在摸鱼,同事聊说过几天想买个手机壳,然后新款如何如何好。结果刚聊完天,我闲的没事又刷新了一下 B 站推荐,“手机壳横向对比推荐”的视频赫然蹦出来,吓了我一跳。

    我个人保证,我此前对手机壳这个门类完全没有兴趣,我甚至对相关领域(手机、壳)也几乎没有兴趣,我的日常观看和推荐列表里不包含任何手机测评相关的内容。我和朋友只在聊天中提到了手机壳这个关键字,我百分百确定我没有通过输入法或其他任何方式将其输入到设备中。并且我保证这不是特殊巧合,在聊天前我已经刷了半小时 B 站,推荐是完全正常的,如果说因为附近用户浏览了手机壳而给我这个使用同样 IP 的用户推荐手机壳的话,为什么之前的半小时里从来没刷到呢。

    我以前觉得所有的“聊天里提到了 XXX ,之后打开微信立马看到 xxxx 的推荐”的神迹,都是通过读取剪切板啊等等类似的行为实现的,和聊天本身无关,因为我觉得工程上完全不可实现,手机既没有明显的申请麦克风权限的行为,也没有明确的录音加速耗电的行为。再者,实时语音分析需要的算力大面积铺开是否现实也是个疑问。

    但是事实也是摆在眼前,实在是不好解释了。如果说 B 站是因为同 IP 的其他用户访问了某内容而推荐给我,为什么以前从来没遇到过这种情况。我在家没有被邻居的推荐列表影响,以前在学校,学校那么多人,也没听说过谁到学校后推荐列表就乱套了的。

    细思恐极

    82 条回复    2024-01-23 04:51:37 +08:00
    whatwhowhenwhere
        1
    whatwhowhenwhere  
       310 天前   ❤️ 1
    先不说有没有。

    如果非要实现确实可以,毕竟定制低功耗的某些功能芯片是有的。
    tyzandhr
        2
    tyzandhr  
       310 天前 via Android
    有可能是你同事搜了手机壳,推荐给附近认识的人的
    FlyingBackscratc
        3
    FlyingBackscratc  
    OP
       310 天前
    @tyzandhr 我们有微信好友,我在使用 B 站 APP ,他刷了半天小红书。如果走你这个链路的话,说明是小红书获取了信息,然后走腾讯的链路,最后又被推给 B 站,然后这个过程在一次聊天间完成?
    miyuki
        4
    miyuki  
       310 天前 via iPhone
    可能用的广告渠道有共享

    连过同一个 wifi (两个手机可搜索到 wifi 的 mac 一样)
    蓝牙搜索列表
    社交关系(分享给好友的链接是带小尾巴的)

    能关联的方式挺多的
    cest
        5
    cest  
       310 天前   ❤️ 1
    唤醒 24x7 待机的指令音除了 hey google 也可以是

    我要
    我想
    买这
    买那

    各种买东西前讨论会说到的词

    被指令唤醒就尝试执行
    被许愿唤醒就根据愿望推广告
    f2kandlove
        6
    f2kandlove  
       310 天前 via iPhone
    手机相关设置没有麦克风的调用记录?
    Cheons
        7
    Cheons  
       310 天前 via Android   ❤️ 9
    广告联盟,相同私密 WiFi 下推送相似的东西,基操了吧。
    同 WiFi 下用户数量太大会判定为公共网络,反而不会乱推送。

    前几年合租平台找的房子共用网络,淘宝天天给我推自慰棒。
    testonly
        8
    testonly  
       310 天前
    手机 APP 我不知道,我说个电脑的。
    前段时间,有贴在 V2 聊热水器,我电脑点进去看,有人推荐小厨宝,然后第二天值得买 APP 我就看到小厨宝,在那之前我连小厨宝是什么都不知道。以前也有类似情况,只是当时没那么确定。
    问题来了:
    手机没装 V2 的 APP
    电脑的值得买不登录,电脑值得买跟手机 APP 的推荐内容是完全不一样的。
    电脑看境外要科学的跟看境内的用不同浏览器,也就是说值得买跟 V2 是完全两个浏览器。
    手机因为流量够,几乎从不连 WIFI 。
    电脑比许多人都简单,我电脑连 QQ,VX 也不装,防毒也是 COMODO 非国内的,也没各种管家,,就最简单的办公软件。

    那么,怎么做到的?
    PS:看完这个贴,有装值得买的看看会不会给你推荐小厨宝。
    RiddMa
        9
    RiddMa  
       310 天前
    协同过滤,搜广推基本算法。
    locoz
        10
    locoz  
       310 天前
    简单的意图预测正好撞概率撞到了而已,只要你没有与社会完全隔离,就必然会因为其他人的一些细节特征关联到你这来。而且广告联盟是跨公司的,不是同一个 APP 一样能给你推,只要在大数据分析结果中你和他存在关联关系就行了。
    OPUK
        11
    OPUK  
       310 天前 via iPhone
    广告联盟 v2 月经贴了
    luckykong
        12
    luckykong  
       310 天前   ❤️ 2
    你可以让你同事多跟你说些其他商品,多说些他想买的,而你不想买的东西。
    在多找几个同事试试。
    你试试最后几个能成功。 难道手机上这么辛苦安装的软件、硬件,就为了你们两个的这一次对话?生效频率这么低,值得么?

    别想多了,其实就是现在的推送策略,偶尔成功了一次罢了。。

    就像你说的“如果说 B 站是因为同 IP 的其他用户访问了某内容而推荐给我,为什么以前从来没遇到过这种情况。我在家没有被邻居的推荐列表影响,以前在学校,学校那么多人,也没听说过谁到学校后推荐列表就乱套了的。” 之前没遇到过,纯粹是因为推送失败了,或者没捕获到你的关联而已。 你半小时前刷的推荐里,也充满了你附近其他人的偏好,只是你不知道、他也不知道而已。
    ruimz
        13
    ruimz  
       310 天前 via iPhone
    “推荐是完全正常的”里这个“正常”可以仔细描述一下吗?
    意思是首页的视频都是你的关注的 up 主的吗?那么在此之前,刷完了所有已关注 up 主的最新视频后会有什么推荐呢?
    Yuanlaoer
        14
    Yuanlaoer  
       310 天前
    说了这么多,都不提用的啥手机
    FlyingBackscratc
        15
    FlyingBackscratc  
    OP
       310 天前
    @ruimz 我的兴趣是宠物区,美食区和 Vtb 。这种广告很明显的好吧,一看到就会感觉怪了。你刷了半天也刷不出个产品,然后还要评测,就这还不让人 PTSD ?我天天看阿猫阿狗,也没听说哪天给我推送个狗链销售评测视频

    @Yuanlaoer 华为+鸿蒙,能不能查应用权限调用记录我不知道,MIUI 我知道是能调的,但我盲猜不是录音实现的,只能说是魔法了。
    KeySouundsFan
        16
    KeySouundsFan  
       310 天前   ❤️ 2
    反过来想,其实它推送了无数次但没有一次引起你的注意,这种情况占了绝大多数,直到碰巧你发现了它
    qzydustin
        17
    qzydustin  
       310 天前
    例证一点说服性都没有。16#说的很有道理。
    shyangs
        18
    shyangs  
       310 天前   ❤️ 5
    小愛同學 / Hey Siri / OK Google 不就是 7x24 待機的喚醒音,為什麼會覺得語音分析不可能?

    喚醒音「想買」,喚醒手機,記錄「手機殼」(「小愛同學」 距離春節還有多久)現代手機科技明明就做得到.
    abc8678
        19
    abc8678  
       310 天前 via Android
    记得以前刚换手机,同时用了新的手机卡,不连接家里的 WIFI ,知乎首页的内容全是陌生的。直到连接了家里的 WIFI ,突然就全变成看腻的那些了,甩也甩不掉
    allplay
        20
    allplay  
       310 天前 via Android   ❤️ 3
    @OPUK 还有很多人不信,继续月经
    zplgm5tI14a3k2ui
        21
    zplgm5tI14a3k2ui  
       310 天前   ❤️ 1
    不必恐慌,Facebook 。Instagram 。X 。YouTube 都是这样的
    smlcgx
        22
    smlcgx  
       310 天前 via iPhone
    联网设备不是信息孤岛,反思一下为什么都管你索取通讯录权限
    psklf
        23
    psklf  
       310 天前
    监听是不可能的;
    肯定是别的方式;
    shijingshijing
        24
    shijingshijing  
       310 天前   ❤️ 1
    @testonly 你不会不知道现在的上网流量都打了 tag 的吧,这个本来是用来做 QoS 的,被国内运营商拿来搞各种骚操作。运营商的各种定向流量卡也是利用了这个原理,你访问特定的网站免流。

    很多通信的基础功能,都被运营商各种滥用,搞出了各种乱七八糟的东西,包括但不限于一键免密登录,SIM 卡套餐定向免流,0 级短信用来推广告,等等。
    sunnysab
        25
    sunnysab  
       310 天前
    @shijingshijing 免流的原理是按域名走代理吧……?
    abc2020988877
        26
    abc2020988877  
       310 天前
    这两天在抖音和淘宝搜了下大流量卡,回到微信朋友圈、公众号中间楼层广告全身电信、联通、移动大流量卡,而且会出现楼层线上中国移动卡,点进去是联通卡办理页面,“监听”无时无刻不在,没有隐私。
    visavisa
        27
    visavisa  
       310 天前
    这么多程序猿没有人知道怎么实现的?
    liprais
        28
    liprais  
       310 天前
    弱智儿童欢乐多
    一年产值上千亿,从业上百万的行业,没有一个人出来吹牛逼说他们做了,说明啥?
    说明人家根本不需要做这个就赚的盆满钵满,先不说能不能做,做出来你给钱啊?
    wheat0r
        29
    wheat0r  
       310 天前
    确实有利用重力加速度传感器进行监听的研究 https://www.ndss-symposium.org/wp-content/uploads/2020/02/24076-paper.pdf
    但是我不认为国内的 app 需要这么搞
    me1onsoda
        30
    me1onsoda  
       310 天前   ❤️ 1
    @liprais 为什么要说出来?自爆卡车?
    fredweili
        31
    fredweili  
       310 天前
    B 站推荐就这么一条么??个性化推荐一般都能关闭
    kernelpanic
        32
    kernelpanic  
       310 天前   ❤️ 2
    之所以没被人挖出代码, 是因为是芯片内部实现的, 甚至手机厂商都不知道
    监听的关键词矩阵是通过所谓的 GPS 星历更新功能下载的, 每隔一段时间会把触发的关键词上报
    网络请求是隐藏在所谓的正常功能里面的
    https://www.google.com/search?q=%E9%AB%98%E9%80%9A%E8%8A%AF%E7%89%87+izatcloud.net
    https://www.secrss.com/articles/54476
    Yuesh1
        33
    Yuesh1  
       310 天前
    前几天错把 Play 看成 Pay ,还在想为什么 Apple Music Classical 为什么订阅了全家桶还会收费,于是使用电脑 [Macos] 在 Google 上搜索了这个问题,这几天朋友圈的广告全是 [Apple 古典乐]
    me1onsoda
        34
    me1onsoda  
       310 天前
    @Cheons 啧啧。。女性需求也很旺盛。。
    sunv2v2
        35
    sunv2v2  
       310 天前
    孕妇效应
    limiter
        36
    limiter  
       310 天前
    广告联盟
    Ericality
        37
    Ericality  
       310 天前   ❤️ 2
    广告联盟 追踪参数 孕妇效应 大数据 ❌
    魔法 窃听 例证 ✔
    所以给你靠边的解释你是一个不回复也不探讨 但是和你观点类似的你倒是回复的积极
    我要是算法我也喜欢这样的 给他制造一个茧房 他会在里面不断内耗中下单
    首先你分享的链接都是带跟踪的 点击一次你俩就产生了关联 微信好友这个怎么追踪我不知道 但是我知道微信有 openid 也就是说他用任何 app 给你分享到微信 你点开了 你俩大概率锁死了(不是说强绑定 但是从那以后你俩的搜索浏览记录对对方会产生影响)
    而这个关系是给广告联盟的 而且是给多个广告连门的 所以你 3 楼的距离是完全成立的 不过没这么麻烦
    只需要 你们之前微信有过互动 小红书推给广告联盟的信息被联盟们分析后 当 b 站获取的时候就推给 b 站了 更笨不需要多链路都走一遍
    然后你凭什么说这个是广告呢 就我自己而言 b 站刷多了 他就会尝试在其中夹杂一些和你感兴趣不相关的内容 那为什么不能是手机壳横屏呢? 所以我说这也可能是孕妇效应
    此外我上面说额也不是全部途径 比如我有一个 b 站账号 A 登录在手机 一个 b 站账号 B 登录在 iPad 因为和对象共享大会员(B 账号) 在已经 24 小时开启规则过滤的情况下(理论上隔绝了已知的广告联盟连接 同时为了防止通过 ip 上传 直接屏蔽 https://ip:443 请求 且不在名单的请求一律走随机出口 避免 IP 一致) 我们的兴趣还是混杂的 虽然我的账号大部分都是我喜欢的 他的账号大部分都是他喜欢的 但是还是会混杂一些我/他完全不看的东西给对方 而我们因为是异地恋 平时也不会谈论这些 聊天用的是 imessage 输入法都是 iOS 默认的 那请问是如何被互相推荐的呢? 难道我也说是通过监听/输入设备的信息做推荐嘛? 未免离谱了吧? 所以我只能说更大概率是孕妇效应了
    dhb233
        38
    dhb233  
       310 天前
    @kernelpanic 看了第二个文章,这不是说没上传敏感数据吗。。。最敏感的就是 IP 地址了
    liprais
        39
    liprais  
       310 天前
    @me1onsoda 没玩过在线广告吧,自己想呗
    xFrye
        40
    xFrye  
       310 天前
    你太低估了广告联盟的能力了
    kernelpanic
        41
    kernelpanic  
       310 天前
    @dhb233 你用手机连电脑的热点, 然后 wireshark 看看就知道了
    hahiru
        42
    hahiru  
       310 天前
    广告联盟的话是互相共享用户偏好的。比如在京东搜索某个东西,在抖音就会刷到推荐广告。可能是你同事有和你重叠的部分。监听还是要求太高了,主要是成本划不来。
    zero0000
        43
    zero0000  
       310 天前
    其实是依据定位信息实现的,通过监听的手段实现太复杂,好比你在与一群同事聊天,定位信息匹配到接近的账号,数据提供到广告联盟,自动匹配账号最近购买的产品大类进行推送。不用管聊天的内容,只要赌概率问题就行了,力大飞砖,粗暴的很。
    ReZer0
        44
    ReZer0  
       310 天前
    广告联盟的数据共享,聊天软件、输入法、甚至附近网络等都可能成为推荐因素,根本用不到麦克风权限这些东西。况且要证明通过麦克风,除非是脱离手机现实交流被捕获,不然变量太多,你手机里安装的任何软件你的任何操作都会是推荐源。
    worldhandsomeboy
        45
    worldhandsomeboy  
       310 天前
    @locoz 表示并不是,上面已经说了,广告联盟,相同私密 WiFi 下推送相似的东西。
    BeforeTooLate
        46
    BeforeTooLate  
       310 天前
    @FlyingBackscratc #3
    广告联盟,管你小红书,还是腾讯还是抖音,只要获取都会共享
    时空同盟,你同事可能自己搜索了,他的输入法记录了,同步推广到例如使用同一办公室网络的用户..
    至于实时语音分析大数据推广,作为程序员的话,可能性多大你可以自己考量一下。
    czfy
        47
    czfy  
       310 天前
    有间营销公司在自己官网宣传会主动监听日常对话( We can identify buyers based on casual conversations in real time ),后来被媒体报道之后删文
    由于没有披露技术细节,所以不清楚是吹牛逼还是真能做到

    https://web.archive.org/web/20231214235444/https://www.cmglocalsolutions.com/blog/active-listening-an-overview
    gdfsjunjun
        48
    gdfsjunjun  
       310 天前
    其实我还是都打开个性化广告的。既然广告都关不掉,还不如给我推送些跟我相关的。反正我是这样想的。
    tramm
        49
    tramm  
       309 天前
    @Cheons 你知道我想听后面的故事的
    junkk
        50
    junkk  
       309 天前
    学过科学的都知道,要论证一件事情存在在相关性或者因果性,一个个例是不够的....
    xxx2023
        51
    xxx2023  
       309 天前
    监听技术肯定有,但你这个不好说是不是监听。非必要不用手机,用手机闲置时可以开启飞行模式。
    tangtang369
        52
    tangtang369  
       309 天前
    微信群聊亲测是有的 车友群讨论轮胎 微信朋友圈的广告就变成了轮胎
    cherbim
        53
    cherbim  
       309 天前
    只要你能大批量“复现”,我就承认,否则我就任务是“小概率事件”
    736531683
        54
    736531683  
       309 天前
    @shyangs 只是免唤醒会开个进程监控是否有唤醒词,有的话才开始录音。理论上如果长期监听,有语音录制和数据上传一定会露馅(包括发热,网络活动抓包,语音占用存储并不小),你们天天盯着会有厂商敢这么做?并且苹果是有明显的录音提示的(我相信苹果在安全方面的节操),显然厂商做不到隐蔽自己的活动。
    zhangsimon
        55
    zhangsimon  
       309 天前   ❤️ 1
    我之前也不信
    但有一次和同事面对面聊了一个非常小众的领域“网文写作”
    我俩平时也不看网文,所以也不会搜索这个关键词
    结果她打开淘宝就推荐了网文模版的商品…
    zhongjun96
        56
    zhongjun96  
       309 天前
    V2 程序员最少一半,大把大厂员工,真有这代码,早就发出来了吧
    willie1991
        57
    willie1991  
       309 天前
    普通用户应该不值得人家花这个钱。。
    chrawsl
        58
    chrawsl  
       309 天前
    实现方式很多,大数据推送其实不是精确打击而是区域覆盖,被推送的客户会从一堆商品里一眼看到自己感兴趣的那个,关联推送的方式有附近的人,和好友,基本靠 wifi ,定位以及好友关系就够了
    Knights
        59
    Knights  
       309 天前
    并不是窃听,而是系统内置了广告联盟的 sdk ,你的任何操作:
    亮屏、打开 app 、设置系统、输入法都会被收集然后上报

    安卓用这个看看就明白了,可以阻止 sdk 联网上报,无需 root:
    https://github.com/celzero/rethink-app
    me1onsoda
        60
    me1onsoda  
       309 天前   ❤️ 1
    @chrawsl
    @miyuki 不太理解。WiFi ,附近的人、好友等等这些关联方式真的有效吗?逻辑上说得通吗?能提高广告的准确推送度、回报率之类吗?广告厂商这么费劲巴拉搞这些意义是什么
    paopjian
        61
    paopjian  
       309 天前
    @me1onsoda 有枣没枣打两杆子, 广告商也不是生下来就会做推广的, 开脑洞想出来了肯定就会试试有没有效果. 甚至城市和农村的推广方法都不一样, 村里有人买个东西好用, 没准家家就都买了,这不就是附近的人推送的作用么
    skyrocketing
        62
    skyrocketing  
       309 天前   ❤️ 3
    icyalala
        63
    icyalala  
       309 天前
    V2 月经贴,每次科普似乎都没用。
    ProjectSky
        65
    ProjectSky  
       309 天前
    同一 WIFI 是有可能的。
    从不关注鱼竿之类的商品,但是淘宝莫名其妙冒出来过鱼竿的推荐
    结果家里还真有个爱钓鱼的,估计是家里有人搜索了相关的商品,后台判断同一 WIFI ,IP 地址一致之类的做统一推送
    anzu
        66
    anzu  
       309 天前
    @kernelpanic 「把触发的关键词上报」是哪来的描述?看文章只提到上传设备信息和标识。
    Damn
        67
    Damn  
       309 天前
    @psklf
    @liprais
    @Ericality https://www.ithome.com/0/745/767.htm
    有没有想过系统内置的语音助手呢?
    然后系统内置广告联盟,这一点很难么?
    llh880808
        68
    llh880808  
       309 天前
    可以怀疑厂商的良心,但不可以怀疑厂商趋利的本性

    如果剪贴板监听+孕妇效应可以实现绝大部分(为了不把话说死,只说绝大部分)精准到让人认为是”监听“的推荐,那么厂商就不需要使用成本更高,效率更低的监听方案
    GeminiAi
        69
    GeminiAi  
       309 天前
    @hahiru 十分赞同!!
    zplgm5tI14a3k2ui
        70
    zplgm5tI14a3k2ui  
       309 天前
    @liprais 线上广告兄弟玩的溜吗?海外的
    wegbjwjm
        71
    wegbjwjm  
       309 天前
    月经贴了,没人会承认的,棱镜爆出来前也没人信.
    butterls
        72
    butterls  
       308 天前 via Android
    没人提手机厂商自己的广告服务么,这个也会卖数据的吧
    v2yllhwa
        73
    v2yllhwa  
       308 天前 via Android
    @kernelpanic “监听的关键词矩阵是通过所谓的 GPS 星历更新功能下载的”
    来源请求?
    FlytoSirius
        74
    FlytoSirius  
       308 天前 via iPhone
    这都是程序员, 为什么不做点: 解包程序 apk ,反编译,分析源码, 这类能发现确凿根据的事情?
    FlytoSirius
        75
    FlytoSirius  
       308 天前 via iPhone
    别的行业在那猜测这些, 我可以理解, 可一堆程序员在这猜测手机程序的行为, 让人觉着很 low 很 low ...
    xiaoranj
        76
    xiaoranj  
       308 天前
    @Knights 我用的是这个 TrackerControl
    jeesk
        77
    jeesk  
       308 天前
    @FlytoSirius 收集语音,和摄像头没有实锤.
    不过, 如果是系统应用在后台调用摄像头是完全可以做到无感的.
    jeesk
        78
    jeesk  
       308 天前
    再说一个案例: 在便利店购买一盒牛奶和果汁. 使用支付宝支付后, 后面发现淘宝不断的推送牛奶和果汁的广告, 这个时候我才知道我的信息被便利店共享了.
    marktrains
        79
    marktrains  
       307 天前 via iPhone
    这个我觉得通过低功耗芯片可以实现,我亲身经历过一个是在 A 手机的 A 微信号上和别人聊天提到一个东西,立马在我的 B 手机 B 微信号的朋友圈刷到这个东西的广告,及其离谱
    Damn
        80
    Damn  
       307 天前
    @FlytoSirius
    @jeesk
    @xmaxance https://www.ithome.com/0/745/767.htm
    系统的语音助手表示毫无压力。
    psklf
        81
    psklf  
       307 天前
    @Damn #67 语音助手实时监控你的所有的声音不现实。
    真的有请 show 出证据
    OPUK
        82
    OPUK  
       306 天前 via iPhone
    @allplay 哈哈。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2592 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 28ms · UTC 04:46 · PVG 12:46 · LAX 20:46 · JFK 23:46
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.