V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
yielder
V2EX  ›  问与答

求助抓取斗鱼直播弹幕问题

  •  1
     
  •   yielder · 2015-05-16 20:49:28 +08:00 · 4307 次点击
    这是一个创建于 3472 天前的主题,其中的信息可能已经有所发展或是发生改变。

    各位V友有尝试过去抓斗鱼的弹幕么。。

    斗鱼的似乎不像B站那样把弹幕放在一个xml上比较好抓

    那个chatRoom.js我也看不出什么名堂

    console里滚着类似 try { flashtoXML(console.log("弹幕……保活消息 时间戳=2301417 time =00:12:30.083")) ; } catch (e) { "<undefined/>"; }
    的信息。但是我不知道flashtoXML是从哪来的。。

    抓这种实时的弹幕有什么好方法么。。

    11 条回复    2015-05-16 23:21:42 +08:00
    m939594960
        1
    m939594960  
       2015-05-16 21:04:37 +08:00 via Android
    试过貌似flash调用的js
    yangff
        2
    yangff  
       2015-05-16 21:05:32 +08:00
    从swf来的.
    yielder
        3
    yielder  
    OP
       2015-05-16 21:07:23 +08:00
    @yangff 难怪我把swf一删弹幕就不滚了。。。
    evlos
        4
    evlos  
       2015-05-16 21:52:51 +08:00 via iPhone
    解析 SWF 吧
    laoyuan
        5
    laoyuan  
       2015-05-16 21:55:55 +08:00
    666666666
    iloveayu
        6
    iloveayu  
       2015-05-16 22:47:38 +08:00
    用selenium搞,简单粗暴,虽然是种非常low的方式。
    bengol
        7
    bengol  
       2015-05-16 22:49:27 +08:00
    请教下,弹幕抓取下来的数据主要可以做什么呢?
    yielder
        8
    yielder  
    OP
       2015-05-16 23:11:21 +08:00
    @bengol 那些6666应该没什么用。。我看到某主播在roll东西,水友基本上发的都是手机号,我想要能把这么多手机号抓下来应该有用,就是这样。。主要还是闲着无聊。。。
    抓这个涉及到什么swf解析什么的,感觉有点复杂了。。
    ETiV
        9
    ETiV  
       2015-05-16 23:12:32 +08:00 via iPhone   ❤️ 1
    用Wireshark抓包,看他的tcp包吧……

    我用nodejs做的,tcp连接上之后做on data的监听即可。还需要定时发心跳包,没记错的话,flash里应该是45秒。

    斗鱼的弹幕文本协议需要解析一下,不是xml或者json。我当初是看着flash的字节码实现的解析方法…
    loveuqian
        10
    loveuqian  
       2015-05-16 23:13:39 +08:00 via iPhone
    斗鱼不是有个弹幕助手么?要不在那试试?
    loveyu
        11
    loveyu  
       2015-05-16 23:21:42 +08:00   ❤️ 1
    如果你可以自己写个TCP连接到斗鱼的服务器。然后你就可以获取到弹幕还有消息通知之类的,前提是有一个登陆操作,自己抓包分析应该不难,返回的数据是一个我看着很不爽的的编码方式,各种@在中间。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   958 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 22:35 · PVG 06:35 · LAX 14:35 · JFK 17:35
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.