V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
myforgame
V2EX  ›  物物交换

求 1688 爬虫, Python 写,无需界面,只要脚本

  •  
  •   myforgame · 2019-07-18 15:47:01 +08:00 · 1297 次点击
    这是一个创建于 1954 天前的主题,其中的信息可能已经有所发展或是发生改变。
    需求场景:
    1、输入关键词,如“电脑”
    2、获取总页数
    3、进入每个分页
    4、进入每个商品
    5、进入“联系方式”页面,获取公司名称、联系方式
    6、将信息存入本地文件

    其他:
    Proxy 可以支持, 也可以不支持,不支持的情况, 需要:
    1、能拿到总页数
    2、至少能爬一页(搜索结果)数据

    费用:
    预计改为 1~2 天内完成,费用 1000~1500 元

    ---

    有兴趣站内信联系
    10 条回复    2019-08-01 09:34:01 +08:00
    cdwyd
        1
    cdwyd  
       2019-07-18 15:52:27 +08:00
    并没有站内信,如果总页数和第一页的话 这个价格可以考虑
    1069401249
        2
    1069401249  
       2019-07-18 16:45:05 +08:00
    我我我举手
    yankebupt
        3
    yankebupt  
       2019-07-18 17:19:15 +08:00
    现在一个手机号只能换取 1688 一个关键字的第一页的数据了么……再多了就要验证码地狱了么……可怕……
    cdwyd
        4
    cdwyd  
       2019-07-18 18:14:03 +08:00 via Android
    @yankebupt 刚试了下必须登录。。
    yankebupt
        5
    yankebupt  
       2019-07-18 18:18:42 +08:00
    嗯。其实本来提升反爬强度对他自己一点好处都没还会让用户反感,但后来发现反爬可以诱使部分人去买他自己的大数据分析服务之类后,就开始变本加厉了 233......
    exceloo
        6
    exceloo  
       2019-07-18 18:46:48 +08:00
    爬慢点不可以吗
    sep1025
        7
    sep1025  
       2019-07-19 11:12:24 +08:00
    一定 python ? js 写 ok 吗?
    myforgame
        8
    myforgame  
    OP
       2019-07-19 14:23:21 +08:00
    感谢各位,已找到合适的人, 结贴。
    maybedk
        9
    maybedk  
       2019-07-19 15:07:49 +08:00
    @myforgame 你好,我来晚了。刚用 scrapy 写好了一个。可以给个联系方式吗?没有站内信
    danmu17
        10
    danmu17  
       2019-08-01 09:34:01 +08:00   ❤️ 1
    @yankebupt 本质上还是筛掉因为数量巨大而破坏力过大的业务玩家,毕竟视他们为整体的话就根本不是爬虫而是 DDOS 了。我在的国家因为法制规范所以游戏规则就和中国完全不同。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2797 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 07:32 · PVG 15:32 · LAX 23:32 · JFK 02:32
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.