V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
Dora112233
V2EX  ›  程序员

有无爬虫大佬

  •  
  •   Dora112233 · 2025 年 3 月 5 日 · 3061 次点击
    这是一个创建于 312 天前的主题,其中的信息可能已经有所发展或是发生改变。
    • 最近要做一个需求,输入 某 88 店铺地址 需要拿到店铺内所有商品详细信息
    • 现在使用的 playwright+camoufox 一直弹滑动验证还一直失败,虽然有时候能成功但效率非常低
    • 有无做过的大佬处理过这些吗
    26 条回复    2025-03-07 08:09:37 +08:00
    ynkkdev
        1
    ynkkdev  
       2025 年 3 月 5 日
    输入 某 88 店铺地址 需要拿到店铺内所有商品详细信息

    这个需求的数据,已经国内头部难度了
    freewind
        2
    freewind  
       2025 年 3 月 5 日
    能做成的估计在吃公家饭
    Dora112233
        3
    Dora112233  
    OP
       2025 年 3 月 5 日
    @freewind 不会啊,好多第三方服务商 只不过太贵,不想花钱
    Dora112233
        4
    Dora112233  
    OP
       2025 年 3 月 5 日
    @youngce 据说 pdd 和某团才是最难的
    uibobo
        5
    uibobo  
       2025 年 3 月 5 日
    哪些第三方我想知道
    wangzi1993
        6
    wangzi1993  
       2025 年 3 月 5 日
    用 RPA 抓会不会好点
    daodao
        7
    daodao  
       2025 年 3 月 5 日
    某 88 网页 DOM 命名 经常会变化策略,如果只是满足一时需求还算容易,你出价 帮你实现。
    mumbler
        8
    mumbler  
       2025 年 3 月 5 日
    大模型时代,只要能显示出来,就抓得到,效率的问题
    Dora112233
        9
    Dora112233  
    OP
       2025 年 3 月 5 日
    Dora112233
        10
    Dora112233  
    OP
       2025 年 3 月 5 日
    @daodao 老板不想出钱😮‍💨
    danbai
        11
    danbai  
    PRO
       2025 年 3 月 5 日
    又不愿意花钱 又不愿意花时间 怎么搞
    eluotao
        12
    eluotao  
       2025 年 3 月 5 日
    能拿电商数据,这个价格不贵。让你老板花钱吧。
    gam2046
        13
    gam2046  
       2025 年 3 月 5 日
    不想出钱,讨论就结束了。

    总不会想着有爬虫大佬给你白嫖吧。

    而且你找到的大佬,报价,大概率会比这些服务商更贵,定制,需要额外的成本。

    这些服务商依靠销量已经摊平了很多研发成本。
    luckyc
        14
    luckyc  
       2025 年 3 月 5 日
    你不会想白嫖大佬吧?
    hubaq
        15
    hubaq  
       2025 年 3 月 5 日
    @mumbler 笑死,大模型做不了爬虫。
    hubaq
        16
    hubaq  
       2025 年 3 月 5 日
    输入 某 88 店铺地址 需要拿到店铺内所有商品详细信息

    未登录情况下一天拿到 1W 条数据阿里给奖金 2W
    单账号登录情况下一天拿到 3000 条数据阿里给奖金 3000
    YILSLIN
        17
    YILSLIN  
       2025 年 3 月 5 日 via Android
    @Dora112233 某团确实严格,我拿 BurpSuite 内嵌浏览器登了一下账号,直接给我封号了。。。
    manhere
        18
    manhere  
       2025 年 3 月 5 日
    怀念 V587 的提示。。。这事的难度在于没法一劳永逸,永远需要和反制斗智斗勇

    爬虫大舞台,号多你就来
    dbow
        19
    dbow  
       2025 年 3 月 5 日
    做大了淘宝会起诉你,现在没有肉身在国内的商家敢这么干
    zeusho871
        20
    zeusho871  
       2025 年 3 月 6 日
    不要用 playwright ,官方版本的 playwright 会被检测,用 Drissonpage 或者 undetected-playwright
    249239432
        21
    249239432  
       2025 年 3 月 6 日
    做这个全网采集店铺数据的一年几千万收入,会告诉你方法么?
    lasuar
        22
    lasuar  
       2025 年 3 月 6 日
    你这个问题前段有时间有人问过,后来找帖子,404 了,连账号都 404 了。小伙纸,不要随时想着白嫖。
    feiniu
        23
    feiniu  
       2025 年 3 月 6 日
    好多公司就靠这数据活下来,这是能随便告诉别人的么
    himly1
        24
    himly1  
       2025 年 3 月 6 日 via Android
    试试 bright data
    CC11001100
        25
    CC11001100  
       2025 年 3 月 6 日
    @Dora112233 #10 6
    pureGirl
        26
    pureGirl  
       2025 年 3 月 7 日 via iPhone
    不就是靠风控吗,胆子大多搞几个帐号
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2835 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 11:57 · PVG 19:57 · LAX 03:57 · JFK 06:57
    ♥ Do have faith in what you're doing.