V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
tongle
V2EX  ›  程序员

高速稳定的代理

  •  1
     
  •   tongle ·
    tongle · 2015-10-14 11:38:50 +08:00 · 8043 次点击
    这是一个创建于 3330 天前的主题,其中的信息可能已经有所发展或是发生改变。
    爬取网站信息时频率太高导致经常被封 IP 地址,找了一些代理但是效果都不太理想,大家有什么优质的代理推荐吗?
    36 条回复    2022-07-19 23:57:13 +08:00
    alect
        1
    alect  
       2015-10-14 12:11:06 +08:00
    开全局代理之后再开 goagent 去爬?
    boter
        2
    boter  
       2015-10-14 12:52:54 +08:00 via iPhone
    @alect 这是要伪装成 g 蜘蛛吗
    xfspace
        3
    xfspace  
       2015-10-14 12:53:43 +08:00 via Android
    马宝有卖
    pango
        4
    pango  
       2015-10-14 13:04:16 +08:00   ❤️ 4
    tor ,你值得拥有。
    我在 do 的 vps 上开 100 个 tor 实例,每小时重启 1/3 实例,于是就有了取之不尽用之不竭的 ip
    tongle
        5
    tongle  
    OP
       2015-10-14 13:26:48 +08:00
    @xfspace 某宝的稳定靠谱吗
    xfspace
        6
    xfspace  
       2015-10-14 13:28:19 +08:00 via Android
    @tongle 马宝的也不稳定...你只能手动扫了
    kmahyyg
        7
    kmahyyg  
       2015-10-14 13:30:53 +08:00
    @pango 怎么弄得?求教程?
    boter
        8
    boter  
       2015-10-14 13:36:41 +08:00   ❤️ 1
    @pango tor 的血就是被你吸干的,[doge]
    gzlock
        9
    gzlock  
       2015-10-14 14:07:28 +08:00 via Android
    @pango 求科普 tor
    cdwyd
        10
    cdwyd  
       2015-10-14 16:31:30 +08:00
    @pango 同求教程
    liufuyi
        11
    liufuyi  
       2015-10-14 16:33:56 +08:00
    @pango 求求求
    fchypzero
        12
    fchypzero  
       2015-10-14 16:33:57 +08:00
    ADSL VPS ,断开就换 IP ,一个地区少说一万多 IP ,足够了吧
    zscblowgod
        13
    zscblowgod  
       2015-10-14 16:47:25 +08:00
    hrvpn 这货感觉不错~
    yuzo555
        14
    yuzo555  
       2015-10-14 19:06:28 +08:00
    @fchypzero 求推荐
    blueeon
        15
    blueeon  
       2015-10-14 20:23:10 +08:00
    好像我知道有个团队正在做一个这样子的产品,针对的场景和你的需求还挺像,简单来说,是一个单入口,多出口的正向代理服务,出口可以自动更换 IP ,去访问你的目标 URL ;但是是收费的,好像是准备按次或者流量来收费,不知道现在开发到什么阶段了。。。
    pango
        16
    pango  
       2015-10-14 20:48:33 +08:00   ❤️ 1
    @kmahyyg 开 n 个 tor ,比如: tor --RunAsDaemon 1 --CookieAuthentication 0 --HashedControlPassword "" --ControlPort $your_random_port --PidFile tor$your_random_id.pid --SocksPort $your_random_socks_port --DataDirectory data/tor$your_random_id ,然后你就有了 n 个不同端口的本地代理啊,然后抓取程序随机选择一个就行了。
    pango
        17
    pango  
       2015-10-14 20:50:33 +08:00
    @boter 好吧,我去开少点,其实我也只是抓取的时候开一下啊,一般每次就一两个小时。[doge] 是什么意思?
    pango
        18
    pango  
       2015-10-14 21:14:08 +08:00   ❤️ 1
    刚刚去看了下 tor 的原理,“ Tor 的转发节点都是网络上的志愿者们使用自己的服务器和网络带宽建立起来的,如果通过 Tor 网络来进行巨额数据的传输,实在是非常的不厚道”。
    我决定放弃使用 tor 抓取大量数据了,多谢 boter 提醒,也请大家仅用这个方法来测试用,不要用作生产环境。
    在这里推荐另外一个方法:
    https://github.com/wenson/proxypool
    这个可以抓取各大 proxy 站点公布的 proxy ,经过测试有效性后存入 redis ,可以同时提供多达几百个有效 proxy ,可以自己写个 cronjob 每隔一段时间更新 proxy 库,用作抓取应该够了。
    Andy1999
        19
    Andy1999  
       2015-10-14 21:16:55 +08:00 via iPhone
    伪造蜘蛛 UA 可行吗
    kmahyyg
        20
    kmahyyg  
       2015-10-14 23:21:24 +08:00
    我只是想开一个程序临时用用,主要用 ss 。有详细的部署教程吗? for centos7/debian7 均可
    ericFork
        21
    ericFork  
       2015-10-15 02:28:57 +08:00
    hidemyass 有个一次付费的服务 每天给你发一批验证后的代理
    TaMud
        22
    TaMud  
       2015-10-15 04:53:32 +08:00   ❤️ 2
    https://proxy.peuland.com 上面有大量可用的代理
    nashsu
        23
    nashsu  
       2015-10-15 08:58:34 +08:00   ❤️ 1
    使用 luminati 也可以,背后是基于 Hola 的,类似 tor ,但是是正规提供代理服务的,相当于 hola 的商业版本。

    缺点是申请有点麻烦,价格有点贵。
    优点是相对稳定、并且可以过滤选择国家。
    mnhkahn
        24
    mnhkahn  
       2015-10-15 10:16:37 +08:00   ❤️ 2
    boro
        25
    boro  
       2015-10-15 16:01:14 +08:00
    @pango 如何实现代理的自动转换?
    cppgohan
        26
    cppgohan  
       2015-10-15 16:51:43 +08:00
    爬哪个网站啊? ip 被封多久? 用代理也不是一样被封?
    tongle
        27
    tongle  
    OP
       2015-10-15 18:01:10 +08:00
    @cppgohan 被封 ip 应该是永久封禁
    phithon
        28
    phithon  
       2015-10-15 18:11:25 +08:00   ❤️ 1
    @boro nginx1.9+有 proxy 模块,可以自动进行 sock 代理的负债均衡~
    TaMud
        29
    TaMud  
       2015-10-15 18:56:41 +08:00
    http://www.xicidaili.com/
    假的太多,几乎全是重复的,去重后没几个,能用的几乎没有几个
    pango
        30
    pango  
       2015-10-16 09:12:31 +08:00   ❤️ 1
    @boro
    proxy =['x.x.x.x:xx','x.x.x.x:xx','x.x.x.x:xx'...........]
    random.choice(proxy)
    cppgohan
        31
    cppgohan  
       2015-10-16 10:05:20 +08:00
    @tongle 永久被封, 用代理也没法避免, 除非知道他的封锁策略. 好奇是哪个网站, 我也爬一爬
    fchypzero
        32
    fchypzero  
       2015-10-16 10:06:15 +08:00
    @yuzo555 淘宝 ADSL VPS
    tongle
        33
    tongle  
    OP
       2015-10-16 11:49:56 +08:00
    @cppgohan appannie 这个
    vwhenx
        34
    vwhenx  
       2016-04-11 16:13:58 +08:00
    vwhenx
        35
    vwhenx  
       2016-04-19 15:18:11 +08:00
    blackmao
        36
    blackmao  
       2022-07-19 23:57:13 +08:00
    推荐用这个代理 xflash.pro
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1067 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 20:27 · PVG 04:27 · LAX 12:27 · JFK 15:27
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.