V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  locoz  ›  全部回复第 197 页 / 共 323 页
回复总数  6443
1 ... 193  194  195  196  197  198  199  200  201  202 ... 323  
2020-07-15 10:46:36 +08:00
回复了 Te11UA 创建的主题 Python 最近爬虫遇到了一个吊诡的事情:更换 virtualenv 环境会导致反爬
@Te11UA #14 如果 IP 是一致的,但上了代理之后都能变正常,那么就大概率是 SSL/TLS 层的问题。建议试一下使用 Wireshark 分别抓一下开抓包和没开抓包两种情况下的两个请求包,并仔细对比其中的 SSL/TLS 连接部分。
2020-07-15 01:05:53 +08:00
回复了 iamverylovely 创建的主题 程序员 用 js 批量和你的 boss 直聘上未来的 boss 沟通。。
@yushuda #12 HR 主动联系的也有可能是自动联系和平台自动匹配哦😃
2020-07-15 01:01:46 +08:00
回复了 statement 创建的主题 生活 听说售楼两年能拿到三四万的工资+提成
听说推广云厂商的服务器能一个月拿到几十万的提成,你看有多少人拿到了?我至今就只见过一个这样的,自称单子多到需要给别人分…然而大部分人一个月连十位数数量、千元级的单子恐怕都没有。
2020-07-14 22:10:25 +08:00
回复了 yanshenxian 创建的主题 程序员 求解 api 网关本身扩容是怎么运行的
@yanshenxian #2 据我所知,在一个解析记录里有多个 IP 的情况下,如果第一个 IP 请求失败了,应用会自己再尝试第二个 IP 。具体这个重试机制是在哪一层做的、会不会有别的问题我就不清楚了,只是知道有这么个事。
@LXGMAX #2 UPnP 可以由应用自行指定端口,但具体得看应用自己怎么做。

直接手动设定端口映射再测试确实是一个更合适的选择。
2020-07-14 21:56:48 +08:00
回复了 yanshenxian 创建的主题 程序员 求解 api 网关本身扩容是怎么运行的
我的理解是多个网关前面也会有个负载均衡措施,比如按照地域划分、按照运营商划分。
简单粗暴点的实现方式就是在 DNS 记录里直接写上多个 IP,现在 DNS 解析服务商基本都支持按地域和运营商区分不同的解析结果。在这个基础上做动态扩容也是一样的,就是在 DNS 解析里加 IP 。
然后普通的 DNS 又会有实时性问题,所以如果要高实时性的话又可以加个 HTTP DNS 。

不是做后端的,所以只了解到这么多,还有别的点的话楼下补充吧 hhh 。
2020-07-14 21:44:40 +08:00
回复了 geektheripper 创建的主题 宽带症候群 3000M 下行, 260M 上行,北京宽带从入门到放弃 [逃
emmmm 问题是你这 IP 也不一样啊,做了链路聚合之后在一些场景下会出问题吧?如果走分流的话限制又挺多…
---
其实还有一种做法就是买个电信的多拨老帐号,然后开个高上行的套餐或者 py 一个千兆套餐(实付原套餐价)再直接多拨,上行加起来随随便便几百兆🤣🤣。
2020-07-14 21:39:02 +08:00
回复了 lzk50136 创建的主题 Android miui11, android10(Q), 2020 年还有办法去除卡米限制吗?
我这一直是提示选择应用商店啊?你是不是设置了默认应用之类的…
@sniperking1234 #2 “容器化”是动词,不是名词,容器就是容器😂
2020-07-14 21:35:28 +08:00
回复了 iamverylovely 创建的主题 程序员 用 js 批量和你的 boss 直聘上未来的 boss 沟通。。
hhhh 我当年找实习的时候就是这么搞的,只不过当时做的是每天自动在拉勾、58 之类的地方按关键词自动投简历(有每天投递限制)。
2020-07-14 21:32:32 +08:00
回复了 ziseyinzi 创建的主题 全球工单系统 张小龙进来,👴教你做微信
挺正常的…甚至对于觉得“我为用户好”、“用户不知道自己要什么”的产品思路是合理的人,可能还会觉得张小龙这做得真对、这不是屎这是糖。毕竟不想要这种东西的人都是小众用户(笑)。

说个前段时间看到的例子:
文件夹和标签对订阅号的整理归类问题。张小龙搞出来了个限制极大的标签和这个信息流,然后某人开始一顿吹…( https://mp.weixin.qq.com/s/_csLsU2MGxUinOFH5fUrOA
直接把文件夹概念贬的啥都不是。然而很多像零散文件、零散资料的场景,用文件夹概念归个大类显然更合理,有标签功能也会被用户当成文件夹用,不过毕竟“用户不知道自己要什么”呢 hhh 。
2020-07-14 21:15:47 +08:00
回复了 Te11UA 创建的主题 Python 最近爬虫遇到了一个吊诡的事情:更换 virtualenv 环境会导致反爬
排除法。
你确定以及肯定你在「用抓包软件」和「没用抓包软件」两种情况下的「两次请求」,IP 都一致吗?有可能只是因为你「忘记设置上级代理」了所以在抓包的时候才会得到一样的结果。
你确定以及肯定抓包时看到的所有东西都一致吗?比如 SSL/TLS 层那个握手时的「支持的加密套件」甚至是具体的版本号。

如果两个请求在各方面都是一致的,就不可能有差异…
你想弄的东西早就有人弄了,但没有多少自己的流量积累,想依靠互推做起来不现实,建议把文章多发几个平台...
2020-07-14 11:10:48 +08:00
回复了 ackermanHu 创建的主题 奇思妙想 关于懒癌||拖延症的想法
@ackermanHu #16 就我自己弄着玩的啊 https://i.v2ex.co/9kZ3y873.png
2020-07-14 10:57:37 +08:00
回复了 ackermanHu 创建的主题 奇思妙想 关于懒癌||拖延症的想法
没用的,我早就试过了...之前弄过一个机器人,会每天定时打电话+推消息,提醒我 TODO 上还有什么东西没解决完。然后结果就是一开始还有点效果,次数多了之后就懒得管了,接到电话直接挂断,甚至有点嫌烦。(然后关掉机器人又拖了好几天
2020-07-14 09:10:36 +08:00
回复了 winnerczwx 创建的主题 Python 关于爬虫并发量的疑问
@heiheidewo #7 也不一定,涉及到别人的利益也可以是恶意爬虫🤣
2020-07-14 09:05:04 +08:00
回复了 winnerczwx 创建的主题 Python 关于爬虫并发量的疑问
你可以打日志记录一下请求、解析、入库这三步每一步的耗时,这样就能很直观地看出哪一步慢、哪一步会被别的东西卡住了,然后再继续细化日志粒度、结合断点就能找到问题点。

另外,单机 50 并发对于单个网站而言已经挺高了,更别提 500 了…建议别搞那么高并发,对你自己好对别人服务器也好。
2020-07-14 08:54:06 +08:00
回复了 sodadev 创建的主题 Java 后悔报班学大数据了
大数据…算了吧,正经搞大数据搞了两三年的都不一定有啥水平,你想着靠报班学…
2020-07-13 21:13:40 +08:00
回复了 K120 创建的主题 问与答 想买个树莓派当服务器,大伙觉得怎么样
不建议。
1 、性能低下。
2 、由于 1 的关系,便携意义不大。
3 、sd 卡这种东西很容易坏,特别这种是读写量大的情况,更容易坏。
你要是想省钱+能跑点服务,就自己家里搞台服务器+公网 IP,成本高不了多少,但体验吊打树莓派。
1 ... 193  194  195  196  197  198  199  200  201  202 ... 323  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5410 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 76ms · UTC 06:54 · PVG 14:54 · LAX 22:54 · JFK 01:54
Developed with CodeLauncher
♥ Do have faith in what you're doing.