V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  dcsuibian  ›  全部回复第 44 页 / 共 86 页
回复总数  1716
1 ... 40  41  42  43  44  45  46  47  48  49 ... 86  
2022-09-15 10:36:07 +08:00
回复了 dfgddgf 创建的主题 程序员 请问最佳的爬虫语言是什么
我觉得是 Node.js ,毕竟 web 本来就是 js 的主战场
1 、对 JSON 的处理好得不得了(毕竟就是来源于 js 的)
2 、方便处理 DOM ,这基本就是前端的工作
3 、异步支持极好(因为 js 的单线程特性,不异步就卡死了)
4 、部分网页的 DOM 其实是 js 生成的,如果你选的就是 js ,那么会比较熟悉
5 、puppeteer 、playwright 这种爬虫杀手锏,都是优先支持 js 的


我是先学的 Python 的 Scrapy ,然后又用了 Node.js 。
我感觉 Node.js 不需要什么爬虫框架,直接 axios 请求下来,然后 cheerio 解析就好了。(最主要是可以复用写前端的经验)

唯有对速度不敢确定,因为我都限制请求频率的,怕踩缝纫机
期望=结果*概率
如果是正的,那就赌。
2022-09-15 01:10:46 +08:00
回复了 Felldeadbird 创建的主题 NAS 2 个 4T 硬盘组了 raid1 有必要降级回去 basic 吗?
有其它备份手段可以降回去,没有的话不建议

NAS 存一份,网盘存一份,可以防意外(火灾、丢失)。但比较麻烦。
Raid 不是备份,但还是可以防一下磁盘故障、坏道啥的。

我个人遇到过磁盘坏道,所以我买 NAS 肯定会开 Raid 。
2022-09-14 10:33:04 +08:00
回复了 threebr 创建的主题 Python 惊了! Python 居然可以计算任意长度的整数
坐下,高级语言常规操作
2022-09-13 21:17:47 +08:00
回复了 herozzm 创建的主题 Docker 创建运行应用的 doker 容器最佳方法
开发环境和生产环境不一样吧。

生产环境的话我肯定是 Dockerfile+编译好的程序拷贝进去。

开发时个人偏向于直接在宿主机上弄环境,你要直接显示文件的变更的话,弄个 Dockerfile.dev ??
2022-09-12 20:22:27 +08:00
回复了 iseki 创建的主题 问与答 有人存身份证号时丢掉最后一位吗
@wxf666 这么做是可以,但无论是对 DBA 和程序员来说都并不友好,增加了操作和代码的复杂度,同时在检索时还会增加数据库的计算量。

用数字存储减少磁盘占用。int64 算 8 字节,14 亿个是 10.43GB ,我这里 sizeof(身份证字符串)是 19 字节,直接算 3 倍好了。那也就是 31.2GB 。现在这个时代,省这点容量是真的划不来。

至于模糊查询,我觉得在公司、企业、学校 OA 系统中比较有可能出现。主要是这种查询多变没法提前写好。
2022-09-12 16:59:56 +08:00
回复了 iseki 创建的主题 问与答 有人存身份证号时丢掉最后一位吗
@wxf666 对啊,就这种用字符串做的话就很方便啊。
更一般点,最最普通的模糊搜索,就是写身份证片段,然后列出所有相关的吧。字符串 like 一下就很简单,但换成数字就很难做的。
2022-09-12 15:24:33 +08:00
回复了 iseki 创建的主题 问与答 有人存身份证号时丢掉最后一位吗
身份证号存数字。。。来个模糊搜索看看
2022-09-10 11:10:27 +08:00
回复了 12345xw 创建的主题 问与答 navicat 凭什么这么贵?
个人猜测可能是让个人用盗版,培养习惯然后企业付费
2022-09-10 11:05:11 +08:00
回复了 12345xw 创建的主题 问与答 navicat 凭什么这么贵?
单论品质还是不错的,各种数据库都有支持( Premium ),导入导出功能好用,跨平台,Mac/Windows 上都能用。
但价格是真 tn 的贵啊,Premium 非商业一个月 273 ,订阅制都用不起。还是转战 DataGrip 了,不过上手难度偏高。
问下隔壁什么都能写的 js 吧
2022-09-09 19:21:58 +08:00
回复了 zy445566 创建的主题 Node.js [吃瓜]egg.js 是不是倒闭了
阿里传统艺能
2022-09-09 13:21:59 +08:00
回复了 jack778 创建的主题 程序员 你为什么喜欢做全栈程序员
兴趣,再者后端不会点前端也没法做
但是在公司还是装不会比较好,要不就是全干
2022-09-09 13:17:59 +08:00
回复了 Felldeadbird 创建的主题 NAS 刚入坑黑群,我只是家里局域网用,有必要洗白吗?
我用的正规希捷银河 16T+开启 SHR ,感觉 NAS 专用盘太贵了,没必要
2022-09-09 02:28:11 +08:00
回复了 Aloento 创建的主题 英国 London Bridge Is Falling Down
第一时间想到死亡搁浅
2022-09-08 21:07:38 +08:00
回复了 edis0n0 创建的主题 程序员 你们数据库 ORM 框架可选字段会设计成 Nullable 吗?
虽然判断麻烦点,但我倾向于保留正确的语义
坚果云,同步很方便,但不能帮你辩护。
所以还是先老老实实请求公司授权吧。
2022-09-08 13:30:05 +08:00
回复了 vain 创建的主题 奇思妙想 如果把此后 30 年的薪水收入一次性给你,你愿意吗?
@cmdOptionKana 题干没有嘛。如果有把握赚大钱+支持违约金形式结束的话那肯定是 nice 的。

但主要就是把握真的不大。
很多人都是理财越理越亏。能跑赢银行利率就已经谢天谢地了。
如果预支工资和按部就班时的生活品质一样,那后者是亏的,因为失去了躺平的自由,同时还要在工作时间外花更多精力研究投资。
2022-09-08 12:33:08 +08:00
回复了 wiirhan 创建的主题 程序员 用 Windows 的前端小伙伴环境是怎么配置的?
@AnkhSpirit 这个我知道,算一方面
我用 yarn 的时候,yarn global add 就不起效,必须要 npm i -g
所以会担心 nvm 出现什么其它影响
1 ... 40  41  42  43  44  45  46  47  48  49 ... 86  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1189 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 42ms · UTC 18:24 · PVG 02:24 · LAX 10:24 · JFK 13:24
Developed with CodeLauncher
♥ Do have faith in what you're doing.