V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  512357301  ›  全部回复第 1 页 / 共 57 页
回复总数  1124
1  2  3  4  5  6  7  8  9  10 ... 57  
2 天前
回复了 andforce 创建的主题 程序员 约 192GB 短信样本如何标记分类?
@andforce #52 mysql 不行,7000 万都吃力,你这是数据分析与处理,属于 OLAP ,需要列式数据库( clickhouse )或者本地数据库( duckdb 、sqlite )。
MySQL 是行式数据库,适合处理单条数据的读写,不适合批量数据处理。7 亿条更是妄想了。
3 天前
回复了 andforce 创建的主题 程序员 约 192GB 短信样本如何标记分类?
对标注不太懂,但这个数据量,处理起来确实比较麻烦,可以考虑 clickhouse 或者 duckdb
前者是数据库,比较重。
后者是单文件,轻量级一些,建议用后者。
先把原始文件切割成小份的,csv 格式最佳,然后用 duckdb 把 csv 清洗压缩成 parquet 格式,压缩率极高,性能也极好。
推荐阅读: https://mp.weixin.qq.com/s/z-_ixPeksB_PjFMNL7NA8Q
5 天前
回复了 program9527 创建的主题 Android 抖音到底是如何识别 Android 设备的
@program9527 #9 很谨慎,很好,以我对这种平台的客服处理机制的了解,你要么找到更高级的投诉渠道,要么卖掉手机,或者卸载抖音,否则只能配合他们提供资料。
海鲜市场收个华为的二手 CPE ,也就是 4G 路由器,能收短信,不能接打电话
10 天前
回复了 syboy 创建的主题 软件 求推荐一款桌面管理工具,不想用 360 了
酷呆桌面
跟海豚调度比呢
换个思路,AI 是小弟,不是大佬,主要的思路、框架、核心代码还得自己来,AI 是辅助,在自己眼皮底下干点脏活累活,就是说本来自己也会干,但是懒得搞,就交给 AI 了。
从哪里下载的?可以去手机厂商自己的应用商店下载试试,厂商应用商店、酷安、Gplay 这三个渠道里的 APP 通知渠道貌似不一样,但并不是所有 APP 都这样。
18 天前
回复了 BlackSnow 创建的主题 Python jupyter debug
我一般直接用 Python 插件,直接新建一个 py 文件,在想分割的地方顶格写#%%
就自动分割出单元格了,也可以像 jupyter 那样只执行单元格内的代码,也能调试。
金山文档呢
本质上还是用户量太大了,用户量涨一个数量级,硬件成本不能也涨一个数量级啊,而且机器多了,运维成本也高了。
功能多,用的人多了,代码量自然也就大了,为了快速迭代,提升开发速度,自然架构就复杂了,专人专岗是效率最高的方式。
说到底所谓的互联网大厂,本质上就是一个个开发工厂。特别是那些外包公司,更是血汗工厂。
24 天前
回复了 qizheng22 创建的主题 程序员 All In Boom 带来的思考
boot2docker 无敌
代码这东西,自己看自己之前的代码,那肯定觉得拿不出手,但别人看或许有新思路呢,黑猫白猫抓住老鼠是好猫,能解决问题就行。
很多“好代码”其实是为了解决工程化之后的熵增问题,可是我一个小脚本考虑什么熵增(doge)
@shylockhg
@learnshare
30 天前
回复了 fields 创建的主题 分享发现 建行又给我限额
打建行客服,让他们给我查下是不是限额了,就要身份证、要电话号、要姓名、要卡号、还要设置什么手机银行密码,不知道这个密码是啥密码,说是我第一次查以后就不用设置了。。。

要就给呗,反正他们全掌握,就是个验证,你跟他们死磕干嘛。提额的前提是过风控,否则还会限额的。
30 天前
回复了 TimG 创建的主题 程序员 求问数据清洗的简易方法
SQL 做起来也不难,只不过 postgresql 或者 MySQL 不适合数据清洗,你得找列式数据库,比如 clickhouse 之类的。
编程思维,那就用 pandas 或者类似的代码框架实现。
数分思维,肯定直接上 SQL ,Python 之类的编程语言只是帮忙拼接 SQL ,调度 SQL 而已。
具体看你的倾向。
@assassing 没有挂载出来也有办法,先把容器 stop ,然后把数据目录 copy 出来一份,然后新建一个容器,把数据目录挂载进去
31 天前
回复了 clacf1 创建的主题 问与答 米家摄像头断网可以使用吗?
我试过,不录,1 楼说的应该是特定机型才行,有的机型不支持录到 smb 里面,只能录 SD 卡,断网就不录了,因为这个还跟同事打赌呢,完败。。。
建议买和家亲的,买之前也得问问客服。
vsc 支持调用远程 Python ,我一般是用 docker 装个 jupyter
@zoharSoul ck 算完之后存到 mysql 呢,后者可以高并发
1  2  3  4  5  6  7  8  9  10 ... 57  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2414 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 43ms · UTC 00:28 · PVG 08:28 · LAX 17:28 · JFK 20:28
Developed with CodeLauncher
♥ Do have faith in what you're doing.