1
hellojinjie 2018-07-06 16:51:35 +08:00 via Android
直接 json.loads
嗯,这个时候就是考验你是不是土豪的时候了😄 |
2
hahastudio 2018-07-06 16:53:28 +08:00
|
3
yedashuai 2018-07-06 16:55:59 +08:00
@hellojinjie 楼上坏坏~~~
|
4
mokeyjay 2018-07-06 16:56:39 +08:00
json 是有一定结构的,你一行一行读了也没法解析呀
|
5
haon 2018-07-06 16:56:48 +08:00
分块啊
|
6
bfpiaoran OP 问题是 json 格式啊 可怜我的小破机器只有 16G @hahastudio @hellojinjie 坏银~~
|
7
qfdk 2018-07-06 16:59:49 +08:00 via iPhone
扔进 elk ?
|
8
yanaraika 2018-07-06 17:00:00 +08:00 via Android
开 swap,存成 hdf 等适合大数据的格式
|
9
InternetExplorer 2018-07-06 17:00:14 +08:00
哪个机器导出来的?这么牛的机器一定也能读吧,让那个机器转成可以分块读取的数据结构再给你
|
10
bfpiaoran OP @hahastudio 这个库可以读么
|
11
eastrd 2018-07-06 17:00:39 +08:00 via Android
丢进 Splunk 吧
|
12
bfpiaoran OP @InternetExplorer 从网上下的 dns 记录
|
14
bfpiaoran OP 凉了 不是 21G 解压之后 127G
|
15
hahastudio 2018-07-06 17:09:58 +08:00
|
16
Droi 2018-07-06 17:12:09 +08:00
|
17
strict 2018-07-06 17:12:49 +08:00
json.load(f)试试?
|
19
814084764 2018-07-06 17:18:50 +08:00
类似于 SAX 读取 XML 的方式??? DOM 方式肯定不行了。
JDK 提供的 XML 解析方式分为两种:DOM 方式和 SAX 方式 DOM:Document Object Model。需要读取整个 XML 文档,先需要在内存中构架代表整个 DOM 树的 Document 对象,可以进行随机访问. 需要考虑内存.适合增删改 SAX:Simple API for XML。采用事件驱动的方式解析 XML 文件,边读边对文档进行处理.适合读取 |
20
bfpiaoran OP 读出来了 很普通的格式 我去想怎么处理啦 谢谢~~~
with open("file_name",'r') as file: for line in file: pass 这样读都是秒读的 |
21
wizardoz 2018-07-06 17:21:25 +08:00
自己从头解析啊,深度优先,一层层放入数据库。
|
24
crab 2018-07-06 17:32:28 +08:00
导入数据库,再通过数据库来
|
25
RicardoScofileld 2018-07-06 18:02:14 +08:00
有个流式读取 json 的库 好行叫 jsonstream 来着可以用那个
|
26
RicardoScofileld 2018-07-06 18:03:04 +08:00
@Droi 如果 json 数据不规整,read_json 不会报错吗
|
27
icyalala 2018-07-06 18:56:24 +08:00
mmap 然后用 SAX 的 API 读取。
如果用 C++ 的话,可以试试 rapidjson。 |
28
luozic 2018-07-08 01:56:59 +08:00 via iPhone
想办法处理一下,把数据搞进数据库。后面玩起来就爽了,elk,postgresql 都支持直接处理 json
|