1
clino 2018-06-25 15:23:39 +08:00 1
第二种如果能用到多核有可能会比较快
另外过滤规则有多条的话,建议看能不能合并成一个正则这样应该能提升效率 |
2
herozhang 2018-06-25 15:28:08 +08:00 1
CPU 速度远快于 IO,所以应该优先解决 IO 问题。
然后就是一个 IO 调度的问题了,如果能把不同目录分布到不同存储器上,或者文件系统本身提供目录结构的元数据是最好的了。 |
3
imn1 OP |
4
luoway 2018-06-25 16:42:37 +08:00 1
第二种更快吧
按 #2 说的,第一种 IO 时间 CPU 空闲着 |
5
clino 2018-06-25 17:39:24 +08:00 1
@imn1 #3
我以前做过一个将多条正则规则合并成一个,每一条给一个标识符,识别出来以后能够根据标识符来对应识别到的是哪一条来针对做处理 用到的正则语法可以参考在 https://docs.python.org/2/library/re.html 里搜索 (?P<name>...) |