如题,最近用 cyhton 写了个加速插件,给 python 中的某个模块加速了两百倍左右,效果十分满意。
于是又给算法复杂度加了十倍,这次 c 也顶不住了,单个函数调用时间一分钟左右。
于是想到了多线程,因为 python 进入 3.6 时代后异步逐渐完善,日常里使用 python 多线程的地方主要还是在 IO,通过异步 IO 复用解决得很开心,所以很久没有用过多线程模块了。
按照我记忆中的只是,python 的 GIL 机制是,如果你调用 C 插件的话是会默认释放 GIL 锁的,也就是说应该是原生使用多线程,并且在每个线程中调用 c 插件的话,它应该是可以利用多核心的,于是写了个简单小测试,但是结果不太对。我最终的结果还是顺序执行的时间,并没有利用多核心加速,是哪里做错了吗,还是我记错了,带佬来说一下。
简单 demo 代码如下:
# timer.py
import zhishu
import time
from threading import Thread
thread_list = [Thread(target = zhishu , args = (150000 , )) for _ in range(8)]
st_time = time.time()
for _ in thread_list:
_.start()
for _ in thread_list:
_.join()
print(time.time() - st_time)
这个简单 demo 创建了 8 个线程,每个线程调用一个名叫 zhishu 的由 cython 编写的函数,这个函数的作用是计算 n 以内质数数量,我本机上单次调用大概需要 2s,我有 8 颗核心,理论上我期望他在 2s 内完成全部计算,但是最终得到的结果却是 16s
cython 代码: 一个简单的质数计算器
# zhishu.pyx
import cython
def zhishu(n):
cdef cython.int count = 0
cdef cython.int i , j , nn
nn = <cython.int> n
for i in range(2 , n):
for j in range(2 , i):
if (i%j == 0):
break
else:
count += 1
return count
感谢!
贴个条,用ctypes确实吃到全核心了,还是cython的问题。
关于cython如何解锁gil,不知道有没有大佬指点一下,with nogil会报错提示仍有python成分所以不能释放gil,但是我看来看去也没感觉哪里python了,不全是c么。
目前还有一个方案是全面移植ctypes,略微麻烦一些,主要是要解决如何把python数据结构传入c++的问题。现有传入结构为一个二维表,在python中映射为list内含dict这种样子,大概这样:
lst = [
{
'id':0,
'name':'Tom',
'age':18,
},
{
'id':0,
'name':'Lily',
'age':20,
},
...
]
这种感觉的。 并不懂怎么转,百度看了看没找到什么有效信息。之前之所以用cython写是因为cython很方便地自动把这些转换完成了,我在写C的时候只需要思考C的问题,写python的时候只需要思考python,现在不让自动转就人麻之麻麻了
1
agegcn 2020-12-08 14:42:19 +08:00
cython 有 nogil 的选项。因为 cython 里也会有 python object,所以需要手动释放 gil 锁
|
2
westoy 2020-12-08 14:42:38 +08:00
最简单的方案就是最里面的 for j 的 range 用 cython.parallel.prange(..., nogil=True)替换掉, 能用多核, 不过效果也有限
建议写个原生 c 方案, 然后套个函数入口, 把参数转成原生类型后套到 with nogil 里面 |
3
black11black OP |
4
jones2000 2020-12-08 23:03:19 +08:00
c 内部开线程或并行计算. 外部 py 只做简单的调度和数据准备工作.
|
5
helloworld000 2020-12-08 23:22:53 +08:00
既然速度真的很重要,建议用 c++重写这个 module,然后用 pybind11 来给其他 python modules 调用
|