python对CUDA扩展有不错的支持,CUDA通过大量线程的并行化可以大幅提高代码计算速度,一般python常用numba、pycuda套件来支持CUDA扩展。numba通过JIT编译器只需将numba装饰器应用到python函数中即可实现CUDA加速,而pycuda需要基于C/C++编写kernel,其移植性、直观性更佳,这里主要介绍pycuda的使用。

阅读全文 »
0%