python multiprocessing 是不是利用多核

如题所述

推荐答案 2017-03-20

总结一下之前的项目，主要用到了Python多进程的知识，其他的一些零碎的辅助知识也会用到，这里主要对整体框架进行总结，至于性能，因为经验问题，不能优化的很好，加上本项目有很多文件的读写，只能算稳定而已。
这个项目是大量的音频文件格式和频率转换，大概300多万个，一个转成7个，原来那个也要用，也就是说最后大概有300*8W个文件，总共大概2T的数据。好了，回忆下要求，首先转换过程中不能破坏原始文件的目录结构；第二，保证所有文件都转换过；第三，异常检测，日志分析，进度检测；第四，保证意外死机等情况下，重新跑代码可以继续执行上次中断的位置而不是要重复在进行转换（重复转换会出现1个文件本来转成8个了，那重复执行，这8个又会各自再生出8个，就产生错误了）；最后，分析汇总错误日志，得到最终处理结果，问题文件汇总查看原因。
其实说白了，就是保证不出现不可逆的错误，保证稳定执行，保证准确，保证完整，保证效率。那么我们要有一个解决问题的思路，一开始说是，有好几台机器可用，就用分布式框架吧，例如Hadoop。。可惜时间短任务重，从头学的话，不得至少一个月？还是Python来的快，多进程执行，多核利用，有几个核就开几个进程，标准库multiprocessing完全可以胜任，一开始想的是thread多线程，后来想到Python的多线程不是类似Java的多线程，Python有一个全局锁机制，多个线程其实并不是并行执行（是不是并发更准确？），而是轮换执行，况且不能有效利用多核，那就确定最终的路线是:multiprocessing+多核（我用的进程池Pool，因为自己一个一个造的进程容易出错，而且性能也没有Pool好），具体的代码后面再说。
好了，下面就说代码吧，首先要从给定的目录中找到目标文件作为待处理任务列表，我写的函数如下：

[python] view plain copy print?
<span style="font-size:14px;">def get_filepath(src):

filepath = collections.deque()

for root,dirs,files in os.walk(src):
for afile in files:
if "_" not in afile:
filepath.append(os.path.join(root,afile))
return filepath
</span>

温馨提示：答案为网友推荐，仅供参考

当前网址：http://33.wendadaohang.com/zd/RhdR44W0hhhc454d5hP.html

相似回答

python中的进程-实战部分答：python中的多线程无法利用多核优势，如果想要充分地使用多核CPU的资源（os.cpu_count()查看），在python中大部分情况需要使用多进程。Python提供了multiprocessing。 multiprocessing模块用来开启子进程，并在子进程中执行我们定制的任务（比如函数），该模块与多线程模块threading的编程接口类似。multiprocessing模...

python怎么实现一个进程答：想要充分利用多核CPU资源，Python中大部分情况下都需要使用多进程，Python中提供了multiprocessing这个包实现多进程。multiprocessing支持子进程、进程间的同步与通信，提供了Process、Queue、Pipe、Lock等组件。开辟子进程 multiprocessing中提供了Process类来生成进程实例 Process([group [, target [, name [, a...

python 多进程和多线程配合答：由于python的多线程中存在PIL锁，因此python的多线程不能利用多核，那么，由于现在的计算机是多核的，就不能充分利用计算机的多核资源。但是python中的多进程是可以跑在不同的cpu上的。因此，尝试了多进程+多线程的方式，来做一个任务。比如：从中科大的镜像源中下载多个rpm包。!/usr/bin/pythonimport...

大家正在搜

python怎么利用多核cpu python利用多核cpu mysql多核cpu利用 python多核多线程编程 linux如何利用多核 nodejs多核利用 python如何调用全部cpu python用什么cpu 多核cpu利用率