多核时代的多线程性能优化

随着摩尔定律的失效,CPU的计算能力不再是可以廉价获得的无限资源了。在多核时代,提高系统的运行速度,采用并发的多线程无疑是最重要的手段了。

在多核系统中,采用何种并发制御方式会极大的影响系统的运行效率,这两天做了一些实验。通常来说,多线程的并发制御主要分为两大类,一类是Polling的轮询方式,也就是Sleep, SwitchToThread,还有一类就是Blocking的阻塞方式,比如Mutex,WaiteForSingleObject这类方式。

简单实验的结果,发现系统的CPU数目越多,并发的线程数越多,使用阻塞方式进行同期制御的程序会更快一些,同时因为不需要轮询,所以CPU的占用率更低。反之,CPU和并发线程数少的时候, Polling的方式更有优势。

 

为了测试比较多线程的性能,这次用了Intel的Vtune中的Thread Profiler,发现还是相当好用的,不过要注意Intel Profiler无法直接监视基于内存变量的同期制御。这时要调用Profiler的API来告诉Profiler,同期计数器开始,结束,取得,释放的时间点才行。