多CPU程序开发: OpenMP-MPI(机群)和CUDA(GPU)

262 阅读 0 评论 173 点赞

我是靠谱客的博主雪白灰狼，这篇文章主要介绍多CPU程序开发: OpenMP-MPI(机群)和CUDA(GPU)，现在分享给大家，希望可以做个参考。

CPU和GPU擅长和不擅长的方面

从它们执行运算的速度与效率的方面来探讨这个论题。
CPU和GPU都是具有运算能力的芯片，CPU更像“通才”——指令运算(执行)为重+ 数值运算，GPU更像“专才”——图形类数值计算为核心。在不同类型的运算方面的速度也就决定了它们的能力——“擅长和不擅长”。芯片的速度主要取决于三个方面：微架构，主频和IPC(每个时钟周期执行的指令数)。
1．微架构
从微架构上看，CPU和GPU看起来完全不是按照相同的设计思路设计的，当代CPU的微架构是按照兼顾“指令并行执行”和“数据并行运算”的思路而设计，就是要兼顾程序执行和数据运算的并行性、通用性以及它们的平衡性。CPU的微架构偏重于程序执行的效率，不会一味追求某种运算极致速度而牺牲程序执行的效率。
CPU微架构的设计是面向指令执行高效率而设计的，因而CPU是计算机中设计最复杂的芯片。和GPU相比，CPU核心的重复设计部分不多，这种复杂性不能仅以晶体管的多寡来衡量，这种复杂性来自于实现：如程序分支预测，推测执行，多重嵌套分支执行，并行执行时候的指令相关性和数据相关性，多核协同处理时候的数据一致性等等复杂逻辑。
GPU其实是由硬件实现的一组图形函数的集合，这些函数主要用于绘制各种图形所需要的运算。这些和像素，光影处理，3D 坐标变换等相关的运算由GPU硬件加速来实现。图形运算的特点是大量同类型数据的密集运算——如图形数据的矩阵运算，GPU的微架构就是面向适合于矩阵类型的数值计算而设计的，大量重复设计的计算单元，这类计算可以分成众多独立的数值计算——大量数值运算的线程，而且数据之间

最后

以上就是雪白灰狼最近收集整理的关于多CPU程序开发: OpenMP-MPI(机群)和CUDA(GPU)的全部内容，更多相关多CPU程序开发:内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供，作为学习参考使用，或来自网络收集整理，版权属于原作者所有。

点赞(173)

本文分类：python
浏览次数：262 次浏览
发布日期：2023-10-31 12:20:21
本文链接：https://www.kaopuke.com/article/k-p-k_13_u_23_o_18_f1_14_j_10_4.html

相关文章

嵌入式软件开发笔试面试知识点总结-C语言部分（试读）

嵌入式软件开发笔试面试知识点总结-C语言部分（试读）

2021-09-13

cocos2d-x游戏引擎核心之多线程分析及注意事项 cocos2d-x游戏引擎核心之——并发编程（消息通知中心）

cocos2d-x游戏引擎核心之多线程分析及注意事项 cocos2d-x游戏引擎核心之——并发编程（消息通知中心）

爬虫（七）--程序，多进程，多线程一、程序、进程和线程二、多线程三、多线程和多进程四、死锁五、项目

爬虫（七）--程序，多进程，多线程一、程序、进程和线程二、多线程三、多线程和多进程四、死锁五、项目

多CPU程序开发: OpenMP-MPI(机群)和CUDA(GPU)

多CPU程序开发: OpenMP-MPI(机群)和CUDA(GPU)

TS知识点1（运行和ts的数据类型）

TS知识点1（运行和ts的数据类型）

typescript入门之：如何使用、不限定函数参数的个数传参、interface约束（对象、函数、数组、类）、定义可选参数

typescript入门之：如何使用、不限定函数参数的个数传参、interface约束（对象、函数、数组、类）、定义可选参数

Java并发编程基础-线程安全问题及JMM(volatile)

Java并发编程基础-线程安全问题及JMM(volatile)

评论列表共有 0 条评论

发表评论取消回复

立即
投稿返回
顶部