gpu的架构特征 gpu采用什么架构

关注数据挖掘者

文章目录

1、GPU架构概述
2、CUDA 并行计算
CUDA线程模型
CUDA 内存模型

gpu的架构特征 gpu采用什么架构

转载

数据挖掘者 2023-06-06 06:46:54

文章标签 gpu的架构特征 gpu 共享内存 CUDA 寄存器 文章分类 架构后端开发

1、GPU架构概述

GPU是一种众核架构，非常适合解决大规模的并行计算。
GPU是CPU的协处理器，必须通过PCIe总线与基于CPU的主机（Host）相连来进行操作，形成异构架构，如下图所示。其中CPU为主机端（Host），负责逻辑控制、数据分发，GPU为设备端（Device），负责并行数据的密集型计算。其中，ALU为算数运算单元。

gpu的架构特征 gpu采用什么架构_共享内存

GPU架构是围绕一个流式多处理器（SM）的可扩展阵列搭建的。下图是英伟达公司的Fermi架构SM的示意图，SM的关键组件包括GPU核心、共享内存/一级缓存、寄存器文件、加载/存储单元、特殊功能单元和线程束调度器。
GPU的每个SM都支持数百个线程并发执行，每个GPU有多个SM，这表示一个GPU可以并发执行数千个线程。
当启动一个内核网格（Grid）时，它的线程块（block）被分布在了可用的SM上执行。

gpu的架构特征 gpu采用什么架构_CUDA_02

多个block可能会被分配到同一个SM上。

gpu的架构特征 gpu采用什么架构_gpu_03

2、CUDA 并行计算

CUDA 是英伟达公司推出的通用并行计算平台和编程模型，它利用英伟达的GPU能够实现并行计算。
CUDA可以通过CUDA加速库、编译器指令、应用编程接口以及标准程序语言的扩展（包括C、C++、Fortan、Python）来使用。

CUDA线程模型

线程（Thread）是GPU的最小执行单元，能够完成一个逻辑操作，每个线程都有自己的指令地址计数器和寄存器状态，利用自身的数据执行当前的指令。
而线程束（Warp）是GPU的基本执行单元，包括32个线程，GPU每次调用线程都是以线程束为单位的，在一个线程束中，所有的线程按照单指令多线程（SIMT）方式执行，即所有线程执行相同的指令。
多个线程束位于一个最高维度为3的线程块（Block）中，同一个线程块中的所有线程，都可以使用共享内存来进行通信、同步。
线程块又通过一个最高维度为3的网格（Grid）来管理。

gpu的架构特征 gpu采用什么架构_共享内存_04

CUDA 内存模型

CUDA内存模型中，有两种类型的存储器：不可编程存储器和可编程存储器，

前者并不对开发人员开放存取接口，包括一级缓存和二级缓存；
后者可以显式地控制数据在内存空间中的存取，包括寄存器、共享内存、本地内存、常量内存、纹理内存以及全局内存。

gpu的架构特征 gpu采用什么架构_寄存器_05

寄存器：

速度最快，分配于每个线程中，数量有限，如果一个核函数使用了超过了限定数量的寄存器，将会溢出到本地内存，降低算法性能。

本地内存：

本地内存用来存放寄存器溢出的内存，本地内存访问符合高效内存访问要求。

共享内存：

比本地内存和全局内存有更高的带宽和更低的延迟。它由线程块分配，生命周期伴随着线程块，线程块中的每个线程都可以共享其存储空间。
一个块内的线程可以通过共享内存进行通信合作。常用的方式是将全局内存读进共享内存中，而读取的方式是每个线程负责读取某一个位置的数据，读完之后块内的所有线程都能够使用整个共享内存中的数据。
读取全局内存到共享内存时要注意同步，在CUDA C中使用线程同步函数__syncthreads()来实现同步。
核函数中存储在共享内存的变量通过修饰符__shared__修饰。

常量内存：

用修饰符__constant__修饰
必须在全局空间内和所有核函数之外声明，对同一编译单元的所有线程核函数可见
只读

纹理内存：

只读
适合访问二维数据

全局内存：

是GPU中最大、延迟最高、最常使用的内存，贯穿程序的整个生命周期。
对全局内存访问时，必须注意内存访问的两个特性：对齐内存访问和合并内存访问。
当一个线程束中全部的32个线程访问一个连续的内存块时，满足合并访问，效率非常高。

gpu的架构特征 gpu采用什么架构_共享内存_06

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

赞
收藏
评论
分享
举报

上一篇： java 判断对象属性有无变动 java判断对象类型的方法

下一篇：保存数据到本地 javascript js本地存储数据

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

数据挖掘者

领资料

2024软考

高级中级初级

华为认证

数通云计算安全

厂商认证

K8s Oracle 红帽

IT技术

数据库网络安全 AIGC

近期文章

1.数据库tips30
2.HP DL380 G10 重做配置阵列
3.pinpoint 2.1.0 版本hbase表
4.理解ES6中的模块
5.JavaScript的“或”运算的高级用法

新人福利

文章目录

1、GPU架构概述
2、CUDA 并行计算
CUDA线程模型
CUDA 内存模型

意见
反馈

训练营

举报文章

请选择举报类型

内容侵权涉嫌营销内容抄袭违法信息其他

具体原因

包含不真实信息涉及个人隐私

原文链接（必填）

补充说明

0/200

上传截图

格式支持JPEG/PNG/JPG，图片不超过1.9M

已经收到您得举报信息，我们会尽快审核

赞

鸿蒙开发者社区

WOT技术大会

公众号矩阵

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 24年11月软考 PMP项目管理免费题库

文章资源问答课堂专栏直播

鸿蒙开发者社区

鸿蒙开发者社区订阅号

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
免费资料
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册

51CTO博客

Copyright © 2005-2024 51CTO.COM 版权所有京ICP证060544号

关于我们

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

友情链接

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

玻璃钢生产厂家孝感玻璃钢景观雕塑玻璃钢名人雕塑制作城市玻璃钢雕塑加工通道商场美陈销售公司玻璃钢卡通人物雕塑制作厂镜面玻璃钢仿铜雕塑制作厂家福建开业商场美陈供应商南皮玻璃钢花盆花器辽源玻璃钢雕塑工程电话四川景观玻璃钢雕塑供应商南宁玻璃钢雕塑翻模招聘玻璃钢公园雕塑系列大型商场创意商业美陈收费标准盐城设计玻璃钢雕塑厂家曲靖玻璃钢雕塑生产制造双层玻璃钢花盆大口三八妇女节商场美陈河源商场装饰玻璃钢雕塑浙江大型主题商场美陈费用西藏玻璃钢骆驼雕塑浙江景观玻璃钢雕塑价位广西人物玻璃钢雕塑生产厂家鞍山售卖沈阳玻璃钢花盆株洲玻璃钢座椅雕塑多少钱广东玻璃钢青蛙雕塑福州水果玻璃钢雕塑西藏商场美陈报价零售玻璃钢花盆花器翼城玻璃钢花盆花器温州玻璃钢雕塑便宜香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡多方发声单亲妈妈陷入热恋 14岁儿子报警汪小菲曝离婚始末遭遇山火的松茸之乡雅江山火三名扑火人员牺牲系谣言何赛飞追着代拍打萧美琴窜访捷克外交部回应卫健委通报少年有偿捐血浆16次猝死手机成瘾是影响睡眠质量重要因素高校汽车撞人致3死16伤司机系学生 315晚会后胖东来又人满为患了小米汽车超级工厂正式揭幕中国拥有亿元资产的家庭达13.3万户周杰伦一审败诉网易男孩8年未见母亲被告知被遗忘许家印被限制高消费饲养员用铁锨驱打大熊猫被辞退男子被猫抓伤后确诊“猫抓病”特朗普无法缴纳4.54亿美元罚金倪萍分享减重40斤方法联合利华开始重组张家界的山上“长”满了韩国人？张立群任西安交通大学校长杨倩无缘巴黎奥运 “重生之我在北大当嫡校长”黑马情侣提车了专访95后高颜值猪保姆考生莫言也上北大硕士复试名单了网友洛杉矶偶遇贾玲专家建议不必谈骨泥色变沉迷短剧的人就像掉进了杀猪盘奥巴马现身唐宁街黑色着装引猜测七年后宇文玥被薅头发捞上岸事业单位女子向同事水杯投不明物质凯特王妃现身！外出购物视频曝光河南驻马店通报西平中学跳楼事件王树国卸任西安交大校长师生送别恒大被罚41.75亿到底怎么缴男子被流浪猫绊倒投喂者赔24万房客欠租失踪房东直发愁西双版纳热带植物园回应蜉蝣大爆发钱人豪晒法院裁定实锤抄袭外国人感慨凌晨的中国很安全胖东来员工每周单休无小长假白宫：哈马斯三号人物被杀测试车高速逃费小米：已补缴老人退休金被冒领16年金额超20万

玻璃钢生产厂家 XML地图 TXT地图虚拟主机 SEO 网站制作网站优化