区分一下cluster、MPP、SMP和SSMP

1 篇文章 0 订阅
订阅专栏

最近学习GA库,发现应当对多种计算机架构进行区分,故查阅资料,总结如下

MPP(Massive Parallel Processing),每个

现在有多种架构需要区分

  • MPP (Massive Parallel Processing)
  • cluster
  • SMP(Symmetrical Multi-Processing)
  • NUMA (Non-uniform memory access)
  • SSMP(Scalable shared-memory multiprocessing)
  • DSM(distributed shared memory)
1 SMP和NUMA、DSM

SMP是对称多处理器,如下图所示。所有的处理器共享一个内存,使用相同的地址空间。所有的处理器通过一条总线(bus)和内存以及IO设备(硬盘等)连接。总线同一时刻只能处理一个请求,当有多个处理器的访存访问请求时,只能一个一个处理,会导致部分处理器由于没有数据而空闲等待。

SMP的优点:

  • 编程容易,不需要修改代码为使用MPI并行的代码。
  • 处理器之间的通讯延迟低

SMP缺点

  • 内存征用情况严重,导致可扩展性差,一个系统支持的处理器数量远没有NUMA的多
  • 需要在硬件上支持cache一致性 (cache coherence)

像一般笔记本用的低端核少的CPU,比如说Intel core i3 ,往往都是SMP架构,只有一个内存控制器 存疑,不是NUMA架构就是SMP了吗?
在这里插入图片描述
NUMA是SMP的扩展版。NUMA中每个处理器都有自己的local memory,而且每个处理器都可以访问其他处理器的local meomory,但是延迟会比访问自己的local memory要高。根据 这里所说,对DSM(分布式内存)的访问,就是NUMA(非均匀内存访问)。DSM也可以说是NUMA。

NUMA架构可以减缓内存访问征用的问题。现在较高性能的处理器如AMD高端CPU Threadripper锐龙、Intel定位高端HEDT的i9 CPU都使用了NUMA架构。例如 知乎老狼所说的
在这里插入图片描述

2 MMP 和 CLUSTER

他俩和SMP以及NUMA不一样,MMP/cluster由多个彼此独立的节点构成的,无法跨节点访问彼此的内存,只能通过MPI等信息传递的方式来实现节点间通信。因为没有内存征用和总线带宽的限制,MMP/cluster的扩展性特别好,像现在(2021年3月)世界排名前500的超算,有几十万、上百万的核心,都是使用的MMP或cluster架构。

MMP和cluster的区别:

  1. MMP使用了更多定制化的组件,包括网络、处理器、操作系统等
    (这两段话几乎是复制的 阿里云技术专家蜚廉,那里有更加详细的说明)

    最早出现的是MMP,cluster是后来才有的。这两个的区别在于MMP的组件大多是单独定制开发,每个节点使用定制CPU,运行OS微内核,使用单独开发的专有网络连接。
    ///
    进入新世纪后,Cluster 得到蓬勃的发展。cluster运行通用操作系统,互连网络使用商业标准的IB和以太网设备连接,存储为SAN、NAS和并行文件系统。原有的MPP超级计算机的单独定制门槛被打破,“堆机器”成了新玩法。

  2. MPP实际上是一台机器,这台机器有使用高速网络紧密连接的成千上万个处理器,只有一个操作系统。
    cluster实际上是有多台机器,每个机器有自己的操作系统(一般都是一样的)、硬盘、内存等,这些机器使用一些普通网络的一些变体连接起来,使用某些系统帮助分配任务给这些主机。
    参考 What is the difference between a Cluster and MPP supercomputer architecture?

3 SSMP

SSMP(可扩展的共享内存处理)的提出是为了在利用SMP优点的同时,提高他的可扩展性,主要措施有两点:

  • 使用DSM
  • 使用switch替代bus(内存总线)

具体不太懂, 这里有详细的介绍


参考文献

  1. 并行计算、分布式计算、集群计算和云计算,大科谱! 链接
  2. 超算简史与下一代超级计算机 (介绍了cluster 和MPP的区别 链接)
  3. why parallel architecture (介绍了SSMP, 链接)
  4. stack Exchange的一个帖子,里面的一个回答引用了很多链接,很值得学习 链接
  5. Massively Parallel Processing (MPP) (大绿字,给了一个综述和一些关于cluster、mpp、smp、numa以及一些其他关于高性能计算的学习链接, 传送门)
  6. SMP vs NUMA vs MPP 架构简介 链接

4 不成熟的思想(下面是搜索材料时候的一些混乱思想,留在这里,可能有错)

NUMA似乎是当初SGI公司主推的一种架构,多个处理器使用共享内存来获得比单个处理器更高的性能,同时又不需要额外的MPI编程。
那串行程序如何使用多个处理器呢? 这需要查一查SGI是怎么成功的
关于SGI的成功, 知乎的yolfilm说到

1994年,我们买过一台 sgi 的名机:「 iris crimson 」。
当年作动画(90年代中期),PC机用的是 3dmax 早期版本,最早的3dmax v1.0,我查了一下,是1996年才发售,换言之,我们最早用那玩意儿(1994年),装在dx66 pc机上的3ds,都是beta版。而且是在dos下运行,装起来要一整盒的软盘。相比之下,整个完整套装的 iris crimson,跑unix系统,除了「中文字」比较烦以外(当时作动画,主要是给建筑案作效果图,里面的中文都是自己建模造字。)除了字体比较痛苦外,相较pc机,那种速度,那种可用性,那种出来画面的品质(商业性),都是 pc 望尘莫及,完全无法比拟的。

而知乎的Tech Priest 说了SGI成功的另外一个 原因

超算这块,sgi当年的看家法宝是numalink, 我不知道numa的机器他家是不是最大的,不过绝对是卖的最多的, 换句话说,单一内存地址空间的,没我核多,比我核多的,都是分布式的mpp或者cluster架构。所以很多不适合mpp/cluster架构的应用(再加上懒得把代码拿mpi重写一遍的应用),还有numa架构带来的管理/开发/使用上的便利(当成一台多核的机器就行),使得sgi从origin到altix随然top500上榜不多(没办法numa没法堆太多的核)但是实际用户不少,sgi当年绝对是闷声发大财。今天转手几次的sgi还在卖UV, 没查过销量但是应该也不会太差, 毕竟就算是今天很多应用更适合numa而不是集群(包括一小部分算法上不适合分布式内存的

第三个从wiki中 NUMA的介绍里也提到了一些原因:

Modern CPUs operate considerably faster than the main memory they use. In the early days of computing and data processing, the CPU generally ran slower than its own memory. The performance lines of processors and memory crossed in the 1960s with the advent of the first supercomputers. Since then, CPUs increasingly have found themselves “starved for data” and having to stall while waiting for data to arrive from memory. Many supercomputer designs of the 1980s and 1990s focused on providing high-speed memory access as opposed to faster processors, allowing the computers to work on large data sets at speeds other systems could not approach.

从上面的分析来看,SGI成功的原因包括

  • 对于视频剪辑,SGI的性能高(为什么嘞?),有配套的剪辑软件,可用性好
  • 对于高性能计算,SGI的服务器提供统一内存寻址空间,对于不适合或是不方便修改为用于MPP/cluster类型并行计算的应用十分友好
  • 在1960年代开始,处理器的计算能力逐渐不再是计算速度的瓶颈。内存访问速度慢常让CPU因等待数据送达而处于空闲状态,这逐渐成为制约计算速度的一大瓶颈。而SGI支持的CC-NUMA架构可以改善这个问题,因此计算性能很高。(均为猜测)

SGI的没落是在家用PC机的性能开始逐渐增强的时候, 知乎的yolfilm认为

SGI的「生死交叉点」,是家用机的 cpu 主频,开始出现超过 100mhz 的机种时(英特尔奔腾系列,以及苹果的 power pc系列),sgi 的败象就按捺不住了。
主频一过百,那时代立刻出现了一堆 pc 架构下的「类 sgi 图型工作站」(比如名机 toaster,大陆市场上的各种杂牌组装图形工作站,更是不计其数)。当然,这种机器会 down,但人家售价只有你的十几分之一,而且还挺好用,你哪能比得过?

这衰败的原因感觉是CPU的性能提升了?这不是和之前说的CPU性能不制约计算速度相违背吗?
可能是因为以前CPU单核性能不高,因此使用多处理器架构,但是多处理器SMP架构会有内存争用的问题,因为一个CPU对内存的访问会让其他CPU都等着。但是NUMA架构能够改善这个问题(这个在NUMA的WIKI里面也说了)。但是随着CPU 的性能提升,不需要太多的核就可以有很好的性能,内存争用情况有了改善,这时其他厂商的电脑、工作站等也能很好的解决问题了,因此SGI的市场受到了蚕食。

(猜测需要证实)

至于说没落,应该说是整个cluster架构的崛起和numa的没落(mpp也没落了)。这就又回到了和工作站一样的问题,既然大家都是堆xeon堆tesla/phi堆infiniband这些开放平台,不计成本狂堆能上top500前十也叫集群,一穷二白刚毕业小青椒暑假找几个本科生拿几台破机器装个rocks也叫集群, 为啥非要sgi呢?

作者:Tech Priest
链接:https://www.zhihu.com/question/30500794/answer/64657328


SGI的特色是NUMA LINK,难道说SGI的机器使用的其实是NUMA的架构?已知NUMA架构是和SMP类似的(wiki,NUMA architectures logically follow in scaling from symmetric multiprocessing (SMP) architectures.)
那么NUMA和SMP的区别与联系是什么呢


才发现,老师给我的《可扩展并行计算》里面就已经讲了各种架构。唉,本科就已经给我的宝藏,我到现在才发现。现在简单了解一下各种架构,然后慢慢地看书学习。不能影响当前的科研进度。

现在的家用电脑是NUMA架构的吗?

GBase 8a-MPP大规模并行计算技术
DAISER的博客
11-26 1857
GBase8aMPPCluster为非对称部署的联邦架构,GClusterCluster和GCwareCluster单独部署为一个集群,最大节点数为64,GNodeCluster单独部署为一个集群
MPP(大规模并行处理)简介
weixin_30378623的博客
04-13 1079
1、 什么是MPPMPP (Massively Parallel Processing),即大规模并行处理,在数据库非共享集群中,每个节点都有独立的磁盘存储系统和内存系统,业务数据根据数据库模型和应用特点划分到各个节点上,每台数据节点通过专用网络或者商业通用网络互相连接,彼此协同计算,作为整体提供数据库服务。非共享数据库集群有完全的可伸缩性、高可用、高性能、优秀的性价比、资源共享等...
SMPCluster的比较
大雄不爱吃肉
02-02 5385
1.             引言 以高性能计算机为基础的计算科学已经成为继理论科学和实验科学之后人类科学研究的第三大支柱,在一些新兴的学科,如新材料技术和生物技术领域,高性能计算机已成为科学研究的必备工具。同时,高性能计算也越来越多地渗透到石油工业等一些传统的产业之中,以提高生产效率、降低生产成本。高性能计算系统作为战略资源对一个国家的科技发展越来越重要。已经有越来越多的教育及经济部门使用高性
超小型射频接头SMP/SSMP
射频问问 (RFASK.NET) 是在"微波射频网(MWRF.NET)”系列原创技术专栏基础上升级打造的技术问答学习平台。
06-29 2514
SMP连接器是一种推入并咬合的对插结合式连接器,其接口是与MMCX连接器相同比例的超小型接口,最小尺寸的安装密度可达到连接器中心间距4.3mm,因此非常适用于高密度盲插合。尤其适用于印制板、机箱、机柜间的高密度盲插合,一般使用方式为全擒纵/半擒纵+连杆+光孔。SMP连接器也称为GPO连接器,可以在高达40G频率范围内工作,具有结构小巧实用频率高,连接快速,抗震性强的特点,广泛应用于阵列天线、卫星通信、雷达等场合。图1 SMP型接头示例(来源rftop.com网站)SMP根据不同的连接保持力,分为光孔、半擒纵
MPP架构
热门推荐
迷路剑客个人博客
11-21 3万+
MPP架构 0x01 摘要 本文综合各家看法,再加上个人理解,介绍下对MPP架构的理解以及一些其他架构的对比。 0x02 MPP架构基本概念 2.1 什么是MPP MPP,全称为Massively Parallel Processor,翻译过来就是大规模并行处理MPP系统是由许多松耦合的处理单元组成的(要注意的是这里指的是处理单元而不是处理器)。每个处理单元内的CPU都有自己私有的资源,如总线...
MPP(massively parallel processing)大规模并行处理
再谈蓝色勋章
09-01 8343
大规模并行处理MPP,massively parallel processing)是多个处理器(processor)处理同一程序的不同部分时该程序的协调过程,工作的各处理器运用自身的操作系统(Operating System)和内存。大规模并行处理器一般运用通讯接口交流。在一些执行过程中,高达两百甚至更多的处理器为同一应用程序工作。数据通路的互连设置允许各处理器相互传递信息。一般来说,大规模
Gbase 8a MPP Cluster 所有相关使用手册
11-02
8. **日志参考**:《GBase 8a MPP Cluster日志参考手册》讲解了如何解读和利用系统日志进行故障排查和性能分析,日志记录了系统运行时的各种信息,是诊断问题和优化性能的重要资源。 掌握以上知识点,用户可以充分...
服务器系统架构SMP&NUMA&MPP.doc
08-06
服务器系统架构是构建高性能计算和数据中心的关键因素,主要包括对称处理器结构(SMP)、非一致存储访问结构(NUMA)和海量并行处理结构(MPP)这三种类型。 1. 对称处理器结构(SMP:Symmetric Multi-...
GBase 8a MPP Cluster SQL 参考手册
11-02
该手册由南大通用数据技术股份有限公司出版,适用于希望深入了解和掌握GBase 8a MPP Cluster数据库系统功能与使用的数据库管理员、开发人员及其他相关技术人员。 #### 二、版权与法律声明 - **版权声明**:文档中...
SMP,NUMA,MPP
404 NOT FOUND
01-08 718
一.概念介绍 SMP Symmetric Multi-Processor 对称处理器 NUMA Non-Uniform Memory Access 非一致存储访问结构 MPP Massive Parallel Processing 海量并行处理结构 SMP CPU 服务器中多个CPU对称工作,无主次或从属关系。 CPU共享相同的物
MPP架构,SMP架构,NUWA架构
最新发布
xiaocaij_icai的博客
10-30 1250
对于MPP架构来说,因为task和Executor是绑定的**,如果某个Executor执行过慢或故障,将会导致整个集群的性能就会受限于这个故障节点的执行速度(所谓木桶的短板效应)**,所以MPP架构的最大缺陷就是——短板效应。另一点,集群中的节点越多,则某个节点出现问题的概率越大,而一旦有节点出现问题,对于MPP架构来说,将导致整个集群性能受限,所以一般实际生产中MPP架构的集群节点不易过多。每个节点内的CPU不能访问另一个节点的内存,节点之间的信息交互是通过节点互联网络实现的,这个过程称为数据重分配。
深入理解服务器CPU三大体系结构--SMP、NUMA、MPP
机械猿的博客
10-12 2399
商用服务器大体可以分为三类,即对称处理器结构 (SMP :Symmetric Multi-Processor) ,非一致存储访问结构 (NUMA :Non-Uniform Memory Access) ,以及海量并行处理结构 (MPP :Massive Parallel Processing) 。
GBase 8a MPP Cluster 架构介绍
huixinhuiyismile的博客
04-29 640
GBase 8a MPP Cluster 采用 MPP + Shared Nothing 的分布式联邦架构,节点间通过TCP/IP 网络进行通信,每个节点采用本地磁盘来存储数据,支持对称部署和非对称部署。 Shared Nothing(SN)是一种分布式计算架构。这这种架构中,每一个节点都是独立的,自给的,在系统中不存在单点竞争。更明确地说,没有节点共享存储和硬盘。 MPP (Massively Parallel Processing),即大规模并行处理,简单来说,MPP是将任务并行的分散到多个服务器和
处理器从单核到多核的演化过程&NUMA&UMA
tugouxp的专栏
12-10 1204
NUMA体系结构:系统中多个内存结点和多个CPU簇,CPU访问本地内存节点的速度最快,访问远端内存结点的速度要慢一点,如下图所示,该系统有三个内存节点,其中CPU0,CPU1组成一个节点node0,他们可以通过系统总线访问本地DDR物理内存,同理,CPU2和CPU3,以及CPU4和CPU5分别构成了Node1和Node2,它们也可以通过系统总线访问本地内存,如果通过UPI或者QPI总线连接,那么CPU0可以通过这条内部总线访问远端的内存节点的物理内存。,每个核簇共享2MB的L2缓存。
GBase 8a MPP Cluster产品基本简介
Freddie0129的博客
04-26 683
介绍了gbase8a的节点类型,组件类型和网络平面类型等。
GBase 8a MPP Cluster 核心技术 - MPP 大规模并行计算技术
zgp_5715116的博客
06-14 320
GBase 8a MPP Cluster 核心技术 - MPP 大规模并行计算技术
商用服务器SMP、NUMA及MPP体系介绍
永远是少年
04-19 1963
今天给大家介绍一下常见的三种商用服务器——SMP、NUMA以及MPP。 一、SMP详解 二、NUMA详解 三、MPP详解
写文章

热门文章

  • conda 解决“libstdc++.so.6: version `GLIBCXX_3.4.20‘ not found“ 14981
  • latex添加标准文献:texmaker+bibtex+gbt7714-2005.bst 12136
  • module-environment简单使用 11490
  • cuda 的driver API 和 runtime API 10651
  • win10+deepin安装 && linux修改系统启动项 7260

分类专栏

  • linux配置 3篇
  • anaconda 3篇
  • 量子化学 7篇
  • linux编译 4篇
  • java 1篇
  • boost 1篇
  • 计算机架构 1篇
  • rocm 4篇
  • bug 1篇
  • wsl 1篇
  • matlab
  • mpi
  • markdown入门 2篇
  • BDF编译问题 12篇
  • c++ 12篇
  • makefile 1篇
  • linux 29篇
  • latex 4篇
  • 待学 1篇
  • fortran 1篇
  • rdkit 1篇
  • cuda 4篇

最新评论

  • latex添加标准文献:texmaker+bibtex+gbt7714-2005.bst

    绝不吃芹菜!: 好的 感谢

  • latex添加标准文献:texmaker+bibtex+gbt7714-2005.bst

    孤鹤~: 没解决,最后用的bibitem,都快答辩了才知道用bibtex格式和论文要求的不一样

  • latex添加标准文献:texmaker+bibtex+gbt7714-2005.bst

    绝不吃芹菜!: 你好 请问你解决了嘛 我也是这样的问题

  • latex添加标准文献:texmaker+bibtex+gbt7714-2005.bst

    孤鹤~: 这个bst增加了参考文献的间距咋办,而且url也单独成行了

  • intel fortran 编译器linux下的安装问题 ./install.sh: 行 769: 14305 段错误已有[已解决]

    c土豆你个马铃薯: 这种东西有什么价值

大家在看

  • 研究效率倍增:12个Zotero插件助你轻松管理文献
  • 双11第16年,年轻人不想再交「线上税」了
  • C++ 中的拷贝构造与赋值操作详解
  • Windows11系统imkrudt.dll文件丢失问题 474
  • 基于nodejs+vue基于的儿童福利院管理系统[开题+源码+程序+论文]计算机毕业设计

最新文章

  • conda 解决“libstdc++.so.6: version `GLIBCXX_3.4.20‘ not found“
  • VScode 使用ssh插件修改远程服务器文件
  • C++ 传指针和传引用的区别
2021年24篇
2020年14篇
2019年12篇
2018年20篇
2017年4篇

目录

目录

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

玻璃钢生产厂家盐城玻璃钢人物雕塑价格如何定西玻璃钢雕塑销售河南商城艺术玻璃钢雕塑工厂阳江公园摆件玻璃钢雕塑安阳玻璃钢动物雕塑定做厂家安徽景区玻璃钢雕塑制作附近玻璃钢卡通雕塑价格人物玻璃钢雕塑工程保山市玻璃钢雕塑设计供应浙江商场美陈市场价盐城玻璃钢卡通雕塑厂家合肥火烈鸟玻璃钢雕塑定做蚌埠抽象玻璃钢雕塑价位万圣节商场女装品牌美陈玻璃钢雕塑摆件开发深圳欧式玻璃钢雕塑厂家工厂和田气球商场美陈装饰哪家靠谱玻璃钢雕塑怎么恢复北京超市商场美陈市场报价商场美陈方案怎样写陕西仿古校园玻璃钢雕塑厂家美陈商场怎么收费西双版纳玻璃钢雕塑淮安酒店玻璃钢雕塑设计伊春公园玻璃钢雕塑安装河南常用商场美陈供应商小品玻璃钢人物雕塑代理价格鞍山玻璃钢雕塑制作石家庄玻璃钢雕塑制作多少钱长沙商场美陈玻璃钢卡通雕塑香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声单亲妈妈陷入热恋 14岁儿子报警汪小菲曝离婚始末遭遇山火的松茸之乡雅江山火三名扑火人员牺牲系谣言何赛飞追着代拍打萧美琴窜访捷克 外交部回应卫健委通报少年有偿捐血浆16次猝死手机成瘾是影响睡眠质量重要因素高校汽车撞人致3死16伤 司机系学生315晚会后胖东来又人满为患了小米汽车超级工厂正式揭幕中国拥有亿元资产的家庭达13.3万户周杰伦一审败诉网易男孩8年未见母亲被告知被遗忘许家印被限制高消费饲养员用铁锨驱打大熊猫被辞退男子被猫抓伤后确诊“猫抓病”特朗普无法缴纳4.54亿美元罚金倪萍分享减重40斤方法联合利华开始重组张家界的山上“长”满了韩国人?张立群任西安交通大学校长杨倩无缘巴黎奥运“重生之我在北大当嫡校长”黑马情侣提车了专访95后高颜值猪保姆考生莫言也上北大硕士复试名单了网友洛杉矶偶遇贾玲专家建议不必谈骨泥色变沉迷短剧的人就像掉进了杀猪盘奥巴马现身唐宁街 黑色着装引猜测七年后宇文玥被薅头发捞上岸事业单位女子向同事水杯投不明物质凯特王妃现身!外出购物视频曝光河南驻马店通报西平中学跳楼事件王树国卸任西安交大校长 师生送别恒大被罚41.75亿到底怎么缴男子被流浪猫绊倒 投喂者赔24万房客欠租失踪 房东直发愁西双版纳热带植物园回应蜉蝣大爆发钱人豪晒法院裁定实锤抄袭外国人感慨凌晨的中国很安全胖东来员工每周单休无小长假白宫:哈马斯三号人物被杀测试车高速逃费 小米:已补缴老人退休金被冒领16年 金额超20万

玻璃钢生产厂家 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化