计算机系统结构从挂科到满分【1】第一章计算机系统结构基础

62 阅读 0 评论 41 点赞

我是靠谱客的博主闪闪皮带，最近开发中收集的这篇文章主要介绍计算机系统结构从挂科到满分【1】第一章计算机系统结构基础，觉得挺不错的，现在分享给大家，希望可以做个参考。

概述

镇楼神图：
在这里插入图片描述
附1：为什么要学习计算机系统结构？
根据外在的需求约束，设计计算机的系统结构，各功能部件及其连接方式以满足约束。
我们学的是结构，设计一个好的结构增益可以超过硬件本身的增益

附2：计算机系统的组织结构和计算机组成原理的区别在哪里？

计算机组成原理强调的是计算机系统结构的逻辑实现，包括物理机器上的数据流，控制流
计算机系统结构强调的计算机系统的软硬件之间的界面，强调的是机器语言程序员看到的层面。
计算机实现强调的是用哪些硬件配置搭配，硬件装配等

具有相同系统结构的计算机可以由不同的计算组成，而同一种计算机组成可以有不同的计算机实现

第一章计算机系统结构基础

1.1 计算机的层次

（1）计算机系统=硬件+软件
（2）虚拟机层与物理机层
在这里插入图片描述
微程序机器级的机器语言就是微指令集。而我们常说的机器语言指的是指令集。
（3）冯诺依曼结构：

（4）广义的系统结构定义：指令系统的结构，组成，硬件

（5）系列机
具有不同组成实现的机器但是统一系统结构组成。比如：Intel 的x86，ARM

（6）计算机系统结构的分类【Flynn分类法】
Flynn分类法的衡量指标：

指令流：计算机执行的指令序列
数据流：指令流调用的数据序列
多倍性：在系统受限的情况下，处于同一执行阶段的指令或数据的最大数目

名词对照：

结构名称	代号
指令流	IS
数据流	DS
控制流	CS
控制部件	CU
处理部件	PU
存储器	MM和SM

那么，把组织结构可以分为4类：

SISD：单指令单数据（冯诺依曼计算机属于SISD）
SIMD：单指令多数据
MISD：多指令单数据
MIMD：多指令多数据

在这里插入图片描述
单指令流的特征就是，CU模块只有一个，并且仅有一条CS（控制流）和一条IS（指令流）。

单数据流的特征就是，PU模块串联，只有一条进和出的DS（数据流）。

（7）并行评价标准
我们会根据计算机系统在单位时间内能够处理的最大二进制位数对并行进行评价。

（最大并行度是单位时间能处理的最大的二进制位数）

最大并行度： $P_m=n*m$ ，n表示字宽，m表示字数
平均并行度：
假设每个时钟周期能同时处理的二进制位数 $P_i$ ，则T各时钟周期内的平均并行度：

$P_a=frac{sum_{i=1}^TP_i}{T}$
实际上就是处理了的总位数除以时钟周期数

平均利用率：
$=frac{P_a}{P_m}$

系统型号 Handler 表示法：(k,d,w)
例题:：Cray-1有1个CPU，12个相当于ALU或PE的处理部件，可以最多实现8级流水线。字长为64位，可以实现1～14位流水线处理。所以 Cray-1系统结构可表示为：(1，12×8，64×(1～14))

1.2 计算机系统评价标准

（1）性能方案评测：性能加速比

Amdahl定律：
$S_n=frac{T_0}{T_n}=frac{总执行时间_{改进前}}{总执行时间_{改进后}}$

加速比依赖于两个因素：

可改进比例： $F_e=frac{Delta_{可改}}{改进前}$
例子：一个需运行60秒的程序中有20秒的运算可以加速，那么这个比例就是20/60。
部件加速倍： $S_e=frac{改进后}{改进前}$ 【速度比】
例子：若系统改进后，可改进部分的执行时间是2秒，而改进前其执行时间为5秒，则部件加速比为5/2。

改进前的执行时间： $T_0$
不可改进比例： $1-F_e$

改进后程序总的执行时间 $T_n=T_0(1-F_e+frac{F_e}{S_e})$

例题：将计算机某一功能的处理速度加快15倍，该功能占整个系统的运行时间的40%，则采用此增强方法之后，整个系统的性能提高多少？

解：
$F_e=40%$
$S_e=15$
$S_n=frac{1}{1-0.4+frac{0.4}{15}}=1.6$
可以使该系统的性能提高到原来的1.6倍

例题：某计算机系统采用浮点运算部件后，使浮点运算速度提高到原来的25倍，而系统运行某一程序的整体性能提高到原来的4倍，试计算该程序中浮点操作所占的比例。

解：
已知 $S_e=25$ ， $S_n=4$
$ $4=frac{1}{(1-F_e+F_e/25)}$

$F_e=78.1%$

所以浮点操作所占比例78.1%

（2）性能方案评测：执行时间（CPU时间和CPI）

我们关注：

时钟长
时钟数

【1】CPU时间：
（CPU时间）执行程序所需的总时钟长=一个程序时钟数 $*$ 单位时钟长

单位时钟长= $1 时钟频率 frac{1}{时钟频率}$

【2】CPI：每条指令的平均时钟周期数
CPI=一个程序时钟总数/一个程序的指令总数
IC=一个程序的指令总数

$C P U 时间 = I C * C P I * 单位时钟长$

所以CPU性能取决于三个参数：单位时钟长，CPI（每指令耗时钟数），IC（指令数）

单位时钟长：由硬件本身决定
CPI：由计算机组成和指令系统决定
IC：取决于指令系统的结构

无论是IC还是CPI，我们都希望越小越好

例题1：【改进前改进后】
假设FP指令的比例为25%，其中，FPSQR占全部指令的比例为2%，FP操作的CPI为4，FPSQR操作的CPI为20 ，其他指令的平均CPI为1.33。现有两种改进方案，第一种是把FPSQR操作的 CPI减至2，第二种是把所有的FP操作的CPI减至2，试比较两种方案对系统性能的提高程度。

解：
我们利用建表法来对问题可视化：
在这里插入图片描述
改进前的
$CPI_{systemBefore}=4*25%+1.33*75%=2$
假如采用第一种方案
$CPI_{FPSQR}=20rightarrow2$
则
$CPI_{systemAfter}=CPI_{systemBefore}-(20-2)*2%=1.64$