Why Parallelism? Why Efficiency?

What is a computer program?

A programm is just a list of processor instructions!(指令集)
picture alternative description

处理器的简单抽象:

Fetch/Decode : 负责读取指令
ALU : 各类计算的执行的单元
Execution Context: 程序涉及的各类变量的寄存器的状态

一个时钟周期执行一条指令

抽象图如下:

如下程序以及编译后的指令集,完成该指令集只需要5个clock:

该指令集完成并行优化最多只需要2个processor

到达优化瓶颈后,可以看到哪怕3 processor也需要3 clock的次数才能完成

我的理解:上述程序所编译的指令存在逻辑上的串行化:

由上述程序的优化方法, 提出SuperScalar execution的概念,即希望处理器自动去找出能够并行执行的指令,这就需要多个Fetch/Decode模块,并且分配执行的AUL单元,由此获得上述Superscalar processor的设计思路

对于指令本身的依赖关系,并行的优化及其有限

后讨论我们如何设计代码,能够最大程度的利用并行计算