第三章 存储系统
【复习提示】
本章是历年考査的重点,特别是有关 Cache 和存储器扩展的知识点容易出综合题。此外,存储器的分类与特点,存储器的扩展 (芯片选择、连接方式、地址范围等),低位交叉存储器,Cache 的相关计算与替换算法,虚拟存储器与快表也容易出选择题。读者应在掌握基本原理和理论的基础上,多结合习题进行练习复习,以加深和巩固。另外,读者还需掌握存在 Cache 和 TLB 的计算机中的地址翻译与 Cache 映射问题,该问题在《操作系统考研复习指导》中有详细说明。
本章有两个难点:一是 ache 映射规律、容量计算及替换特性;二是交又存储器访问时间和访问效率。二者都可与第 5 章的大题综合,或与第 6 章总线访问内存时间的计算问题综合。
在学习本章时,请读者思考以下问题:
-
- 存储器的层次结构主要体现在何处?为何要分这些层次?计算机如何管理这些层次?
-
- 存取周期和存取时间有何区别?
-
- 在虚拟存储器中,页面是设置得大一些好还是设置得小一些好?
请读者在学习本章的过程中寻找答案,本章末尾会给出参考答案。
3.1 存储器概述
3.1.1 存储器的分类
相联存储器的基本原理是把存储单元所存内容的某一部分作为检索项(即关键字项)去检索该存储器,并将存储器中与该检索项符合的存储单元内容进行读出或写入。所以它是 按内容或地址进行寻址的,价格较为昂贵。 一般用来制作 TLB、相联 Cache 等。
按在计算机中的作用对存储器分类:
-
1> 主存储器, 简称主存。CPU 可以直接随机地对其进行访问,也可以和高速缓存器及辅助存储器交换数据。
-
2> 辅助存储器, 简称辅存,不能与 CPU 直接相连,用来存放当前暂时不用的程序和数据
-
3> 高速缓冲存储器, 位于主存和 CPU 之间,用来存放正在执行的程序段和数据
按存储介质分类:
- 磁表面存储器(磁盘,磁带),磁心存储器半导体存储器(MOS 型存储器,双极存储器)和光存储器(光盘)。
按存取方式分类:
-
1> 随机存储器(RAM)。存储器的任何一个存储单元的内容都可以随机存取,而且存取时间与存取单元的物理位置无关,主要用作主存或高速缓冲存储器。
-
2> 只读存储器(ROM)。存储器的内容只能随机读出而不能写入。。即使断电,内容也不会丢失。
-
3> 串行访问存储器。对存储单元进行读 / 写操作时,需按其物理位置的先后顺序寻址,包括顺序存取存储器(如磁带)与直接存取存储器(如磁盘)。
按信息的可保存性分类:
- 断电后,存储信息即消失的存储器,称为易失性存储器,如 RAM。断电后信息仍然保持的存储器,称为非易失性存储器,如 ROM,磁表面存储器和光存储器。若某个存储单元所存储的信息被读出时,原存储信息被破坏,则称为破坏性读出;若读出时,被读单元原存储信息不被破坏,则称为非破坏性读出。具有破坏性读出性能的存储器,每次读出操作后,必须紧接一个再生的操作,以便恢复被破坏的信息。
3.1.2 存储器的性能指标
存储器的性能指标,有 3 个主要的性能指标,存储容量,单位成本和存储速度
-
1> 存储容量:存储字数 * 字长
-
2> 单位成本:每位价格 = 总成本 / 总容量
-
3> 存储速度:数据传输率 = 数据的宽度 / 存储周期
存取时间:存取时间时指从启动一次存储器操作到完成该操作所经历的时间,分为读出时间和写入时间。
存取周期:它是指存储器进行一次完整的读写操作所需的全部时间,即连续两次独立访问存储器操作(读或写操作)之间所需的最小时间间隔。
主存带宽:主存带宽又称数据传输率,表示每秒从主存进出信息的最大数量,单位为字 / 秒,字节 / 秒
存取时间不等于存储周期,通常存储周期大于存取时间。因为任何一种存储器,在读写操作之后,总要有一段恢复内部状态的复原时间。
3.2 存储器的层次结构
3.3 半导体随机存储器
3.3.1 SRAM 和 DRAM
3.3.2 只读存储器
3.3.3 主存的基本组成(存储系统)
3.4 主存储器与 CPU 的连接
3.4.2 主存容量的扩展
1. 位扩展
2. 字扩展
原来译码器的功能在这里可以使用!
3. 字位同时扩展法
设 CPU 有 16 根地址线,8 根数据线,并用 MREQ 作为访存控制信号(低电平有效),用 WR 作为读 / 写控制信号(高电平为读,低电平为写)。现有下列存储芯片:1K×4 位 RAM,4K×8 位 RAM,8K×8 位 RAM,2K×8 位 ROM,4K×8 位 ROM,8K×8 位 ROM 及 74LS138 译码器和各种门电路。画出 CPU 与存储器的连接图,要求:
1)主存地址空间分配:6000H~67FFH 为系统程序区;6800H~6BFFH 为用户程序区。
2)合理选用上述存储芯片,说明各选几片?
3)详细画出存储芯片的片选逻辑图。
补充:系统程序区用 ROM,用户程序区用 RAM
MAR 和 MDR 是直接做在 CPU 芯片上面的!
3.5 双端口 RAM 和多模块存储器
3.5.1 双端口 RAM
3.5.2 多模块存储器
交叉存储器实际上是一种模块式的存储器,它能并行执行多个独立的读 / 写操作。
3.6 高速缓冲存储器
3.6.1 程序访问的局部性原理
3.6.2 Cache 的基本工作原理
直接好家伙!
3.6.4 Cache 中主存块的替换算法
- 随机算法 (RAND): 随机地确定替换的 Cache 块。它的实现比较简单,但没有依据程序访问的局部性原理,故可能命中率较低
- 先进先出算法 (FIFO): 选择最早调入的行进行替换。它比较容易实现,但也没有依据程序访问的局部性原理,可能会把一些需要经常使用的程序块(如循环程序)也作为最早进入 Cache 的块替换掉。
- 近期最少使用算法(LRU): 依据程序访问的局部性原理选择近期内长久未访问过的存储行作为替换的行,平均命中率要比 FFO 要高,是堆栈类算法。
LRU 算法对每行设置一个计数器, Cache 每命中一次,命中行计数器清 0, 而其他各行计数器均加 1, 需要替换时比较各特定行的计数值,将计数值最大的行换出。 - 最不经常使用算法 (LFU): 将一段时间内被访问次数最少的存储行换出。每行也设置一个计数器,新行建立后从 0 开始计数,每访问一次,被访问的行计数器加 1, 需要替换时比较各特定行的计数值,将计数值最小的行换出。
Cache 例题
3.7 虚拟存储器
3.7.1 虚拟存储器的基本概念
3.7.5 段页式虚拟存储器
把程序按逻辑结构分段,每段再划分为固定大小的页,
主存空间也划分为大小相等的页,
程序对主存的调入、调出仍以页为基本传送单位。
每个程序对应一个段表,每段对应一个页表
虚拟地址:段号 + 段内页号 + 页内地址
3.7.3 快表(TLB)
页表、段表存放在主存中,收到虚拟地址后要先访问主存,査询页表、段表,进行虚实地址转换。
放在主存中的页表称为慢表 (Page)
提高变换速度→用高速绥沖存储器存放常用的页表项 → 快表 (TLB)
3.8 本章开头提出的问题回答
1) 存储器的层次结构主要体现在何处?为何要分这些层次?计算机如何管理这些层次?
-
- 存储器的层次结构主要体现在何处?为何要分这些层次?计算机如何管理这些层次?
存储器的层次结构主要体现在 Cache - 主存和 主存 - 辅存这两个存储层次上。
Cache - 主存层次在存储系统中主要 对 CPU 访存起加速作用,即从整体运行的效果分析,CPU 访存速度加快,接近于 Cache 的速度,而寻址空间和位价却接近于主存。
主存 - 辅存层次在存储系统中主要 起扩容作用,即从程序员的角度看,他所使用的存储器的容量和位价接近于辅存,而速度接近于主存。
综合上述两个存储层次的作用,从整个存储系统来看,就达到了速度快、容量大、位价低的优化效果。
主存与 Cache 之间的信息调度功能全部由硬件自动完成。而主存与辅存层次的调度目前广泛采用虚拟存储技术实现,即将主存与辅存的一部分通过软 / 硬结合的技术组成虚拟存储器,程序员可用这个比主存实际空间(物理地址空间)大得多的虚拟地址空间(逻辑地址空间)编程,当程序运行时,再由软 / 硬件自动配合完成虚拟地址空间与主存实际物理空间的转换。因此,这两个层次上的调度或转换操作对于程序员来说都是透明的。
- 存储器的层次结构主要体现在何处?为何要分这些层次?计算机如何管理这些层次?
2) 存取周期和存取时间有何区别?
-
- 存取周期和存取时间有何区别?
存取周期和存取时间的主要区别是:存取时间仅为完成一次操作的时间;而存取周期不仅包含操作时间,而且包含操作后线路的恢复时间,即存取周期 = 存取时间 + 恢复时间。(这是不是也可以解释,为什么 IC 前端,时序分析中有建立时间和保持时间吧)
- 存取周期和存取时间有何区别?
3) 在虚拟存储器中,页面是设置得大一些好还是设置得小一些好?
-
- 在虚拟存储器中,页面是设置得大一些好还是设置得小一些好?
页面不能设置得过大,也不能设置得过小。因为页面太小时,平均页内剩余空间较少,可节省存储空间,但会使得页表增大,而且页面太小时不能充分利用访存的空间局部性来提高命中率;页面太大时,可减少页表空间,但平均页内剩余空间较大,会浪费较多存储空间,页面太大还会使页面调入 / 调出的时间较长
- 在虚拟存储器中,页面是设置得大一些好还是设置得小一些好?
3.9 常见问题
1. 存取时间 Ta 就是存储周期 Tm 吗?
-
- 存取时间 Ta 就是存储周期 Tm 吗?
不是。存取时间 Ta 是执行一次读操作或写操作的时间,分为读出时间和写入时间。读出时间是从主存接收到有效地址开始到数据稳定为止的时间;写入时间是从主存接收到有效地址开始到数据写入被写单元为止的时间。
存储周期 Tm 是指存储器进行连续两次独立地读或写操作所需的最小时间间隔。所以存取时间 Ta 不等于存储周期 Tm。通常存储周期 Tm 大于存取时间 Ta。
- 存取时间 Ta 就是存储周期 Tm 吗?
2. Cache 行的大小和命中率之间有什么关系?
- 2.Cache 行的大小和命中率之间有什么关系?
行的长度较大,可以充分利用程序访问的空间局部性,使一个较大的局部空间被一起调到 Cache 中,因而可以增加命中机会。但是,行长也不能太大,主要原因有两个:- 行长大使失效损失变大。也就是说,若未命中,则需花更多时间从主存读块。
- 行长太大, Cache 项数变少,因而命中的可能性变小
3. 发生取指令 Cache 缺失的处理过程是什么?
-
- 发生取指令 Cache 缺失的处理过程是什么?
- 程序计数器恢复当前指令的值。
- 对主存进行读的操作。
- 将读入的指令写入 Cache 中,更改有效位和标记位。
- 重新执行当前指令。
4. 关于 Cache 的一些小知识
-
- 关于 Cache 的一些小知识。
- 多级 Cache。现代计算机系统中,一般采用多级的 Cache 系统。CPU 执行指令时,先到速度最快的一级 Cache(LI Cache) 中寻找指令或数据,找不到时,再到速度次快的二级 Cache(L2 Cache) 中找… 最后到主存中找。
- 指令 Cache 和数据 Cache。指令和数据可以分别存储在不同的 Cache 中( LI Cache 一般会这么做),这种结构也称哈佛 Cache, 其特点是允许 CPU 在同一个 Cache 存储周期内同时提取指令和数据,由于指令执行过程取指和取数据都有可能访问 Cache, 因此这一特性可以保证不同的指令同时访存。