操作系统 存储管理(一)

此处输入图片的描述

1. 内存空间的扩充

1.1 覆盖技术

基本思想:是将内存的同一区域按照使用的先后顺序,分配给几个不同进程或一个进程 的几个程序段或数据段。

内存中分为一个“固定区”和若干个“覆盖区”。需要常驻内存的段放在“固定区”中,调入后就不再调出(除非运行结束)不常用的段放在“覆盖区”,需要用到时调入内存,用不到时调出内存
此处输入图片的描述
必须由程序员声明覆盖结构,操作系统完成自动覆盖。
缺点:对用户不透明,增加了用户编程负担。
覆盖技术只用于早期的操作系统中,现在己成为历史。

1.2 交换技术

把内存中暂时无法运行的进程或者暂时不需要的程序、数据写入辅存,并将具备运行条 件的进程或者需要的程序、数据从辅存读入内存

  1. 具有对换功能的操作系统中,通常把磁盘空间分为文件区和对换区两部分。文件区主要用于存放文件,主要追求存储空间的利用率,因此对文件区空间的管理采用离散分配方式;对换区空间只占磁盘空间的小部分,被换出的进程数据就存放在对换区。由于对换的速度直接影响到系统的整体速度,因此对换区空间的管理主要追求换入换出速度,因此通常对换区采用连续分配方式(学过文件管理章节后即可理解)。总之,对换区的I/O速度比文件区的更快。
  2. 交换通常在许多进程运行且内存吃紧时进行,而系统负荷降低就暂停。例如:在发现许多进程运行时经常发生缺页,就说明内存紧张,此时可以换出一些进程; 如果缺页率明显下降,就可以暂停换出。
  3. 可优先换出阻塞进程;可换出优先级低的进程;为了”止优先级低的进程在被调入内存后很快又被换出,有的系统还会考虑进程在内存的驻留时间…(注意:PCB 会常驻内存,不会被换出外存)

此处输入图片的描述

2. 内存空间的分配与回收

2.1 连续分配管理方式

2.1.1 单一连续分配

在单一连续分配方式中,内存被分为“系统区和用户区”。系统区通常位于内存的低地址部分,用于存放操作系统相关数据;用户区用于存放用户进程相关数据。 内存中只能有一道用户程序,用户程序独占整个用户区 空间。

优点:实现简单;无外部碎片;可以采用覆盖技术扩充 内存;不一定需要采取内存保护(eg:早期的 PC 操作 系统 MS-DOS)。
缺点:只能用于单用户、单任务的操作系统中;有内部碎片;存储器利用率极低。

此处输入图片的描述

2.1.2 固定分区分配

为了在内存中装入多道程序,且这些程序之间又不会相互干扰, 于是将整个用户空间划分为若干个固定大小的分区,在 每个分区中只装入一道作业,这样就形成了最早的、最简单的一种可运行多道程序的内存处理方式。
此处输入图片的描述
分区大小相等:缺乏灵活性,但是很适合用于用一台计算机控制多个相同对象的场合(比如:钢铁厂有n个相 同的炼钢炉,就可把内存分为n个大小相等的区域存放 n个炼钢炉控制程序)

分区大小不等:增加了灵活性,可以满足不同大小的进 程需求。根据常在系统中运行的作业大小情况进行划分(比如:划分多个小分区、适量中等分区、少量大分区)

操作系统需要建立一个数据结构——分区说明表,来实现各个分区的分配与回收。每个表项对应一个分区,通常按分区大小排列。每个表项包括对应分区的大小、起始地址、状态(是否己分配)。

此处输入图片的描述

2.1.3 动态分区分配

动态分区分配又称为可变分区分配。这种分配方式不会预先划分内存分区,而是在进程装入内存时,根据进程的大小动态地建立分区,并使分区的大小正好适合进程的需要。因此系统分区的大小和数目是可变的。

动态分区分配没有内部碎片,但是有外部碎片。

内部碎片:分配给某进程的内存区域中,如果有些部分没有用上。
外部碎片:是指内存中的某些空闲分区由于太小而难以利用。

如果内存中空闲空间的总和本来可以满足某进程的要求,但由于进程需要的是一整块连续的内存空间,因此这些 “碎片”不能满足进程的需求。 可以通过紧凑(拼凑,Compaction)技术来解决外部碎片。

2.1.4 动态分区分配算法

2.1.4.1 首次适应算法

算法思想:将空闲分区链以地址递增的顺序连接;在进行内存分配时,从链首开始顺序查找,直到找到一块分区的大小可以满足需求时,按照该作业的大小,从该分区中分配出内存,将剩下的空闲分区仍然链在空闲分区链中。

此处输入图片的描述

优点:高址部分的大的空闲分区得到保留,为大作业的内存分配创造了条件;
缺点
(1)每次都是优先利用低址部分的空闲分区,造成低址部分产生大量的外碎片。
(2)每次都是从低址部分查找,使得查找空闲分区的开销增大;

2.1.4.2 最佳适应算法

算法思想:将空闲分区链中的空闲分区按照空闲分区由小到大的顺序排序,从而形成空闲分区链。每次从链首进行查找合适的空闲分区为作业分配内存,这样每次找到的空闲分区是和作业大小最接近的,所谓“最佳”.

此处输入图片的描述

优点:第一次找到的空闲分区是大小最接近待分配内存作业大小的;
缺点: 产生大量难以利用的外部碎片。

2.1.4.3 最坏适应算法

算法思想:与最佳适应算法刚好相反,将空闲分区链的分区按照从大到小的顺序排序形成空闲分区链,每次查找时只要看第一个空闲分区是否满足即可。

此处输入图片的描述

优点:效率高,分区查找方便;
缺点:当小作业把大空闲分区分小了,那么,大作业就找不到合适的空闲分区。

2.1.4.4 临近适应算法

算法思想:分配内存时不是从链首进行查找可以分配内存的空闲分区,而是从上一次分配内存的空闲分区的下一个分区开始查找,直到 找到可以为该进程分配内存的空闲分区。

此处输入图片的描述

优点:
(1)使得空闲分区分布更加均匀;
(2)空闲分区的查找开销小;

缺点:高址部分的大空闲分区被分小,使得大作业进入无法分配内存;

此处输入图片的描述

2.1.4 小结

此处输入图片的描述

考虑支持多道程序的两种连续分配方式:

  1. 固定分区分配:缺乏灵活性,会产生大量的内部碎片, 内存的利用率很低。
  2. 动态分区分配:会产生很多外部碎片,虽然可以用 “紧凑”技术来处理,但是“紧凑”的时间代价很高

2.2 非连续分配管理方式

2.2.1 分页存储管理

空间划分
1)对于进程:将一个用户进程的地址空间(逻辑空间)划分成若干个大小相等的区域,称为页或页面。
2)对于内存:内存空间也分成与页大小相等的区域,称为块(物理块),同样是从0开始编号。

将内存空间分为一个个大小相等的分区(比如:每个分区4KB),每个分区就是一个“页框”,或称“页帧”、“存块”、“物理块”。每个页框有一个编号,即“页框号”(或 者“内存块号”、“页帧号”、“物理块号”)页框号从0开 始。

将用户进程的地址空间也分为与页框大小相等的一个个区域,称为“页”或“页面”。每个页面也有一个编号,即“页号”, 页号也是从0开始。(注:进程的最后一个页面可能没有一个页框那么大。因此, 页框不能太大,否则可能产生过大的内部碎片)

操作系统以页框为单位为各个进程分配内存空间。进程的每个页面分别放入一个页框中。也就是说,进程的页面与内存的页 框有一一对应的关系。各个页面不必连续存放,也不必按先后顺序来,可以放到不相邻的页框中。

地址结构
逻辑地址:
此处输入图片的描述
地址结构包含两个部分:前一部分为页号,后一部分为页内偏移量 W。在上图所示的例子中,地址长度为 32 位,其中 0~11位 为“页内偏移量”,或称“页内地址”:12~31 位为“页号”。

如果有 K 位表示“页内偏移量”,则说明该系统中一个页面的大小是$2^k$个内存单元,如果有M位表示“页号”,则说明在该系统中,一个进程最多允许有$2^M$个页面

物理地址:
此处输入图片的描述

物理地址长度为22位,其中块内位移占0~11,即每块的大小$2^{12}=4KB$;块号占12~21,地址空间最多允许有$2^{10} = 1K$块。

页表
此处输入图片的描述

地址转换
此处输入图片的描述

  1. 要算出逻辑地址对应的页号
  2. 要知道该页号对应页面在内存中的 起始地址
  3. 要算出逻辑地址在页面内的“偏移量”
  4. 物理地址 = 页面始址 + 页内偏移量

此处输入图片的描述

2.2.1.1 基本地址变换机构

基本地址变换机构可以借助进程的页表将逻辑地址转换为物理地址。通常会在系统中设置一个页表寄存器(PTR),存放页表在内存中的起始地址F和页表长度M。进程未执行时,页表的始址和页表长度放在进程控制块(PCB)中,当进程被调度时,操作系到页表寄存器中。

此处输入图片的描述

基本地址变换机构可以借助进程的页表将逻辑地址转换为物理地址。通常会在系统中设置一个页表寄存器(PTR),存放页表在内存中的起始地址F和页表长度M。进程未执行时,页表的始址和页表长度放在进程控制块(PCB)中,当进程被调度时,操作系统内核会把它们放到页表寄存器中。

注意:页面大小是2的整数幂
设页面大小为L,逻辑地址A到物理地址E的变换过程如下:
①计算页号 P 和页内偏移量W(如果用十进制数子算,则P=A/L,W=A%L;但是在计算机实际运行时,逻辑地址结构是固定不变的,因此计算机硬件可以更快地得到二进制表示的页号、页内偏移量)
②比较页号P 和页表长度M,若P≥M则产生越界中断,否则继续执行。(页号是从0开始的,而页表长度至少是1,因此P=M 时也会越界)
③页表中页号P对应的页表项地址=页表起始地F+页号P*页表项长度,取出该页表项内容b,即为内存块号。(注意区分页表项长度、页表长度、页面大小的区别。页表长度指的是这个页表中总共有几个页表项,即总共有几个页;页表项长度指的是每个页表项占多大的存储空间; 页面大小指的是一个页面占多大的存储空间)
④计算 E = b * L + W,用得到的物理地址E去访存。(如果内存块号、页面偏移量是用二进制表示的,那么把二者拼接起来就是最终的物理地址了)
此处输入图片的描述

2.2.1.2 具有快表的地址变换结果

时间局部性:如果执行了程序中的某条指令,那么不久后这条指令很有可能再次执行;如果某个数据被访问过,不久之后该数据很可能再 次被访问。(因为程序中存在大量的循环)
空间局部性:一旦程序访问了某个存储单元,在不久之后,其附近的存储单元也很有可能被访问。(因为很多数据在内存中都是连续存放的)

在基本地址变换机构中,每次要访问一个逻辑地址,都需要查询内存中的页表。由于局部性原理,可能连续很多次查到的都是同一个页表项。既然如此,能否利用这个特性减少访问页表的次数呢?

快表,又称联想寄存器(TLB),是一种访问速度比内存快很多的高速缓冲存储器,用来存放当前访问的若干页表项,以加速地址变换的过程。与此对应,内存中的页表常称为慢表

此处输入图片的描述

引入快表后,地址的变换过程
① CPU给出逻辑地址,由某个硬件算得页号、页内偏移量,将页号与快表中的所有页号进行比较。
② 如果找到匹配的页号,说明要访问的页表项在快表中有副本,则直接从中取出该页对应的内存块号,再将内存块号与页内偏移量拼接形成物理地址,最后,访问该物理地址对应的内存单元。因此, 若快表命中,则访问某个逻辑地址仅需一次访存即可。
③ 如果没有找到匹配的页号,则需要访问内存中的页表,找到对应页表项,得到页面存放的内存块号,再将内存块号与页内偏移量拼接形成物理地址,最后,访问该物理地址对应的内存单元。因此,若快表未命中,则访问某个逻辑地址需要两次访存(注意:在找到页表项后,应同时将其存入快表,以便后面可能的再次访问。但若快表己满,则必须按照一定的算法对旧的页表项进行替换)

由于查询快表的速度比查询页表的速度快很多,因此只要快表命中,就可以节省很多时间。 因为局部性原理,一般来说快表的命中率可以达到 90% 以上。

例:某系统使用基本分页存储管理,并采用了具有快表的地址变换机构。访问一次快表耗时 1us,访 问一次内存耗时 100us。若快表的命中率为 90%,那么访问一个逻辑地址的平均耗时是多少?
(1+100) * 0.9 + (1+100+100) * 0.1 = 111 us
有的系统支持快表和慢表同时查找,如果是这样,平均耗时应该是
(1+100) * 0.9 + (100+100) * 0.1 =110.9 us
若未采用快表机制,则访问一个逻辑地址需要 100+100 = 200us
显然,号入快表机制后,访问一个逻辑地址的速度快多了。

地址变换过程 访问一个逻辑地址的访存次数
基本地址变换机构 ①算页号、页内偏移量
②检查页号合法性
③查页表,找到页面存放的内存块号
④根据内存块号与页内偏移量得到物理地址
⑤访问目标内存单元
两次访存
具有块表的地址变换机构 ①算页号、页内偏移量
②检查页号合法性
③查快表。若命中,即可知道页面存放的内存块号,可直接进行⑤;若未命中则进行④
④查页表,找到页面存放的内存块号,并且将页表项复制到快表中
⑤根据内存块号与页内偏移量得到物理地址
⑥访问目标内存单元
快表命中,只需一次访存

快表未命中,只需两次访存

2.2.1.3 两级页表结构

2.2.2 基本分段存储管理

进程的地址空间:按照程序自身的逻辑关系划分为若干个段,每个段都有一个段名在低级语言中,程序员使用段名来编程),每段从0开始编址
内存分配规则:以段为单位进行分配,每个段在内存中占据连续空间,但各段之间可以不相邻

此处输入图片的描述

2.2.2.1 基本原理

逻辑地址结构
此处输入图片的描述

段号的位数决定了每个进程最多可以分几个段
段内地址位数决定了每个段的最大长度是多少

在上述例子中,若系统是按字节寻址的,则 段号占16位,因此在该系统中,每个进程最多有 $2^{16} = 64K $个段 段内地址占 16位,因此每个段的最大长度是 $2^{16} = 64KB $。

段表
此处输入图片的描述

  1. 每个段对应一个段表项,其中记录了该段在内存中的起始位置(又称 “基址”)和段的长度。
  2. 各个段表项的长度是相同的。例如:某系统按字节寻址,采用分段存储管理,逻辑地址结构为(段号16位, 即可表示最大段长。物理内存大小为4GB(可用32位表示整个物理内存地址空间)。因此,可以让每个段表项占16+32=48位,即6B。于段表项长度相同,因此段号可以是隐含的,不占存储空间。若段表 存放的起始地址为 M,则 K号段对应的段表项存放的地址为 M + K*6

2.2.2.2 地址转换

此处输入图片的描述

2.2.2.3 小结

此处输入图片的描述

2.2.3 分段、分页管理的对比

页是信息的物理单位。分页的主要目的是为了实现离散分配,提高内存利用率。分页仅仅是系统管 理上的需要,完全是系统行为,对用户是不可见的。
段是信息的逻辑单位。分页的主要目的是更好地满足用户需求。一个段常包含着一组属于一个逻辑模块的信息。分段对用户是可见的,用户编程时需要显式地给出段名。

页的大小固定且由系统决定。段的长度却不固定,决定于用户编写的程序。
分页的用户进程地址空间是一维的,程序员只需给出一个记忆符即可表示一个地址。 分段的用户进程地址空间是二维的,程序员在标识一个地址时,既要给出段名,也要给出段内地址。

分段比分页更容易实现信息的共享和保护。不能被修改的代码称为纯代码或可重入代码(不属于临 界资源),这样的代码是可以共享的。可修改的代码是不能共享的

访问一个逻辑地址需要几次访存?
分页(单级页表):第一次访存——查内存中的页表,第二次访存——访问目标内存单元。总共两次 访存
分段:第一次访存——查内存中的段表,第二次访存——访问目标内存单元。总共两次访存 与分页系统类似,分段系统中也可以寻入快表机构,将近期访问过的段表项放到快表中,这样可以加
快地址变换速度。

优点 缺点
分页管理 内存空间利用率高,不会产生外部碎片,只会有少量的页内碎片 不方便按照逻辑模块实现信息的共享和保护
分段管理 很方便按照逻辑模块实现信息的共享和保护 如果段长过大,为其分配很大的连续空间会很不方便。另外,段式管理会产生外部碎片

2.2.4 段页式管理

-------------本文结束感谢您的阅读-------------