从硬件出发,浅谈操作系统的段机制与页机制


我们写一个程序,经过编译之后会变成一堆的指令。操作系统在执行这个程序的时候,也正是执行这堆指令。 指令可以是 取数据的指令 或 取下一条被执行指令 的指令。但无论是什么指令,都会进行内存的访问和寻址。就像是我们必须找到东西放在哪里,我们才能去使用它。

那操作系统怎样帮我们去寻址呢?答案是 内存寻址涉及到内存的 段机制 和 页机制。

让我们从硬件的发展史的角度来看段机制。

段的引入是解决“ 地址总线的宽度一般要大于寄存器的宽度 ”这个问题。

8086的分段寻址,是指一个物理地址由段地址(segment selector)与偏移量(offset)两部分组成,长度各是16比特。其中段地址左移4位(即乘以16)与偏移量相加即为物理地址。例如,06EFh:1234h,表示段地址为06EFh,偏移量为1234h,物理地址为06EF0h + 1234h = 08124h。在计算物理地址时如果发生上溢出,8086处理器舍弃进位。例如,FFFFh:0010h所对应的物理地址为00000h.

这种分段寻址,即 段地址+偏移量 的做法,在以80286开始之后会被称为 实模式。 1982年,Intel 的80286面世了。它是第一款采用 保护模式 的 x86微处理器。地址总线增加到24位使它可以访问到16M 的内存空间。即使是可访的内存空间增加了,但它的分段大小依然是64K,程序的规模受限,注定286受不到更多的喜爱。

所以,286很快就被80386所替代了。

1985年,Intel 发布了80386。一个拥有32位的微处理器。并且地址总数(address bus)也是32位的,寻址能力大幅提高到4G。同时,为了向前兼容8086,386中既有保护模式,又有实模式。并且在保护模式下,分段的大小可以到达4G(2**32)。

现在有必要简单交代一下,实模式 与 保护模式 分别是什么了。

实模式: 是 段地址+偏移量 的方式,得到物理地址,进而寻址。 保护模式: 不允许通过段寄存器取值得到段的起始地址,而是把虚拟地址转进一个 MMU 的硬件,经过额外的转换和检查,进而得到一个物理地址。(如下图)。其中的额外检查就可以起到例如保护某段数据的作用。

是时候来一个简单的总结了。

从4004到386,先是直接物理地址寻址,然后是 实模式 形式的寻址,最后变为 保护模式 形式寻址。 最重要的变化是从“实模式”向“保护模式”的转变。这背后实际也是处理器的系统体系结构的变化。虽然386往后的CPU在各方面都有改进,但由于在本质上的结构没有大变化,所以386往后的处理器都统称80x86。

我们还需要解决小内存运行大作业的问题——页机制的引入

段机制抛开了实际物理内存的大小,从抽象层面提供给开发人员更大的线性空间进行程序开发。但物理内存如果不足时的情况仍需解决。

分页,这时就被提出了。分页很好地解决了小内存的问题。

它通过将 物理内存空间 和 线性地址空间 分成若干相等的页。(一般都为4KB)。这样整个程序就不需要连续存放在物理内存中,更可以按需把页面调进内存,而不需要把整个线性地址空间加载到内存中。正如你将会看到的,这种机制十分巧妙又实用。 要实现分页,需要讨论的问题比分段要多,这里不过多累赘,有兴趣可以移步到《操作系统学习笔记-储存管理》这篇文章阅读。

最后

本文只是一种浅述,没有对段机制和页机制进行深入。只是从历史的角度出发,整理后扼要地介绍这两个机制。 如果顺着这个方向进一步找书和资料会发现 Intel 的设计是越来越细致和周全的。而实际在各种不同处理器上开发操作系统又是有各种的考虑和取舍的。 例如 Linux,它就没有用 Intel 的段机制,而是将其绕过。毕竟不是每个品牌的处理器都支持段的。