操作系统多级页表与快表--12

x33g5p2x  于2022-07-26 转载在 其他  
字(2.5k)|赞(0)|评价(0)|浏览(688)

为了提高内存空间利用率,页应该小,但是页小了页表就大了…

对于32的操作系统来说,用于寻址的位数是32位,那么最多可以表示2的32次方大小的地址,也就是4G。

4G大小能够存放多少页呢 ?

就以Linux 0.11 每页4k进行计算,4G/4K=1M ,4G寻址空间,可以定位到1M的页数。

那么如果某程序发出了某个32位的虚拟地址,然后将该地址除以4k,可以得到对应的虚拟页号是多少,然后需要通过查询页表来获取到该虚拟页号对应的实页号:

通过查询页表,可以知道某个虚拟页号对应的实页号,但是用户发出的32位地址空间,可以表示的虚拟页号有1M之多,那么就意味着,页表项中需要维护着1M个虚拟页号与其对应实页好的映射关系,那么这个页表占据的内存是不是太大了?

并且考虑到页大小如果设计的越大的话,那么对于内存资源的浪费就越严重,那么就要缩小页的大小,但是页大小的缩小,就意味着32地址所表示的虚拟页号会增多,随之而来的是页表中表项记录的增加,页表越来越大,这种情况下,该怎么处理呢?

页表会很大,页表放置就成了问题…

页面尺寸通常为4K,而地址是32位的,所以32地址能够表示2的20次方个页面。

2的20次方个页表项都得放在内存中,需要4M内存;系统中并发10个进程,就需要40M内存。

32位: 总空间[0,4G]!

实际上大部分逻辑地址根本不会用到,因为对于某个程序而言,通常最大访问内存的范围可能也就十几M,根本不会达到4G大小。

对于下面给出的例子而言: 假设某个程序的页表如下,虚拟页号为2的一栏为空,是因为当前程序没有使用到该虚拟页,那么很自然我们就想到了删除掉这一行记录。

所以大家思考: 能否将不使用的逻辑页号从页表中删除掉呢?

第一种尝试,只存放用到的页

很自然的想法:用到的逻辑页才有页表项

如果只存放用到的页到页表中,那么每次去页表中定位某个虚拟页号对应的表项就需要顺序遍历一遍,挨个比较才能定位到对应的表项,这样话,假设页表中的表项有1000个,那么平均每次定位就需要访存500次 !!!

读取一条指令需要访存一次,但是你光定位,就给我额外访问了500次之多,这不是搞笑的吗?

很自然,因为表项是顺序排列,人们就想到通过二分查找等手段来加速查询过程,但是即使是二分查找,复杂度也在log(n)。

对于32位地址而言,也需要log(2^20)=20次额外的访存。
对于CPU而言,其主要瓶颈就在访存上,如果页表中表项不是连续的,那么就意味着,我们每执行一条指令,就额外需要10几次访存。

这显然行不通,因此页表中表项必须是连续的才行,即使没用到,也保留。

如果页表中表项是连续的,没用到的虚拟页号也会保留的话,那么定位到具体的表项只需要额外一次访存即可

32位地址空间+ 4K页面+页号必须连续 ===> 2^20个页表项 ==>大页表占用内存,造成浪费

既要连续又要让页表占用内存少,怎么办?

用书的章目录和节目录来类比思考…

第二种尝试:多级页表,即页目录表(章)+页表(节)

对于书本而言,普通图书的目录结构通过是由章加小节构成的,如下:

假设我们需要去看看链表的相关知识点,那么因为章节是连续的,那就先挨个看看章节名,通过章节名,就可以判断链表这个知识点在不在当前章节中,如果不在,就不需要去看这个章节下面的小节了。

发现在第25章中,因此,我们只需要看第25章哪一个小节对应了链表。

假设每章下面有10个小节,而我们通过看章节名,直接跳过了25个章节下面的250个小节,相当于省去了250次比较的过程

如果将这种思想放到页管理上来,就引出了下面的页目录表(章)+页表(节),对于可以直接跳过其中小节的页章节,那么对应该页章节指向的页小节就可以不用载入到内存中来,节省了内存资源。

具体是怎么设计的多级页表的呢?

  • 对于逻辑地址(虚拟地址)而言,它的前10位表示的是页目录号,即最多可以表示2^10 个页目录,随后是10位的页号,表示一个页目录下最多存放2^10个页表项。

那么首先当前进程PCB中需要记录当前进程对应的页目录位置,即需要有一个页目录指针,并且该页目录是需要载入内存的。

并且页目录中的表项也都是连续存放的,如果有表项是当前进程用不到,也会保留,这样可以保证连续性,从而定位到某个页目录只需要一次访存即可。

页目录中每个表项,可以看做是一个章节,每个章节指针指向了一个存放着2^10个页表项的页面,并且该页面中的页表项也都是连续存放的,可以直接通过1次访存定位到具体的页表项,然后通过页表项找到对应的实页号。

当前进程只需要载入自己需要的页章节指针指向的页小节页面到内存即可,对于自己用不到的页章节,则无需载入其对应的页小节页面到内存中来,这样可以大大节约内存,并且访存次数也只需要两次即可。

多级页表提高了空间效率,但在时间上?

对于多级页表而言,如果只有两级的话,需要先去页目录中定位到具体的页章节,然后通过该页章节指针,来到其指向的页小节页面,在页小节页面中再定位到具体的页表项,然后就可以通过页表项得到其对应的实页号。

可见多级页表虽然节约了内存的开销,但是在时间上,相对于单级页表而言,还是多出来了一次访存的开销,并且随着级数增加,访存开销也会变大。

为了保证页表项连续,并且还要减少页表对内存的浪费,就必须采用多级页表的形式,但是多级页表时间上的不足,应该由什么来弥补呢?

  • 最常见的思想就是缓存,因为缓存可以提高时间效率,而这里就是使用了TLB快表充当缓存作用,以此来弥补多级页表时间上的不足

通过CPU内部从TLB寄存器,来缓存最近使用到的页,并且因为TLB采用了相联存储设计,硬件可以直接通过虚页号定位到缓存中某个表项,然后直接得到对应的实业号,从而直接计算得出物理地址。
相联存储可以联系一下计算机组成原理中cache缓存那一块知识点

如果TLB缓存未命中,则再去查询多级页表,然后将结果加入缓存。

如果TLB缺失,那么查询多级页表也就不可避免了,只要确保了TLB的高命中率,那么查询多级页表这点时间浪费,也就可以被弥补了

TLB得以发挥作用的原因

为什么TLB条目数可以在64-1024之间?

正是因为程序访问存在局部性原理,所以程序执行时,通常在某个时间段内,只会频繁访问某几个页面号,那么因为TLB缓存了对应的页面号,所以命中率就会很高。

相关文章