当前课程知识点:操作系统 > 第二十一讲 文件系统 > 21.2 文件描述符 > 21.2 文件描述符
下面我们来讨论
文件描述符这个基本的概念
文件描述符是指打开的文件
它在内存当中所维护的相关信息
首先我们来讨论一下打开文件的过程
我在读写数据之前
我必须打开文件
这是我们通常情况下
你写的程序里头的文件访问的模式
打开然后进行读 或者写操作
完成之后 一个关闭
我就不再对这个文件进行操作了
针对于这种模式呢
在操作系统内核当中
维护了打开文件的相关信息
也就是说它会跟踪进程打开的文件
所谓的跟踪就是在内核当中
维护了一个打开文件表
这个文件表里的每一项
对应一个打开的文件
这时候我给它一个标识
就是文件描述符
也就是说文件描述符
是打开文件的一个标识
为什么我不直接用文件的标识呢
原因在于打开文件的数目和
你的文件系统里的文件数目
是有数量级的差别的
这样的话我可以给它一个
更简单的标识来方便我们的访问
文件描述符是操作系统
在打开文件表中维护的
打开文件的状态和信息
这里有些什么样的信息呢
首先第一个是文件指针
我们在读写文件的时候
最后一次读写的位置
每个进程都维护自己的打开文件指针
也就相当于我有一个文件
有多个进程对它进行读写
在读的时候你的这个指针
每个进程只是跟自己的指针相关联
另外的一个进程读写相同的文件
这时候你的文件指针
并不随着它的读写而发生改变
这就是我们这里说的
每个进程分别维护自己的打开文件指针
除了文件指针之外
再有一个是文件打开计数
这里指的是当前这个
被打开的文件打开的次数
记录这个次数的意思是在于
最后一个进程关闭文件的时候
那么就可以将这个文件
从打开文件表当中去除了
这是打开文件计数
同时还有就是文件在磁盘上的位置
这时候我们会把一部分
磁盘上的文件的内容缓存到内存当中
所以这时候
我要记录文件在磁盘上的位置
你下次再读的时候
有缓存的这些内容
我就可以利用内存当中
缓存的数据让你进行访问
再有是访问权限
每个进程访问文件的时候
它是以什么样的方式来进行访问
你比如说只读 可读可写
为了能够通过文件系统
来实现对文件的访问
我们有必要来讨论一下
文件从用户和系统的角度来讲
它是个什么样的
这就是我们这里说到的
文件的用户视图和系统视图
用户视图是指
我们用户进程看到的文件是什么样
这里头呢 文件是持久的数据结构
这是你应用进程
我需要读写文件里的数据的时候
这些数据是有结构的
这是我们这里想看到的
但是从系统的角度来讲
它并不关心这个事
所以系统提供了一个文件的访问接口
在这里头呢
文件变成了一个字节序列了
当然对这一点的理解
不同的系统会有一些差别
在Unix 系统Linux系统 这一类的系统里
它认为文件内容是字节的序列
操作系统并不关心
存储在磁盘上的数据这些数据的格式
这是你应用进程需要关心的
这就是我们这里的系统视图
也就是说它把文件
视为是数据块的集合
说到数据块呢 这有两个
我们访问的数据块和磁盘的扇区
有关系但是也有区别
数据块是逻辑的存储单位
可能由多个扇区组成
而扇区是物理的存储单元
数据块的大小和扇区的大小
可能不一样
通常情况下是
几个扇区构成一个数据块
特别是对于容量比较大的
这些磁盘来说是这样的
有了用户的视角和系统的视角
那这时候它们之间的转换怎么来做呢
我们先来看一个文件读写的例子
进程读文件的时候
它是怎么在做呢
首先读取你对应的这个内容
所在的那个数据块
整块读出来 也就是说磁盘的访问
它具有这样一个特征
它的最小访问单位只能是块
我不能去对块当中的单独的字节
进行读或者是写
也就是说你想读出一个字节
也必须把整块读出来
你想写一个字节
也必须把整块重新写
那这样一来的话
我在这个地方就是
读出字节所在的数据块
然后把其中需要的内容返回给进程
这是你的读操作
而进程的写文件操作呢
它是先读取相应的数据块
也就是说你要写的那个位置所对应的
那一块的内容全部读出来
然后修改相应块当中的对应的内容
修改完毕之后 把整块写回去
这是你的写操作 对于这种情况呢
我们在这里头从用户视图到系统视图
就有一个转换
这个转换过程当中的
一个重要的特征是文件系统当中的操作
它的基本操作单位是数据块
有了这个之后
我们在这里就会有这样一个特征
你即使只读一个字节
也需要把整块读出来
你比如说我这里一个字节
而一块呢 是4K 那这时候呢
也就相当于我为了
读其中千分之零点几的数据
读写的量实际上是它的上千倍
所以在这里头呢
读写数据的时候我们一种优化
就是一块的内容
我是不是有可能
把它充分的利用起来
在具体讨论内容的时候
我们还有一个问题需要在这来讨论
就是进程对文件的访问模式
也就是说操作系统
在实现文件系统的时候
它需要了解用户进程
是如何访问文件的
那么在这里头呢
有这样三种方式
第一种是顺序访问
按文件的字节序列这个顺序
依次进行读写操作
我们现在用到的大多数文件访问
都是顺序访问
而第二种是随机访问
我访问的位置并不是顺序的
从中间读
这种做法呢
在实际的进程访问当中并不常用
但是仍然很重要
比如说像我们在这里的虚拟存储当中
把内存页存储到对换文件当中
这时候它的访问就是随机的
它对系统的性能的影响很大
第三个是索引访问
依据数据特征
来找文件当中的相应位置的数据
这种做法通常情况下
在我们操作系统里
并不完整的提供索引访问机制
一种做法是在上边建数据库
数据库提供完善的索引访问方式
实际上某种角度上来讲
我们可以认为操作系统里的文件系统
是一个小型的数据库
这是索引访问文件的一个示例
说我要想找文件里的某一个记录
这时我怎么找呢
我需要先找着
这个记录对应的位置在哪
这时候形成一个索引
一种我把它整个读出来
然后再挑我想要的这个
这时候它的效率会比较低
所以在这呢
基于索引的访问的话
就是我在这里加了一个索引
事先把相应的内容做了一种抽象
然后这时候我再来访问的时候
我先访问索引文件里的内容
找到它对应的位置
这时候再去读它相应的记录的内容
这样的话就可以提高它的读写效率
这是索引访问的做法
对于文件的内部呢
我们说从操作系统的角度来讲
它并不关心它的结构
在实际的系统当中
我们可以把它视为这样几种结构
一种是无结构的
它就是一个单词 或者说字节的序列
第二种是简单的记录结构
我把它分成若干列
每一列是其中的一个内容
这种列的大小或者记录的大小
可以有固定长度的
也可以是可变长度的
再有一种就是复杂结构的
我在这里定义复杂的结构
通常情况下这些复杂的结构
都是由你应用程序来识别
而从操作系统层面来讲
这些结构并不是很关心
但是为什么我们在这里会来讨论
它的内部结构呢
就是你到底是可执行文件
还是文本文件
在操作系统接口这一层面上
它提供某种程度的支持和识别
接下来是文件的共享和访问控制
多用户系统里头
文件的共享就变得很必要了
你比如说系统里很多文件
你不可以每个用户保存一份
通过共享可以节约磁盘的存储空间
在这里共享之后就带来一个问题
我的访问如何来控制
访问控制是每个用户
它到底可以访问哪些文件
可以以什么样的方式来访问
这是访问权限
在我们现在的系统里
通常情况下的访问权限有这样几种
读 写 执行 删除和看到它的列表
这些基本的权限呢
对应到每一个用户
这就是我们的文件访问控制列表 ACL
对于每一个文件 每一个用户
它有什么样的权限
在Unix系统里它的做法是这样的
用户分成当前的用户
用户所在的组和系统里的所有人
也就是分成三个范围
然后每一个文件的访问权限
分成读 写 执行这样三种权限
如果在这种情况下
你要想把所有的文件权限全部列清楚
这时候就构成一个访问矩阵了
三种类型的用户
然后它有三种权限组合到一起
每一个文件有一个自己的选择
那这样我给出整个系统当中的
每一个文件的访问权限
为了让这件事情做起来方便
我们需要识别用户
我必须识别用户是谁
我才能决定它有什么样的访问权限
然后为了让这件事情做起来效率更高
我们可以把用户分组 提供组标识
那这样的话
我可以给一组人设相同的权限
我只需要判断这个用户
是否在这个组就行了
关于访问权限
我们在这里就只做一个简单讨论
深入的讨论在不同的操作系统当中
都有很多的内容
接下来一个问题是说
共享所导致的语义一致性
当多个进程同时访问共享文件的时候
它们如何来协调
这里的协调
我们同前边的同步算法很相似
我需要协调我写到里头的内容
你读的内容大家是不是一致的
由于磁盘和网络延时的缘故
我们在文件系统里
对这个问题是弱化处理的
也就是说它的设计很简单
在Unix系统里简单到什么程度呢
对于文件的读写
一个用户写进去的内容
其他的用户立即可见
然后共享文件呢
允许多个用户同时读和写
基本上是说在这里
它没有协调的这些控制
这样一来的话
你的内容读写是不是完整
就需要靠应用程序自己来把握
那也就相当于我把这个一致性的问题
甩给应用进程自己去处理了
还有两种做法呢
一个是会话语义
写入的内容只有当文件被关闭的时候
其它用户才可见 这样一来的话
你相当于改的内容必须写完整了
其他的进程才能看得到
这样一来它们之间要协调的事情
就变得会简单一些
但是它的效率会低一些
还有一种是读写锁
操作系统在这里呢
提供几种基本的互斥访问锁
由应用进程自己来选择
我需要什么样的同步互斥
来保证我内容的一致性
这是一致性的问题
-0.1 Piazza讨论区
--html
-0.2 在线实验平台
--实验平台使用帮助
--平台使用帮助
-0.2在线实验平台
--Raw HTML
-1.1 课程概述
--视频
-第一讲 操作系统概述--练习
-1.2 教学安排
--视频
-1.3 什么是操作系统
--Video
-1.4 为什么学习操作系统,如何学习操作系统
--Video
-1.5 操作系统实例
--视频
-1.6 操作系统的演变
--视频
-1.7 操作系统结构
--视频
-2.1 前言和国内外现状
-2.2 OS实验目标
-2.3 8个OS实验概述
-2.4 实验环境搭建
-2.5 x86-32硬件介绍
-2.6 ucore部分编程技巧
-2.7 演示实验操作过程
--Q6
--Q7
--Q10
-3.1 BIOS
--3.1 BIOS
-3.2 系统启动流程
-3.3 中断、异常和系统调用比较
-第三讲 启动、中断、异常和系统调用--3.3 中断、异常和系统调用比较
-3.4 系统调用
--3.4 系统调用
-第三讲 启动、中断、异常和系统调用--3.4 系统调用
-3.5 系统调用示例
-3.6 ucore+系统调用代码
-4.1 启动顺序
--4.1 启动顺序
-4.2 C函数调用的实现
-4.3 GCC内联汇编
-4.4 x86中断处理过程
-4.5 练习一
--4.5 练习一
-4.6 练习二
--4.6 练习二
-4.7 练习三
--4.7 练习三
-4.8 练习四 练习五
-4.9 练习六
--4.9 练习六
-5.1 计算机体系结构和内存层次
-5.2 地址空间和地址生成
-5.3 连续内存分配
-5.4 碎片整理
--5.4 碎片整理
-5.5 伙伴系统
--5.5 伙伴系统
-第五讲 物理内存管理: 连续内存分配--5.6 练习
-6.1 非连续内存分配的需求背景
-6.2 段式存储管理
-- 6.2 段式存储管理
-6.3 页式存储管理
-6.4 页表概述
--6.4 页表概述
-6.5 快表和多级页表
-6.6 反置页表
--6.6 反置页表
-6.7 段页式存储管理
-第六讲 物理内存管理: 非连续内存分配--6.8 练习
-7.1 了解x86保护模式中的特权级
-第七讲 实验二 物理内存管理--7.1 了解x86保护模式中的特权级
-7.2 了解特权级切换过程
-第七讲 实验二 物理内存管理--7.2 了解特权级切换过程
-7.3 了解段/页表
-第七讲 实验二 物理内存管理--7.3 了解段/页表
-7.4 了解UCORE建立段/页表
-第七讲 实验二 物理内存管理--7.4 了解UCORE建立段/页表
-7.5 演示lab2实验环节
-8.1 虚拟存储的需求背景
-8.2 覆盖和交换
-8.3 局部性原理
-8.4 虚拟存储概念
-8.5 虚拟页式存储
-8.6 缺页异常
--8.6 缺页异常
-9.1 页面置换算法的概念
-9.2 最优算法、先进先出算法和最近最久未使用算法
-第九讲 页面置换算法--9.2 最优算法、先进先出算法和最近最久未使用算法
-9.3 时钟置换算法和最不常用算法
-第九讲 页面置换算法--9.3 时钟置换算法和最不常用算法
-9.4 Belady现象和局部置换算法比较
-第九讲 页面置换算法--9.4 Belady现象和局部置换算法比较
-9.5 工作集置换算法
-第九讲 页面置换算法--9.5 工作集置换算法
-9.6 缺页率置换算法
-第九讲 页面置换算法--9.6 缺页率置换算法
-9.7 抖动和负载控制
-10.1 实验目标:虚存管理
-第十讲 实验三 虚拟内存管理--10.1 实验目标:虚存管理
-10.2 回顾历史和了解当下
-第十讲 实验三 虚拟内存管理--10.2 回顾历史和了解当下
-10.3 处理流程、关键数据结构和功能
-第十讲 实验三 虚拟内存管理--10.3 处理流程、关键数据结构和功能
-10.4 页访问异常
-第十讲 实验三 虚拟内存管理--10.4 页访问异常
-10.5 页换入换出机制
-第十讲 实验三 虚拟内存管理--10.5 页换入换出机制
-11.1 进程的概念
-第十一讲 进程和线程--11.1 进程的概念
-11.2 进程控制块
-第十一讲 进程和线程--11.2 进程控制块
-11.3 进程状态
-第十一讲 进程和线程--11.3 进程状态
-11.4 三状态进程模型
-11.5 挂起进程模型
-第十一讲 进程和线程--11.5 挂起进程模型
-11.6 线程的概念
-第十一讲 进程和线程--11.6 线程的概念
-11.7 用户线程
-第十一讲 进程和线程--11.7 用户线程
-11.8 内核线程
-第十一讲 进程和线程--11.8 内核线程
-12.1 进程切换
-第十二讲 进程控制--12.1 进程切换
-12.2 进程创建
-第十二讲 进程控制--12.2 进程创建
-12.3 进程加载
-第十二讲 进程控制--12.3 进程加载
-12.4 进程等待与退出
-第十二讲 进程控制--12.4 进程等待与退出
-13.1 总体介绍
-13.2 关键数据结构
-13.3 执行流程
-13.4 实际操作
-14.1 总体介绍
-14.2 进程的内存布局
-14.3 执行ELF格式的二进制代码-do_execve的实现
--14.3 执行ELF格式的二进制代码-do_execve的实现
-14.4 执行ELF格式的二进制代码-load_icode的实现
--14.4 执行ELF格式的二进制代码-load_icode的实现
-14.5 进程复制
-14.6 内存管理的copy-on-write机制
-15.1 处理机调度概念
-第十五讲 处理机调度--15.1 处理机调度概念
-15.2 调度准则
-15.3 先来先服务、短进程优先和最高响应比优先调度算法
--15.3 先来先服务、短进程优先和最高响应比优先调度算法
-第十五讲 处理机调度--15.3 先来先服务、短进程优先和最高响应比优先调度算法
-15.4 时间片轮转、多级反馈队列、公平共享调度算法和ucore调度框架
--15.4 时间片轮转、多级反馈队列、公平共享调度算法和ucore调度框架
-第十五讲 处理机调度--15.4 时间片轮转、多级反馈队列、公平共享调度算法和uc
-15.5 实时调度和多处理器调度
-第十五讲 处理机调度--15.5 实时调度和多处理器调度
-15.6 优先级反置
-第十五讲 处理机调度--15.6 优先级反置
-16.1 总体介绍和调度过程
-16.2 调度算法支撑框架
-16.3 时间片轮转调度算法
-16.4 Stride调度算法
-17.1 背景
--17.1 背景
-17.2 现实生活中的同步问题
-第十七讲 同步互斥--17.2 现实生活中的同步问题
-17.3 临界区和禁用硬件中断同步方法
-第十七讲 同步互斥--17.3 临界区和禁用硬件中断同步方法
-17.4 基于软件的同步方法
-第十七讲 同步互斥--17.4 基于软件的同步方法
-17.5 高级抽象的同步方法
-第十七讲 同步互斥--17.5 高级抽象的同步方法
-18.1 信号量
--18.1 信号量
-第十八讲 信号量与管程--18.1 信号量
-18.2 信号量使用
-第十八讲 信号量与管程--18.2 信号量使用
-18.3 管程
--18.3 管程
-第十八讲 信号量与管程--18.3 管程
-18.4 哲学家就餐问题
-18.5 读者-写者问题
-19.1 总体介绍
-19.2 底层支撑
-第十九讲 实验七 同步互斥--19.2 底层支撑
-19.3 信号量设计实现
-第十九讲 实验七 同步互斥--19.3 信号量设计实现
-19.4 管程和条件变量设计实现
-第十九讲 实验七 同步互斥--19.4 管程和条件变量设计实现
-19.5 哲学家就餐问题
-20.1 死锁概念
-第二十讲 死锁和进程通信--20.1 死锁概念
-20.2 死锁处理方法
-第二十讲 死锁和进程通信--20.2 死锁处理方法
-20.3 银行家算法
-第二十讲 死锁和进程通信--20.3 银行家算法
-20.4 死锁检测
-第二十讲 死锁和进程通信--20.4 死锁检测
-20.5 进程通信概念
-第二十讲 死锁和进程通信--20.5 进程通信概念
-20.6 信号和管道
-第二十讲 死锁和进程通信--20.6 信号和管道
-20.7 消息队列和共享内存
-第二十讲 死锁和进程通信--20.7 消息队列和共享内存
-21.1 文件系统和文件
-第二十一讲 文件系统--21.1 文件系统和文件
-21.2 文件描述符
-第二十一讲 文件系统--21.2 文件描述符
-21.3 目录、文件别名和文件系统种类
-第二十一讲 文件系统--21.3 目录、文件别名和文件系统种类
-21.4 虚拟文件系统
-第二十一讲 文件系统--21.4 虚拟文件系统
-21.5 文件缓存和打开文件
-第二十一讲 文件系统--21.5 文件缓存和打开文件
-21.6 文件分配
-第二十一讲 文件系统--21.6 文件分配
-21.7 空闲空间管理和冗余磁盘阵列RAID
-第二十一讲 文件系统--21.7 空闲空间管理和冗余磁盘阵列RAID
-22.1 总体介绍
-第二十二讲 实验八 文件系统--22.1 总体介绍
-22.2 ucore 文件系统架构
-第二十二讲 实验八 文件系统--22.2 ucore 文件系统架构
-22.3 Simple File System分析
-第二十二讲 实验八 文件系统--22.3 Simple File System分析
-22.4 Virtual File System分析
-第二十二讲 实验八 文件系统--22.4 Virtual File System分
-22.5 I/O设备接口分析
-第二十二讲 实验八 文件系统--22.5 I/O设备接口分析
-22.6 执行流程分析
-23.1 I/O特点
--视频
-第二十三讲 I/O子系统--23.1 I/O特点
-23.2 I/O结构
--816C80A0F5E3B8809C33DC5901307461
-第二十三讲 I/O子系统--23.2 I/O结构
-23.3 I/O数据传输
--C58221E14388B9DB9C33DC5901307461
-第二十三讲 I/O子系统--23.3 I/O数据传输
-23.4 磁盘调度
--567A3F1FCBFB3F4C9C33DC5901307461
-第二十三讲 I/O子系统--23.4 磁盘调度
-23.5 磁盘缓存
--C327536B80D25CE79C33DC5901307461
-第二十三讲 I/O子系统--23.5 磁盘缓存
-html
--html