1. SD卡中FAT32文件系统快速入门
1.1. 理论知识
1.1.1. MBR(Main Boot Record)
- 主引导记录,占446字节, 为计算机启动后从可启动介质上首先装入内存并且执行的代码,通常用来解释分区结构
1.1.2. DBR(DOS Boot Record)
- DOS引导记录,为操作系统进入文件系统以后可以访问的第一个扇区,通常用来解释文件系统,DBR是由硬盘的MBR装载的程序段。DBR装入内存后,即开始执行该引导程序段,其主要功能是完成操作系统的自举并将控制权交给操作系统。每个分区都有引导扇区,但只有被设为活动分区才会被MBR装的DBR入内存运行
1.1.3. EBR(Extended Boot Record)
- 扩展分区引导记录,类似于主引导记录MBR.因为MBR四条分区信息的限制,可以使用EBR方便扩展.它的结构与MBR类似,但是没有引导程序和磁盘签名,仅仅保留了分区表和结束标志
1.1.4. 工具说明
- 本文中的SD卡为SanDisk,大小为8G(卡上面写的),每簇8个扇区,每扇区512bytes
- 使用的查看工具为“Winhex.exe”
1.2. 硬盘结构与SD卡结构
1.2.1. 硬盘结构
-
以4分区的硬盘为例加以说明:
-
主引导扇区包括主引导记录(446bytes),4个DPT(Disk partition table硬盘分区表)(4*16=64bytes),分区有效标志0x55AA
-
扩展分区中的每个逻辑驱动器都存在一个类似于MBR的扩展引导记录EBR。扩展引导记录包括一个扩展分区表和该扇区的标签。如果磁盘上没有扩展分区,那么就不会有扩展引导记录和逻辑驱动器。第一个逻辑驱动器的扩展分区表中的第一项指向它自身的引导扇区。第二项指向下一个逻辑驱动器的EBR。如果不存在进一步的逻辑驱动器,第二项就不会使用,而且被记录成一系列零。如果有附加的逻辑驱动器,那么第二个逻辑驱动器的扩展分区表的第一项会指向它本身的引导扇区。第二个逻辑驱动器的扩展分区表的第二项指向下一个逻辑驱动器的EBR。扩展分区表的第三项和第四项永远都不会被使用。
关于扩展分区,如下图所示,扩展分区中逻辑驱动器的扩展引导记录是一个连接表。该图显示了一个扩展分区上的三个逻辑驱动器,说明了前面的逻辑驱动器和最后一个逻辑驱动器之间在扩展分区表中的差异 -
除了扩展分区上最后一个逻辑驱动器外,扩展分区表的格式在每个逻辑驱动器中都是重复的:第一个项标识了逻辑驱动器本身的引导扇区,第二个项标识了下一个逻辑驱动器的EBR。最后一个逻辑驱动器的扩展分区表只会列出它本身的分区项。最后一个扩展分区表的第二个项到第四个项未被使用
1.2.2. MBR分析
- MBR放置在硬盘物理地址0的地方。总共512字节的主引导扇区中,MBR只占用了其中的446个字节,另外64个字节交给了 DPT,最后两个字节“55,AA”是分区的结束标志。DPT由4个分区表组成,每个16字节。下图为硬盘的MBR图
- 你的硬盘的MBR引导代码可能并非这样。不过即使不同,所执行的功能大体是一样的
-
红色划线部分即为DPT分区表,详细定义如下表,仅以第一个分区表为例说明,需要注意的是FAT32文件系统数据存储方式为小端字节序,数据反着看就对了~就像下表中总扇区数一样
1.2.3. SD卡结构
SD卡是没有分区的,默认只有一个分区,使用winhex打开如下
- unpartitioned space:非分区空间,即MBR所在扇区,0扇区
- Partition1(F:):分区空间,数据即是保存在此处的,开始扇区为305152,此值可以在MBR中找到
- 分区是以柱面的容量为分区粒度的,如果磁盘总空间不是整数个柱面的话,不够一个柱面空间就是剩余空间了,这部分空间并不参与分区,无法利用
- 卡空间说明:7.3G=8*1000*1000*1000/1024/1024/1024,8G使用单位是十进制的,十进制下1G=1000M=1000000K=1000000000Bytes,而二进制下1G=1024M、1M=1024K,1K=1024bytes,而硬盘制造商一般会以10进制为单位
1.2.4. SD卡MBR
打开上图非分区空间,如下:
- 红色划线(0x0004A800):相对扇区数,305152,四不四很熟悉?
- 绿色划线(0x00E83800):总扇区数,15218688
- 总空间=总扇区数*每扇区字节数=15218688*512=7791968256,winhen显示的总字节数为7948206080差不多啦~~~
1.2.5. SD卡存储结构
SD卡文件系统并不是处在整个SD卡最开始的地方,它处在MBR所处的保留区之后,于是我们可以对使用FAT32文件系统的SD卡整体布局给出如下图示。
1.3. FAT32文件系统
1.3.1. FAT文件系统介绍
-
FAT(File Allocation Table,文件分配表)文件系统是windows操作系统所使用的一种文件系统,它的发展过程经历了FAT12、FAT16、FAT32三个阶段。FAT文件系统用“簇”作为数据单元。一个“簇”由一组连续的扇区组成,簇所含的扇区数必须是2的整数次幂。簇的最大值为64个扇区,即32KB。所有簇从2开始进行编号,每个簇都有一个自己的地址编号。用户文件和目录都存储在簇中。 本文每簇4KB大小。
-
FAT文件系统的数据结构中有两个重要的结构:文件分配表和目录项:
文件分配表:文件和文件夹内容储存在簇中,如果一个文件或文件夹需要多于一个簇的空间,则用FAT表来描述,如何找到另外的簇。FAT结构用于指出文件的下一个簇,同时也说明了簇的分配状态。FAT12、FAT16、FAT32这三种文件系统之间的主要区别在与FAT项的大小不同。
目录项:FAT文件系统的每一个文件和文件夹都被分配到一个目录项,目录项中记录着文件名、大小、文件内容起始地址以及其他一些元数据。 - 在FAT文件系统中,文件系统的数据记录在“引导扇区中(DBR)”中。引导扇区位于整个文件系统的0号扇区,是文件系统隐藏区域(也称为保留区)的一部分,我们称其为DBR扇区,DBR中记录着文件系统的起始位置、大小、FAT表个数及大小等相关信息。在FAT文件系统中,同时使用“扇区地址”和“簇地址”两种地址管理方式。这是因为只有存储用户数据的数据区使用簇进行管理(FAT12和FAT16的根目录除外),所有簇都位于数据区。其他文件系统管理数据区域是不以簇进行管理的,这部分区域使用扇区地址进行管理。文件系统的起始扇区为0号扇区(逻辑0扇区)。
1.3.2. FAT32文件系统结构
FAT文件系统整体分布如1.2.5节所示
- 深绿色:保留区含有一个重要的数据结构——DOS引导扇区(DBR)。FAT12、FAT16的保留区通常只有一个扇区,而FAT32的保留扇区要多一些,除0号扇区外,还有其他一些扇区,其中包括了DBR的备份扇区。
- 黄色:FAT区由两个大小相等的FAT表组成——FAT1、FAT2,FAT2紧跟在FAT1之后。
- 灰色:FAT12、FAT16的根目录虽然也属于数据区,但是他们并不由簇进行管理。也就是说FAT12、FAT16的根目录是没有簇号的,他们的2号簇从根目录之后开始。而FAT32的根目录通常位于2号簇。
1.3.3. 保留区(深绿色)
- FAT32文件系统的开始部分有一个由若干个扇区组成的保留区,保留区的大小会记录在DBR扇区中,比较常见的为32、34或38个扇区。由DBR中0x0e和0x0f两个地址的数值决定,小端字节序,即N的值。
1.3.4. DBR解析
对读写FAT文件系统来说常用的就图中划线部分,48个字节,具体定义如下:
- 0x00~0x02:3字节,跳转指令。
- 0x03~0x0A:8字节,文件系统标志和版本号,这里为MSDOS5.0。
- 0x0B~0x0C:2字节,每扇区字节数,0x0200=512
- 0x0D~0x0D:1字节,每簇扇区数,0x08。
- 0x0E~0x0F:2字节,保留扇区数,0x0C22=3106
- 0x10~0x10:1字节,FAT表个数,0x02。
- 0x11~0x12:2字节,FAT32必须等于0,FAT12/FAT16为根目录中目录的个数;
- 0x13~0x14:2字节,FAT32必须等于0,FAT12/FAT16为扇区总数。
- 0x15~0x15:1字节,哪种存储介质,0xF8标准值,可移动存储介质。
- 0x16~0x17:2字节,FAT32必须为0,FAT12/FAT16为一个FAT 表所占的扇区数。
- 0x18~0x19:2字节,每磁道扇区数,只对于“特殊形状”(由磁头和柱面分割为若干磁道)的存储介质有效,0x003F=63。
- 0x1A~0x1B:2字节,磁头数,只对特殊的介质才有效,0x00FF=255。
- 0x1C~0x1F:4字节,EBR分区之前所隐藏的扇区数,0x0004A800=305152又出现了呢,与MBR中地址0x1C6开始的4个字节数值相等。
- 0x20~0x23:4字节,文件系统总扇区数,0x00E83800=15218688
- 0x24~0x27:4字节,每个FAT表占用扇区数,0x000039EF=14831
- 0x28~0x29:2字节,标记,此域FAT32 特有。
- 0x2A~0x2B:2字节,FAT32版本号0.0,FAT32特有。
- 0x2C~0x2F:4字节,根目录所在第一个簇的簇号,0x02。(虽然在FAT32文件系统下,根目录可以存放在数据区的任何位置,但是通常情况下还是起始于2号簇)
- 0x30~0x31:2字节,FSINFO(文件系统信息扇区)扇区号0x01,该扇区为操作系统提供关于空簇总数及下一可用簇的信息。
- 0x32~0x33:2字节,备份引导扇区的位置。备份引导扇区总是位于文件系统的6号扇区。
- 0x34~0x3F:12字节,用于以后FAT 扩展使用。
- 0x40~0x40:1字节,与FAT12/16 的定义相同,只不过两者位于启动扇区不同的位置而已。
- 0x41~0x41:1字节,与FAT12/16 的定义相同,只不过两者位于启动扇区不同的位置而已 。
- 0x42~0x42:1字节,扩展引导标志,0x29。与FAT12/16 的定义相同,只不过两者位于启动扇区不同的位置而已
- 0x43~0x46:4字节,卷序列号。通常为一个随机值。
- 0x47~0x51:11字节,卷标(ASCII码),如果建立文件系统的时候指定了卷标,会保存在此。
- 0x52~0x59:8字节,文件系统格式的ASCII码,FAT32。
- 0x5A~0x1FD:共420字节,引导代码。
- 0x1FE~0x1FF:签名标志“55 AA”。
FAT文件系统将引导代码与文件形同数据结构融合在FAT32文件系统引导扇区的512字节中,90~509字节为引导代码,而FAT12/16则是62~509字节为引导代码。同时,FAT32还可以利用引导扇区后的扇区空间存放附加的引导代码。一个FAT卷即使不是可引导文件系统,也会存在引导代码。
1.3.5. FSINFO扇区
FAT32在保留区中增加了一个FSINFO扇区,用以记录文件系统中空闲簇的数量以及下一可用簇的簇号等信息,以供操作系统作为参考。FSINFO信息扇区一般位于文件系统的1号扇区,结构非常简单。
- 0x200~0x203:4个字节,扩展引导标志“0x52526141”。
- 0x204~0x3E3:480个字节,未使用,全部置0。
- 0x3E4~0x3E7:4个字节,FSINFO签名“0x72724161”。
- 0x3E8~0x3EB:4个字节,文件系统的空簇数,0xFFFFFFFF,这个值感觉有问题,格式化SD卡新建一个小于4K的文件,此处的值变成0x1CF6FE,所以上面的值应该为0x1FF6FF,猜测可能是由于格式化之后就会将此处置FF,新建文件后才会恢复
- 0x3EC~0x3EF:4个字节,下一可用簇号(0x00000002)。
- 0x3F0~0x3FD:14个字节,未使用。
- 0x3FE~0x3FF:2个字节,“55 AA”标志。
温馨提示:通常情况下,文件系统的2号扇区结尾也会被设置“55 AA”标志。6号扇区也会有一个引导扇区的备份,相应的7号扇区应该是一个备份FSINFO信息扇区,8号扇区可以看做是2号扇区的备份。
1.3.6. FAT表
紧跟在保留分区后面的是FAT区,其由两个完全相同的FAT(File Allocation Table, 文件分配表)表单组成,FAT文件系统的名字也是因此而来。FAT 表是一组与数据簇号对应的列表。FAT2紧跟在FAT1之后,它的位置可以通过FAT1的位置加上FAT表的扇区数计算出来。
1.3.7. FAT表的作用
-
文件系统分配磁盘空间按簇来分配。因此,文件占有磁盘空间时,基本单位不是字节而是簇,即使某个文件只有一个字节,操作系统也会给它分配一个最小单元:即一个簇。对于大文件,需要分配多个簇。同一个文件的数据并不一定完整地存放在磁盘中一个连续地区域内,而往往会分若干段,像链子一样存放。这种存储方式称为文件的链式存储。为了实现文件的链式存储,文件系统必须准确地记录哪些簇已经被文件占用,还必须为每个已经占用的簇指明存储后继的下一个簇的簇号,对于文件的最后一簇,则要指明本簇无后继簇。这些都是由FAT表来保存的,FAT 表对应表项中记录着它所代表的簇的有关信息:诸如是空,是不是坏簇,是否是已经是某个文件的尾簇等。
-
对于文件系统来说,FAT表有两个重要作用:描述簇的分配状态以及标明文件或目录的下一簇的簇号。
- 通常情况下,一个FAT文件系统会有两个FAT表,但有时也允许只有一个FAT表,FAT表的具体个数记录在引导扇区的偏移0x10字节处。
- 由于FAT区紧跟在文件系统保留区后,所以FAT1在文件系统中的位置可以通过引导记录中偏移0x0E~0x0F字节处的“保留扇区数”得到,即M值。
1.3.8. FAT表分析说明
- FAT32中每个簇的簇地址是有32bit(4个字节),FAT表中的所有字节位置以4字节为单位进行划分,并对所有划分后的位置由0进行地址编号。0号地址与1号地址被系统保留并存储特殊标志内容。从2号地址开始,每个地址对应于数据区的簇号,FAT表中的地址编号与数据区中的簇号相同。我们称FAT表中的这些地址为FAT表项,FAT表项中记录的值称为FAT表项值。
- 当文件系统被创建,也就是进行格式化操作时,分配给FAT区域的空间将会被清空,在FAT1与FAT2的0号表项与1号表项写入特定值。由于创建文件系统的同时也会创建根目录,也就是为根目录分配了一个簇空间,通常为2号簇,与之对应的2号FAT表项记录为2号簇,被写入一个结束标记。
- 由于簇号起始于2号,所以FAT表项的0号表项与1号表项不与任何簇对应。FAT32的0号表项值总是“F8FFFF0F”。
- 1号表项可能被用于记录脏标志,以说明文件系统没有被正常卸载或者磁盘表面存在错误。不过这个值并不重要。正常情况下1号表项值为“FFFFFFFF”或“FFFFFF0F”。
- 如果某个簇未被分配使用,它对应的FAT表项值0;
- 当某个簇已被分配使用,则它对应的FAT表项内的表项值也就是该文件的下一个存储位置的簇号。如果该文件结束于该簇,则在它的FAT表项中记录的是一个文件结束标记,对于FAT32而言,代表文件结束的FAT表项值为0x0FFFFFFF。
- 如果某个簇存在坏扇区,则整个簇会用0xFFFFFF7标记为坏簇,这个坏簇标记就记录在它所对应的FAT表项中。
- 在文件系统中新建文件时,如果新建的文件只占用一个簇,为其分配的簇对应的FAT表项将会写入结束标记。如果新建的文件不只占用一个簇,则在其所占用的每个簇对应的FAT表项中写入为其分配的下一簇的簇号,在最后一个簇对应的FAT表象中写入结束标记。
- 新建目录时,只为其分配一个簇的空间,对应的FAT表项中写入结束标记。当目录增大超出一个簇的大小时,将会在空闲空间中继续为其分配一个簇,并在FAT表中为其建立FAT表链以描述它所占用的簇情况。
1.3.9. FAT表示例
- 绿色划线:0号表项,0x0FFFFFF8,FAT表起始固定标识
- 红色划线,1号表项,0x0FFFFFFF,不使用,默认值
- 蓝色划线,2号表项,0x0FFFFFFF,标识文件结束,表项对应2号簇,根目录所在簇
- 如何找到FAT表所在扇区:
DBR的偏移0x0E-0x0F(0x0C22=3106)是保留区大小,保留区之后即为FAT1起始扇区,上图中偏移0x184400转换为扇区0x184400/512=3106,扇区从0计数,所以3106扇区即是FAT1所在扇区,读者可以通过FAT表大小,计算出FAT2的起始扇区吗?我相信可以的,你们都是最胖的T_T - 计算根目录起始扇区:
N=保留区大小+2*FAT表大小=0x0C22+2*0x000039EF=32768 - 将SD卡格式化,新建TEST.txt文件,大小为8.5KB,FAT表结构如下:
- 红色划线:2号表项,对应2号簇,为根目录
- 绿色划线:3号表项,对应3号簇,表项值为0x04,Test.txt的下一个簇为4号簇
- 蓝色划线:4号表项,对应5号簇,表项值为0x05,Test.txt的下一个簇为5号簇
- 黄色划线:5号表项,对应5号簇,表项值为0x0FFFFFFF,文件结束
1.3.10. 数据区(灰色区域)
- 数据区是真正用于存放用户数据的区域。数据区紧跟在FAT2之后,被划分成一个个的簇。所有的簇从2开始进行编号,也就是说,2号簇的起始位置就是数据区的起始位置。
- 虽然原则上FAT32允许根目录位于数据区的任何位置,但通常情况下它都位于数据区起始扇区。在FAT文件系统中,先要寻找数据区的第一簇(即2号簇)的位置,它不是位于文件系统开始处,而是位于数据区。从前面的学习知道,在数据区前面是保留区域和FAT区域,在前面还有MBR区域,这些区域都不使用FAT表进行管理。因此,数据区以前的区域只能使用扇区地址,而无法使用簇地址。
- 数据区起始扇区号即是根目录扇区号,上面已计算得出32768。
1.4. 目录项
目录所在的扇区,都是以32 Bytes划分为一个单位,每个单位称为一个目录项,即每个目录项的长度都是32 Bytes 。根目录由若干个目录项组成,一个目录项占用32个字节,可以是长文件名目录项、文件目录项、“.”目录项和“..”目录项等
此处只是简单的以上文中创建的TEST.txt为例说明短文件目录项的结构。
- 0x00-0x07:文件名,不足8个字节0x20补全(短文件名8.3命名规则)
- 0x08-0x0A:扩展名
- 0x0B:文件属性,0x20表示归档
- 0x0D:创建时间的10毫秒位
- 0x0E-0x0F:文件创建时间
- 0x10-0x11:文件创建日期
- 0x12-0x13:文件最后访问日期
- 0x14-0x15:文件起始簇号的高16位 0x0000
- 0x16-0x17:文件最近修改时间
- 0x18-0x19:文件最近修改日期
- 0x1A-0x1B:文件起始簇号的地16位 0x0003
- 0x1C-0x1F:文件的长度,0x2206=8710bytes=8.5K
原文链接:https://blog.csdn.net/u010650845/article/details/60881687