Структура данных на магнитном диске
Наименьшей единицей хранения данных на магнитных дисках является файл. Файл(от англ. (file - папка) — это именованная совокупность любых данных, размещенная на внешнем запоминающем устройстве и хранимая, пересылаемая и обрабатываемая как единое целое. Файл может содержать программу, числовые данные, текст, закодированное изображение и др.
Файловая система - это функциональная часть операционной системы, обеспечивающая выполнение операций над файлами. Файловая система позволяет работать с файлами и директориями (каталогами) независимо от их содержимого, размера, типа и т. д.
Файловая система определяет общую структуру именования, хранения и организации файлов в операционной системе.
Функции файловой системы:
сохранение информации на внешних носителях;
чтение информации из файлов;
удаление файлов, каталогов;
переименование файлов;
копирование файлов и др.
Каждый диск разбивается на две области: область хранения файлов и каталог. Каталог содержит имя файла и указание на начало его размещения на диске в области данных.
Каждый файл на диске имеет свой адрес. Если процессору нужна какая-то информация, размещенная на внешнем запоминающем устройстве, он находит на диске нужный файл, а потом байт за байтом считывает из него данные в оперативную память, пока не дойдет до конца файла.
Чтобы у каждого файла на диске был свой адрес, диск разбивают на дорожки,а дорожки, в свою очередь, разбивают на секторы.Размер каждого сектора стандартен и как, правило, равен 512 байтам. Разбиение диска на дорожки и секторы называется форматированием диска.
Адреса записанных файлов компьютер запоминает в специальной таблице - таблице размещения хранения данных на жестком диске — FAT (File Allocation Table — таблица размещения файлов). Таким образом, когда компьютеру нужен какой-то файл, он по имени файла находит в этой таблице номер дорожки и номер сектора, после чего магнитная головка переводится в нужное положение; файл считывается и направляется в оперативную память для обработки.
При повреждении таблицы размещения файлов информация, имевшаяся на диске, будет утрачена, так как к ней нельзя будет обратиться. Поэтому таблица размещения файлов для надежности дублируется. У нее есть копия, и при любых повреждениях компьютер сам восстанавливает эту таблицу.
Для записи в таблице размещения файлов адреса любого файла может использоваться 16 битов, такую таблицу размещения файлов называют FАТ 16. С помощью 16 битов можно выразить 216 (65 536) разных значений. Это значит, файлам на жестком диске не может быть предоставлено не более чем 65 536 разных адресов (и самих файлов соответственно не может быть более 65 536). Нужно помнить, что операционные системы DOS и Windows не различают цилиндры, головки и физические секторы диска, который для этих ОС предстает в виде непрерывной последовательности логических секторов или кластеров (группы смежных секторов). Система MS-DOS до версии 7.0 включительно и система Windows могли распознать 65 536 логических блоков на диске. Начиная с Windows 95 OSR2, появилась возможность использовать для нумерации логических элементов на диске 32-разрядные данные, а значит, число адресуемых элементов теоретически возросло до 4 294 967 295. Для DOS до версии 3.х включительно размер логического блока равнялся 512 байтам, т. е. размеру физического сектора. Видимо, поэтому появилось понятие «логический сектор», используемое и поныне. Наибольшая емкость диска, с которым могла работать DOS, составляла 32 Мбайт. Современные жесткие диски имеют очень большие объёмы, и им не хватает такого количества адресов. Был найден выход: объединять логические секторы в группы - так называемые кластеры. Под этим термином понимается группа таких смежных секторов, которым соответствует одно значение адреса. Если увеличить размер кластера, то можно будет работать с большими разделами, оставаясь в рамках 16-разрядной адресации. Кластер (cluster) представляет собой группу смежных секторов, количество которых равно степени 2 — например, 1,2,4,8,16,32 или 64. Согласно спецификации Microsoft, максимальный размер кластера равен 32 Кбайт. Каждому кластеру присваивается адрес; для первого кластера он равен 2. Другими словами, кластеров с адресами 0 и 1 не существует. Например, для жестких дисков, имеющих размер больше 2 Гбайт, как было показано выше, кластер равен 32 Кбайт. Предположим, что нам надо записать на диск файл размером 35 Кбайт. длязаписи на диск файла такого объема потребуется 2 кластера — 64 Кбайта, т. е. 29 Кбайт памяти диска просто пропадают.
Если диск меньше, то и кластер у его меньше (табл.5.1). После перехода к 32-разрядной адресации стало возможным (правда, лишь теоретически) применять кластеры любого размера на любых разделах. В одном кластере могут содержаться десятки секторов, и, каким бы маленьким ни был файл, он все равно займет целый кластер, и все неиспользуемые секторы в нем просто пропадут.
В системе записи адреса файла на жестком диске FАТ 32 адрес записывается не двумя байтами, а четырьмя (32 бита). С помощью 32 битов можно выразить 232 (4 294 967 296) разных значений. Это значит, что файлам на жестком диске не может бить предоставлено более чем 4 294 967 296 разных адресов (и самих файлов соответственно не может быть более 4 294 967 296).
Таблица 5.1 Размеры кластеров по умолчанию для FAT 16 и FAT32
Объем носителя | Величина кластера | Величина кластера | Величина кластера |
данных | FAT16 | FAT32 | NTFS |
7 Мб– 16 Мб | 2 Кб | не поддерживается | 512 байтов |
17 Мб– 32 Мб | 512 байтов | не поддерживается | 512 байтов |
33 Мб– 64 Мб | 1 Кб | 512 байтов | 512 байтов |
65 Мб– 128 Мб | 2 Кб | 1 Кб | 512 байтов |
129 Мб– 256 Мб | 4 Кб | 2 Кб | 512 байтов |
257 Мб– 512 Мб | 8 Кб | 4 Кб | 512 байтов |
513 Мб– 1 Гб | 16 Кб | 4 Кб | 1 Кб |
Таким образом, чем больше жесткий диск, тем больше места на нем тратится впустую из-за несовершенной системы адресации файлов. Для борьбы с нерациональными потерями жесткий диск разбивают на несколько разделов – логических жестких дисков.
Каждый логический диск имеет собственную таблицу размещения файлов, поэтому на нем действует своя система адресации. В итоге потери из-за размеров кластеров становятся меньше.
Ниже приведены принципы организации файловой системы FAT. Одна из наиболее значимых информационных структур логического диска - его загрузочная запись. Назначение данной записи - загрузка ОС и организация хранения данных. Если логический диск является системным, то в его первом секторе имеется код загрузки ОС, управляющийся от MBR (Master boot record). Его задача - загрузка основных файлов ОС и передача им управления; в Windows 9х такими файлами будут io.sys и msdos.sys.
Если не существует загрузочной записи, то она создается и заполняется программой FORMAT. Но если она уже есть, то утилита FORMAT будет использовать ее информацию.
Вопросы
1. Расскажите о памяти первичной и вторичной. Приведите характеристики.
2. Расскажите о характеристиках ленточных накопителей,
3. Сравните характеристики твердотельных накопителей SSD и характеристика жесткие диски,
5. Поясните суть файловой системы.
6. Поясните принцип о FAT . В чем ограничение FAT16?
7. Поясните организацию секторов и кластеров на HDD.
8. Поясните организацию FAT32.
9. Расскажите о потери дискового пространства, из-за несовершенной системы адресации.
10. Чем организация файловой системы NFTS отличается от FAT.
Лекция №6
Таблица размещения файлов FAT.