Файл и его характеристики. Каталог и его характеристики
Имя состоит из двух частей: собственного имени и расширения. Расширение может отсутствовать, и тогда имя совпадает с собственным именем. Собственное имя файла содержит от 1 до 8 символов, а расширение от 1 до 3 символов. Расширение (если оно имеется) отделяется от собственного имени точкой. Таким образом, имя файла имеет длину от 1 до 12 символов. Если в состав имени входят строчные буквы, система всегда воспринимает их как прописные. Например, имена RINS.EXE и RinS.Exe обозначают один и тот же файл. Поэтому, когда вы набираете на клавиатуре имя файла, можете использовать любой регистр — верхний или нижний. Расширение имени, как правило, уточняет происхождение, назначение, принадлежность файла к какой-либо группе. Многие программные системы требуют, чтобы файл конкретного типа обладал и конкретным расширением (например, MS-DOS считает программами файлы с расширением .ЕХЕ и .СОМ, системы dBASE требует для своих рабочих файлов расширения .DBF и т. п.). Во многих случаях программы не требуют, но предполагают (или рекомендуют) определенные расширения. Например, для текстовых файлов удобно использовать расширение.ТХТ. Логический диск — это шкаф, в котором хранятся ящики с папками и отдельные папки Представьте себе, что папка — это файл с именем, помеченным на этикетке. Тогда отдельный ящик — это каталог данного логического диска, ящичек в этом ящике — подкаталог данного каталога. Каждый каталог имеет имя длиной не более 8 символов, например: SIMP, CODBASE, WINWORD. Полный список каталогов и отдельных файлов на логическом диске называется оглавлением корневого каталога данного диска (или просто корневым каталогом), причем в этом каталоге регистрируются каталоги первого уровня и отдельные файлы. В каталогах первого уровня находятся каталоги второго уровня и отдельные файлы.В одном каталоге не могут быть зарегистрированы файлы с одинаковыми именами, — например, CONF.EXE. Однако одноименные файлы могут без ограничений регистрироваться в разных каталогах любого уровня вложенности. Каталог иногда называют директорией (от английского слова «directory» — справочник, адресная книга).
Организация файловой системы. Файловая структура и ее обслуживание.
Все современные ОС обеспечивают создание файловой системы, предназначенной для хранения данных на дисках и обеспечения доступа к ним. Принцип организации файловой системы зависит от ОС. Наиболее распространенный тип – табличный. Диск представляется как набор поверхностей. Каждая поверхность диска разделяется на кольцевые дорожки, а каждая дорожка на секторы. Размеры секторов фиксированы и равны 512 байт. Чтобы найти на диске тот или иной файл, надо знать, где он расположен, т.е. его адрес. (№ поверхности, № дорожки, № сектора). У каждой поверхности есть своя головка для чтения/записи, эти головки перемещаются одновременно. Поэтому вместо понятия дорожки используется понятие цилиндра. Цилиндр – это совокупность всех дорожек, имеющих одинаковые номера, т.е. равноудаленных от оси вращения. Поэтому – местонахождение файла на жестком диске определяется: № цилиндра, № поверхности, № сектора. Сектор – наименьшая единица хранения данных, но для адресации она используется не во всех файловых системах. Для этого она слишком мала. Такие ОС как MS-DOS, Windows, используют для адресации более крупную единицу хранения, называемую кластером. Кластер – это группа соседних секторов. Размер кластера зависит от размера жесткого диска. Чем больше диск, тем большим назначается размер кластера (8, 16, 32, 64 сектора). Данные о том, в каком кластере диска начинается тот или иной файл, хранятся в системной области диска в специальных таблицах размещения файлов (FAT-таблицах). Т.к. нарушение FAT-таблиц приводит к невозможности воспользоваться данными, записанными на диске, к ней предъявляются особые требования надежности и она существует в двух экземплярах, идентичность которых регулярно контролируется средствами ОС. ОС MS-DOS, Windows 95 и Windows NT реализуют 16 разрядные поля в таблицах размещения файлов. Такая файловая система называется FAT-16. (не более 65536 записей – 216 о местоположении данных, то есть жесткий диск не больше 2 Гбайт). ОС Windows 98, Windows 2000, Windows XP – FAT 32, 32-разрядные поля в таблице размещений файлов, т.е. подходит для любого жесткого диска. Файловая система NTFS обеспечивает такое сочетание производительности, надежности и эффективности, которое невозможно получить с помощью FAT. Основными целями разработки NTFS являлись обеспечение скоростного выполнения стандартных операций над файлами, таких как чтение, запись, поиск, и предоставления дополнительных возможностей, включая восстановление поврежденной файловой системы на чрезвычайно больших дисках. NTFS - единственная файловая система в Windows, которая позволяет назначать права доступа к различным файлам. Устанавливая пользователям определенные разрешения для файлов и каталогов, пользователь может защищать конфиденциальную информацию от несанкционированного доступа. NTFS имеет размер кластера 512 байт, что в принципе оптимально, но его можно менять до 64К. Более важно то, что NTFS способна теоретически работать с томами размером в 16,777,216 терабайт. Теоретически, потому что таких жестких дисков пока просто не существует, и появятся они весьма не скоро. NTFS содержит две копии аналога FAT, которые называются MFT (Master File Table). В отличие от FAT MSDOS, MFT больше напоминает таблицу базы данных. Если оригинал MFT повреждён в случае аппаратной ошибки (например, появления bad-сектора), то система при следующей загрузке использует копию MFT, и автоматически создаёт новый оригинал, уже с учётом повреждений. Но это не самое главное. Главное, что NTFS использует систему транзакций при записи файлов на диск. Эта система пришла из СУБД, где защита целостности данных - жизненно важное дело. Уже это говорит о её эффективности. Файловая структура. Вся совокупность файлов на диске и взаимосвязей между ними называется файловой структурой. Развитые операционные системы имеют иерархическую - многоуровневую файловую структуру, организованную в виде дерева. Каталог - это поименованная совокупность файлов и подкаталогов (т.е. вложенных каталогов). Каталог самого верхнего уровня называется корневым. Он не вложен ни в какие другие каталоги. В каталоге хранится информация о файлах и подкаталогах - имя, размер, дата и время последнего обновления и т.п. Путь к файлу- это последовательность, состоящая из имен каталогов, которые необходимо пройти, перемещаясь по дереву каталогов, начиная от текущего каталога, чтобы добраться до каталога, в котором непосредственно хранится файл. Полное имя файла- это последовательно записанные имя дисковода, путь к файлу от корневого каталога и имя файла. Например, C:\fin.com. Или: C:\CLASS\HTML\example1.htm Таким образом, несмотря на то, что данные о местоположении файлов хранятся в табличной структуре, пользователю они представляются в виде иерархической структуры (все необходимые преобразования берет на себя операционная система). К функции обслуживания файловой структуры относятся следующие операции, происходящие под управлением ОС: - создание файлов и присвоение им имен;- создание каталогов (папок) и присвоение им имен; - переименование файлов и каталогов (папок); - копирование и перемещение файлов между дисками компьютера и между каталогами (папками) одного диска; - удаление файлов и каталогов (папок); - навигация по файловой структуре с целью доступа к заданному файлу, каталогу (папке); - управление атрибутами файлов. Создание и именование файлов. Файл – это именованная последовательность байтов произвольной длины (в том числе нулевой), т.е. фактически создание файла состоит в присвоении ему имени и регистрации его в файловой системе – это одна из функций ОС. Даже когда создаем файл в прикладной программе, для этого привлекаются средства ОС. По способам именования файлов различают «короткое» (MS-DOS) и «длинное» (Windows 95 и далее) имя. «Короткое» - 8 символов на имя, 3 на расширение. Имя от расширения отделяется точкой (только алфавитно-цифровые символы латинского алфавита). Основным недостатком коротких имен является их низкая содержательность. Использование длинных имен файлов имеет ряд особенностей. Оно может содержать 256 символов и содержать любые символы, кроме 9-ти специальных: \ / : * ? “ < > | . В имени разрешается использовать пробелы и несколько точек. Расширением имени считаются все символы, идущие после последней точки. - Если длинное имя файла включает пробелы, то в служебных операциях его надо заключать в кавычки. Рекомендуется не использовать пробелы, а заменять их символами подчеркивания. - В корневой папке диска (на верхнем уровне иерархической файловой структуры) нежелательно хранить файлы с длинными именами – в отличие от прочих папок в ней ограничено количество единиц хранения, причем чем длиннее имена, тем меньше файлов можно разместить в корневой папке. - Кроме ограничения на длину имени файла (256 символов) существует гораздо более жесткое ограничение на длину полного имени файла (в него входит путь доступа к файлу, начиная от вершины иерархической структуры). Полное имя не может быть длиннее 260 символов. - Разрешается использовать символы любых алфавитов, в том числе и русского, но если документ готовится для передачи, с заказчиком необходимо согласовать возможность воспроизведения файлов с такими именами на его оборудовании. - Прописные и строчные буквы не различаются ОС. Однако символы различных регистров исправно отображаются ОС. - расширение имени файла используется для передачи ОС, исполняющей программе или пользователю сведений о том, к какому типу относятся данные, содержащиеся в файле, и о формате, в котором они записаны. В ранних ОС этот факт использовался мало. В современных ОС любое расширение имени файла может нести информацию для ОС. Системы Windows имеют средства для регистрации свойств типов файлов по расширению их имени, поэтому во многих случаях выбор расширения именем файла не является частным делом пользователя. Приложения этих систем предлагают выбрать только основную часть имени и указать тип файла, а соответствующее расширение имени приписывают автоматически. Создание каталогов. Каталоги (папки) – важные элементы иерархической структуры, необходимые для обеспечения удобного доступа к файлам, если файлов на носителе слишком много. Файлы объединяются в каталоги по любому общему признаку, заданному их создателем (по типу, принадлежности , по времени создания т.п.). Каталоги низких уровней вкладываются в каталоги более высоких уровней и являются для них вложенными. Верхним уровнем вложенности иерархической структуры является корневой каталог диска. Все современные ОС позволяют создавать каталоги. Правила присвоения имени каталогу ничем не отличаются от правил присвоения имени файлу, хотя негласно для каталогов не принято задавать расширение имен. В иерархических структурах данных адрес объекта задается маршрутом (путем доступа), ведущим от вершины структуры к объекту. При записи пути доступа к файлу, проходящего через систему вложенных каталогов, все промежуточные каталоги разделяются между собой определенным символом (\ - обратная косая черта). Например, С:\ Мои документы \Текущие \Рефераты \Опер_сист.doc В ОС, имеющих интерфейс командной строки, навигацию осуществляют путем ввода команд перехода с диска на диск или из каталога в каталог. В связи с крайним неудобством такой навигации широкое применение нашли специальные служебные программы, называемые файловыми оболочками. Как и ОС, файловые оболочки бывают неграфическими и графическими. Наиболее известная неграфическая файловая оболочка для MS-DOS – диспетчер файлов Norton Commander. Управление атрибутами файлов. Кроме имени и расширения имени файла ОС хранит для каждого файла дату его создания (изменения) и несколько флаговых величин, называемых атрибутами файла. Атрибуты – это дополнительные параметры, определяющие свойства файлов. ОС позволяет их контролировать и изменять. Состояние атрибутов учитывается при проведении автоматических операций с файлами. Основные атрибуты: только для чтения; скрытый; системный; архивный.