Урок 9 Лекция 4/45 Файлы и файловая система
Логическая структура дисков состоит из:
· загрузочной области,
· FAT-области,
· области каталогов,
· области данных.
Основное назначение файлов ― хранить информацию. Они также предназначены для передачи данных от программы к программе и от системы к системе. Другими словами, файл ― это хранилище стабильных и мобильных данных. Но, файл ― это нечто большее, чем просто хранилище данных. Обычно файл имеет имя, атрибуты, время модификации и время создания.
Понятие файла менялось с течением времени. Операционные системы первых больших ЭВМ представляли файл, как хранилище для базы данных и, поэтому файл являлся набором записей. Обычно все записи в файле были одного размера, часто по 80 символов каждая. При этом много времени уходило на поиск и запись данных в большой файл.
В конце 60-х годов наметилась тенденция к упрощению операционных систем, что позволило использовать их на менее мощных компьютерах. Это нашло свое отражение и в развитии операционной системы Unix. В Unix под файлом понималась последовательность байтов. Стало легче хранить данные на диске, так как не надо было запоминать размер записи.
Unix оказал очень большое влияние на другие операционные системы персональных компьютеров. Почти все они поддерживают идею Unix о том, что файл ― это просто последовательность байтов. Файлы, представляющие собой поток данных, стали использоваться при обмене информацией между компьютерными системами. Если используется более сложная структура файла (как в операционных системах OS/2 и Macintosh), она всегда может быть преобразована в поток байтов, передана и на другом конце канала связи воссоздана в исходном виде.
Файл ― это поименованная последовательность байтов, имеющая собственное имя и хранящаяся на внешнем носителе.
Файловая структура представляет собой систему хранения файлов на запоминающем устройстве, например, диске. Файлы организованы в каталоги (иногда называемые директориями или папками). Любой каталог может содержать произвольное число подкаталогов, в каждом из которых могут храниться файлы и другие каталоги.
Способ, которым данные организованы в байты, называется форматом файла.
Для того чтобы прочесть файл, например, электронной таблицы, необходимо знать, каким образом байты представляют числа (формулы, текст) в каждой ячейке; чтобы прочесть файл текстового редактора, надо знать, какие байты представляют символы, а какие шрифты или поля, а также другую информацию.
Программы могут хранить данные в файле таким способом, какой выберет программист. Зачастую предполагается, однако, что файлы будут использоваться различными программами. По этой причине многие прикладные программы поддерживают некоторые наиболее распространенные форматы, так что другие программы могут понять данные в файле. Компании по производству программного обеспечения (которые хотят, чтобы их программы стали "стандартами"), часто публикуют информацию относительно форматов, которые они создали, чтобы их можно было бы использовать в других приложениях.
Все файлы условно можно разделить на две части ― текстовые и двоичные.
Текстовые файлы ― наиболее распространенный тип данных во всем компьютерном мире. Для хранения каждого символа чаще всего отводится один байт, а кодирование текстовых файлов выполняют с помощью специальных таблиц, в которых каждому символу соответствует определенное число, не превышающее 255. Файл, для кодировки которого используется только 127 первых чисел, называется ASCII―файлом (сокращение от American Standard Code for Information Intercange ― американский стандартный код для обмена информацией), но в таком файле не могут быть представлены буквы, отличные от латиницы (в том числе и русские). Большинство национальных алфавитов можно закодировать с помощью восьмибитной таблицы. Для русского языка наиболее популярны на данный момент три кодировки: Koi8-R, Windows-1251 и, так называемая, альтернативная (alt) кодировка. Подробнее о кодировании русского текста рассказано в главе "Обработка документов".
Двоичные файлы, в отличие от текстовых, не так просто просмотреть и в них, обычно, нет знакомых нам слов ― лишь множество непонятных символов. Эти файлы не предназначены непосредственно для чтения человеком. Примерами двоичных файлов являются исполняемые программы и файлы с графическими изображениями.
Файловую систему можно представить в виде дерева, только корень (root) этого дерева находится вверху, а ветви растут вниз. Листья этого дерева и есть файлы, а разветвления ― каталоги (директории).
В каждом каталоге может быть много различных файлов и каталогов. В этом смысле каталог выполняет две важные функции: в каталоге хранятся файлы и каталог соединяется с другими каталогами, как ветвь дерева соединяется с другими ветвями. Каждый каталог может содержать множество каталогов, но сам должен быть потомком только одного каталога.
При входе в систему пользователь оказывается в своей домашней директории, в которой он может создавать файлы, удалять их и копировать. Имя, которое дается каталогу или файлу при его создании, не является полным. Полным именем является его путевое имя. В ОС Linux путевое имя состоит из имен всех каталогов, образующих путь к файлу от вершины дерева (/). Эти имена отделяются друг от друга символами "косая черта" (/, "слеш"). Путевые имена даются и файлам. Фактически имя, которым система обозначает файл, представляет собой комбинацию имени файла с именами каталогов, образующих путь от корневого каталога до каталога данного файла.
Путь может быть абсолютным и относительным. Абсолютный путь ― это полное имя файла или каталога, начинающееся символом корневого каталога. Относительный путь начинается символом текущего (рабочего) каталога и представляет собой обозначение пути к файлу относительно рабочего каталога.
Для просмотра файлов с иными расширениями существуют специальные программы, которые правильно отображают формат файла:
Наиболее часто встречающиеся расширения:
Архивные файлы | .arj, .arc, .zip, .zoo, .pak, .lzh, .rar, .cab |
Графические файлы | .bmp, .png, .pic, .wpg, .wpb, .tif, .gif, .icp, .pcx, .grf, .drw, .clp, .msp, .psd, .pcd |
Файлы редакторов документов | .txt, .doc, .wps, .vw4, .wri, .sam, .jw, .ws7, .pdf ,(.hml) |
Файлы табличных процессов | .wks, .wki, .wk3, .wkt, .wxq, .wrk, .xls, .wqi, .vpp, .nod |
Логическая структура диска (как жесткого, так и съемного) предусматривает наличие области каталогов и области файлов. Каталоги в операционных системах семейства WINDOWS представлены папками. Папки (каталоги) могут содержать как следующий уровень каталогов (папок), так и непосредственно файлы. От умелого размещения пользователем данных на диске в системе каталогов зависит качество работы на ПЭВМ, поэтому прежде, чем начинать создавать сложные системы документооборота необходимо продумать структуру каталогов. Как правило, бывает достаточно использовать предметную каталогизацию, однако при значительном увеличении объемов документации возникает необходимость вводить объектное разбиение каталогов. Таким образом, если заранее известно, что количество документов по предметному (тематическому) разбиению сделает работу оператора ПЭВМ неудобной, целесообразным может стать ввести разбиение по объектам, а уже внутри данной системы использовать предметную каталогизацию. Как показывает практика, работа оператора тем продуктивнее, чем продуманнее создана им структура каталогов (папок). Более того, при объектном использовании системы каталогов становится возможным более продуктивно использовать механизм разграничения допуска к информации, хранимой на диске.
Проводник отображает структуру каталогов ― в левой части экрана и содержание выбранной папки ― в правой части экрана. Для того чтобы отобразить содержание конкретной папки необходимо просто щелкнуть по ней два раза. Выбранные файлами можно:
а) переименовывать ― однократный щелчок мышью по имени файла;
б) перемещать и копировать ― с помощью приема перетащить (скопировать ― удерживая) мышью; используя возможности меню "Правка"; или воспользовавшись специальными кнопками на панели инструментов.
г) создать папку или ярлык (ссылку на программу или документ);
д) найти и прейти к конкретной папке или файлу ("сервис");
е) изменить параметры отображения данных в окне ("сервис" > "параметры");
ж) установить или изменить "трактовку расширений" ("сервис" > "параметры").
В обычном состоянии двойной щелчок по имени файла не приводит ни к каким действиям, только наличие "трактовки расширений" (когда операционной системе сообщено какие расширение соответствуют каким программам) позволяет реализовать данный механизм загрузки документов (программ). Если трактовка расширений не установлена или требуется загрузить документ не в стандартную для него программу, то необходимо загрузить программу двойным щелчком на ее имени, а уже затем из меню программы загружать требуемый документ.
Интерфейс "Проводника" имеет много общего с интерфейсом обычного каталога (отсутствует только меню "Сервис"), поэтому если требуется оперативный доступ к каталогам можно использовать простые папки, которые через "Другие папки" позволяют производить обзор содержимого дисков.