Единицы измерения данных
Файлы и каталоги. Понятие структуры файлов поддерживаемые различными операционными системами.
Минимальная единица храненияданных на запоминающих устройствах - файл.
Файл(File) – это последовательность произвольного числа байтов, хранящихся во внешней памяти компьютера и обладающая уникальным именем.
Имя файла = собственно имя .расширение файла
Имя файла разделено на две части: собственно имя файла (префикс) и расширение (суффикс), определяющее его тип (программа, данные и т.д.).
Расширение имени файла – последовательность символов, добавляемых к имени файла и предназначенных для идентификации типа (формата) файла.
Расширение имени файла несет определенную информацию для современных операционных систем, которые имеют средства для регистрации свойств типов файлов по расширению их имени. Поэтому чаще всего выбор расширения имени файла не является частным делом пользователя. Приложения этих систем предлагают задать только собственное имя файла и указать тип файла, а соответствующее расширение имени приписывают автоматически.
Расширение обычно отделяется от основной части имени файла точкой.
Иногда могут использоваться несколько расширений, следующих друг за другом, например, «.tar.gz».
Файловая система - это функциональная часть операционной системы, определяющая способ организации, хранения и именования данных на дисках и обеспечение доступа к ним.
Функции файловой системы:
работа с файлами и папками(создание, удаление, переименование, копирование и перемещение файлов и папок, навигация по файловой структуре с целью доступа к задаваемому файлу, папке).
работа с данными, которые хранятся в файлах (запись, чтение, поиск данных и т.д.)
Файловая система
отслеживает размещение файлов на диске и свободное дисковое пространство,
обеспечивает пользователю удобный интерфейс при работе с данными и совместное использование файлов несколькими пользователями и процессами.
Иерархическая структура, в виде которой операционная система отображает файлы и папки диска, называется файловой структурой.
Папка (Folder) или каталог (директория(Directory)) - это место на диске, файл, в котором содержится список файлов, входящих в него, и их атрибуты.
Имя папки определяется так же, как и имя файла, но обычно без расширения.
Каталог может содержать в себе файлы и другие каталоги, которые называются подкаталогамиили вложенными каталогами.
Каталог самого верхнего уровня, не входящий ни в одну из папок, называется корневым каталогом.
Каталоги и файлы образуют дерево каталогов.
Файл характеризуется уникальным путем доступак нему.
Длина пути доступа к файлу не должна быть больше 260 символов.
Единицы представления данных
Существует множество систем представления данных. Об одной из них, принятой в информатике и вычислительной технике, двоичном коде, уже говорилось выше. Наименьшей единицей такого представления является бит (двоичный разряд), Совокупность двоичных разрядов, выражающих числовые или иные данные, образует некий битовый рисунок. Практика показала, что с битовым представлением удобнее работать, если этот рисунок имеет регулярную форму. В настоящее время в качестве таких форм используются группы из восьми битов, которые называются байтами(соответствует одному символу).
Группа из 16 взаимосвязанных бит (двух взаимосвязанных байтов) в информатике называется словом. Соответственно, группы из четырех взаимосвязанных байтов (32 разряда) называетсяудвоенным словом, а группа из восьми байтов (64 разряда) -учетверенным словом.
Десятичное число | Двоичное число | Байт |
0000 0001 | ||
0000 0010 | ||
... | ||
Единицы измерения данных
Существует много различных систем и единиц представления данных, Каждая научная дисциплина и каждая область человеческой деятельности может использовать свои, наиболее удобные или традиционно устоявшиеся единицы. В информатике для измерения данных используют тот факт, что разные типы данных имеют уникальное двоичное представление и потому вводят свои единицы измерения данных, основанные на нём.
Наименьшей единицей измерения является байт. Поскольку одним байтом, как правило, кодируется один символ текстовой информации, то для текстовых документов размер в байтах соответствует лексическому объему в символах (за исключением кодировки Unicode).
Более крупная единица измерения - килобайт (Кбайт). Условно можно считать, что 1 Кбайт примерно равен 1000 байт. Условность связана с тем, что для вычислительной техники, работающей с двоичными числами, более удобно представление чисел в виде степени с двойки и потому на самом деле 1 Кбайт равен 210 байт, что составляет 1024 байт. Однако всюду, где это не принципиально, с инженерной погрешностью до 3%, «лишние» байты округляют. В килобайтах измеряют сравнительно небольшие объемы данных. Условно можно считать, что одна страница машинописного текста составляет около 2 Кбайт.
Более крупные единицы измерения данных образуются добавлением префиксов мега- , гига- , тера- ; в более крупных единицах пока нет практической необходимости.
- 1 Мбайт = 1024 Кбайт = 1020 байт
- 1 Гбайт = 1024 Мбайт = 1030 байт
- 1 Тбайт = 1024 Гбайт = 1040 байт
Необходимо обратить внимание на то, что при переходе к более крупным единицам измерения инженерная погрешность, связанная с округлением будет накапливаться, а потому становится недопустимой, поэтому на старших единицах измерения округление производится реже.