Линейные структуры (списки данных, векторы данных)

Типы данных

Традиционно выделяют два типа данных — двоичные (бинарные) и текстовые.

Двоичные данные обрабатываются только специализированным программным обеспечением, знающим их структуру, все остальные программы передают данные без изменений.

Текстовые данные воспринимаются передающими системами как текст, записанный на каком-либо языке. Для них может осуществляться перекодировка (из кодировки отправляющей системы в кодировку принимающей), заменяться символы переноса строки, изменяться максимальная длина строки, изменяться количество пробелов в тексте.

Передача текстовых данных как бинарных приводит к необходимости изменять кодировку в прикладном программном обеспечении (это умеет большинство прикладного ПО, отображающего текст, получаемый из разных источников), передача бинарных данных как текстовых может привести к их необратимому повреждению.

Операции с данными

Для повышения качества данные преобразуются из одного вида в другой с помощью методов обработки. Обработка данных включает операции:

1) ввод (сбор) данных — накопление данных с целью обеспечения достаточной полноты для принятия решений;

2) формализация данных — приведение данных, поступающих из разных источников, к одинаковой форме, для повышения их доступности;

3) фильтрация данных — это отсеивание «лишних» данных, в которых нет необходимости для повышения достоверности и адекватности;

4) сортировка данных — это упорядочивание данных по заданному признаку с целью удобства их использования;

5) архивация — это организация хранения данных в удобной и легкодоступной форме;

6) защита данных — включает меры, направленные на предотвращение утраты, воспроизведения и модификации данных;

7) транспортировка данных — приём и передача данных между участниками информационного процесса;

8) преобразование данных — это перевод данных из одной формы в другую или из одной структуры в другую.

Данные, в сфере компьютерных технологий, таких как Интернет, – результат отображения информации, зафиксированный на каком-либо носителе. Для того, кто записывает эти данные, например программиста, – это часть программы, которую код преобразовывает в понятный для компьютера язык, а также база знаний, которая используется в разработанных приложениях. Для операционной системы данные – это совокупность ячеек памяти, которые обладают определенными свойствами. Данные можно сравнить с булочкой. Для обычного человека это кондитерское изделие, которое можно съесть (или нельзя, если оно заплесневело). Для пекаря же булочка это комбинация ингредиентов (муки, яиц, сахара, разрыхлителя, ароматизатора, начинки и т.д.) с определенными функциями. В информатике есть два вида данных: текстовые и двоичные. Двоичные данные называются еще бинарными. Что такое бинарные данные – без поллитрыпрофану не разобраться, да и поллитровка вряд ли поможет. Эти данные обрабатываются специальными программами. Другие же программы, не прошедшие специальный курс обучения обращению с двоичными данными, передают их без изменений. Желудок страуса может переваривать гвозди (со слов некоторых натуралистов), а желудок обычного человека – нет. И на «выходе» у человека будут те же самые гвозди, что и на «входе». Настоятельно не рекомендуется проверять эту аксиому на собственном организме. Текстовые же данные машины воспринимают как текст. Текстовые данные могут перекодироваться ( в настройках браузеров типа Интернет Эксплорер есть такая команда, как «изменить кодировку»). Их можно перекодировать из кодировки системы-отправителя в кодировку получателя. Можно их превращать и в бинарные данные. А вот бинарные перекодировать в текстовые очень трудно и данные могут быть в результате этого повреждены. Как говорил один кузнец: «Что один человек построил, другой завсегда поломать сможет». А вот заново построить – вряд ли.

Основные структуры данных

Работа с большими наборами данных автоматизируется проще, когда данные упорядочены, то есть образуют заданную структуру. Существует три основных типа структур данных: линейная, иерархическая и табличная. Их можно рассмотреть на примере обычной книги. Если разобрать книгу на отдельные листы и перемешать их, книга потеряет свое назначение. Она по-прежнему будет представлять набор данных, но подобрать адекватный метод для получения из нее информации весьма непросто. (Еще хуже дело будет обстоять, если из книги вырезать каждую букву отдельно, — в этом случае вряд ли вообще найдется адекватный метод для ее прочтения.)
Если же собрать все листы книги в правильной последовательности, мы получим простейшую структуру данных — линейную. Такую книгу уже можно читать, хотя для поиска нужных данных ее придется прочитать подряд, начиная с самого начала, что не всегда удобно.
Для быстрого поиска данных существует иерархическая структура. Так, например, книги разбивают на части, разделы, главы, параграфы и т. п. Элементы структуры более низкого уровня входят в элементы структуры более высокого уровня: разделы состоят из глав, главы из параграфов и т. д.
Для больших массивов поиск данных в иерархической структуре намного проще, чем в линейной, однако и здесь необходима навигация, связанная с необходимостью просмотра. На практике задачу упрощают тем, что в большинстве книг есть вспомогательная перекрестная таблица, связывающая элементы иерархической структуры с элементами линейной структуры, то есть связывающая разделы, главы и параграфы с номерами страниц. В книгах с простой иерархической структурой, рассчитанных на последовательное чтение, эту таблицу принято называть оглавлением, а в книгах со сложной структурой, допускающей выборочное чтение, ее называют содержанием.

Единицы измерения данных

Существует много различных систем и единиц измерения данных. Каждая научная дисциплина и каждая область человеческой деятельности может использовать свои, наиболее удобные или традиционно устоявшиеся единицы. В информатике для измерения данных используют тот факт, что разные типы данных имеют универсальное двоичное представление и потому вводят свои единицы данных, основанные на нем.
Наименьшей единицей измерения является байт. Поскольку одним байтом, как правило, кодируется один символ текстовой информации, то для текстовых документов размер в байтах соответствует лексическому объему в символах (пока исключение представляет рассмотренная выше универсальная кодировка UNICODE).
Более крупная единица измерения — килобайт (Кбайт). Условно можно считать, что 1 Кбайт примерно равен 1000 байт. Условность связана с тем, что для вычислительной техники, работающей с двоичными числами, более удобно представление чисел в виде степени двойки и потому на самом деле 1 Кбайт равен 210 байт (1024 байт). Однако всюду, где это не принципиально, с инженерной погрешностью (до 3 %) «забывают» о «лишних» байтах. В килобайтах измеряют сравнительно небольшие объемы данных. Условно можно считать, что одна страница неформатированного машинописного текста составляет около 2 Кбайт. Более крупные единицы измерения данных образуются добавлением префиксов мега-, гига- тера-; в более крупных единицах пока нет практической надобности.

1 Мбайт = 1024 Кбайт = 1020 байт

1 Гбайт = 1024 Мбайт = 1030 байт

1 Тбайт = 1024 Гбайт = 1040 байт
Особо обратим внимание на то, что при переходе к более крупным единицам «инженерная» погрешность, связанная с округлением, накапливается и становится недопустимой, поэтому на старших единицах измерения округление производится реже.

Единицы хранения данных

При хранении данных решаются две проблемы: как сохранить данные в наиболее компактном виде и как обеспечить к ним удобный и быстрый доступ (если доступ не обеспечен, то это не хранение). Для обеспечения доступа необходимо, чтобы данные имели упорядоченную структуру, а при этом, как мы уже знаем, образуется «паразитная нагрузка» в виде адресных данных. Без них нельзя получить доступ к нужным элементам данных, входящих в структуру.
Поскольку адресные данные тоже имеют размер и тоже подлежат хранению, хранить данные в виде мелких единиц, таких как байты, неудобно. Их неудобно хранить и в более крупных единицах (килобайтах, мегабайтах и т. п.), поскольку неполное заполнение одной единицы хранения приводит к неэффективности хранения.
В качестве единицы хранения данных принят объект переменной длины, называемый файлом. Файл — это последовательность произвольного числа байтов, обладающая уникальным собственным именем. Обычно в отдельном файле хранят данные, относящиеся к одному типу. В этом случае тип данных определяет тип файла. Проще всего представить себе файл в виде безразмерного канцелярского досье, в которое можно по желанию добавлять содержимое или извлекать его оттуда. Поскольку в определении файла нет ограничений на размер, можно представить себе файл, имеющий 0 байтов (пустой файл), и файл, имеющий любое число байтов.
В определении файла особое внимание уделяется имени. Оно фактически несет в себе адресные данные, без которых данные, хранящиеся в файле, не станут информацией из-за отсутствия метода доступа к ним. Кроме функций, связанных с адресацией, имя файла может хранить и сведения о типе данных, заключенных в нем. Для автоматических средств работы с данными это важно, поскольку по имени файла они могут автоматически определить адекватный метод извлечения информации из файла.

Знание – зафиксированная и проверенная практикой информация, которая может многократно использоваться людьми для решения тех или иных задач. Знания – это вид информации, которая хранится в базе знаний и отображает знания специалиста в конкретной предметной области. Знания – это интеллектуальный капитал. Формальные знания могут быть в виде документов (стандартов, нормативов), регламентирующих принятие решений или учебников, инструкций с описанием решения задач. Неформальные знания – это знания и опыт специалистов в определенной предметной области.

Вопрос №3. Свойства информации.

Свойства информации:

v Адекватность

v Достоверность

v Полнота

v Ценность

v Современность (актуальность)

v Понятность

v Доступность

v Краткость

Адекватность:

4. Синтаксическая – отвечает за формально-логическое соответствие объекта и его информационной модели.

5. Семантическая (смысловая)– отвечает за смысл тех понятий, которые включены в модель.

6. Прагматическая (потребительская) – соответствие между потребителем информации и целью, которую он преследует.

Точностьцифрового представления информации определяется степенью его близости к реальному состоянию объекта, процесса, явления и т.п. Для информации, отображаемой кодом, известно 4 классификации точности:

5. Формальная точность определяется единицей младшего разряда числа (xxxxxxxxx.xxxxx знаки после запятой)

6. Реальная точность определяется значением единицы последнего разряда числа, верность которого гарантируется.

7. Максимальная точность, которую можно получить в конкретных условиях функционирования системы (один из способов увеличения максимальной точности – увеличение количества разрядов)

8. Необходимая точность определяется функциональным значением показателя.

Количеством информацииназывают числовую характеристику сигнала, отражающую ту степень неопределенности (неполноту знаний), которая исчезает после получения сообщения в виде данного сигнала.

Подходы к определению количества информации:

v Синтаксический – количество букв

v Семантический – количество смысла

v Прагматический

Р. Хартли (американский инженер ) в 1928 г. Рассматривал процесс получения информации как выбор одного сообщения из конечного неопределенного заданного множества из Nравновероятных сообщений, а количество информации I, содержащейся в выбранном сообщении, определял как двоичный логарифм N.

Формула Хартли I=log2N или N=2i

Где i – количество информации в битах, N – число возможных состояний

Формула Шеннона (расширенный вариант формулы Хартли):

I=-(p1log2p1+p2log2p2+…p2log2pn), где p – верность того, что i-е сообщение выделено в наборе из N сообщений, т.к. p от 0 до 1, то логарифм отрицателен.

Если p1,…,pnравны, то каждый равна 1/n и формула Шеннона превращается в формулу Хартли.

Минимальное количество информации – бит.

Объективность и субъективность информации.Понятие объективности информации является относительным. Это понятно, если учесть, что методы являются субъективными. Более объективной принято считать ту информацию, в которую методы вносят меньший субъективный элемент. Так, например, принято считать, что в результате наблюдения фотоснимка природного объекта или явления образуется более объективная информация, чем в результате наблюдения рисунка того же объекта, выполненного человеком. В ходе информационного процесса степень объективности информации всегда понижается. Это свойство учитывают, например, в правовых дисциплинах, где по-разному обрабатываются показания лиц, непосредственно наблюдавших события или получивших информацию косвенным путем (посредством умозаключений или со слов третьих лиц). В не меньшей степени объективность информации учитывают в исторических дисциплинах. Одни и те же события, зафиксированные в исторических документах разных стран и народов, выглядят совершенно по-разному. У историков имеются свои методы для тестирования объективности исторических данных и создания новых, более достоверных данных путем сопоставления, фильтрации и селекции исходных данных. Обратим внимание на то, что здесь речь идет не о повышении объективности данных, а о повышении их достоверности (это совсем другое свойство).

Полнота информации. Полнота информации во многом характеризует качество информации и определяет достаточность данных для принятия решений или для создания новых данных на основе имеющихся. Чем полнее данные, тем шире диапазон методов, которые можно использовать, тем проще подобрать метод, вносящий минимум погрешностей в ход информационного процесса.

Достоверность информации. Данные возникают в момент регистрации сигналов, но не все сигналы являются «полезными» — всегда присутствует какой-то уровень посторонних сигналов, в результате чего полезные данные сопровождаются опреде­ленным уровнем «информационного шума». Если полезный сигнал зарегистрирован более четко, чем посторонние сигналы, достоверность информации может быть более высокой. При увеличении уровня шумов достоверность информации снижается. В этом случае для передачи того же количества информации требуется использовать либо больше данных, либо более сложные методы.

Адекватность информации — это степень соответствия реальному объективному состоянию дела. Неадекватная информация может образовываться при создании новой информации на основе неполных или недостоверных данных. Однако и полные, и достоверные данные могут приводить к созданию неадекватной информации в случае применения к ним неадекватных методов.

Доступность информации — мера возможности получить ту или иную информа­цию. На степень доступности информации влияют одновременно как доступность данных, так и доступность адекватных методов для их интерпретации. Отсутствие доступа к данным или отсутствие адекватных методов обработки данных приводят к одинаковому результату: информация оказывается недоступной. Отсутствие адекватных методов для работы с данными во многих случаях приводит к применению неадекватных методов, в результате чего образуется неполная, неадекватная или недостоверная информация.

Актуальность информации — это степень соответствия информации текущему моменту времени. Нередко с актуальностью, как и с полнотой, связывают коммерческую ценность информации. Поскольку информационные процессы растянуты во времени, то достоверная и адекватная, но устаревшая информация может приводить к ошибочным решениям. Необходимость поиска (или разработки) адекватного метода для работы с данными может приводить к такой задержке в получении информации, что она становится неактуальной и ненужной. На этом, в частности, осно­ваны многие современные системы шифрования данных с открытым ключом. Лица, не владеющие ключом (методом) для чтения данных, могут заняться поиском ключа, поскольку алгоритм его работы доступен, но продолжительность этого поиска столь велика, что за время работы информация теряет актуальность и, соответственно, связанную с ней практическую ценность.

1. Вопрос №4. Процессы сбора, передачи и накопления информации.

Сбор информации

Эта фаза имеет место в цикле обращения, когда отображение информации от источника выполняет человек. Тогда источник информации называют предметной областью.

Сбор информации – это процесс целенаправленного извлечения и анализа информации о предметной области, в роли которой может выступать тот или иной процесс, объект и т.д. Цель сбора - обеспечение готовности информации к дальнейшему продвижению в информационном процессе. Поскольку эта фаза начинает цикл обращения информации, она очень важна, от качества ее исполнения во многом зависит качество информации, которая будет использоваться потребителем при решении целевых задач информационной технологии.

Данная фаза содержит этапы:

1. первичное восприятие информации. Здесь осуществляется определение качественных и количественных характеристик предметной области, важных для решаемых потребителем информации задач;

2. разработка системы классификации и кодирования информации, кодирование классов;

3. распознавание и кодирование объектов;

4. регистрация результатов.

5. Передача информации

6.

7. Схема передачи информации с использованием средств информационной техники представлена на рисунке:

8.

9. Линейные структуры (списки данных, векторы данных) - student2.ru

10. Здесь сокращения означают следующее:

11.

12. ИС – источник сообщения. Он регистрирует (фиксирует) информацию на каком-либо носителе, в результате чего образуется сигнал. Может выполнять в целом первую фазу обращения информации, а также криптографическое кодирование. В роли ИС могут выступать сканеры, факсимильные аппараты, клавиатуры, компьютеры и т.д.

13.

14. КИ – кодер источника. Выполняет эффективное кодирование информации в сигнале в случае необходимости. Данный элемент может отсутствовать в схеме.

15.

16. КК – кодер канала. На него возложены функции помехозащитного кодирования, если передаваемый сигнал подвержен помехам.

17.

18. У – уплотнитель сигнала. Способствует передаче нескольких сигналов по одной линии связи ЛС. Может отсутствовать в схеме. Уплотнение рассмотрено далее.

19.

20. М – модулятор сигнала. Изменяет информационные характеристики сигналов-носителей, накладывая на него дискретный сигнал. Модуляция рассмотрена далее.

21.

22. ЛС – линия связи – физическая среда (например, воздух, электрическое или магнитное поле) и технические средства в ней, который используются для передачи сигнала на расстояние.

23.

24. ДМ – демодулятор. Выполняет выделение дискретного сигнала из сигнала-носителя. Имеет место в схеме только при наличии модулятора М.

25.

26. В – устройство выделения уплотненного сигнала. Имеет место в схеме только при наличии уплотнителя У.

27.

28. ДК – декодер канала. Выявляет и/или исправляет ошибки, допущенные при передаче сигнала по линии связи ЛС. Присутствует в схеме только при наличии кодера канала КК.

29.

30. ДИ – декодер источника. Декодирует эффективные коды. Присутствует в схеме только при наличии кодера источника КИ.

31.

32. ПС – получатель сообщения. В его роли может выступать компьютер, принтер, дисплей и т.д.

33.

34. КС – канал связи.

35.

36. Технически блоки модулятор (М) и демодулятор (ДМ) реализованы в одном устройстве, которое называется модем (МОдулятор-ДЕМодулятор).

37. Аналогично блоки кодеров (КИ и КК) и декодеров (ДИ и ДК) реализованы технически в одном устройстве, называемом кодек (КОдер-ДЕКодер).

38. Блоки уплотнитель У и блок выделения сигнала В образуют мультиплексор.

Кодирование информации

Формальный язык

Язык – это система обозначений и правил для передачи сообщений. Различают языки естественные, на которых общаются люди, и искусственные (или формальные). К формальным языкам относятся языки программирования.

Язык задается алфавитом, синтаксисом и семантикой. Язык программирования – это формальный язык, обеспечивающий описание конкретных проблем, формулируемых человеком и решаемых с помощью компьютера.

Алфавит представляет собой совокупность упорядоченных в определенном смысле символов (букв) в данном языке или системе. Только символы, принадлежащие данному алфавиту, можно использовать для построения слов.

Синтаксис (от греч. syntaxis – построение, порядок) – это набор правил построения слов, конструкций и структур текста в языке или системе. Некоторые авторы включают в синтаксис и алфавит. Ошибки, возникающие при написании программы и касающиеся только синтаксиса, выявляются при синтаксическом анализе, осуществляемом транслятором.

Слово можно определить как упорядоченный набор символов в заданном алфавите, имеющий определенный смысл.

Транслятор (от англ. translator – переводчик) – это программа, производящая трансляцию программы с одного языка программирования в другой.

Под семантикой (от греч. semantikos – обозначающий) понимается смысл каждой синтаксической конструкции в языке или системе.

В языке программирования транслятор переводит синтаксические конструкции языка программирования в команды, понятные операционной системе и процессору. Смысловые ошибки транслятор выявить не может, их поиск происходит во время отладки, тестирования и использования программы человеком.

Кодирование информации

Любая информация, с которой работает современная вычислительная техника, преобразуется в числа в двоичной системе счисления.

Дело в том, что физические устройства (регистры, ячейки памяти) могут находиться в двух состояниях, которым соотносят 0 или 1. Используя ряд подобных физических устройств, можно хранить в памяти компьютера почти любое число в двоичной системе счисления. Сколько физических ячеек используемых для записи числа, столько и разрядное число можно записать. Если ячеек 8, то и число может состоять из 8 цифр.

Кодирование в компьютере целых чисел, дробных и отрицательных, а также символов (букв и др.) имеет свои особенности для каждого вида. Например, для хранения целых чисел выделяется меньше памяти (меньше ячеек), чем для хранения дробных независимо от их значения.

Однако, всегда следует помнить, что любая информация (числовая, текстовая, графическая, звуковая и др.) в памяти компьютера представляется в виде чисел в двоичной системе счисления (почти всегда).

В общем смысле кодирование информации можно определить как перевод информации, представленной сообщением в первичном алфавите, в последовательность кодов.

Надо понимать, что любые данные - это так или иначе закодированная информация. Информация может быть представлена в разных формах: в виде чисел, текста, рисунка и др. Перевод из одной формы в другую - это кодирование.

Натуральные числа (целые положительные числа)

Обычно ячейка памяти равна 1 байту, который в свою очередь равен 8 битам. Т.е. в одной ячейке памяти можно сохранить восьмиразрядное число в двоичной системе счисления. Очевидно, что минимальным таким числом будет 00000000, а максимальным 11111111.

Если представить число 11111111 в десятичной системе счисления, то мы получим число 255. Т.е в одном байте можно сохранять целые положительные числа от 0 до 255 включительно (всего 256 значений, что соответствует 28).

Для хранения чисел имеющих значение большее, чем 255, используют большее количество байтов. Так в двух байтах можно хранить число, состоящее из 16 разрядов. Можно узнать количество возможных комбинаций нулей и единиц для 16-ти разрядного числа: 216 = 65536. Т.е. в двух байтах можно сохранить любое число от 0 до 65535.

Для примера посчитаем, количество значений, которые можно сохранить, если использовать 4-х байтную ячейку памяти (такая ячейка имеет 32 разряда):

232 = 4 294 967 296,

т.е. более 4 миллиардов.

Прямой код

Прямой код – это представление числа в двоичной системе счисления, при котором первый (старший) разряд отводится под знак числа. Если число положительное, то в левый разряд записывается 0; если число отрицательное, то в левый разряд записывается 1.

Таким образом, в двоичной системе счисления, используя прямой код, в восьмиразрядной ячейке (байте) можно записать семиразрядное число. Например:

0 00011010 - положительное число
1 00011010 – отрицательное число

Количество значений, которые можно поместить в семиразрядной ячейке со знаком в дополнительном разряде равно 256. Это совпадает с количеством значений, которые можно поместить в восьмиразрядную ячейку без указания знака. Однако диапазон значений уже другой, ему принадлежат значения от -128 до 127 включительно (при переводе в десятичную систему счисления).

При этом в вычислительной технике прямой код используется почти исключительно для представления положительных чисел.

Для отрицательных чисел используется так называемый дополнительный код. Это связано с удобством выполнения операций над числами электронными устройствами компьютера.

Дополнительный код

В дополнительном коде, также как и прямом, первый разряд отводится для представления знака числа. Прямой код используется для представления положительных чисел, а дополнительный – для представления отрицательных. Поэтому, если в первом разряде находится 1, то мы имеем дело с дополнительным кодом и с отрицательным числом.

Все остальные разряды числа в дополнительном коде сначала инвертируются, т.е. заменяются противоположными (0 на 1, а 1 на 0). Например, если 1 0001100 – это прямой код числа, то при формировании его дополнительного кода, сначала надо заменить нули на единицы, а единицы на нули, кроме первого разряда. Получаем 1 1110011. Но это еще не окончательный вид дополнительного кода числа.

Далее следует прибавить единицу к получившемуся инверсией числу:

1 1110011 + 1 = 1 1110100

В итоге и получается число, которое принято называть дополнительным кодом числа.

Причина, по которой используется дополнительный код числа для представления отрицательных чисел, связана с тем, что так проще выполнять математические операции. Например, у нас два числа, представленных в прямом коде. Одно число положительное, другое – отрицательное и эти числа нужно сложить. Однако просто сложить их нельзя. Сначала компьютер должен определить, что это за числа. Выяснив, что одно число отрицательное, ему следует заменить операцию сложения операцией вычитания. Потом, машина должна определить, какое число больше по модулю, чтобы выяснить знак результата и определиться с тем, что из чего вычитать. В итоге, получается сложный алгоритм. Куда проще складывать числа, если отрицательные преобразованы в дополнительный код. Это можно увидеть на примерах ниже.

Дискретизация и квантование

При преобразовании звуковой информации в цифровую форму ее подвергают дискретизации и квантованию. Дискретизация заключается в замерах величины аналогового сигнала огромное множество раз в секунду. Полученной величине аналогового сигнала сопоставляется определенное значение из заранее выделенного диапазона: 256 (8 бит) или 65536 (16 бит). Привидение в соответствие уровня сигнала определенной величине диапазона и есть квантование.

Понятно, что как бы часто мы не проводили измерения, все равно часть информации будет теряться. Однако и понятно, что чем чаще мы проводим замеры, тем точнее будет соответствовать цифровой звук своему аналоговому оригиналу.

Также, чем больше бит отведено под кодирование уровня сигнала (квантование), тем точнее соответствие.

С другой стороны, звук хорошего качества будет содержать больше данных и, следовательно, больше занимать места на цифровом носителе информации.

В качестве примера можно привести такие расчеты. Для записи качественной музыки аналоговый звуковой сигнал измеряют более 44 000 раз в секунду и квантуют 2 байтами (16 бит дает диапазон из 65536 значений). Т.е. за одну секунду записывается 88 000 байт информации. Это равно (88 000 / 1024) примерно 86 Кбайт. Минута обойдется уже в 5168 Кбайт (86*60), что немного больше 5 Мб.

Линейные структуры (списки данных, векторы данных) - student2.ru

RGB модель

Экран монитора в графическом режиме разбит на точки (пиксели). Изображение формируется путем сочетания различных цветов и оттенков каждой точки.

Кодирование цвета может быть различным. Для создания изображения на экране монитора обычно используется цветовая модель RGB (Red – красный, Green – зеленый, Blue – синий).

Все разнообразие цветов достигается смешением этих трех основных цветов в различных пропорциях. Другими словами, любой цвет характеризуется определенной долей красного, зеленого и синего цветов. Поэтому для каждого пикселя конкретного изображения на экране монитора имеется набор из трех цветов с определенным уровнем яркости. За счет сочетания различных яркостей этих цветов (красного, зеленого и синего) создается весь спектр цветов, которые мы видим на экране.

Но сколько уровней яркости существует для каждого цвета? Ответ на этот вопрос скажет, сколько различных цветов и оттенков может принять каждая точка.

Если каждый из трех может быть только в двух состояниях (0 и 1), то всего мы можем получить 23 = 8 цветов. Так, например, если красный и зеленый будут на максимуме (1), а синий выключен (0), то получится чистый желтый цвет.

Однако в современных компьютерах градаций яркости намного больше, чем две. Получаются десятки тысяч, даже сотни тысяч цветов. При этом надо понимать, что увеличение степени разрешения (количество пикселей) и числа используемых цветов приводит к увеличению объема информации, хранимой в видеопамяти для отображения конкретной картинки.

Кодирование цвета с помощью модели RGB удобно представить в виде цветового куба. Каждому цвету на экране монитора соответствует точка внутри этого куба. Начало координат соответствует черному цвету (полное отсутствие любого цвета). На противоположной вершине куба находится точка, соответствующая белому цвету (максимальная яркость для каждого цвета). Вообще, единица соответствует максимальной яркости цвета (красного, зеленого или синего), которую может выдать монитор.

Отрезок (0, 0, 0) – (1, 1, 1) описывает градации серого цвета.
Если взять любую точку внутри куба и провести отрезок к ней от начала координат, то мы получим плавный переход определенного цвета от темного оттенка к светлому.

На гранях куба расположены самые насыщенные цвета, внутри куба – менее насыщенные (начинают подмешиваться серые оттенки).

Линейные структуры (списки данных, векторы данных) - student2.ru

Аналоговая обработка сигналов — любая обработка, производящаяся над аналоговыми сигналами аналоговыми средствами. В более узком смысле — математический алгоритм, обрабатывающий сигнал, представленный аналоговой электроникой, в котором математические значения представлены непрерывными физическими величинами, например, напряжением, электрическим током или электрическим зарядом. Небольшая ошибка или шум в сигнале будет представлен в результирующей ошибке обработанного сигнала.

Первыми электронными приборами для обработки аналоговых сигналов были электронные лампы, затем их сменили транзисторы. Сегодня одним из основных элементов для аналоговой обработки сигнала является операционный усилитель (ОУ).

Основные задачи

  • Линейная фильтрация — селекция сигнала в частотной области; синтез фильтров, согласованных с сигналами; частотное разделение каналов; цифровые преобразователи Гильберта и дифференциаторы; корректоры характеристик каналов
  • Спектральный анализ — обработка речевых, звуковых, сейсмических, гидроакустических сигналов; распознавание образов
  • Частотно-временной анализ — компрессия изображений, гидро- и радиолокация, разнообразные задачи обнаружения сигнала
  • Адаптивная фильтрация — обработка речи, изображений, распознавание образов, подавление шумов, адаптивные антенные решетки
  • Нелинейная обработка — вычисление корреляций, медианная фильтрация; синтез амплитудных, фазовых, частотных детекторов, обработка речи, векторное кодирование
  • Многоскоростная обработка — интерполяция (увеличение) и децимация (уменьшение) частоты дискретизации в многоскоростных системах телекоммуникации, аудиосистемах
  • Свертка - традиционные типы
  • Секционная сверткаОсновные преобразования

Измерение информации

ПОНЯТЬ

Верно ли, что истрепанная книжка, если в ней нет вырванных страниц, несет для Вас ровно столько же информации, сколько такая же новая?

Каменная скрижаль весом в три тонны несет для археологов столько же информации, сколько ее хороший фотоснимок в археологическом журнале. Не так ли?

Когда московская радиостудия передает последние известия, то одну и ту же информацию получает и подмосковный житель и житель Новосибирска. Но поток энергии радиоволн в Новосибирске намного меньше, чем в Москве.

Следовательно,мощность сигнала, также как и размер и вес носителя, не могут служить оценкой количества информации, переносимой сигналом.Как же оценить это количество?

Из курса физики вы знаете, что прежде, чем измерять значение какой-либо физической величины, надо ввести единицу измерения. У информации тоже есть такая единица - бит, но смысл ее различен при разных подходах к определению понятия “информация”.

I ПОДХОД.Неизмеряемость информации в быту (информация как новизна)

ПРИМЕР

Вы получили какое - то сообщение, например, прочитали статью в любимом журнале. В этом сообщении содержится какое-то количество информации. Как оценить, сколько информации Вы получили? Другими словами,как измерить информацию?Можно ли сказать, что чем больше статья, тем больше информации она содержит?

Разные люди, получившие одно и то же сообщение, по-разному оценивают его информационную ёмкость, то есть количество информации, содержащееся в нем. Это происходит оттого, что знания людей о событиях, явлениях, о которых идет речь в сообщении, до получения сообщения были различными. Поэтому те, кто знал об этом мало, сочтут, что получили много информации, те же, кто знал больше, могут сказать, что информации не получили вовсе. Количество информации в сообщении, таким образом, зависит от того, насколько ново это сообщение для получателя.

В таком случае, количество информации в одном и том же сообщении должно определяться отдельно для каждого получателя, то есть иметь субъективный характер. Но субъективные вещи не поддаются сравнению и анализу, для их измерения трудно выбрать одну общую для всех единицу измерения.

Таким образом, с точки зрения информации как новизны, мы не можем однозначно и объективно оценить количество информации, содержащейся даже в

Наши рекомендации