Дескрипторная система классификации
В этом разделе изложены основы дескрипторной системы классификации информации.
Дескрипторная (описательная) система классификации используется для организации поиска информации, для ведения тезаурусов (словарей). Язык дескрипторной системы классификации приближен к естественному языку описания информационных объектов. Дескрипторная система классификации используется в библиотечной системе поиска.
При дескрипторном методе классификации отбирается совокупность ключевых слов или словосочетаний, описывающих определенную предметную область или совокупность однородных объектов. Среди ключевых слов могут быть синонимы. Из совокупности синонимов выбираются один или несколько наиболее употребляемых. Создается словарь ключевых слов и словосочетаний - словарь дескрипторов. Между дескрипторами устанавливаются связи, позволяющие расширить область поиска информации. Виды связей могут быть:
- синомические - указывающие некоторую совокупность ключевых слов, таких как синонимы;
- родовидовые - отражающие включение некоторого класса объектов в более представительный класс;
- ассоциативные - соединяющие дескрипторы, обладающие общим свойством.
2) Внутренняя (основная) память реализуется с помощью набора микросхем, установленных на материнской плате. Она предназначена для хранения программ и данных, с которыми процессор непосредственно работает.
Память компьютера состоит из ячеек, местонахождение которых определяется уникальным адресом. В каждой ячейке хранится машинное слово, соответствующее какому либо данному или элементу программы. От разрядности машинного слова зависит объем внутренней памяти (количество ячеек).
Ёмкость памяти измеряется в килобайтах, мегабайтах и гигабайтах.
Кроме временных данных, которые определяются тем, что компьютер делает в настоящий момент, он должен знать и постоянно помнить некоторые стандартные программы и данные.
Например, компьютер должен знать, что ему делать после включения, где найти и прочитать операционную систему, которой будет передано управление компьютером, как выполнить конкретную операцию и пр. Причём выключение питания компьютера не должно приводить к потере этой важной информации.
Решение проблем хранения различных видов информации и надежного функционирования персонального компьютера привело к использованию нескольких видов внутренней памяти: оперативной, постоянной, кэш-памяти.
1) Классификация информации по разным признакам
Информация, как предмет, обладает следующими основными видами показателей:
1. Показатели назначения – характеризуют полезный эффект от использования продукции по назначению и обуславливающее область ее применения.
2. Показатели надежности и долговечности – определяют одноименные свойства информации в конкретных условиях ее применения
3. Показатели технологичности – характеризуют информацию с точки зрения ее производства и обработки.
4. Эргономические показатели – учитывают показатели воздействия ее на человека
5. Эстетические показатели
6. Показатели стандартизации и унификации
7. Потентно-правовые показатели
8. Экономические показатели
Информация – не материальная продукция, поэтому все эти показатели применимы к ней лишь отчасти, соотв. Применение ее сильно зависят от ее потребит. Адекватности и как правило характеризуется:
1. Репрезентативность – правильность, качественная адекватность заданных свойств реального объекта
2. Содержательность – это удельная семантическая емкость информации
3. Достаточность – количество информации, которое позволяет при ее минимальном количестве принять правильное управленческое решение.
4. Доступность – свойство информации, для восприятия человеком, осуществляющим управленческое решение
5. Актуальность – свойство информации сохранять свою полезность в течение какого-либо интервала времени.
6. Своевременность – свойство информации, обеспечивающее возможность ее использования в заданный момент времени.
7. Точность – возможность различать почти равные значения. Реальная точность – определяется последним разрядом числа, верность которого гарантируется.
8. Достоверность – свойство информации отражать реально существующие объекты с необходимой точностью
9. Устойчивость – свойство информации реагировать на изменение входных данных, сохраняя необходимую точность
10. Ценность – свойство информации определять меру ее прогматической адекватности.
2) Переместительный закон аналогичен переместительному закону обычной алгебры и записывается в виде:
а) для дизъюнкции
(3.1)
б) для конъюнкции
(3.2)
Таким образом, от перемены мест слагаемых (сомножителей) их логическая сумма (логическое произведение) не меняется.
Сочетательный закон также аналогичен сочетательному закону обычной алгебры и записывается в виде:
а) для дизъюнкции
(3.3)
б) для конъюнкции
(3.4)
Следовательно, можно группировать переменные, объединенные знаком дизъюнкции или конъюнкции, это не меняет значений ПФ.
Распределительный закон записывается в виде:
а) для дизъюнкции
(3.5)
т. е. дизъюнкция переменной и конъюнкции равносильна конъюнкции дизъюнкций этой переменной с сомножителями;
б) для конъюнкции
(3.6)
т. е. конъюнкция переменной и дизъюнкции эквивалентна дизъюнкции конъюнкций этой переменной со слагаемыми.
Справедливость выражения (3.5) доказывается путем г составления таблиц истинности для левой и правой частей. Значения этих таблиц совпадают для одинаковых наборов переменных, это и доказывает справедливость (3.5).
Закон инверсии:
а) для дизъюнкции
(3.7)
т. е. отрицание дизъюнкции логических переменных эквивалентно конъюнкции отрицаний этих переменных;
б) для конъюнкции
(3.8)
т. е. отрицание конъюнкции переменных эквивалентно дизъюнкции отрицаний этих переменных.
Справедливость выражений (3.7) и (3.8), как и (3.5), докалывается также путем составления таблиц истинности для левой и правой частей каждого выражения и их сравнения на совпадение для одних и тех же наборов переменных.
Докажем, например, справедливость формулы (3.8). Для этого составим таблицу истинности (табл. 3.9) правой и левой части соотношения (3.8).
Из табл. 3.9 видно, что содержимое столбцов 4 и 7 совпадает на одних и тех же наборах переменных (т. е. в одних и тех же строках). Это и доказывает справедливость формулы (3.8).
Из законов алгебры логики выводится ряд важных правил, которые полезны при выполнении эквивалентных преобразований ПФ.
1. Выражения, имеющие всегда значение 1:
2.Выражения, имеющие всегда значение 0:
3. Двойное отрицание:
4.Повторение:
5.Склеивание: .
Это правило доказывается путем вынесения в левой части х1 за скобку и применения правила 1 для выражения, имеющего значение 1:
6.Поглощение:
Для доказательства справедливости этого правила вынесем в левой части за скобку х1 и применим правило 1 для выражения, имеющего значение 1:
1)см тетр
2) В равномерных кодах все комбинации содержат одинаковое количество символов (разрядов).
В неравномерных кодах каждая комбинация содержит различное количество разрядов (например,
код Морзе).
В вычислительной технике применяют в основном равномерные коды.
В качестве примера равномерного кода можно назвать ASCII-таблицу, где каждому из 256 символов сопоставлено двоичное значение от 00000000 до 11111111. Независимо от вероятности появления символа на его представление отводится 1 байт, или 8 бит. Как известно, национальные языки обладают большой избыточностью, то есть разницей между энтропией источника и максимально возможной энтропией, обусловленной равной вероятностью появления любого символа из алфавита. Например, избыточность русского языка составляет 70%, а английского – 50%. Это в частности означает, что некоторые буквы появляются в тексте гораздо чаще других и поэтому использовать равномерное кодирование нерационально.
При неравномерном кодировании часто встречающимся символам сопоставляются более короткие кодовые последовательности, редко встречающимся – более длинные. За счет этого удается значительно сократить объем файла без потерь информации. Существует несколько методов неравномерного кодирования, важнейших из которых является метод Шеннона-Фано.
1) Информацией называют любые сведения, являющиеся объектом передачи, распределения, преобразования, хранения и использования.
Сообщением называется форма представления информации. Это может быть текст (последовательность символов), звуковое давление, яркость и цвет, данные на выходе вычислительной машины и др.
Чтобы передать информацию, надо передать содержащие эту информацию сообщения.
Как источником, так и получателем информации, может быть человек (оператор), технические устройства - датчики, преобразовывающие информацию в сигнал и наоборот.
При использовании радиотехнических средств сообщение представляет собой электрический сигнал (ток или напряжение). Информация, а следовательно и сообщение, являются, как правило, медленно меняющимися функциями времени. Для лучшей передачи ее на большие расстояния используются "быстрые" радиоволны, называемые несущими колебаниями (по аналогии с техническими средствами доставки письменных сообщений: автомобили, самолеты и др., позволяющими увеличить скорость доставки).
Процесс переноса сообщения на несущее колебание называется модуляцией. Сообщение при этом называется радиосигналом. На приемном конце системы связи из радиосигнала снова получают сообщение.Этот процесс называется демодуляцией или детектированием.
2) Первоначально ЭВМ были созданы для вычислений, но постепенно на ней стали решать задачи по физике, химии, биологии, управлению технологическими процессами, рисованию мультфильмов и т.д., т.е. для решения задач с математикой непосредственно не связанных. В общем случае выделяют несколько этапов в подготовке и решении задач на ЭВМ.
На первом этапе анализируется условие задачи, определяются исходные данные и результаты, устанавливается зависимость между величинами, рассматриваемыми в задаче. Некоторые задачи имеют множество способов решения, поэтому необходимо выбрать способ решения (сделать постановку задачи, составить модель задачи). Для этого необходимо определить математические соотношения между исходными данными и результатом. Выполнив перевод задачи на язык математики, получают математическую модель.
Второй этап заключается в составлении алгоритма решения задачи по выбранной модели.
На третьем этапе алгоритм записывается на языке программирования и полученная программа вводится в ЭВМ. Далее проводится отладка программы, т.е. поиск и ошибок. Различают логические и семантические ошибки. Семантические ошибки возникают, когда программист неправильно записывает конструкции языка программирования. Семантические ошибки отыскать легче, т. к. современные трансляторы языков программирования способны их выявить. Логические ошибки возникают, когда инструкции записаны правильно, но последовательность их выполнения дает неверный результат.
Далее проводится тестирование, которое заключается в запуске программы с использованием контрольных примеров - тестов. Тесты выбирают таким образом, чтобы при работе с ними программа прошла все возможные ветви алгоритма, поскольку на каждом из них могут быть свои ошибки.
После отладки и тестирования программа выполняется с реальными исходными данными и проводится анализ полученных результатов, т.е. сопоставление их с экспериментальными фактами, теоретическими воззрениями и другой информацией об изучаемом объекте. Если результаты работы программы не удовлетворяют пользователей по каким-либо параметрам, то производится уточнение модели. При уточнении модели правится алгоритм программы, снова проводятся отладка, тестирование, расчеты и анализ результатов. Так продолжается до тех пор, пока результаты работы программы не будут удовлетворять знаниям об изучаемом объекте.
Общая схема решения задач с помощью ЭВМ выглядит так:
1) Компьютер представляет собой электронный прибор, предназначенный для получения, хранения, обработки, передачи и вывода информации. При этом информация может быть самой разной: текстовой, числовой, графической, аудио или видео.
Компьютер хранит и обрабатывает только числа, следовательно, для работы с любой информацией на компьютере ее необходимо представить в виде чисел или, как говорят, закодировать.
Электрические сигналы внутри компьютера могут иметь два состояния: есть напряжение или нет напряжения. Из этого следует, что компьютер умеет считать до двух, или знает всего две цифры. Одна, называемая единицей, - когда напряжение есть, и вторая, называемая нулем, - когда напряжения нет. С помощью этих двух цифр можно выразить любое число точно так же, как мы в повседневной жизни используем десять цифр. Запись различных чисел с помощью цифр называется системой счисления. Мы используем десятичную систему счисления, а компьютер – двоичную систему, которая для нас непривычна. Двоичная цифра может принимать значения: ноль или единица, следовательно, может хранить информацию о каком-либо событии, которое с одинаковой вероятностью может произойти, а может и не произойти. Информация о таком событии называется битом. Поэтому говорят, что двоичная цифра хранит один бит, являющейся единицей хранения информации. Так как бит хранит очень мало информации, чаще используются другие единицы измерения:
1 байт = 8 бит 1 Кб = 1024 байт
1 Мб = 1024 Кб 1Гб = 1024Мб.
Таким образом, любая информация в компьютере представляется в виде последовательностей нулей и единиц. Одно и то же число программа для работы с текстом может принять за букву, программа для работы с изображениями – за фрагмент изображения, а программа для работы со звуком – за ноту. Даже сами программы хранятся в виде набора чисел.
2)Информационная культура - область культуры, связанная с функционированием информации в обществе и формированием информационных качеств личности.
Информационная культура- уровень знаний, позволяющий человеку свободно ориентироваться в информационном пространстве, участвовать в его формировании и способствовать информационному взаимодействию
Определение
Базовыми элементами, которыми оперирует алгебра логики, являются высказывания. Высказывания строятся над множеством {B, , , , 0, 1}, где B — непустое множество, над элементами которого определены триоперации:
отрицание (унарная операция),
конъюнкция (бинарная),
дизъюнкция (бинарная),
а также константы — логический ноль 0 и логическая единица 1.
Дизъю́нкт — пропозициональная формула, являющаяся дизъюнкцией одного или более литералов (например ). Конъюнкт — пропозициональная формула, являющаяся конъюнкцией одного или более литералов (например ).
Править]Аксиомы
1.
2.
3.
4.
5.
6.
7.
8.
9.