Властивості, якісні характеристики та кількісна оцінка інформації
Ряд особливостей наближає інформацію до матеріальних об’єктів, оскільки її можна передати, перетворити, записати, отримати, копіювати, знищити. У той же час при розповсюдженні інформації проявляється властивість не притаманна матеріальним об’єктам – при передачі інформації з однієї системи в іншу кількість інформації в передаючій системі не зменшується, а в приймаючій системі, як правило, збільшується.
Визначити якість інформації надзвичайно складно. Тому оцінку її проводять, аналізуючи якісні показники притаманні інформації, найбільш важливими з яких з точки зору можливості використання інформації для управління складними об’єктами є репрезентативність, адекватність, змістовність, точність, достовірність, достатність, доступність, своєчасність, цінність, актуальність та стійкість [13, 16].
Репрезентативність інформації –це правильність відображення заданих властивостей об’єкта.Вона визначає критерії відбору для адекватного відображення властивостей об’єкта і залежить від правильності вибраної концепції, методики вимірювання, відбору та формування інформації.
Адекватністьінформаціїзадає певний рівень відповідності змісту одержаної інформації образу реального об’єкта, який відображається.
Неадекватність інформації може виникати при створенні нової інформації на основі неповних або недостовірних даних. Однак, поява неадекватної інформації можлива і при використанні повних та достовірних даних у випадку застосування до них неадекватних методів.
З точки зору науки про знакові системи (семіотики) адекватність інформації може виражатися у трьох формах [13]: синтаксичній, семантичній та прагматичній. Синтаксична адекватність визначає процес передачі інформації, семантична – враховує її смисловий зміст, відповідність образа об’єкта та його реального аналога, а прагматична – визначає відповідність отриманої інформації меті управління.
Синтаксична адекватність зв’язана з відтворенням формально-структурних характеристик відображення, абстраговано від змістових та споживчих параметрів. На синтаксичному рівні враховують: тип матеріального носія; спосіб представлення інформації; швидкість передачі та обробки інформації; формат кодів представлення інформації; надійність, точність перетворення інформації тощо. Інформацію, яка розглядається із синтаксичних позицій, як правило, називають даними.
Семантична адекватність має на увазіврахуваннязмісту інформації. На цьому рівні аналізуються ті відомості, які відображає інформація, розглядаються змістовні зв’язки між кодами представлення інформації.
Прагматична адекватність відображає відповідність інформації та мети управління, відношення інформації та її споживача, характеризує корисні властивості інформації. Прагматичний аспект розгляду інформації зв’язаний з цінністю, корисністю інформації для вироблення управлінського рішення.
Змістовністьінформації – це її питома семантична ємність, яка визначається відношенням кількості семантичної інформації в повідомленні до об’єму даних, які його відображають, тобто S = Ic/Vд.
Із збільшенням змістовності інформації зростає семантична пропускна здатність інформаційної системи, оскільки для передачі одних і тих же відомостей потрібно перетворювати менший об’єм даних. Поряд із змістовністю можна використовувати і показник інформативності, який характеризується відношенням кількості синтаксичної інформації до об’єму даних – Y = I/Vд. Значення S часто може характеризуватись значеннямY, так як у правильно організованих системах управління кількість семантичної інформації пропорційна, а часто і дорівнює кількості синтаксичної інформації в повідомленні.
Точністьвизначає ступінь близькості одержаної інформації до реального стану об’єкта, який відображається. Необхідна точність визначається функціональним призначенням інформації і повинна забезпечувати правильність прийняття управлінських рішень.
Достовірність інформації –це її властивість відображати реально існуючі об’єкти з необхідною точністю. Достовірність інформації – це ймовірність відсутності помилок.
Корисна інформація завжди супроводжується певним рівнем «інформаційного шуму». При збільшенні рівня шуму достовірність інформації понижується. У цьому випадку для передачі тієї ж кількості інформації необхідно використовувати або більш складні методи, або більше даних. На практиці достовірність D інформації вимірюється довірчою ймовірністю необхідної точності відображення реально існуючого об’єкта, тобто ймовірністю того що значення параметру, яке відображається інформацією, відрізняється від істинного його значення в межах необхідної точності:
, (1.1)
де D — реальна точність відбиття параметра, [Dп] — діапазон необхідної точності відбиття параметра.
При оцінці істинності інформації розв’язуються дві основні імовірнісні задачі:
1. визначення точності інформації або розрахунок математичного сподівання абсолютної величини відхилення значення показника від об’єктивно існуючого дійсного значення параметра, що відбивається ним;
2. визначення достовірності інформації або обчислення ймовірності того, що похибка показника не вийде за межі допустимих значень. Адекватність відображення включає і точність, і достовірність інформації.
Достовірність інформації оцінюється рядом показників, серед яких виділяють одиничні показники достовірності, показники коригованості та комплексні показники достовірності інформації. До одиничних показників відносять:
довірчу ймовірність необхідної точності (достовірність) — імовірність того, що в межах заданого напрацювання (інформаційної сукупності — масиву, показника, реквізиту, кодового слова, символу або іншого інформаційного компоненту) відсутні грубі похибки, що приводять до порушення необхідної точності. Достовірність D = 1 – Рпом , де Рпом - ймовірність такої помилки;
середнє напрацювання інформації на помилку — відношення об’єму інформації І, перетворюваної в системі, до математичного очікування Р кількості помилок, що виникають в інформації, Q = І/Р;
вірогідність помилки (параметр потоку помилок) — вірогідність появи помилки в черговій інформаційній сукупності.
Достатність (повнота) інформації – це наявність мінімальної, але достатньої для прийняття оптимального управлінського рішення інформації.
Доступність інформації означає можливість її сприйняття тими для кого вона призначена, а при обробці технічними засобами – вільний доступ до неї для проведення операцій ознайомлення, документування, модифікації та знищення.
Своєчасність інформації – це можливість її використання в заданий момент часу.
Своєчасною є така інформація, яка поступає в систему управління не пізніше назначеного моменту часу.
Цінність інформації визначається ступенем її придатності для практичного використання у досягненні поставленої мети.
Це комплексний показник її якості, що визначається ефективністю прийнятого на її основі рішення. Цінність інформації прийнято визначати також величиною втрат, які вона відвертає або затратами на її добування.
Актуальність інформації –це її властивість зберігати свою цінність в часі.
Актуальність інформації характеризується ступенем збереження початкової цінності в момент часу її використання і залежить від динаміки змін статистичних характеристик об’єкта, який відображається, та від інтервалу часу, який пройшов з моменту виникнення інформації. Визначається актуальність А(t)наступним чином:
, (1.2)
де Z(t0) – початкова цінність інформації у моменти часу t0, а Z(t) – цінність інформації в момент часу t.
Стійкість –це властивість результуючої інформації реагувати на зміну вихідних даних без порушення необхідної точності.
Як вже відзначалося раніше, цінність, корисність інформації визначається тим наскільки ефективно вона впливає на досягнення поставленої мети. Однак, деколи цінність інформації може бути від’ємною (негативною). У цьому випадку вона називається дезінформацією, а її джерелом є суб’єктивні фактори (думки, погляди, оцінки). Можливе також навмисне спотворення інформації з певною метою. Якщо ця мета викликана суспільними інтересами, то дезінформація може бути корисною (наприклад, у військовій справі – використання хибних сигналів, неправдивих повідомлень, фальшивих позначень, щоб ввести в оману ворога).
Говорячи про якість інформації, не можна не згадати про таку характеристику, як оптимальність, оскільки дуже часто вживають терміни «оптимальна інформація», «оптимальне повідомлення», не розшифровуючи про що йдеться. Оптимальних у всіх відношеннях процесів, об’єктів не існує. Оптимальний – це значить найкращий з точки зору якогось критерію. Тому, говорячи про оптимальне повідомлення, слід уточняти з точки зору якого критерію воно оптимальне. Крім цього потребує уточнення по відношенню до кого це повідомлення є оптимальним, оскільки для одного одержувача воно може бути оптимальним, а для іншого не міститиме нічого нового або взагалі буде незрозумілим. В ідеальному випадку повідомлення можна вважати оптимальним, якщо воно по своїй формі, змісту, цілі та часу відповідатиме можливостям та потребам його одержувача.
Наукове визначення поняття «інформація» базується на імовірнісних властивостях отриманих відомостей. Чим менша ймовірність події (процесу, явища і т.п.) про яку повідомляється, тим більшу інформацію містить це повідомлення. Для кількісної оцінки інформації використовують поняття ентропії. Вона означає міру невизначеності системи або деякої ситуації (випадкової події, випадкової величини) при умові, що загальна кількість станів (виходів) кінцева (може бути порахована).
Ентропія системи α, яка має Nможливих станів - H(α), визначається за формулою Шеннона
(1.3)
де Pi-ймовірність того, що система знаходиться в і-му стані.
ЕнтропіяH(α) характеризує степінь невизначеності системи α і має такі властивості:
· вона є неперервною функцією аргументу;
· ентропія максимальна, якщо кожний можливий результат рівно ймовірний;
· ентропія дорівнює нулю, коли немає ніякої невизначеності (тобто, коли ймовірність кожного з результатів дорівнює 1);
· ентропія двох незалежних подій дорівнює сумі ентропій цих подій;
· ентропія збільшується з числом можливих результатів експериментів. Якщо набір можливих експериментальних результатів розбити на групи, то для отримання результуючої ентропії необхідно значення ентропій індивідуальних груп помножити на їх статистичні ваги.
У відповідності з трьома формами адекватності інформації (синтаксична, семантична та прагматична) виконується і її вимірювання. Перша форма відповідає сприйняттю зовнішніх структурних характеристик, тобто синтаксичної сторони інформації; друга – забезпечує формування понять та представлень, виявлення смислу, змісту інформації та її узагальнення, а третя безпосередньо зв’язана з практичним використанням інформації для мети діяльності системи [13].
Кількісна оцінка інформації на синтаксичному рівнінеможлива без визначення ентропії системи. Одержання інформації зв’язано із зміною ступеня непоінформованості одержувача про стан системи.
Нехай, наприклад, до одержання повідомлення одержувач має деякі попередні (апріорні) відомості про систему α. Ентропія H(α) є для нього мірою непоінформованості про систему, мірою невизначеності її стану. Після одержання деякого повідомлення βодержувач набуває додаткової інформації Iβ(α), яка зменшує його апріорну невизначеність так, що апостеріорна (після одержання повідомлення β) невизначеність стану системи стає H(α/β). Тоді кількість інформації Iβ(α) про систему α, отримана в повідомленні β буде визначатись, як:
(1.4)
Тобто кількість інформації вимірюється зменшенням невизначеності стану системи, а ентропія системи H(α)може розглядатись як міра невистачаючої інформації.
Важливою характеристикою на синтаксичному рівні є об’єм даних у повідомленні - VД. Він вимірюється кількістю символів (розрядів) прийнятого алфавіту в цьому повідомленні. Нехай, наприклад, по каналу зв’язку передається n – розрядне повідомлення, яке використовує m різних символів. Тоді об’єм даних у повідомленні буде становити VД=n, а кількість всіляких кодових комбінацій - N = mⁿ. У випадку рівно ймовірної появи будь-якої кодової комбінації, кількість інформації, придбаної абонентом внаслідок отримання вірного повідомлення, буде I = log N = n log m. Для не рівно ймовірних станів системи завжди:
, . (1.5)
Степінь інформативності повідомлення Y визначається відношенням кількості інформації до об’єму даних, тобто Y=I/VД, причому 0<Y<1 (Y характеризує лаконічність повідомлення). Із збільшенням Y зменшуються об’єми робіт пов’язані з перетворенням даних в системі. Тому прагнуть до підвищення інформативності, для чого розробляються спеціальні методи оптимального кодування інформації.
У різних системах числення один розряд має різну вагу і, відповідно, змінюється одиниця вимірювання об’єму даних. Так, у двійковій системі числення мінімальною одиницею вимірювання служить біт, широко використовується укрупнена одиниця вимірювання – байт; у десятковій системі числення одиницею вимірювання є діт (десятковий розряд).
Для вимірювання смислового змісту інформації, тобто її кількості на семантичному рівні, найбільше визнання отримала тезаурусна міра інформації, запропонована Ю. І. Шнейдером, яка зв’язує її семантичні властивості із здатністю користувача сприймати повідомлення яке надійшло. Для цього використовується поняття тезаурус користувача – сукупність відомостей які він має у своєму розпорядженні. В залежності від співвідношень між смисловим змістом інформації - S*та тезаурусом користувача – Sкзмінюється кількість семантичної інформації Iс, що сприймається і включається у свій тезаурус користувачем (рис. 1.2).
При Sк0користувач не сприймає, не розуміє інформацію, яка поступає, при користувач усе знає і ця інформація йому не потрібна. В обох випадках Iс = 0. Максимального значення Iснабуває при погодженні S* з тезаурусом Sк (Sк = Sкорt- рис. 1.2), коли інформація, яка поступає, зрозуміла користувачу і несе йому раніше не відомі (відсутні у його тезаурусі) відомості.
Рис. 1.2. Залежність Iс = f (Sк) [13]
Слід прагнути до погодження величин S* та Sк так, щоб інформація, яка циркулює в системі, була зрозумілою, доступною для сприйняття і мала найбільшу змістовність S, тобто S=Iс/VД.
Прагматичною мірою інформації є її корисність, цінність для користувача, для управління. Так, наприклад, в системі управління виробництвом цінність інформації визначається ефективністю економічного управління, яке здійснюється на її основі:
, (1.6)
деIпβ(α) – цінність інформаційного повідомлення βдля системи управління α; П(α) – апріорний очікуваний економічний ефект від функціонування системи управління α; П(α/β) – очікуваний ефект функціонування системи αпри умові, що для управління буде використана інформація, яка міститься у повідомленні β.
Корисність економічної інформації можна визначити зростанням економічних показників організації, обумовлених її використанням (під економічною інформацією розуміють сукупність відомостей про соціально-економічні процеси, що слугують для управління цими процесами і колективами людей у виробничій і невиробничій сферах [29]).