Від сигналів до даних, інформації та знань. Перетворення сигналів та основні операції з даними
Фізичні об’єкти в матеріальному світі знаходяться в стані безперервного руху та зміни, що характеризується обміном енергією та її переходом із однієї форми в іншу. Усі види енергетичного обміну супроводжуються появою сигналів при взаємодії яких із фізичними тілами в останніх виникають певні зміни властивостей. Це явище називається реєстрацією сигналу. Такі зміни можна спостерігати, вимірювати або фіксувати певними способами – при цьому виникають та регіструються нові сигнали, тобто створюються дані [90].
Сигнал –це матеріальний носій інформації – фізичний процес, параметри якого адекватно відображають інформацію про стан об’єкта спостереження.Фізичний процес є невід’ємною властивістю об’єкта, зв’язаний з ним вектором змінних стану певної розмірності і представляє собою їх набір, отриманий для різних значень часу. Результатом спостереження є вимірювання у дискретні проміжки часу деяких фізичних величин, які є відображенням змінних стану процесу.
У природі всі вимірювані фізичні величини представляються аналоговими сигналами. Назва «аналоговий» дана неперервним сигналам, тому, що вони «аналогічні» фізичним процесам, які зустрічаються в дійсності. Деякі сигнали представляють собою реакції на інші сигнали. Наприклад, відбитий сигнал радара або ультразвукової системи відображення, представляє собою модель випромінюваного сигналу.
За своєю фізичною природою сигнали можуть бути електричні, оптичні, акустичні, електромагнітні і т. д. Важливим параметром для усіх типів сигналу є значення рівня сигналу (його енергії) у всіх точках. У якості інших параметрів, як правило, виступає час (одномірний сигнал), просторові координати (двомірний та багатомірні сигнали).
В залежності від області визначення говорять про часову, частотну та просторову форму представлення сигналу. Якщо область визначення неперервна, то говорять про неперервний або аналоговий сигнал. Якщо сигнал приймає тільки певний набір дискретних станів, його називають дискретним. Область значень сигналів також може бути неперервною або дискретною. Стрілочний вольтметр – приклад приладу, який вимірює неперервну величину. Запис його показів з певною точністю – це не що інше, як дискретизація сигналу напруги за рівнем.
Сигнал, у якого область визначення і область значень дискретні, називається цифровим. Цифровий сигнал можна представити у вигляді масиву чисел – за звичай одномірного (наприклад, мова) або двомірного (наприклад, зображення).
Зареєстровані сигнали представляють собою дані. У відповідності з методом реєстрації дані можуть зберігатись і транспортуватись на різних матеріальних носіях.
Дані –це будь-які знання про предмети, факти, поняття і т. п. проблемної області, якими обмінюються користувачі системи обробки даних, представлені у формалізованому виді, придатному для передачі, інтерпретації чи обробки з участю людини або автоматичними засобами (ДСТУ).
Самі по собі дані ніякої цінності не представляють. Дані несуть у собі інформацію про події, які відбулися в матеріальному світі, оскільки вони є реєстрацією сигналів, що виникли в результаті цих подій. Між даними та інформацією в загальному випадку не існує взаємно-однозначної відповідності. Наприклад, прослуховуючи передачу радіостанції на незнайомій мові, ми отримуємо дані, але не отримуємо інформацію, оскільки не володіємо методом перетворення даних у відомі нам поняття. Для отримання інформації необхідний певний метод обробки даних, їх інтерпретація.
Інтерпретація –процес перетворення даних в інформацію, процес надання їм смислу. Цей процес залежить від багатьох факторів: хто інтерпретує дані, якою інформацією вже володіє інтерпретатор, з яких позицій він розглядає отримані дані. Такий процес може здійснюватися людиною або групою осіб, біологічними об’єктами, технічними засобами у тому числі і комп’ютером. Наприклад, зображення іконки – значка-картинки на Робочому Столі Windows, яка символізує ту чи іншу програму або файл – це дані, які повинні бути інтерпретовані операційною системою. У той же час одні і ті ж самі дані можуть нести зовсім різну інформацію різним одержувачам (інтерпретаторам), оскільки інтерпретація даних залежить від багатьох додаткових об’єктивних та суб’єктивних факторів. Крім цього в любому достатньо великому наборі даних є особливі позиції (знаки, ключові слова, признаки), які управляють процесом інтерпретації і тому мають особливе значення.
Нарівні з поняттям «достовірність інформації» існує поняття «достовірність даних» (під цим поняттям розуміють їх безпомилковість). Вона вимірюється ймовірністю появи помилки в даних. Недостовірність даних може привести до збільшення їх об’єму у той час, коли недостовірність інформації завжди зменшує її кількість.
Необхідно звернути увагу на те, що досить часто такі терміни, як «дані», «інформація» та «знання» використовуються один замість іншого. Така розмитість понять недопустима у вік інформатики.
Дані –це окремі факти, які характеризують об'єкти, процеси та явища предметної області, а також їх властивості. Це найбільш прості елементи знання, їх мета неоднозначна, їм властива велика ступінь свободи. Специфіка даних полягає в тому, що вони, з одного боку, існують незалежно від спостерігача, а з іншого боку – стають власне «даними» лише тоді, коли існує їхній суб’єкт, який цілеспрямовано їх фіксує. Дані є тією основою, на якій потім базуються висновки і приймаються рішення.
Інформація –це цілеспрямовано оброблена сукупність даних, їй властива більш висока конкретність мети.До інформації слід відноситись як до об’єкту особливої природи, який виникає в момент протікання інформаційного процесу взаємодії об’єктивних даних та адекватних їм методів отримання інформації [90]. Весь інший час вона перебуває у вигляді даних. На властивості інформації впливають як властивості даних, які складають її змістовну частину, так і властивості методів, які взаємодіють з даними в ході інформаційного процесу. Після його закінчення властивості інформації переносяться на властивості нових даних.
Знання –це не просто накопичення інформації: вони представляють собою організовану сукупність, яка відображає прагнення людей, які створили та інтерпретували її. Величезні сховища даних та інформації (банки даних, енциклопедії тощо) – це тільки незадіяні запаси «сировини» для знань.
Знання охоплюють процес обробки вхідних даних, включаючи координацію дій для досягнення результатів. Їх об’єм, якість визначається успіхом (або невдачею) у досягненні поставленої мети. Знання – це дії, скоординовані тим, хто знає, і тому залежать від його характеру. Спосіб, яким знання можуть бути введені у дію, залежить від природи «справи», як вона розуміється в організації знаючого та її робочим середовищем [42].
Знання розглядаються як добре структуровані дані, метадані або дані про дані. Знання – це закономірності предметної області (принципи, зв'язки, закони), отримані в результаті практичної діяльності і професійного досвіду, які дозволяють спеціалістам ставити і розв'язувати задачі в певних галузях, це сукупність фактів, закономірностей, відношень та евристичних правил, що відбиває рівень обізнаності з проблемами деяких предметних областей. Згідно з різними підходами виокремлюють такі типи знань:
декларативні (предметні) знання — факти, відомості описового характеру, класи об’єктів і зв’язки між ними, які можна подати у вигляді множини тверджень, що не залежать від того, де і коли такі знання використовуються;
процедурні знання (правила) — описи процедур, за допомогою яких ці знання можна здобути та розв’язати певні типові для певної предметної області задачі. У разі процедурного подання знань немає потреби зберігати інформацію про всі можливі стани предметної області, як тоді, коли використовуються декларативні знання, — достатньо мати опис початкового стану та процедур, що генерують на його основі потрібні наступні стани;
евристичні знання — знання, які акумулюють неформальний досвід розв’язування задач у деякій предметній області;
семантичні знання — знання про стан об’єктів предметної області та відношення між ними;
прагматичні знання — знання про способи розв’язування задач у предметній області;
каузальні знання — знання, в основу яких покладено причинно-наслідкові зв’язки;
метазнання — «знання про знання», які містять загальні відомості про принципи структурування та використання знань. До рівня метазнань також відносять стратегії управління вибором і застосуванням процедурних знань.
Специфічні особливості знань, що дають змогу відрізнити їх від даних – це: внутрішня інтерпретація, наявність ситуативних зв’язків, активність і форма подання.
Промислові системи вимірювання, збору даних, управління процесом для виробляння відповідних сигналів зворотного зв’язку та безпосереднього керування процесом використовують інформацію, отриману від давачів. Давачі і, зв’язані з ними кола, використовуються для вимірювання різних фізичних властивостей, наприклад, температури, сили, тиску, напруженості, прискорення, інтенсивності та інше.
Давач(sensor) –це пристрій, який перетворює вхідний сигнал або збудження (що відображає фізичну властивість) у електричний вихідний сигнал. Часто вживається також термін «перетворювач», хоча, строго говорячи, перетворювач (transducer) – це конвертор одного типу енергії в іншу.
Давачі, як правило, є елементами великої системи, яка складається із формувачів сигналів та різних аналогових та цифрових кіл їх обробки. З точки зору формування сигналу розрізняють активні та пасивні сенсори. Активний сенсор вимагає наявності зовнішнього джерела збудження. Це, наприклад, термістори, резистивні термометри (RTD – Resistance Temperature Detectors) і тензометри. Через них протікає струм. Для знаходження значення опору вимірюється відповідне значення напруги. Іншим способом є улаштування пристрою у мостову схему. Тут також необхідний зовнішній струм або зовнішня напруга по колу.
Пасивні сенсори генерують свій електричний вихідний сигнал без використання зовнішнього струму або зовнішньої напруги по колу. Прикладом пасивних давачів є термоелементи та фотодіоди, які, незалежно від зовнішніх кіл, створюють термоелектричні напруги або фотодіодний струм, відповідно.
Границю шкали виходів більшості давачів складають малі зміни напруги, струму або опору, і тому, перед проведенням аналогової або цифрової обробки сигналу, виходи повинні бути відповідним чином погоджені. Для цього існує цілий ряд кіл, які відносяться до кіл формування сигналу. Основними функціями формування сигналу є підсилення, зсув рівня, гальванічна ізоляція, трансформація опору, лінеаризація, фільтрація.
Більшість виходів сенсорів є нелінійними, тому для одержання коректних вимірювань їх виходи повинні бути лінеаризовані. Для виконання цієї функції може бути використана аналогова техніка, хоча поява останнім часом високопродуктивних АЦП дозволяє проводити більш ефективну і точну лінеаризацію - програмну.
Цифрова техніка стає усе більш популярною при обробці виходів з давачів в системах збору даних, управління процесом та вимірювання. Восьмирозрядні мікро контролери (наприклад, 8051-сумісні) володіють достатньою швидкістю обробки даних. Включенням аналого-цифрового перетворення та можливості програмування мікроконтролера всередині давача, можна реалізувати «інтелектуальний датчик» (smart sensor»), який має функції самокалібровки, лінеаризації та ін.
Серія виробів MicroConverter от Analog Devices містить вбудовані високопродуктивні мультиплексори, АЦП, ЦАП, з’єднані з flash-пам’яттю ядром мікро контролера індустріального стандарту 8052, і підтримує декілька стандартів конфігурації послідовного порту. Ці вироби є першими інтегрованими схемами, які можна назвати «інтелектуальними давачами» для систем збору даних на одному кристалі.
Першочергова причина обробки фізичних сигналів полягає в необхідності отримання інформації, яка міститься в них. Ця інформація присутня в амплітуді сигналу, в частоті чи в спектральному складі, у фазі чи у відносних часових залежностях декількох сигналів.
У деяких випадках бажано переформатувати інформацію, яка міститься в сигналі. Наприклад, зміна формату має місце при передачі звукового сигналу в телефонній системі з багатоканальним доступом і частотним розділенням (FDMA). У цьому випадку аналогові методи використовуються для створення «стеку» голосових каналів у частотному спектрі для передачі через радіорелейну станцію мікрохвильового діапазону, коаксіальний чи оптоволоконний кабель. У випадку цифрового зв’язку аналогова звукова інформація спочатку перетворюється в цифрову з допомогою аналого-цифрового перетворювача (АЦП). Цифрова інформація, яка представляє індивідуальні звукові канали, мультиплексується в часі (багатоканальний доступ з часовим розділенням, (TDMA) і передається по послідовній цифровій лінії зв’язку.
Ще одна причина обробки сигналів полягає у стисненні полоси частот сигналу (без суттєвої втрати інформації) з наступним форматуванням та передачею інформації на понижених швидкостях, що дозволяє звузити смугу пропускання каналу. Високошвидкісні модеми і системи адаптивної імпульсно-кодової модуляції (ADPCM) широко використовують алгоритми усунення надлишковості даних (стиснення), так само, як і цифрові системи мобільного зв’язку, MPEG рекордери, програвачі та телебачення високої чіткості (HDTV).
У деяких випадках, у сигналі, який містить інформацію, присутній шум, і основною метою є відновлення сигналу. Такі методи як фільтрація, автокореляція, згортка і т. д., часто використовуються для виконання цієї задачі і в аналоговій і в цифровій областях.
У цілому ряді випадків фізичні аналогові сигнали можуть бути безпосередньо згенеровані (штучно сформовані). Наприклад, музика і мова, які штучно синтезуються. При генерації фізичних аналогових сигналів з використанням тільки цифрових методів базуються на інформації, попередньо отриманій із джерел аналогічних фізичних аналогових сигналів. При розробці звукових систем попередньо задаються певними статистичними властивостями звуків, які генеруються, широко використовуючи для цього методи цифрової обробки сигналів (ЦОС).
Сигнали можуть бути оброблені з використанням аналогових методів (аналогова обробка сигналів, або ASP), цифрових методів (цифрова обробка сигналів, або DSP) або комбінації аналогових і цифрових методів (комбінована обробка сигналів, або MSP). Основна відмінність DSP від традиційного комп’ютерного аналізу даних полягає у високій швидкості та ефективності виконання складних функцій цифрової обробки, таких як фільтрація, аналіз із використанням швидкого перетворення Фур’є, стиснення даних у реальному масштабі часу.
У випадку комбінованої обробки сигналів, системою виконується як аналогова так і цифрова обробка. Така система може бути реалізована у вигляді друкованої плати, гібридної інтегральної схеми або окремого кристалу з інтегрованими елементами. АЦП і ЦАП представляють собою пристрої комбінованої обробки сигналів, оскільки в кожному з них реалізуються як аналогові так і цифрові функції. Неможливо обробити фізичні аналогові сигнали, використовуючи тільки цифрові методи, оскільки всі давачі (мікрофони, термопари, тензорезистори, п’єзоелектричні кристали, головки накопичувача на магнітних дисках і т. д.) є аналоговими пристроями. Тому деякі види сигналів вимагають наявності схем нормалізації для подальшої обробки сигналів аналоговими або цифровими методами. Схеми нормалізації сигналу на практиці реалізуються за допомогою аналогових процесорів, які виконують такі функції як підсилення, накопичування, виявлення сигналу на фоні шуму, динамічне стиснення діапазону та фільтрація.
Більша частина обробки аналогового сигналу здійснюється в АЦП, оскільки він розташований найближче до давача. Багатофункційність АЦП може проявлятися у збільшенні частоти дискретизації, розширенні динамічного діапазону, підвищенні роздільної здатності, , відсічці вхідного шуму і т. д.
Загальне представлення про принципи обробки аналогового сигналу можна отримати із структурної схеми (рис. 1.3).
Рис.1.3. Структурна схема цифрової обробки аналогових сигналів
Як правило, перед здійсненням реального аналого-цифрового перетворення, аналоговий сигнал проходить через кола нормалізації, які виконують функції підсилення, послаблення (аттенюації), та фільтрації. Для подавлення небажаних сигналів поза смугою пропускання та запобігання накладанню спектрів необхідний ФНЧ/ПФ.
Аналого-цифровий перетворювач неперервно дискретизує сигнал із частотою, яка дорівнює частоті дискретизації – fД, та видає новий відлік цифровому процесору обробки сигналів (ЦПОС) із такою ж частотою. Для забезпечення роботи в режимі реального часу ЦПОС повинен закінчити усі обчислення в межах інтервалу дискретизації 1/fД та передати вихідний відлік на ЦАП до поступлення наступного відліку з АЦП.
Цифро-аналоговий перетворювач (ЦАП) потрібний, коли дані необхідно перетворити назад у аналоговий сигнал (наприклад, у випадку голосового або звукового додатку). Тоді після нього, для подавлення небажаних ВЧ-гармонік необхідно застосовувати ФНЧ.
У реальних процесах аналого-цифрового та цифро-аналогового перетворення є два ключових етапи: дискретизація по часу та квантування за амплітудою, які визначають роздільну здатність цих операцій.
Відомості, отримані після аналізу стану досліджуваного об’єкта та зовнішнього (по відношенню до нього) середовища і зафіксовані на певному типі матеріального носія є даними. Тому процес подальшого їх перетворення називають технологічним процесом обробки даних.
У ході інформаційного процесу дані перетворюються з одного виду в інший. Пристрої для введення та виведення даних, які працюють з носіями інформації, в структурі вартості обчислювальних систем складають, як правило, до половини вартості апаратних засобів. У структурі можливих операцій з даними, в якості основних, можна виділити такі [90]:
· збір даних – процес отримання даних від різних джерел, накопичення їх, групування та представлення в формі, придатній для вводу в ЕОМ;
· формалізація даних – приведення даних, які поступають із різних джерел, до однакової форми, щоб їх можна було співставляти між собою;
· фільтрація даних – відсіювання зайвих даних у яких немає необхідності для прийняття рішення;
· сортування даних – впорядкування даних за певною ознакою з метою зручності використання;
· архівація даних – організація зберігання даних у зручній та легкодоступній формі; використовується для зниження економічних затрат по зберіганню даних та підвищує загальну надійність інформаційного процесу в цілому;
· захист даних – охорона даних від несанкціонованого, зловмисного або випадкового їх розкриття, модифікації або знищення;
· транспортування даних – приймання та передавання даних між віддаленими учасниками інформаційного процесу;
· перетворення даних – перевід даних із однієї форми в іншу або з однієї структури в іншу.
Перетворення даних часто виникає при їх транспортуванні. Так, наприклад, для транспортування цифрових даних по каналах аналогових телефонних мереж необхідне їх перетворення в деяку подібність звукових сигналів, що здійснюється з допомогою пристрою який називається телефонним модемом.