Гіпертекст як форма організації інформації

ПОШУКОВА РОБОТА

Гіпертекст як засіб

нелінійної репрезентації тексту

Київ, 2002

1. Вступ. 3

2. Історія гіпертексту. 4

3. Гіпертекст як форма організації інформації 5

4. Гіпертекстова технологія. 7

5. Гіпертекстові системи. 9

Властивості ідеалізованої гіпертекстової системи. 11

Основні критерії для оцінки потужності гіпертекстових систем. 12

6. Недоліки і проблеми гіпертекстових систем. 12

7. Гіпертекст - інструмент представлення знань. 13

8. Висновки. 14

9. Література. 15

Вступ

Гіпертекст - сучасна інформаційна, комп'ютерно-підтримувана технологія організації текстових, графічних, відео- та звукових матеріалів, а також їх споживання, що відзначається двома особливостями:

1. в ній поєднуються нелінійний, асоціативно - фрагментарний та сітковий принципи репрезентації інформаційного середовища;

2. формування та вилучення потрібної інформації здійснюється шляхом вільної навігації за нелінійними зв'язками, зафіксованими в гіпертекстовому середовищі.

Сучасний стан розвитку інформаційних технологій, зокрема, операційні системи типу Microsoft Windows, MacOS, XWindows, а також прикладні програмні продукти, які створені для них, мають риси, які свого часу були описані дослідниками гіпертексту. Віконний інтерфейс, маніпулятор “миша”, панель завдань та інші “звичні” для користувача речі було винайдено при проектуванні першої гіпертекстової комп’ютерної системи ще в 1963-у році.

Розвиток всесвітньої мережі INTERNET, а точніше інформаційний бум, який не спадає впродовж останніх років, нерозривно пов’язаний з World Wide Web (WWW) – першою інформаційною гіпертекстовою службою планетарного масштабу. Кількість і доступність інформації помножені на зручність гіпертекстової організації цієї величезної бази даних зробили так, що велика кількість людей вже не уявляють своє повсякдення без INTERNET.

Гіпертекст як технологія, з його інтуїтивно зрозумілими, наближеним до людського способу мислення інтерфейсом, став одним з найефективніших способів представлення інформації. Ідеологія гіпертекстового представлення інформації дедалі поширюється не тільки на енциклопедичні знання, але й на спосіб організації інтерфейсу будь-якого сучасного програмного продукту, від іграшки до системи банківського обліку.

В цій роботі зроблено спробу сумувати сучасні знання про гіпертекст, його історію, складові частини, напрямки розвитку та сфери застосування.

Історія гіпертексту

Першим, хто глибоко усвідомив недосконалість традиційних методів роботи з усілякими носіями інформації (звітами, планами, програмами, дові­дниками, енциклопедіями, книгами й ін.), а також недосконалість і самої форми організації цих носіїв, був Буш, науковий радник президента Рузвельта. Під час другої світової війни він виконував обов’язки директора Управління досліджень і розробок США і відчував величезне інформаційне перевантаження при контролі діяльності 6000 вчених, які працювали на оборону країни. Буш передбачав інформаційний вибух. У 1945 р. він зазначав, що існуючі методи представлення і перегляду результатів досліджень цілком неадекватні задачам, які постають перед користувачем. Він наголошував, що складності при пошуку необхідного запису частіше усього виникають через штучність побудови самої пошукової системи. Як правило, дані всіх типів заносяться в пам'ять відповідно до алфавітного або числового порядку, і інформація відшукується шляхом перегляду поверх униз підкласу за підкласом. Крім того, досягнувши необхідного елемента, користувач повинний вийти із системи і знову включитися в неї, щоб пройти вже новим шляхом.

Буш звертав увагу на те, що людський мозок працює інакше, а саме на основі асоціацій. Затримуючись на одному предметі, він швидко перестрибує на інший, запропонований асоціацією думки. Щоб відбити в комп'ютері цей процес, потрібні спеціальні засоби для встановлення зв'язку й звертання до асоційованого предмета.

Буш не побачив утілення своїх ідей при житті, але ввійшов в історію як піонер гіпертексту, який усвідомив значення нелінійного пошуку для інтелектуальної роботи і запропонував пристрій для реалізації такого пошуку - машину МЕМЕХ. Вона передбачала нелінійне, багатоаспектне впорядкування інформації та використання процедур асоціативного поглядання пов'язаних між собою даних.

У задумі Буша відбилися основні риси гіпертекстових систем: зберігання тексту разом із графічними компонентами, включення в базу даних власних матеріалів, перегляд інформації за зв'язками, перехід від фрагмента до фрагмента одним натисненням кнопки, формування шляхів у гіпертексті.

Термін “гіпертекст” увів Нельсон і визначив його як комбінацію природно-мовного тексту зі здатністю комп'ютера здійснювати інтерактивне розгалуження або динамічне відтворення нелінійного тексту, який не може бути надрукованим у звичайний спосіб на аркуші паперу. Нельсон відзначав: “Звичайний лист є послідовним..., тому що він... походить від мови. Проте структура думок не послідовна. Вони постійно переплітаються одна з одною, і коли ми пишемо, нам завжди хочеться зв'язати думки не послідовно”.

В одній зі своїх ранніх книг “Інформаційні системи майбутнього” він писав: “Гіпертекст може відрізнятися від звичайного тексту порядком проходження матеріалу (елементи гіпертексту можуть розміщуватися у вигляді ієрархічного дерева або сітки, він може мати декілька рівнів стислості викладу і деталізації матеріалу), засобом його представлення (використання матеріалу може забезпечити відтворення рухливих ілюстрацій) і т.д.”.

Ідеї Буша і Нельсона розвинув Енгельбарт. У 1963 р. під його керівництвом було розроблено першу комп'ютерну гіпертекстову систему NLS (oN Line System). У процесі її розробки Енгельбарт винайшов ряд пристроїв і концепцій, які ввійшли в сучасний арсенал обчислювальної техніки: маніпулятор типу “миша”; багатовіконний інтерфейс; акордову клавіатуру; текстовий редактор і контекстно-дошкульна підтримку.

Багато програмних продуктів (наприклад, продукти Microsoft Windows) мають риси гіпертексту (ГТ) - це, як правило, гіпертекстоподібний інтерфейс. Проте ГТ як технологія має більші можливості.

У СРСР роботи, які були пов'язані з нелінійним представленням тексту, природно в повній безвісності щодо самого терміна “гіпертекст”, велися різними авторами ще в 50-ті роки. Це роботи, які одержали назви “логіко-значеннєвий метод”, роботи з “структури і синтаксису зв’язаного тексту”, ідеологія текстових виражень і її реалізації в ЕОМ серії МІР.

В 90-их роках сформувався великий інтерес до гіпертексту. Прийшло усвідомлення величезних можливостей цієї технології для представлення, осмислення і прогнозування об'єктів дослідів. Результати останніх років перевершили всі очікування. Використання систем гіпермедіа, мультимедіа - новий якісний стрибок в розвитку інформаційних технологій.

Гіпертекст як форма організації інформації

У літературі термін “гіпертекст” (ГТ) використовується найчастіше як для позначення об'єкта дослідження, так і технології дослідження. Як об'єкт ГТ являє собою сітку, в якій зв'язки між вузлами - фрагментами ГТ - проставлені самим користувачем, частіше усього по семантичній близькості фрагментів. У якості фрагментів можуть виступати тексти, формули, графічна інформація, звуко- і відеозапис, тобто довільні модулі знань. У ГТ знято всі обмеження на структуру і зв'язки між ними. Не потрібно формалізації знань. На відміну від СУБД і інформаційно-пошукових систем елементами ГТ є природні тексти, що не потребують ні індексування, ні форматування. Кожний модуль знань може бути поданий у своїй формі. Доступ до них здійснюється шляхом навігації в гіпертекстовій базі знань. Гіпертекст відкритий для поповнення і змін. У нього немає апріорно визначеної структури. Це засіб представлення заздалегідь не структурованих, вільно нарощуваних знань. Користувач власноруч формує своє інформаційне середовище. Для цього ГТ - технологія надає йому дружній інтерфейс. Завдяки такому підходу зникають багато бар'єрів між користувачем і комп'ютером або відповідною інформаційною системою. Вона перестає бути “чорним ящиком”; взаємозв'язок між елементами знань стає видимим і доступним для користувача, що може настроювати інформаційну систему на свою проблемну область.

Все це знаменує новий рівень взаємовідносин людина - система і є відповідним до інтелектуальної діяльності людини.

Серед різноманітних визначень гіпертексту найстислішим і доречнішим є таке: “Гіпертекстом називається текст, на якому задані зв'язки між виділеними в ньому елементами”.

Елементами ГТ можуть бути довільні символи (наприклад, знаки алгебраїчних операцій), слова і словосполучення, повні тексти й окремі фрази, малюнки, графіки, або їх частини тощо. Якщо до складу ГТ входить інформація різних типів (текст, ілюстрація, мультиплікація, звук, відео), то такий ГТ називають гіпермедіа (ГМ) або гіперсередовищем.

Серед різноманітних моделей ГТ (наприклад, апарат теорії графів) найпростішою і наочною є сітка, у вузлах якої записуються блоки інформації, а дуги інтерпретуються як зв'язки між блоками і виділеними в них елементами. Зв'язки можуть бути одно - і двобічними.

Ці зв'язки грають особливу роль у гіпертексті. Належність до них є однією з основних відмінностей гіпертекстових баз даних від звичайних. У звичайних БД зв'язки носять чисто службовий характер - організуються для забезпечення доступу до даних шляхом опрацювання запитів. У ГТ системах зв'язки самі по собі надають важливу для користувача спеціально збережену і видавану інформацію. У залежності від моделі зв'язки в гіпертексті виділяються різноманітними графічними засобами: шрифтами, кольором, спеціальними символами.

Зв'язки можуть інтерпретуватися як причина і наслідок, загальне і часткове, функція й аргумент, а також, що дуже важливо, у якості зв'язку може існувати будь-яка інша асоціація, яку бачить, встановлює й називає користувач. Зв'язок є одним із головних об'єктів аналізу, проектування і використання. Це стало основою для висновку, що “гіпертекстові системи свідчать, вочевидь, про початок нового періоду - періоду “зв’язоцентричного” підходу”. Тут мається на увазі, що на початку (перші двадцять років інформатики) панував “алгоцентричний” підхід - у центрі уваги знаходилися алгоритми і мови програмування. Потім у 70-ті роки була епоха “інфоцентричного” підходу - інтерес до баз даних і систем керування цими базами. Поряд із “зв’язоцентричним” можна говорити також про “антропоцентричний” підхід, оскільки основною метою гіпертексту є створення дружнього інформаційного середовища для інтелектуальної роботи користувача.

1. Можливості ГТ як засобу представлення інформації дозволяють (на основі аналізу проекту QVARTET Технічного університету Лафборо, Великобританія): комбінувати структуру вихідного документа, забезпечувати їх гнучкість; автоматизувати навчання: не тільки переглядати групу документів, але і вивчати механізм утворення асоціативних зв'язків;

2. здійснювати навігацію у великих базах даних, незалежно від їхнього обсягу, забезпечуючи доступ до необхідної інформації, пропонувати пошукову стратегію, побудовану з врахуванням інтересів конкретного користувача;

3. застосовувати будь-які типи дискретних носіїв для забезпечення багатосередовищності (тексту, звуку, відео, графіки).

Крім того, ГТ є засобом підтримки неформалізованої інтелектуальної діяльності, тому що вказує на зв'язки кожного окремого аспекту або поняття, чим забезпечується більш легкий доступ до інформаційних об'єктів; не потребує формалізації знань; має практично необмежену область застосування, може бути інструментом аналізу і прогнозування структур досліджуваних об'єктів; організує інформацію з чисто семантичних критеріїв, завдяки чому виникає ефект об'єктивного інформаційного середовища.

Гіпертекстова технологія

Як було зазначено вище, концепція гіпертексту з’явилася ще в некомп’ютерну епоху.

Дійсно, текстовий матеріал можна представити з використанням значеннєвих зв'язків і без комп'ютерів. Прикладом є довідники й енциклопедії з добре розвиненою системою посилань між текстовими фрагментами. Ці фрагменти можна вважати за вузли сітки. Проте структура таких “ручних” систем ГТ практично не дозволяє читачеві достатньо глибоко аналізувати матеріал через трудомісткість доступу до різних вузлів сітки.

Під ГТ-технологією розуміється формування, підтримка, нарощування і перегляд організованого у виді сітки тексту на комп'ютерній основі.

Комп'ютерна ГТ-технологія забезпечує легкість роботи з гіперсіткою або гіпертекстом як об'єктом. З погляду комп'ютерної технології упорядкування або формування ГТ, тобто накопичення інформації в базі даних, може мислитися як наступне покоління текстового редактора. На додаток до звичних характеристик ГТ-редактор повинен мати засоби: зміни початкової структури тексту; введення підрядкових зауважень, що не впливають на головний текст; електронні закладинки тощо.

Перегляд або читання гіпертексту - це звертання до гіпертекстової бази через інтерфейс користувача, тобто фактично нове покоління систем керування текстовими БД. Повний текст стає доступним у множині проекцій для різних цілей і при різноманітних стратегіях пошуку. У ГТ системах база даних організується у вигляді відкритої, вільно нарощуваної і змінюваної сітки, вузли якої (лінійні тексти) з'єднуються самим користувачем із уже наявними в базі даних вузлами. Пошук інформації в мережі здійснюється шляхом інтерактивної навігації по зв'язках, де перехід від одних елементів до інших виконується з урахуванням їхньої семантичної близькості, текст одержує як би ще один вимір. Такий підхід якісно відрізняє ГТ технологію від традиційних засобів звернення до інформації через пошуковий образ.

Одним із важливих методів освоєння інформації є запам'ятовування різноманітних шляхів переміщення в ГТ-мережі. Виявлення шляхів або віртуальних структур можна розглядати як альтернативу опрацюванню інформації за правилами логічного виводу.

Програмне забезпечення, що підтримує ГТ-технологію, ґрунтується на чотирьох базисних функціях, властивих тільки ГТ: ЗАМІЩЕННЯ, ПРИМІТКИ, ЗАПИТИ і ПОСИЛАННЯ.

Використання функції ЗАМІЩЕННЯ при скануванні тексту дозволяє замінити будь-який вузол пов'язаної з ним інформації текстовим фрагментом, малюнком тощо. Наприклад, замість заголовка розділу можна одержати його текст або анотацію до нього.

Функція ПРИМІТКИ дає можливість робити “примітки на полях” у всьому різноманітті виразних засобів сучасних терміналів (кольорової графіки, музики). Ця функція є оберненою до попередньої: із виділеним вузлом потрібно зв'язати зазначену інформацію.

Функція ЗАПИТИ дозволяє аналізувати текст із певної точки зору. При цьому може використовуватися довільна інформація, що пов'язана з вузлом. Пошук може здійснюватися по ключових словах, роздільникам, шляхом зіставлення зі зразком тощо, тобто необхідні знання фільтруються з гіпертексту. У сполученні з функцією ЗАМІЩЕННЯ функція ЗАПИТИ одержує функціонально-орієнтовані зрізи вихідного тексту, тобто структурує текст відповідно до потреб користувачів.

Функція ПОСИЛАННЯ є найбільше важливою функцією гіпертексту. Вона використовує зв'язки інформаційної сітки, у вигляді якої ГТ поданий як об'єкт. Завдяки цим зв'язкам функція звертається до асоціативно зв'язаних фрагментів даного вузла. Фізично це означає цілеспрямований перегляд тексту, причому в різноманітних напрямках і на різну глибину. Напрямок можна вказувати за допомогою миші в діалоговому режимі, або автоматично за допомогою запитів, що фільтрують інформацію.

На сучасному рівні розуміння гіпертекст являє собою середовище програмного забезпечення для організації спільної роботи, комунікації і придбання знань. ГТ підтримує властивість мозку берегти і відшукувати інформацію за допомогою асоціативних зв'язків. Організація інформації в гіпертексті по чисто семантичних критеріях робить його новим інструментом для підтримки інтелектуальної діяльності людини. До такої діяльності можна віднести:

· попереднє обґрунтування ухвалення рішення;

· пошук рішення складної (погано формалізованої) проблеми;

· проектування різноманітного роду об'єктів;

· розробку деякої системи ідей;

· побудову зв'язаного тексту (підручників, монографій, статей, дисертацій, звітів).

Сумуючи можливості ГТ-технології, виділимо її основні функції:

1. Підтримка посилань-зв'язків - це функція електронної книги. Як згадано вище, інформацію можна подавати з використанням значеннєвих зв'язків і без комп'ютерів. Проте лише машинно-підтримувані зв'язки забезпечують якісно новий рівень читання. В даний час уже подані у вигляді електронних книг “Біблія”, “Оксфордський словник” та багато іншої літератури.

2. Прямий доступ - функція електронного часопису. ГТ-технологія підтримує доступ до вузлів сітки по іменах. Від зазначеного (активного) вузла можна продовжити вивчення матеріалу використавши зв'язках-посилання.

3. Браузінг - пошук інформації шляхом перегляду. Використовується при організації особистих баз даних, записних книжок, початкової орієнтації в інформаційному середовищі. Системи можуть володіти декількома браузінгами, організованими по різних принципах вибірки вузлів.

Вищезазначені функції реалізовано, як правило, у всіх прикладних переглядових ГТ системах. У таких системах база даних готується до експлуатації відповідної системи і може змінюватися тільки адміністратором системи.

Зміна, нарощування і ведення гіпертексту є суть ГТ-технології і вигідно відрізняють гіпертекстові бази даних від інших, де концептуальні схеми не змінюються користувачем. При цьому забезпечується дружній інтерфейс для створення нових вузлів ГТ, установлення зв'язків, знищення вузлів, редагування змісту вузлів тощо.

Виділення віртуальних структур передбачає можливість прокладати маршрути в ГТ і запам'ятовувати ці шляхи. Ця функція реалізує підтримку інтелектуальній діяльності людини - авторській роботі, рішенню проблем на ранніх стадіях проектування, формуванню системи аргументації, ГТ-белетристиці (представленню всіляких сюжетних ліній) і таке інше.

Гіпертекстові системи

ГТ-технологія реалізується в конкретної ГТ системі, що складається з двох частин: гіпертексту, тобто інформації, яка записана у вигляді ГТ, і оболонки - спеціальної програми, що здійснює навігацію по ГТ.

ГТ система - програмна система високого рівня, за допомогою якої користувач в інтерактивному режимі може досліджувати знання нелінійним засобом. Така система містить засоби опрацювання слів і структур (мається на увазі структура ГТ), інформаційного зв'язування елементів, а також прокладення і запам'ятовування шляхів у ГТ. Проте при цьому зникає різниця між автором і читачем.

У найзагальнішому вигляді взаємодія з ГТ системою полягає в таких діях: користувач читає на екрані комп'ютера деякий текст і має можливість виконувати ряд зазначених у системі дій в залежності від того, які асоціації виникають у нього при читанні тексту на екрані.

Дж. Конклін у своєму огляді класифікував ГТ системи з погляду їхнього застосування і відокремив чотири типи систем. До першого типу - бібліотечних макросистем - він відніс системи, що дозволяють вільно добавляти вузли в гіпертекстову сітку. В них, як правило, одиницею інформації є документ, що може бути зв'язаний із будь-яким іншим документом.

Другий тип - це системи для дослідження “злобливих” проблем, що являють собою інструментальні засоби підтримки творчого процесу. Вони корисні при роботі з численними, слабко зв'язаними ідеями, і застосовуються на ранніх стадіях авторської роботи. Мають засоби для аналізу гіпермережі і виділення в ній по деяких ознаках вузлів і підструктур.

Третій тип - це системи перегляду баз даних (browsing). Вони подібні бібліотечним макросистемам, проте містять менші обсяги інформації і призначені для роботи з різноманітними довідковими системами. У цих системах додавання нової інформації або не дозволяється, або спеціально не підтримується. Тут головне - легкість доступу до інформації.

Четвертий тип - це системи широкого призначення. Основна їх особливість - модифікуємість, використовуються для дослідження можливостей власне самої ГТ-технології. З лінгво-когнітивного погляду саме вони становлять найбільший інтерес. Гіпертекст використовується саме як спосіб сіткової організації текстової інформації, де користувач сам формує вузли та прокладає нові асоціаційні маршрути. Вузли можуть репрезентувати інформації різних типів - від окремого слова до речення або суцільного тексту, малюнки, таблиці, графіки тощо. Найбільш цікавим є те, що в вузлах користувачі можуть зберігати окремі думки, концепції або ідеї, заготовки майбутнього тексту. Вузли є рухомими - їх можна зв'язувати, пересувати, змінювати. Мандруючи за зазначеними зв'язками-маршрутами, можна сконструювати різноманітні комбінації текстової інформації, проглядати матеріал у будь-якій послідовності, тримаючи одночасно в полі зору та зіставляти різні інформаційні блоки, формувати нові текстові структури тощо. Отже, гіпертекст виступає як своєрідне знаряддя для генерації текстів.

Нижче відповідно до Конкліну описані основні характеристики ідеалізованої ГТ системи з погляду користувача, а також перелік властивостей, по яких можна вивчати (оцінювати) ту або іншу систему.

Наши рекомендации