Контент-аналіз, компонентний аналіз та побудова тезаурусів для соціологів

17 всіх різновидах опитування населення важливим методом аналізу отриманих даних вважають контент-аналіз. Перевага його перед традиційними методами соціологічного аналізу полягає в то­му, що враження дослідника-спостерігача, які залежать від його осо­бистих якостей, замінено на більш стандартизовані та нейтральні процедури, які здебільшого передбачають вимірювання, тобто вико­ристання прийомів кількісного аналізу.

• Контент-аналіз вчені визначають як специфічну техніку до­слідження, спрямовану на об'єктивне, систематичне та кіль­кісне описання змісту повідомлення, яке відповідає цілям дослідника. У цьому разі під об'єктивністю розуміють аналіз, підпорядкований чітким правилам, які різним дослідникам, що працюють з одними й тими самими текстами, дають змогу отримувати однакові результати.

Систематичність передбачає впорядкування та розподіл змісту документа за відповідними категоріями (рубриками). Що стосується кількісного описання, то тут мають на увазі вимірюваність значущих елементів тексту, підраховування їхньої частоти.

За словами М. Гравитця, контент-аналіз, який виник як реакція на старий та надто суб'єктивний метод літературного аналізу типу літературної критики, від самого початку прагнув до використання чіткого кількісного методу.

Існує кілька типів контент-аналізу. Перший — пошуковий аналіз — пов'язаний з перевіркою певної гіпотези, мета якої точно сформу­льована, а результати піддаються кількісній оцінці. Якщо контент-аналіз застосовують до великої кількості даних без чітких гіпотез та без знання того, що являє собою сучасна лінгвістика тексту (дискур­су), то дослідник тільки марно витратить час та зусилля. Це цільо­вий аналіз, чітко сфокусований на предметі дослідження. Щоправ­да, у такому разі виникає небезпека, що до поля зору не потраплять істотні елементи, які він не передбачав.

Другим типом контент-аналізу є кількісний та якісний аналіз тексту. Якщо кількісний аналіз націлений на виявлення частоти ок­ремих тем, слів або символів, що містяться у тексті, то якісний аналіз пов'язаний з фіксуванням нетривіальних висловлювань, мов­них новацій, з розумінням цінності теми повідомлення.

Третім типом контент-аналізу є прямий та побічний аналіз текс­ту. Найчастіше вимірювання застосовують у прямій формі. Наприк­лад, порівнюють два різновиди пропаганди, реклами, а потім підра­ховують окремі теми, слова, символи. Побічний аналіз має справу з підтекстом, який також піддатний кількісній оцінці (сюди належать недомовки, паузи, темп та ритм мовлення, вибір слів).

Четвертим типом контент-аналізу є структурний аналіз тексту. Тут головний наголос припадає на лінгвістику та аналіз дискурсу.

Гравитц виокремлює питання, на які мають бути дані відповіді за допомогою контент-аналізу. До цих питань належать: хто гово рить? що говорить? як говорить? кому говорить? яким є результат мовленнєвої комунікації?

Оскільки контент-аналіз має справу з текстами, соціолог повинен уміти розчленовувати їх на головні складові частини. Тут йому на допомогу має прийти компонентний аналіз.

У 20—30-ті роки XX ст. у зв'язку з розвитком структуралістсько го мовознавства німецькі та швейцарські лінгвісти поставили і їм порядок денний питання про структуру та організацію словника, Визнаним лідером у цьому напрямі лінгвістичних досліджень став Й. Трір (1894—1970), який відкрив нову фазу в історії семантики Ідеї Тріра найбільш послідовно було розвинено Л. Вайсгербером (1899—1985), який не тільки продовжив традицію, а й створив свою власну теорію "семантичних полів".

Поняття "семантичне поле" становить цілком певний інтерес для методологів наукового пізнання через те, що у своєрідній формі воскрешає лейбніцевську ідею створення універсального "словника" науки. Лейбніц намагався відшукати найпростіші та найфундаментальніші поняття, які є "першоцеглинками" всієї нашої мислительної системи та становлять свого роду "алфавіт" ("словник") понять.

Вже Трір окреслив відмінність між "лексичним" та "смисловим (поняттєвим)" полем. Так, згідно з його вченням, "смисл" лексеми є поняттєвою цариною всередині ширшого поняттєвого (смислово­го) поля. Відмітна особливість трірівської теорії полягає у такому: головні словники всіх мов мають апріорну неструктуровану суб­станцію (фундамент) значення. Цю "субстанцію" Трір ототожнює з "реальністю" мовного світосприйняття. Кожна мова виражає реаль­ність у свій власний спосіб, створюючи таким чином свій власний погляд на реальність та утверджуючи свою власну систему "понять" ("смислів").

Якими є структурні особливості "семантичного поля"?

Автори вчення про "семантичне поле " відзначають існування ме­режі (асоціації) зв'язків кожного слова, тобто значення окремого слова не має самостійного статусу, а цілком визначене зв'язками з іншими словами (зв'язками за формою, за значенням, за формою та значенням одночасно). Асоціативне поле слова — нестабільна, мін­лива структура. Воно різне у кожного мовця, відмінне у різних со­ціальних групах, залежить від ситуації. Можливі розміри такого "поля" показали французькі лінгвісти, які дослідили асоціативне по­ле слова "спаї" ("кіт") і показали, що воно нараховує близько 2000 термінів, які можуть бути зведені приблизно до 300 головних термінів.

До розряду структурних особливостей "семантичного поля" на­лежить "валентність слів". Поняття "валентність слова" було введе­не до лінгвістики наприкінці 50-х років XX ст. за аналогією з хімічною валентністю. Іноді його уточнюють через поняття "кіль­кість потенційних зв'язків слова". Потенційні зв'язки (валентність) дають слову змогу відносно швидко та легко входити до складу пев­них типів речень. Так, слово "різати" має дві валентності (різати "що"та різати "чим'). Урахування валентності відіграє велику роль у з'ясуванні механізму можливих семантичних змін, включаючи метафороутворення (порівняйте: "різати хліб" та "різати правду-матку в очі"). Порівняно з дієсловами валентність іменників виражена менш яскраво. До потенційних валентностей іменників належать їх зв'язки з іншими іменниками, а також з дієсловами та прикметни­ками. Поняття "валентність слова" ще більше уточнюють за допо­могою лінгвістичного аналізу структури "семантичного поля", коли виокремлюють так звані парадигматичні (Й. Трір) та синтагматичні (В. Порциг) відношення, без яких не може бути створена задовільна теорія лексичної структури. Крім того, до дослідження цієї пробле­матики необхідно залучити поняття "контекст" і зважати на те, що неможливо дослідити словник будь-якої мови без урахування її граматичної структури.

Характеристику парадигматичних (від грецьк. paradeigma - приклад, зразок; система форм одного й того самого слова, зокрема, наведена у вигляді таблиці) відношень здійснюють за допомогою технічного терміна "антиномія" (від грецьк. anti — проти (префікс, що позначає протилежність чому-небудь) + оnуmа — ім'я; слова, що належать до однієї смислової групи, але мають протилежні значен­ня, наприклад, "твердий — м'який", "дорого — дешево", "хвороба — здоров'я"). Цей термін використовують, аби вказати на опозицій­ність значень між лексемами (наприклад, "високий — низький", "чоловічий — жіночий", "брат — сестра", "біжить — стоїть", "впе­ред — назад" тощо).

Зразком синтагматичних (від грецьк. syntagma— букв. щось поєднане; послідовність двох або більше мовних одиниць, з'єднаних певним типом зв'язку, наприклад, "веселий лісовик") відношень є відношення типу синтаксичних моделей (наприклад, "блакитний — небо" ("блакитне небо"), "білявий — волосся" ("біляве волосся" тощо).

Для соціологів певний інтерес становлять відношення гіпонімії (від грецьк. hуро — під, внизу + оnуmа — їм'я; парадигматичне відношення у семантичному полі), які поряд з антиномією (не­сумісністю) є найфундаментальнішими парадигматичними смисло­вими відношеннями. Термін "гіпонімія" створено за аналогією із "синонімією" та "антиномією". Хоча цей термін відносно новий, але його ідейний прототип має давню традицію. Наприклад, анало­гом гіпонімії у логіці є включення одного класу до іншого. Відно­шення гіпонімії передбачає ієрархічну структуру словника та конк­ретних "семантичних полів" усередині цього словника.

• Подальшим розвитком методу структурного аналізу "семан­тичних полів" є компонентний аналіз, який становить цінність для соціологів. Його логіко-філософськими витоками можна вважати традиційну теорію утворення абстракцій, яка сягає арістотелевої видо-родової ієрархії. Компонентний аналіз має свій прототип і в лейбніцевському поняттєвому "алфавіті", ідея якого стала засадовою для побудови так званих концепту­альних (поняттєвих) словників. Одним з найранніших і добре відомих словників цього типу є "Тезаурус англійських слів та фраз" (1852) П. М. Роджета.

Засадовий принцип тезауруса (від грецьк. tnesauros — запас, скарб, скарбниця; словник, в якому показано семантичні відношен­ня між лексичними одиницями), як відзначав сам Роджет у вступі до першого видання, полягає у класифікації слів та фраз мови не згідно зі звучанням їх або орфографією, але відповідно до їхнього значення.

З поняттєвим аналізом у дусі тезаурусів тісно пов'язаний компо­нентний аналіз. Цей зв'язок відображено у використанні логічного та теоретико-множинного підходів до семантики як науки про зна­чення. Компонентний аналіз ґрунтовано на тезі, що значення кож­ної лексеми може бути проаналізоване в термінах множини більш загальних смислових компонентів (семантичних категорій, семан­тичних маркерів, семем тощо).

Компонентний підхід до семантики має тривалу історію у лінгвістиці, логіці та філософії. Він присутній у традиційних визна­ченнях виразів природної мови через поділ роду на види (наприк­лад, наука -» фізика) та видів на підвиди (наприклад, фізика —> ме­ханіка). Компонентний аналіз — це певна методика економного описання деяких семантичних відношень між лексичними одиниця­ми, а також між реченнями, які їх містять. Прикладом семантичних компонентів є:

бик корова теля
півень курка курча
жеребець кобила лоша
баран вівця ягня

Компонентний аналіз тісно пов'язаний з поняттям аналогії в ро­зумінні математичної пропорції. Тут слід відзначити, що з розвитком алгебри за Нового часу істотно прояснився математичний смисл

поняття пропорції, яке у працях давньогрецьких математиків являло собою зародкову форму алгебраїчного аналізу. У науці Нового часу останній набув поширення, завдяки чому аналогія, відокремлена від пропорції, була зарахована до розряду ймовірнісних засобів пізнан­ня. Протягом XVIII—XIX ст. відбулося остаточне розділення понять "аналогія" та "пропорція".

Поняття аналогії почали асоціювати з евристичним способом пізнання у формі ймовірнісного знання, натомість поняття про­порції набуло власне математичного смислу, будучи розширене до поняття функції. У першому разі маємо справу з індуктивним мето­дом, у другому — з дедуктивним.

Компонентний аналіз має значення не тільки для описання мов­них "сутностей", які, зокрема, є важливими для соціолінгвістики, а й для графічного (теоретико-модельного) уявлення власне соціаль­них "сутностей" (наприклад, соціальних ролей, відносин між мали­ми групами тощо).

Як відзначав польський логік М. Пшеленцький, теорія множин є теорією всіх можливих "сутностей", а тому теоретико-множинне поняття моделі достатньо широке, щоб охопити всі аспекти реаль­ності — як математичні, так і емпіричні. Необхідно підкреслити, що у цьому разі ми маємо приклад типового функціонального аналізу в логіко-математичному дусі. Цей аналіз націлено на побудову моде­лей об'єктів складної природи, він є засобом для отримання знань про ці об'єкти, з чого випливає, що моделі не можна розглядати як щось самодостатнє та тотожне знанню про об'єкти. Іншими слова­ми, за допомогою моделей можна будувати теорію, але самі моделі ще не є остаточною теорією, хоча й можуть мати теоретичний характер.

Оскільки компонентний аналіз пов'язаний з аналізом концепту­альним, смислові компоненти можуть бути розглянуті як "атомар­ні", а смисли конкретних лексем — як "молекулярні" (як "поняття" в їх повсякденному або традиційному формально-логічному тлума­ченні, але не в сучасному науковому тлумаченні). Наприклад, смисл слова "чоловік" (смисл, витлумачений як доповнення до смислу сло­ва "жінка") слід аналізувати як комбінацію в молекулярному понятті "чоловік" атомарних понять (скажімо, "чоловічий", "дорослий").

Показово, що компонентний аналіз у США розвивався переваж­но завдяки зусиллям американських соціальних антропологів (етно­логів) як техніка для описання та порівняння словника кровноспоріднених відносин у різних мовах. Останнім часом компонент­ний аналіз привернув увагу тих соціологів, які намагаються вдоско­налювати контент-аналіз та використовувати теорію графів для моделювання досліджуваних явищ.

Компонентний аналіз може бути розглянутий як розширення те­орії "семантичного поля", як спроба утвердити та обґрунтувати цю теорію на міцному теоретичному та методологічному фундаменті. Для соціологів це означає, що контент-аналіз має своє коріння в те­орії "семантичного поля". Важливим є ще й те, що компонентний аналіз дає змогу по-новому переосмислити арістотелеву традицію в тлумаченні "змісту" та "обсягу" понять, а відтак через логіко-гносеологічну проблематику вийти на проблематику семантичну й на ті її аспекти, які цікавлять соціологів.

В історії європейської логіко-філософської науки особливе місце посідає німецький мислитель Г. Лотце (1817—1881), на жаль, нині напівзабутий, хоча він і справив достатньо сильний вплив на Г. Фреге, Е. Гуссерля, А. Мейнонга та ін. Лотце переконливо спростував учення старої формальної логіки про взаємовідношення змісту та обсягу понять під час узагальнень. Без цієї реформи, як вважають сучасні логіки, неможливий був би подальший рух наукової думки у розв'язанні питання про утворення та інтерпретацію загальних понять.

Згідно з Лотце, при утворенні загальних понять відбувається не відкидання несхожих ознак, а їх перетворення згідно з фіксованим правилом (схемою), яке об'єднує багатоманітність змісту загального поняття. Аналогом такого механізму утворення загальних понять є компонентний аналіз внутрішньої структури лексеми. Ця структура відображає синтаксичну структуру відповідних речень та фраз. На­приклад, смисл дієслова "вбивати" може бути розкладений на такі його складові компоненти, як "причина", "робити", "не" та "живий". Ці компоненти не механічно підсумовують, а синтетично об'єдну­ють в ієрархічну структуру, яку можна подати таким чином:

(ПРИЧИНА (РОБИТИ (НЕ (ЖИВИМ)))).

У результаті маємо:

(1) (НЕ-ЖИВИЙ) - (МЕРТВИЙ);

(2) (РОБИТИ (НЕ-ЖИВИМ)) - (ПОМЕРТИ).

Якщо інтерпретувати загальне поняття з точки зору компонент­ного аналізу, то воно перетворюється на своєрідне "концептуальне поле", яке має певну структуру. "Концептуальне поле" принципово ширше за "семантичне поле". Про це свідчить відмінність між змістом понять та значенням слів. Скажімо, хімік аналізує не зна­чення слова "сіль", а реальний фізичний матеріал. Зміст та значен­ня не тотожні "сутностями". Поняття з його змістом — категорія не мови, а пізнання. Якби значення було тотожне поняттю, тоді зна­чення не могло б бути органічним компонентом мови й лінгвісти не були б компетентними досліджувати його. Проте не слід впадати у крайнощі, забуваючи про те, що поняття поза мовою — це химера. Як слушно вважають філософи, поняття не може виникати та існу­вати поза словом, оскільки воно і є специфічно словесною (терміно­логічною) формою відображення предметів, але воно нерідко вини­кає та існує без того слова (терміна), значенням якого може стати.

Цей конфлікт між мовою та поняттєвим мисленням призводить до появи метафор. Тому, з одного боку, метафора — це продукт власне мовленнєвої діяльності, а з іншого — вона є наслідком змін у концептуальній системі, у структурі концептуального поля.

Феномен метафороутворень свідчить не тільки про семантичну змінюваність словника природної мови, а й про зміни у значеннях термінів, тісно пов'язаних з концептуальними, теоретичними зміна­ми. Тому в науці постійно існує проблема впорядкування та уточ­нення термінології.

Звичайно, значення термінів залежить не від значення слів. Цю залежність треба шукати в теорії, яка заздалегідь визначає вибір термінів та їхню теоретичну "валентність" (сполученість, зв'язок). Проте хоч би якою штучною (формалізованою) була мова науки, це — все ж таки мова, призначена не тільки для конструювання теорій, а й для комунікації, без чого немислимий розвиток науково-теоретич­них знань, обміну нагромадженим досвідом тощо. Звідси випливає, що комунікативна функція наукової мови має бути подана у такому вигляді, який сприяв би вченим у створенні ефективних пошукових систем для встановлення конструктивного взаєморозуміння у діало­говому режимі. Саме тут і можуть надати значну допомогу тезауру­си, які вже міцно закріпилися у багатьох комп'ютерних "редакто­рах" і стали звичним інструментом користувачів.

Структурною підвалиною цього типу тезаурусів є концептуальне поле, висловлюване ієрархічною системою термінів-понять, яка забез­печує пошук відповідних лексичних одиниць (скажімо, для складання соціологічних запитальників). Для пошуку у зворотному напрямі (від слова до терміна-поняття) може бути використаний алфавітний покажчик, як це, наприклад, має місце у тезаурусі Роджета. Для соціологів, які працюють з анкетами, такого роду зворотний рух цінний тим, що дає змогу швидко увійти до сфери вихідних теоре­тичних припущень та гіпотез, які з тих чи інших причин невідомі тому, хто здійснює опитування (інтерв'юерові).

Часто доводиться чути, що опитування за стандартизованими ан­кетами звичайні інтерв'юери можуть проводити лише щодо загаль­новідомих питань, які стосуються, наприклад споживання товарів повсякденного попиту або політики. Для вужчих досліджень, спе­ціалізованих тем необхідно нібито залучати фахівців, які володіють термінологією та ознайомлені з колом проблем. Це хоча й звучить переконливо, але насправді є однією з численних помилок здорово­го глузду, які ускладнюють правильне використання методу опиту­вання. Спеціальна термінологія та точне знання проблем потрібні при складанні анкет, але не в роботі з респондентами.

У соціологічних дослідженнях з використанням запитальників та методу контент-аналізу ми рухаємося за такою схемою:

ПОНЯТТЯ (концепція у формі висовуваної гіпотези) -» СЛОВО (запитальник) -» ПОНЯТТЯ (концепція у формі перевірюваної гіпотези).

Аналогічна схема має місце у тезаурусах. Отже, використання те­заурусів, програмно розроблених для комп'ютерів, є неодмінною умовою сучасного застосування контент-аналізу.

ВИСНОВКИ

1. Техніку соціологічного аналізу не можна розгляда­ти із суто інструменталістської (прагматистської) точки зору, оскільки будь-який інструмент науко­вого пізнання є предметним (у тому числі речовин­ним) втіленням теоретичних досягнень науки, її узагальненого досвіду. Говорячи про техніку аналізу, а не про технічну (матеріальну) осна­щеність тієї чи тієї наукової дисципліни, ми перед­усім маємо на увазі раціоналізовану методику цього аналізу, доведену у деяких випадках до вироблених алгоритмів. Ця техніка аналізу розви­вається разом з розвитком наукового пізнання, завдяки чому стає більш гнучкою та універсаль­ною, а отже, й застосовною до ширшого кола розв'язуваних завдань. Прикладом цього є обмін технічним інструментарієм між лінгвістикою та соціологією.

2. Сучасна соціолінгвістика оперує такими поняття­ми, як "текст", "контекст", "дискурс", "пропози­ція", "супозиція", "пресупозиція", "семантичне поле", "концептуальне (поняттєве) поле", "валент­ність" тощо. Розширення термінологічного слов­ника соціолінгвістики за рахунок ініціативи лінгвістів передбачає реакцію у відповідь з боку соціологів, які вже не один раз запозичували у лінгвістів поняття та методи, наприклад, для робо­ти з анкетами, тестами тощо. У цьому разі на по­рядку денному стоїть питання про більш тісне співробітництво лінгвістів та соціологів.

3. Контент-аналіз — важливий інструмент лінгвістич­но-статистичного аналізу в рамках соціології. За умов фронтальної комп'ютеризації наукових досліджень та розробок контент-аналіз має бути не просто адаптований до комп'ютерних програм, а сполучений з відповідними інформаційно-пошу­ковими системами, однією з яких є тезаурус, пов'язаний з поняттями "семантичне поле", "кон­цептуальне поле" та з методом компонентного аналізу. Таке сполучення передбачає істотне зба­гачення пізнавальних можливостей контентного аналізу.

Нестуля

Аналіз документів. Цей метод дозволяє отримати відомості про минулі події, спостереження за якими вже не можливі. Дже­релом соціологічної інформації, як правило, є текстові повідом­лення, які містяться в доповідях, протоколах, публікаціях, листах тощо. Особливу роль виконує соціальна статистична інформація, яка в більшості випадків використовується для характеристики конкретно-історичного контексту розвитку процесу або явища, що досліджується. Важливою особливістю всіх статистичних да­них є їх співвіднесення до певної групи як до цілісності.

Незамінним методом підбору текстів є контент-аналіз,який активно використовується у процесі вивчення засобів масової інформації. Аналіз здійснюється через використання однотипних стандартизованих показників (індикаторів) для пошуку та підрахування масовості тих чи інших характеристик тексту.

Семке. Шпаргалка

Аналіз документівЦей метод дозволяє одержати відомості про минулі події, спостереження за якими вже неможливе.

Вивчення документів допомагає виявити тенденції й ди­наміку змін і розвитку певних явищі процесів. Джерелом со­ціологічної інформації виступають зазвичай текстові повідомлення, що знаходяться в протоколах, доповідях, резолюціях, рішеннях, публікація, листах і т.п. Особливу роль виконує соціальна статистична інформація, яка у більшості випадків використовується для характеристики конкретно-історичного контексту розвитку досліджуваного явища або процесу. Важливою особливістю більшої частини статистичних документів є їх агрегований характер, що означає їхню співвіднесеність з певною групою як цілим. Так. доступність «споживчого кошика» може бути віднесена як до всього населення, так і до окремих соціальних груп

Не менш важливого значення набуває контент-аналіз, що активно застосовується в дослідженнях засобів масової інформації. Аналіз заснований на використанні однакових стандартизованих показни­ків (індикаторів) для пошуку, обліку й підрахунку масовості тих або інших характеристик тексту. Даний аналіз здійснюється за схемою хто сказав, що. кому як. з якою метою і з яким результатом.

Андрущенко

Наши рекомендации