Контент-аналіз, компонентний аналіз та побудова тезаурусів для соціологів
17 всіх різновидах опитування населення важливим методом аналізу отриманих даних вважають контент-аналіз. Перевага його перед традиційними методами соціологічного аналізу полягає в тому, що враження дослідника-спостерігача, які залежать від його особистих якостей, замінено на більш стандартизовані та нейтральні процедури, які здебільшого передбачають вимірювання, тобто використання прийомів кількісного аналізу.
• Контент-аналіз вчені визначають як специфічну техніку дослідження, спрямовану на об'єктивне, систематичне та кількісне описання змісту повідомлення, яке відповідає цілям дослідника. У цьому разі під об'єктивністю розуміють аналіз, підпорядкований чітким правилам, які різним дослідникам, що працюють з одними й тими самими текстами, дають змогу отримувати однакові результати.
Систематичність передбачає впорядкування та розподіл змісту документа за відповідними категоріями (рубриками). Що стосується кількісного описання, то тут мають на увазі вимірюваність значущих елементів тексту, підраховування їхньої частоти.
За словами М. Гравитця, контент-аналіз, який виник як реакція на старий та надто суб'єктивний метод літературного аналізу типу літературної критики, від самого початку прагнув до використання чіткого кількісного методу.
Існує кілька типів контент-аналізу. Перший — пошуковий аналіз — пов'язаний з перевіркою певної гіпотези, мета якої точно сформульована, а результати піддаються кількісній оцінці. Якщо контент-аналіз застосовують до великої кількості даних без чітких гіпотез та без знання того, що являє собою сучасна лінгвістика тексту (дискурсу), то дослідник тільки марно витратить час та зусилля. Це цільовий аналіз, чітко сфокусований на предметі дослідження. Щоправда, у такому разі виникає небезпека, що до поля зору не потраплять істотні елементи, які він не передбачав.
Другим типом контент-аналізу є кількісний та якісний аналіз тексту. Якщо кількісний аналіз націлений на виявлення частоти окремих тем, слів або символів, що містяться у тексті, то якісний аналіз пов'язаний з фіксуванням нетривіальних висловлювань, мовних новацій, з розумінням цінності теми повідомлення.
Третім типом контент-аналізу є прямий та побічний аналіз тексту. Найчастіше вимірювання застосовують у прямій формі. Наприклад, порівнюють два різновиди пропаганди, реклами, а потім підраховують окремі теми, слова, символи. Побічний аналіз має справу з підтекстом, який також піддатний кількісній оцінці (сюди належать недомовки, паузи, темп та ритм мовлення, вибір слів).
Четвертим типом контент-аналізу є структурний аналіз тексту. Тут головний наголос припадає на лінгвістику та аналіз дискурсу.
Гравитц виокремлює питання, на які мають бути дані відповіді за допомогою контент-аналізу. До цих питань належать: хто гово рить? що говорить? як говорить? кому говорить? яким є результат мовленнєвої комунікації?
Оскільки контент-аналіз має справу з текстами, соціолог повинен уміти розчленовувати їх на головні складові частини. Тут йому на допомогу має прийти компонентний аналіз.
У 20—30-ті роки XX ст. у зв'язку з розвитком структуралістсько го мовознавства німецькі та швейцарські лінгвісти поставили і їм порядок денний питання про структуру та організацію словника, Визнаним лідером у цьому напрямі лінгвістичних досліджень став Й. Трір (1894—1970), який відкрив нову фазу в історії семантики Ідеї Тріра найбільш послідовно було розвинено Л. Вайсгербером (1899—1985), який не тільки продовжив традицію, а й створив свою власну теорію "семантичних полів".
Поняття "семантичне поле" становить цілком певний інтерес для методологів наукового пізнання через те, що у своєрідній формі воскрешає лейбніцевську ідею створення універсального "словника" науки. Лейбніц намагався відшукати найпростіші та найфундаментальніші поняття, які є "першоцеглинками" всієї нашої мислительної системи та становлять свого роду "алфавіт" ("словник") понять.
Вже Трір окреслив відмінність між "лексичним" та "смисловим (поняттєвим)" полем. Так, згідно з його вченням, "смисл" лексеми є поняттєвою цариною всередині ширшого поняттєвого (смислового) поля. Відмітна особливість трірівської теорії полягає у такому: головні словники всіх мов мають апріорну неструктуровану субстанцію (фундамент) значення. Цю "субстанцію" Трір ототожнює з "реальністю" мовного світосприйняття. Кожна мова виражає реальність у свій власний спосіб, створюючи таким чином свій власний погляд на реальність та утверджуючи свою власну систему "понять" ("смислів").
Якими є структурні особливості "семантичного поля"?
Автори вчення про "семантичне поле " відзначають існування мережі (асоціації) зв'язків кожного слова, тобто значення окремого слова не має самостійного статусу, а цілком визначене зв'язками з іншими словами (зв'язками за формою, за значенням, за формою та значенням одночасно). Асоціативне поле слова — нестабільна, мінлива структура. Воно різне у кожного мовця, відмінне у різних соціальних групах, залежить від ситуації. Можливі розміри такого "поля" показали французькі лінгвісти, які дослідили асоціативне поле слова "спаї" ("кіт") і показали, що воно нараховує близько 2000 термінів, які можуть бути зведені приблизно до 300 головних термінів.
До розряду структурних особливостей "семантичного поля" належить "валентність слів". Поняття "валентність слова" було введене до лінгвістики наприкінці 50-х років XX ст. за аналогією з хімічною валентністю. Іноді його уточнюють через поняття "кількість потенційних зв'язків слова". Потенційні зв'язки (валентність) дають слову змогу відносно швидко та легко входити до складу певних типів речень. Так, слово "різати" має дві валентності (різати "що"та різати "чим'). Урахування валентності відіграє велику роль у з'ясуванні механізму можливих семантичних змін, включаючи метафороутворення (порівняйте: "різати хліб" та "різати правду-матку в очі"). Порівняно з дієсловами валентність іменників виражена менш яскраво. До потенційних валентностей іменників належать їх зв'язки з іншими іменниками, а також з дієсловами та прикметниками. Поняття "валентність слова" ще більше уточнюють за допомогою лінгвістичного аналізу структури "семантичного поля", коли виокремлюють так звані парадигматичні (Й. Трір) та синтагматичні (В. Порциг) відношення, без яких не може бути створена задовільна теорія лексичної структури. Крім того, до дослідження цієї проблематики необхідно залучити поняття "контекст" і зважати на те, що неможливо дослідити словник будь-якої мови без урахування її граматичної структури.
Характеристику парадигматичних (від грецьк. paradeigma - приклад, зразок; система форм одного й того самого слова, зокрема, наведена у вигляді таблиці) відношень здійснюють за допомогою технічного терміна "антиномія" (від грецьк. anti — проти (префікс, що позначає протилежність чому-небудь) + оnуmа — ім'я; слова, що належать до однієї смислової групи, але мають протилежні значення, наприклад, "твердий — м'який", "дорого — дешево", "хвороба — здоров'я"). Цей термін використовують, аби вказати на опозиційність значень між лексемами (наприклад, "високий — низький", "чоловічий — жіночий", "брат — сестра", "біжить — стоїть", "вперед — назад" тощо).
Зразком синтагматичних (від грецьк. syntagma— букв. щось поєднане; послідовність двох або більше мовних одиниць, з'єднаних певним типом зв'язку, наприклад, "веселий лісовик") відношень є відношення типу синтаксичних моделей (наприклад, "блакитний — небо" ("блакитне небо"), "білявий — волосся" ("біляве волосся" тощо).
Для соціологів певний інтерес становлять відношення гіпонімії (від грецьк. hуро — під, внизу + оnуmа — їм'я; парадигматичне відношення у семантичному полі), які поряд з антиномією (несумісністю) є найфундаментальнішими парадигматичними смисловими відношеннями. Термін "гіпонімія" створено за аналогією із "синонімією" та "антиномією". Хоча цей термін відносно новий, але його ідейний прототип має давню традицію. Наприклад, аналогом гіпонімії у логіці є включення одного класу до іншого. Відношення гіпонімії передбачає ієрархічну структуру словника та конкретних "семантичних полів" усередині цього словника.
• Подальшим розвитком методу структурного аналізу "семантичних полів" є компонентний аналіз, який становить цінність для соціологів. Його логіко-філософськими витоками можна вважати традиційну теорію утворення абстракцій, яка сягає арістотелевої видо-родової ієрархії. Компонентний аналіз має свій прототип і в лейбніцевському поняттєвому "алфавіті", ідея якого стала засадовою для побудови так званих концептуальних (поняттєвих) словників. Одним з найранніших і добре відомих словників цього типу є "Тезаурус англійських слів та фраз" (1852) П. М. Роджета.
Засадовий принцип тезауруса (від грецьк. tnesauros — запас, скарб, скарбниця; словник, в якому показано семантичні відношення між лексичними одиницями), як відзначав сам Роджет у вступі до першого видання, полягає у класифікації слів та фраз мови не згідно зі звучанням їх або орфографією, але відповідно до їхнього значення.
З поняттєвим аналізом у дусі тезаурусів тісно пов'язаний компонентний аналіз. Цей зв'язок відображено у використанні логічного та теоретико-множинного підходів до семантики як науки про значення. Компонентний аналіз ґрунтовано на тезі, що значення кожної лексеми може бути проаналізоване в термінах множини більш загальних смислових компонентів (семантичних категорій, семантичних маркерів, семем тощо).
Компонентний підхід до семантики має тривалу історію у лінгвістиці, логіці та філософії. Він присутній у традиційних визначеннях виразів природної мови через поділ роду на види (наприклад, наука -» фізика) та видів на підвиди (наприклад, фізика —> механіка). Компонентний аналіз — це певна методика економного описання деяких семантичних відношень між лексичними одиницями, а також між реченнями, які їх містять. Прикладом семантичних компонентів є:
бик | корова | теля |
півень | курка | курча |
жеребець | кобила | лоша |
баран | вівця | ягня |
Компонентний аналіз тісно пов'язаний з поняттям аналогії в розумінні математичної пропорції. Тут слід відзначити, що з розвитком алгебри за Нового часу істотно прояснився математичний смисл
поняття пропорції, яке у працях давньогрецьких математиків являло собою зародкову форму алгебраїчного аналізу. У науці Нового часу останній набув поширення, завдяки чому аналогія, відокремлена від пропорції, була зарахована до розряду ймовірнісних засобів пізнання. Протягом XVIII—XIX ст. відбулося остаточне розділення понять "аналогія" та "пропорція".
Поняття аналогії почали асоціювати з евристичним способом пізнання у формі ймовірнісного знання, натомість поняття пропорції набуло власне математичного смислу, будучи розширене до поняття функції. У першому разі маємо справу з індуктивним методом, у другому — з дедуктивним.
Компонентний аналіз має значення не тільки для описання мовних "сутностей", які, зокрема, є важливими для соціолінгвістики, а й для графічного (теоретико-модельного) уявлення власне соціальних "сутностей" (наприклад, соціальних ролей, відносин між малими групами тощо).
Як відзначав польський логік М. Пшеленцький, теорія множин є теорією всіх можливих "сутностей", а тому теоретико-множинне поняття моделі достатньо широке, щоб охопити всі аспекти реальності — як математичні, так і емпіричні. Необхідно підкреслити, що у цьому разі ми маємо приклад типового функціонального аналізу в логіко-математичному дусі. Цей аналіз націлено на побудову моделей об'єктів складної природи, він є засобом для отримання знань про ці об'єкти, з чого випливає, що моделі не можна розглядати як щось самодостатнє та тотожне знанню про об'єкти. Іншими словами, за допомогою моделей можна будувати теорію, але самі моделі ще не є остаточною теорією, хоча й можуть мати теоретичний характер.
Оскільки компонентний аналіз пов'язаний з аналізом концептуальним, смислові компоненти можуть бути розглянуті як "атомарні", а смисли конкретних лексем — як "молекулярні" (як "поняття" в їх повсякденному або традиційному формально-логічному тлумаченні, але не в сучасному науковому тлумаченні). Наприклад, смисл слова "чоловік" (смисл, витлумачений як доповнення до смислу слова "жінка") слід аналізувати як комбінацію в молекулярному понятті "чоловік" атомарних понять (скажімо, "чоловічий", "дорослий").
Показово, що компонентний аналіз у США розвивався переважно завдяки зусиллям американських соціальних антропологів (етнологів) як техніка для описання та порівняння словника кровноспоріднених відносин у різних мовах. Останнім часом компонентний аналіз привернув увагу тих соціологів, які намагаються вдосконалювати контент-аналіз та використовувати теорію графів для моделювання досліджуваних явищ.
Компонентний аналіз може бути розглянутий як розширення теорії "семантичного поля", як спроба утвердити та обґрунтувати цю теорію на міцному теоретичному та методологічному фундаменті. Для соціологів це означає, що контент-аналіз має своє коріння в теорії "семантичного поля". Важливим є ще й те, що компонентний аналіз дає змогу по-новому переосмислити арістотелеву традицію в тлумаченні "змісту" та "обсягу" понять, а відтак через логіко-гносеологічну проблематику вийти на проблематику семантичну й на ті її аспекти, які цікавлять соціологів.
В історії європейської логіко-філософської науки особливе місце посідає німецький мислитель Г. Лотце (1817—1881), на жаль, нині напівзабутий, хоча він і справив достатньо сильний вплив на Г. Фреге, Е. Гуссерля, А. Мейнонга та ін. Лотце переконливо спростував учення старої формальної логіки про взаємовідношення змісту та обсягу понять під час узагальнень. Без цієї реформи, як вважають сучасні логіки, неможливий був би подальший рух наукової думки у розв'язанні питання про утворення та інтерпретацію загальних понять.
Згідно з Лотце, при утворенні загальних понять відбувається не відкидання несхожих ознак, а їх перетворення згідно з фіксованим правилом (схемою), яке об'єднує багатоманітність змісту загального поняття. Аналогом такого механізму утворення загальних понять є компонентний аналіз внутрішньої структури лексеми. Ця структура відображає синтаксичну структуру відповідних речень та фраз. Наприклад, смисл дієслова "вбивати" може бути розкладений на такі його складові компоненти, як "причина", "робити", "не" та "живий". Ці компоненти не механічно підсумовують, а синтетично об'єднують в ієрархічну структуру, яку можна подати таким чином:
(ПРИЧИНА (РОБИТИ (НЕ (ЖИВИМ)))).
У результаті маємо:
(1) (НЕ-ЖИВИЙ) - (МЕРТВИЙ);
(2) (РОБИТИ (НЕ-ЖИВИМ)) - (ПОМЕРТИ).
Якщо інтерпретувати загальне поняття з точки зору компонентного аналізу, то воно перетворюється на своєрідне "концептуальне поле", яке має певну структуру. "Концептуальне поле" принципово ширше за "семантичне поле". Про це свідчить відмінність між змістом понять та значенням слів. Скажімо, хімік аналізує не значення слова "сіль", а реальний фізичний матеріал. Зміст та значення не тотожні "сутностями". Поняття з його змістом — категорія не мови, а пізнання. Якби значення було тотожне поняттю, тоді значення не могло б бути органічним компонентом мови й лінгвісти не були б компетентними досліджувати його. Проте не слід впадати у крайнощі, забуваючи про те, що поняття поза мовою — це химера. Як слушно вважають філософи, поняття не може виникати та існувати поза словом, оскільки воно і є специфічно словесною (термінологічною) формою відображення предметів, але воно нерідко виникає та існує без того слова (терміна), значенням якого може стати.
Цей конфлікт між мовою та поняттєвим мисленням призводить до появи метафор. Тому, з одного боку, метафора — це продукт власне мовленнєвої діяльності, а з іншого — вона є наслідком змін у концептуальній системі, у структурі концептуального поля.
Феномен метафороутворень свідчить не тільки про семантичну змінюваність словника природної мови, а й про зміни у значеннях термінів, тісно пов'язаних з концептуальними, теоретичними змінами. Тому в науці постійно існує проблема впорядкування та уточнення термінології.
Звичайно, значення термінів залежить не від значення слів. Цю залежність треба шукати в теорії, яка заздалегідь визначає вибір термінів та їхню теоретичну "валентність" (сполученість, зв'язок). Проте хоч би якою штучною (формалізованою) була мова науки, це — все ж таки мова, призначена не тільки для конструювання теорій, а й для комунікації, без чого немислимий розвиток науково-теоретичних знань, обміну нагромадженим досвідом тощо. Звідси випливає, що комунікативна функція наукової мови має бути подана у такому вигляді, який сприяв би вченим у створенні ефективних пошукових систем для встановлення конструктивного взаєморозуміння у діалоговому режимі. Саме тут і можуть надати значну допомогу тезауруси, які вже міцно закріпилися у багатьох комп'ютерних "редакторах" і стали звичним інструментом користувачів.
Структурною підвалиною цього типу тезаурусів є концептуальне поле, висловлюване ієрархічною системою термінів-понять, яка забезпечує пошук відповідних лексичних одиниць (скажімо, для складання соціологічних запитальників). Для пошуку у зворотному напрямі (від слова до терміна-поняття) може бути використаний алфавітний покажчик, як це, наприклад, має місце у тезаурусі Роджета. Для соціологів, які працюють з анкетами, такого роду зворотний рух цінний тим, що дає змогу швидко увійти до сфери вихідних теоретичних припущень та гіпотез, які з тих чи інших причин невідомі тому, хто здійснює опитування (інтерв'юерові).
Часто доводиться чути, що опитування за стандартизованими анкетами звичайні інтерв'юери можуть проводити лише щодо загальновідомих питань, які стосуються, наприклад споживання товарів повсякденного попиту або політики. Для вужчих досліджень, спеціалізованих тем необхідно нібито залучати фахівців, які володіють термінологією та ознайомлені з колом проблем. Це хоча й звучить переконливо, але насправді є однією з численних помилок здорового глузду, які ускладнюють правильне використання методу опитування. Спеціальна термінологія та точне знання проблем потрібні при складанні анкет, але не в роботі з респондентами.
У соціологічних дослідженнях з використанням запитальників та методу контент-аналізу ми рухаємося за такою схемою:
ПОНЯТТЯ (концепція у формі висовуваної гіпотези) -» СЛОВО (запитальник) -» ПОНЯТТЯ (концепція у формі перевірюваної гіпотези).
Аналогічна схема має місце у тезаурусах. Отже, використання тезаурусів, програмно розроблених для комп'ютерів, є неодмінною умовою сучасного застосування контент-аналізу.
ВИСНОВКИ
1. Техніку соціологічного аналізу не можна розглядати із суто інструменталістської (прагматистської) точки зору, оскільки будь-який інструмент наукового пізнання є предметним (у тому числі речовинним) втіленням теоретичних досягнень науки, її узагальненого досвіду. Говорячи про техніку аналізу, а не про технічну (матеріальну) оснащеність тієї чи тієї наукової дисципліни, ми передусім маємо на увазі раціоналізовану методику цього аналізу, доведену у деяких випадках до вироблених алгоритмів. Ця техніка аналізу розвивається разом з розвитком наукового пізнання, завдяки чому стає більш гнучкою та універсальною, а отже, й застосовною до ширшого кола розв'язуваних завдань. Прикладом цього є обмін технічним інструментарієм між лінгвістикою та соціологією.
2. Сучасна соціолінгвістика оперує такими поняттями, як "текст", "контекст", "дискурс", "пропозиція", "супозиція", "пресупозиція", "семантичне поле", "концептуальне (поняттєве) поле", "валентність" тощо. Розширення термінологічного словника соціолінгвістики за рахунок ініціативи лінгвістів передбачає реакцію у відповідь з боку соціологів, які вже не один раз запозичували у лінгвістів поняття та методи, наприклад, для роботи з анкетами, тестами тощо. У цьому разі на порядку денному стоїть питання про більш тісне співробітництво лінгвістів та соціологів.
3. Контент-аналіз — важливий інструмент лінгвістично-статистичного аналізу в рамках соціології. За умов фронтальної комп'ютеризації наукових досліджень та розробок контент-аналіз має бути не просто адаптований до комп'ютерних програм, а сполучений з відповідними інформаційно-пошуковими системами, однією з яких є тезаурус, пов'язаний з поняттями "семантичне поле", "концептуальне поле" та з методом компонентного аналізу. Таке сполучення передбачає істотне збагачення пізнавальних можливостей контентного аналізу.
Нестуля
Аналіз документів. Цей метод дозволяє отримати відомості про минулі події, спостереження за якими вже не можливі. Джерелом соціологічної інформації, як правило, є текстові повідомлення, які містяться в доповідях, протоколах, публікаціях, листах тощо. Особливу роль виконує соціальна статистична інформація, яка в більшості випадків використовується для характеристики конкретно-історичного контексту розвитку процесу або явища, що досліджується. Важливою особливістю всіх статистичних даних є їх співвіднесення до певної групи як до цілісності.
Незамінним методом підбору текстів є контент-аналіз,який активно використовується у процесі вивчення засобів масової інформації. Аналіз здійснюється через використання однотипних стандартизованих показників (індикаторів) для пошуку та підрахування масовості тих чи інших характеристик тексту.
Семке. Шпаргалка
Аналіз документівЦей метод дозволяє одержати відомості про минулі події, спостереження за якими вже неможливе.
Вивчення документів допомагає виявити тенденції й динаміку змін і розвитку певних явищі процесів. Джерелом соціологічної інформації виступають зазвичай текстові повідомлення, що знаходяться в протоколах, доповідях, резолюціях, рішеннях, публікація, листах і т.п. Особливу роль виконує соціальна статистична інформація, яка у більшості випадків використовується для характеристики конкретно-історичного контексту розвитку досліджуваного явища або процесу. Важливою особливістю більшої частини статистичних документів є їх агрегований характер, що означає їхню співвіднесеність з певною групою як цілим. Так. доступність «споживчого кошика» може бути віднесена як до всього населення, так і до окремих соціальних груп
Не менш важливого значення набуває контент-аналіз, що активно застосовується в дослідженнях засобів масової інформації. Аналіз заснований на використанні однакових стандартизованих показників (індикаторів) для пошуку, обліку й підрахунку масовості тих або інших характеристик тексту. Даний аналіз здійснюється за схемою хто сказав, що. кому як. з якою метою і з яким результатом.
Андрущенко