Технология гипертекста и ее использование в информационных системах.

Технология гипертекста и ее использование в информационных системах.

Гипертекст - принцип организации информационных массивов, при котором отдельные информационные элементы связаны между собой ассоциативными отношениями, обеспечивающими быстрый поиск необходимой информации и/или просмотр взаимосвязанных данных. Термин гипертекст введен Тедом Нельсоном в 1965 году. Технология гипертекста принадлежит к системам автоматизации деятельности по обработке информации и служит для облегчения поиска нужной информации. Гипертекстовые системы представляют собой реализацию средствами вычислительной техники ассоциативного подхода к представлению информации. Они имитируют способность человеческого интеллекта осуществлять хранение больших объемов информации и поиск в них посредством ассоциаций в процессах коммуникации и мышления. Идея гипертекста состоит в том, чтобы дать возможность человеку воспринимать информацию в последовательности, отвечающем его интересам. Сегодня гипертекстовый документ представляет собой множество фрагментов информации (статей), объединенных в некоторую сетевую структуру. В качестве информационных фрагментов могут выступать текст, графический образ, анимация, видеоролики и даже программа. Гипертекстовые документы получили широкое распространение в электронных изданиях. Идея гипертекста широко использовалась при составлении справочников и энциклопедий. Например, в тексте статьи энциклопедии по какому-либо вопросу встречаются ссылки, типа смотри статью такую-то, содержащую дополнения и пояснения к текущей проблеме. В настоящее время используемая технология гипертекста позволяет получать доступ к большим массивам текстовой информации, не поддающейся упорядочиванию обычными способами. Гипертекстовые системы хорошо приспособлены для создания информационных систем в плохо структурированных предметных областях. Эти технологии применяются тогда, когда пользователь не может четко сформулировать свои информационные потребности, а делает это в процессе поиска информации. Традиционные методы информационного поиска, например по ключевым эффективный доступ к большим информационным массивам.Еще одним воплощением гипертекстовой технологии в совокупности с многолетним опытом в области программного обеспечения (ПО) работы с графическими данными является программный пакет Adobe Acrobat. Этот пакет содержит все необходимые компоненты для создания сложных информационных систем.

Метод контент-анализа

Первые опыты использования количественных методов, близких к контент-аналитическим, относятся к концу XIX в. Существенный прогресс в технике контент-анализа связывают с Лассуэлом (провел исследование основных тем и идей, превалировавших в офиц.пропаганде стран-участников Первой мировой войны). Сущность контент-анализа заключается в том, чтобы по внешним – количественным – характеристикам текста на уровне слов и словосочетаний сделать правдоподобные предложения о его плане содержания и, как следствие, сделать выводы об особенностях мышления и сознания автора текста – его намерениях, установках, желаниях и т.д. Для литер.текста может быть поставлена задача изучения особенностей изображения представленных в нем персонажей. Если количество привлекаемых текстов и авторов достаточно велико, то сделанные выводы могут быть распространены на большую социально значимую группу людей и даже на обществ.сознание в целом.

Единицы контент-анализа: (их много написала только некоторые из них!!!)

1. «Физические» единицы. Под таковыми понимаются сущности с четко очерченными физическими, геометрическими или временными границами, например, экземпляры книги, номера газет, экземпляры плакатов или листовок, фотографии и т.п.

2. Структурно-семиотические единицы. Под таковыми имеются в виду основные элементы семиотических систем. В случае естественного языка это: лексика языка (слова и их эквиваленты, например выражение железная дорога или термин контент-анализ, т.е. то, что фиксируется в словарях) и грамматические показатели (например, отрицательные частицы или показател таких категорий, как, скажем, отглагольные имена). Контент-анализ грамматических категорий представляет собой достаточно редкое исследовательское начинание, стимулом к которому является гипотеза (весьма правдоподобная) о том, что употребление грамматических форм в меньшей степени, чем употребление лексики, контролируется автором текста и поэтому может послужить источником таких сведений о нем, которые он сам вовсе не собирался делать доступными своим читателям.

3. Понятийно-тематические единицы. В большинстве случаев контент-аналитик интересуется стоящими за словами значимыми для него понятиями, темами, проблемами – иными словами, тем, что можно назвать понятийно-тематическими единицами. Исследователь, интересующийся тем, какое место в общественном сознании занимает, скажем, проблема преступности, обязан принимать во внимание не только присутствие в анализируемом информационном массиве слова преступность, но и упоминания заказных и всяких прочих убийств, бандитского беспредела, «крыши», «братков», авторитетов, власти криминала и проч.

4. Референциальные и квазиреференциальные единицы. К референциальным, точнее, конкретно-референциальным единицам относятся обозначения реальных личностей, событий, городов, стран, организаций и т.д. Это, так сказать, «энциклопедический» блок единиц анализа.(например, -В.В.Жириновский, Владимир Вольфович, Вольфыч, Жирик, сын юриста, лидер ЛДПР- способы обозначения в тексте конкретной фигуры могут различаться, однако конкретно-референтная единица здесь во всех случаях одна). Квазиреференциальные единицы в политических текстах чаще всего бывают представлены обозначениями всякого рода «сил» – коллективных актеров политической сцены, референция которых может колебаться от реальной (типа КПРФ) через обобщенную (коммунисты, либералы, исламисты) к откровенно мифологизированной (мировая закулиса).

5. «Поэтические» единицы. Под таковыми имеются в виду допускающие количественное измерение средства художественной выразительности – например, каламбуров, аллитераций и т.п.

Этапы контент-анализа:

Первый этап: Выбор материала - корпус языковых данных. Классический пример корпуса – газетные публикации за опред. период времени и др. Второй этап: Выбо концептуальной переменной и определение ее значений – языковых репрезентантов выбранного понятия в тексте. Третий этап: Выбор единицы кодирования. Значения концептуальной переменной могут приписываться текстам, их фрагментам, абзацам и отдельным словам и словосочетаниям. Четвертый этап: Отбор кодировщиков и формулировка инструкций по кодированию. Общий принцип кодировки – жесткий и мягкий. Пятый этап: Происходит кодировка данных. Шестой этап: Осуществляется подсчет данных и интерпретация результатов.

Квантитативная лингвистика.

Название «квантитативная лингвистика» достаточно условно, хотя и довольно широко используется в современной научной литературе. Оно характеризует междисциплинарное направление в прикладных исследованиях, в котором в качестве основного инструмента изучения языка и речи используются количественные или статистические методы анализа. Иногда квантитативная (или количественная) лингвистика противопоставляется комбинаторной лингвистике. В последней доминирующую роль занимает «неколичественный» математический аппарат теория множеств, математическая логика, теория алгоритмов и т.д.

Применение количественных методов при описании функционирования языка мало чем отличается от использования аналогичного инструментария в естественных и гуманитарных науках. Привлечение методов измерения и подсчета языковых реализаций позволяет, однако, существенно модифицировать представление о языковой системе и возможностях ее функционирования. В этом отношении квантитативная лингвистика оказывается важнейшим фактором, влияющим на лингвистическую теорию. Например, в сфере грамматики теоретическая лингвистика, как правило, ограничивается констатацией существования в русском языке системы падежей. Со структурной точки зрения этого, быть может, и достаточно. Между тем за рамками обсуждения остается весьма существенная информация о том, как часто используются различные падежи, какова динамка использования различных падежей с течением времени. Исследование такого рода позволило бы выявить тенденции развития падежной системы и на основе этого даже сформулировать гипотезы о будущем состоянии грамматической системы русского языка. С теоретической точки зрения использование статистических методов в языкознании позволяет дополнить структурную модель языка вероятностным компонентом, то есть создать структурно-вероятностную модель, обладающую значительным объяснительным потенциалом. Эту сторону использования количественных методов следует считать приложением статистики в языкознании. К моделям такого рода относится, например, «модель жизненного цикла слова», предложенная А. А. Поликарповым . Проведенный им квантитативный анализ показал, что в достаточно значительной временной перспективе имеется явная тенденция к увеличению степени абстрактности значений у многозначного слова — чем позже возникает значение, тем оно более абстрактно. Разработанная количественная модель позволяет делать интересные предположение об относительном «возрасте» различных частей речи, тенденций развития лексической системы языка и т.д. Из приведенного примера видно, что задача построения структурно вероятностной модели функционирования языка относится к теоретическим проблемам лингвистики и входит в компетенцию теории языка. В прикладной же области квантитативная лингвистика представлена прежде всего использованием фрагментов этой модели.

Дешифровка кодированного текста. В процессе дешифровки также могут использоваться данные о частоте употребления графем, морфем и слов, а также их взаимном расположении. К настоящему времени разработаны продуктивные алгоритмы дешифровки, основанные на частоте и дистрибуции элементов кодированного текста; ср. деши-Фровочные алгоритмы Б. В. Сухотина, статистико-комбинаторный метод Н.Д.Андреева. Близки к задачам дешифровки формальные процедуры «открытия» морфемного состава неописанного языка, предложенные 3. Харрисом.

Авторизация атрибуция текста. Проблема авторизации текста относится к числу классических проблем филологического исследования. Часто она рассматривается в рамках «количественной стилистики» — стилеметрии. Авторизация включает как литературную, так и лингвистическую составляющую. В. В. Виноградов в книге «Проблема авторства и теория стилей» сформулировал типологию факторов атрибуции текста. Морозов, перу которого принадлежит опубликованная в 1915 г. работа «Лингвистические спектры, в квантитативном анализе предлагал опираться не на тематически связанную лексику слова, определяемые спецификой описываемого материала, его предметной и проблемной ориентацией, — а на служебные слова и слова тематически нейтральные. Дело в том, что именно особенности употребления служебных слов, лексем с общей семантикой, не привязанной к тематике художественного произведения, формируют авторский стиль и практически не поддаются имитации.

Машинный перевод

По качеству: 1) информативный – знакомство с текстом на иностранном языке, 2) точный – для детального знакомства с содержанием, 3)сверхточный – для официальных документов и хаконов.

Направления исследования: 1)перевод смысла безотносительно формы. «текст-смысл-текст». Используется универсальный язык-посредник. 2) перевод на уровне переводных языковых соответствий.

Виды: 1) информативный (пословный), 2) профессиональный – для больших переводов, 3)персональный – нужно предредактирование.

1.4.5. Некоторые известные системы машинного перевода. Количество ре­ально работающих и проектируемых систем МП к настоящему времени перевалило за сотню.

Система GAT(Georgetown Automatic Translation). Одна из первых систем МП, разрабатывавшаяся с 1952 г. в Джорджтаунском университете США. Проблемная область — перевод русскоязычных текстов по физике на английский язык. Страте­гия создания — прямой перевод с некоторыми син­таксическими перестановками, приближавшими русский порядок слов к английскому. При том, что програм­ма не имела под собой никакой серьезной лингвистической базы, она эксплуатировалась в Евроатоме до 1976 г.

Системы СЕТА и GETA. Система русско-французского машин­ного перевода, разрабатывавшаяся во Франции в Гренобльском универ­ситете с 1961 по 1971 гг. Стратегия построения — использование языка-посредника, независимого от структуры входного и выходного языков. Опыт разработки оказался не вполне удачным, поскольку сконструиро­ванный язык-посредник приводил к потере релевантной информации. Тем не менее с помощью СМП СЕТА были переведены русские тексты по математике и физике общим объемом 400 тыс. слов. В дальнейшем проект трансформировался в новый проект разработки СМП GETA, в которой реализовывалась стратегия построения СМП с трансфером. Грамматический модуль системы GETA состоит из трех типов программ: преобразование линейных цепочек в деревья (например, при морфоло­гическом анализе); преобразование одних деревьев в другие (например, при синтаксическом анализе и в ходе межъязыковых операций); преобра­зование деревьев в линейные цепочки (например, при морфологическом синтезе). Системы СЕТА и GETA являются научно-экспериментальны­ми, хотя в настоящее время предпринимаются усилия по разработке промышленной версии СМП GETA.

Системы семейства ЭТАП(Электротехнический Автоматический Перевод). Работа над системами началась в 1974 г. в ИНФОРМЭЛЕКТРО и была продолжена в Институте проблем передачи информации РАН; в 1980 г. была сдана первая очередь ЭТАП-1 (фран­цузско-русский перевод), а в 1985 — ЭТАП-2 (англо-русский перевод). СМП ЭТАП-2 предназначена для перевода связных текстов и заголовков патентов. Система ЭТАП-2 работала в режиме качественного перево­да на основе полного синтаксического анализа и в режиме пословного перевода.

Система ФРАП. Начало работ над системой ФРАП — французско-русский автоматический перевод — в 1975 г. под руководством Н. Н. Леонтьевой. Было реализовано две экспе­риментальные версии системы (первая версия — в 1980 г., вторая — в 1985 г.). Архитектура СМП ФРАП - перево­д через язык-посредник. В существующем варианте системы реализована лишь часть модели, выполняющая сле­дующие функции: построение подстрочника, грамматический режим, неполный семантический режим.

Система CULT. Программа CULT представляет собой типичный пример системы человеко-машинного перевода. Разработка системы, предназначенной для перевода китайских математических и физических текстов на английский язык. Требует активного участия человека в процессе самого перевода. Так, пользователь в ряде случаев должен выявить границы составляющих, определить, в каком значении используется то или иное слово. Активное уча­стие человека в процессе работы программы практически исключает этап постредактирования-успешная работа системы человеко-машинного перевода.

Системы семейства ALPS. -типичный пример компьютерного ин­струментария, образующего рабочее место переводчика. Системы фирмы ALPS позволяют проводить экранное редактирование текста в многооконном текстовом редакторе, осуществлять оперативный поиск слова в словарных базах дан­ных, переносить информацию из баз данных в текстовый файл, а также делать пословный перевод текста, опирающийся на введенные в систему словарные источники. Предусмотрена возможность пофразового перево­да, которая пока не реализована в полном объеме. Обеспечивают перевод на английский, немецкий, французский, португальский и испанский языки.

Дистанционное обучение

Дистанционное обучение (ДО) — совокупность технологий, обеспечивающих доставку обучаемым основного объема изучаемого материала, интерактивное взаимодействие обучаемых и преподавателей в процессе обучения, предоставление обучаемым возможности самостоятельной работы по освоению изучаемого материала, а также в процессе обучения.

Современное ДО строится на использовании следующих основных элементов:1)среды передачи информации (почта, телевидение, радио, информационные коммуникационные сети),2)методов, зависимых от технической среды обмена информацией.

В настоящее время перспективным является интерактивное взаимодействие с учащимся посредством информационных коммуникационных сетей, из которых массово выделяется среда интернет-пользователей. Введение стандартов способствует как углублению требований к составу ДО, так и требований к программному обеспечению. имеются отечественные разработки программного обеспечения, которые достаточно широко применяются как отечественными, так и зарубежными ДО. ДО претендует на особую форму обучения (наряду с очной, заочной, вечерней, экстернатом). Использование технологий ДО позволяет:1)снизить затраты на проведение обучения (не требуется затрат на аренду помещений, поездок к месту учебы, как учащихся, так и преподавателей и т. п.);2)проводить обучение большого количества человек;3)повысить качество обучения за счет применения современных средств, объемных электронных библиотек и т.д.4)создать единую образовательную среду (особенно актуально для корпоративного обучения). Дистанционное обучение занимает всё большую роль в модернизации образования. формы занятий:

Чат-занятия — учебные занятия, осуществляемые с использованием чат-технологий. Чат-занятия проводятся синхронно, то есть все участники имеют одновременный доступ к чату. В рамках многих дистанционных учебных заведений действует чат-школа, в которой с помощью чат-кабинетов организуется деятельность дистанционных педагогов и учеников.

Веб-занятия — дистанционные уроки, конференции, семинары, деловые игры, лабораторные работы, практикумы и другие формы учебных занятий, проводимых с помощью средств телекоммуникаций и других возможностей «Всемирной паутины». Используются веб-форумы — форма работы пользователей по определённой теме или проблеме с помощью записей, оставляемых на одном из сайтов с установленной на нем соответствующей программой. От чат-занятий веб-форумы отличаются возможностью более длительной (многодневной) работы и асинхронным характером взаимодействия учеников и педагогов.

Телеконференции — проводятся, как правило, на основе списков рассылки с использованием электронной почты. Характерно достижение образовательных задач. Также существуют формы дистанционного обучения, при котором учебные материалы высылаются почтой в регионы.

В основе такой системы заложен метод обучения, который получил название «Природный процесс обучения» (Natural Learning Manner). ДО — это демократичная простая и свободная система обучения. Она была изобретена в Великобритании[ и сейчас активно используется жителями Европы, для получения дополнительного образования.

Телеприсутствие: Существует много различных способов дистанционного обучения. Напр, с помощью робота R.Bot 100. Сейчас в Москве в одной из школ, идёт эксперимент по такому виду дистанционного обучения. Мальчик инвалид, находясь дома за компьютером, слышит, видит, разговаривает при помощи робота. Учитель задаёт ему вопросы, он отвечает. При этом и учитель видит ученика, потому что на роботе находится монитор. При этом у мальчика создаётся почти полное впечатление, что он находится в классе вместе со своими сверстниками на уроке. На переменах, он может так же общаться со своими одноклассниками.[1] Если эксперимент станет удачным, он может открыть дорогу большому проекту, по внедрению, такого метода дистанционного обучения по всей России.

Типология

Значимое варьирование на фонетико-фонологическом уровнеразделяется на сегментное варьирование и супрасегментное варьирование. Сегментное варьирование эффективно в создании определенных позитивных представлений у адресата. Варьирование супрасегментных хар-к — интонации.

Значимое варьирование на лексическом уровне. Речевоздействующим эффектом может обладать даже стилистически нейтральная лексика. Д. Болинджер разбирает пример «убийство 4 студентов». СМИ определили его как трагедию. Но оно могло быть названо и преступлением, что повлекло бы постановку вопроса о его виновниках.

на синтаксическом уровне.Одна и та же ситуация при использовании различных глаголов или синтаксических преобразований может акцентировать внимание адресата на различных сторонах описываемого положения дел, ср. Дума обсуждает бюджет, предложенный правительством (все участники ситуации представлены, но «Дума» выделена); Правительство внесло бюджет в Думу (все уч присутствуют, но выделено «правительство», а Дума представлена как «локус»); Бюджет принят в первом чтении (главные участники ситуации исключены из языкового описания ситуации).

выбора порядка слов также важен:

(3) — Доходное озеро и принадлежащие к нему сад и дом, — Очень хорошо, запишем! Запишем: дом, сад и принадлежащий к ним водоем. Ибо кто может сказать, что озеро — это не водоем? С другой стороны: если упомянутые дом и сад принадлежат к озеру или, иначе говоря, водоему, ясно, что и водоем в обратном порядке принадлежит к дому и саду. Пиши, как я сказал: «дом, сад и принадлежащий к ним водоем!» — По ловкости это был удивительный ход (...); озеро волшебно превратилось в некий захудалый водоем (...).

Типология механизмов речевого воздействия с процедурной точки зренияосновывается не на уровневой модели языка, а на когнитивных процедурах преобразования знания, приводящих к его передаче в речевом акте и введении в модель мира адресата. К процедурным механизмам воздействия на сознание относится варьирование степени детальности описания ситуации.Так, одну и ту же ситуацию можно назвать событиями, гражданской войной и крупномасштабными столкновениями вооруженных группировок в борьбе за государственную власть. Лишь второе из приведенных языковых описаний характеризует ситуацию прототипическим образом и активизирует обширный набор прагматически значимых ассоциаций.

Процедурным механизмом воздействия является использование метафоризации. Напр,в англ выражении to solve the problem «решить проблему» скрыта идея растворения проблемы как некоторой субстанции. Такое восприятие проблемы настраивает человека не на то, чтобы окончательно избавиться от трудностей, а на то, чтобы найти катализатор, который «растворить» данную проблему, тащя еще более сложных проблем.

Психолигвистика

Официальное провозглашение Психолингвистики(П) произошло в 1954 г. актом опубли­кования сборника научных исследований «Psy-cholinguistics. A survey of theory and research problems», редактировали который Ч. Осгуд и Т. Сибеок - батьки П. В центре внимания П исследований стоят процессы речеобразования и восприятия, а также усвоения язы­ка ребенком. Основные методы П исследования — ассоциа­тивный эксперимент, метод семантического дифференциала Ч. Осгуда — заимствованы из психологии. Некоторые П эксперименты используются в лингвистике. Напр, ассоциативный для составление ассоциативных словарей. П в основной своей части — приложение психологии в лингвистике, а не приложение лингвистики в психологии. Тем самым это не часть прикладной лингвистики, а скорее часть «прикладной психоло­гии».

данные об особен­ностях устройства языковой системы используются в изучении афазии. Афазия —нарушения речи, возникающих из-за поражения коры головного мозга. Изучением занимался А.Р.Лурия.

Это лингвистическое по сути основание классификации используется для выделения различных типов

Р.Якобсон сформулировал гипотезу, согласно которой процесс распада речи при афазии повторяет в обратном порядка процесс становления речи в онтогенезе, а восстановление речевой способности афатиков в процессе лечения повторяет процесс усвоения языка ребенком. Из этого следует, что наиболее сложные аспекты языковой компетенции и речевого поведения утрачиваются в первую очередь, а восстанавливаются самыми последними В основном гипотеза Р.Якобсона получила экспериментальное подтверждение.

Лингвистические данные позволяют делать выводы и о других психических расстройствах. Например, речь шизофреников на ранних стадиях характеризуется невнятностью, бессвязностью, нарушениями артикуляции, немотивированным варьированием громкости произнесения. Письменный текст, устойчивые словосочетания теряют цельность, высказывания плохо мотивированы и тематически не соотносятся друг с другом. Маниакально-депрессивные психозы сопровождаются упрощением синтаксической структуры предложения, ошибками в реализации моделей управления глаголов. Разрушение способности к планированию приводит к ошибочному выбору лексемы из синонимического ряда – ср. Он врезал ей под очи вместо Он врезал ей под глаз. Лингвистический эксперимент оказывается важным фактором диагностики психических заболеваний.

Возможности приложения лингвистических знаний в этой области отнюдь не ограничиваются диагностикой. Курс реабилитации больных с нарушениями речи включает серии специальных лингвистических упражнений, которые различаются для больных с разными психическими расстройствами. К сожалению, эта сфера еще плохо освоена лингвистами.

Технология гипертекста и ее использование в информационных системах.

Гипертекст - принцип организации информационных массивов, при котором отдельные информационные элементы связаны между собой ассоциативными отношениями, обеспечивающими быстрый поиск необходимой информации и/или просмотр взаимосвязанных данных. Термин гипертекст введен Тедом Нельсоном в 1965 году. Технология гипертекста принадлежит к системам автоматизации деятельности по обработке информации и служит для облегчения поиска нужной информации. Гипертекстовые системы представляют собой реализацию средствами вычислительной техники ассоциативного подхода к представлению информации. Они имитируют способность человеческого интеллекта осуществлять хранение больших объемов информации и поиск в них посредством ассоциаций в процессах коммуникации и мышления. Идея гипертекста состоит в том, чтобы дать возможность человеку воспринимать информацию в последовательности, отвечающем его интересам. Сегодня гипертекстовый документ представляет собой множество фрагментов информации (статей), объединенных в некоторую сетевую структуру. В качестве информационных фрагментов могут выступать текст, графический образ, анимация, видеоролики и даже программа. Гипертекстовые документы получили широкое распространение в электронных изданиях. Идея гипертекста широко использовалась при составлении справочников и энциклопедий. Например, в тексте статьи энциклопедии по какому-либо вопросу встречаются ссылки, типа смотри статью такую-то, содержащую дополнения и пояснения к текущей проблеме. В настоящее время используемая технология гипертекста позволяет получать доступ к большим массивам текстовой информации, не поддающейся упорядочиванию обычными способами. Гипертекстовые системы хорошо приспособлены для создания информационных систем в плохо структурированных предметных областях. Эти технологии применяются тогда, когда пользователь не может четко сформулировать свои информационные потребности, а делает это в процессе поиска информации. Традиционные методы информационного поиска, например по ключевым эффективный доступ к большим информационным массивам.Еще одним воплощением гипертекстовой технологии в совокупности с многолетним опытом в области программного обеспечения (ПО) работы с графическими данными является программный пакет Adobe Acrobat. Этот пакет содержит все необходимые компоненты для создания сложных информационных систем.

Метод контент-анализа

Первые опыты использования количественных методов, близких к контент-аналитическим, относятся к концу XIX в. Существенный прогресс в технике контент-анализа связывают с Лассуэлом (провел исследование основных тем и идей, превалировавших в офиц.пропаганде стран-участников Первой мировой войны). Сущность контент-анализа заключается в том, чтобы по внешним – количественным – характеристикам текста на уровне слов и словосочетаний сделать правдоподобные предложения о его плане содержания и, как следствие, сделать выводы об особенностях мышления и сознания автора текста – его намерениях, установках, желаниях и т.д. Для литер.текста может быть поставлена задача изучения особенностей изображения представленных в нем персонажей. Если количество привлекаемых текстов и авторов достаточно велико, то сделанные выводы могут быть распространены на большую социально значимую группу людей и даже на обществ.сознание в целом.

Единицы контент-анализа: (их много написала только некоторые из них!!!)

1. «Физические» единицы. Под таковыми понимаются сущности с четко очерченными физическими, геометрическими или временными границами, например, экземпляры книги, номера газет, экземпляры плакатов или листовок, фотографии и т.п.

2. Структурно-семиотические единицы. Под таковыми имеются в виду основные элементы семиотических систем. В случае естественного языка это: лексика языка (слова и их эквиваленты, например выражение железная дорога или термин контент-анализ, т.е. то, что фиксируется в словарях) и грамматические показатели (например, отрицательные частицы или показател таких категорий, как, скажем, отглагольные имена). Контент-анализ грамматических категорий представляет собой достаточно редкое исследовательское начинание, стимулом к которому является гипотеза (весьма правдоподобная) о том, что употребление грамматических форм в меньшей степени, чем употребление лексики, контролируется автором текста и поэтому может послужить источником таких сведений о нем, которые он сам вовсе не собирался делать доступными своим читателям.

3. Понятийно-тематические единицы. В большинстве случаев контент-аналитик интересуется стоящими за словами значимыми для него понятиями, темами, проблемами – иными словами, тем, что можно назвать понятийно-тематическими единицами. Исследователь, интересующийся тем, какое место в общественном сознании занимает, скажем, проблема преступности, обязан принимать во внимание не только присутствие в анализируемом информационном массиве слова преступность, но и упоминания заказных и всяких прочих убийств, бандитского беспредела, «крыши», «братков», авторитетов, власти криминала и проч.

4. Референциальные и квазиреференциальные единицы. К референциальным, точнее, конкретно-референциальным единицам относятся обозначения реальных личностей, событий, городов, стран, организаций и т.д. Это, так сказать, «энциклопедический» блок единиц анализа.(например, -В.В.Жириновский, Владимир Вольфович, Вольфыч, Жирик, сын юриста, лидер ЛДПР- способы обозначения в тексте конкретной фигуры могут различаться, однако конкретно-референтная единица здесь во всех случаях одна). Квазиреференциальные единицы в политических текстах чаще всего бывают представлены обозначениями всякого рода «сил» – коллективных актеров политической сцены, референция которых может колебаться от реальной (типа КПРФ) через обобщенную (коммунисты, либералы, исламисты) к откровенно мифологизированной (мировая закулиса).

5. «Поэтические» единицы. Под таковыми имеются в виду допускающие количественное измерение средства художественной выразительности – например, каламбуров, аллитераций и т.п.

Этапы контент-анализа:

Первый этап: Выбор материала - корпус языковых данных. Классический пример корпуса – газетные публикации за опред. период времени и др. Второй этап: Выбо концептуальной переменной и определение ее значений – языковых репрезентантов выбранного понятия в тексте. Третий этап: Выбор единицы кодирования. Значения концептуальной переменной могут приписываться текстам, их фрагментам, абзацам и отдельным словам и словосочетаниям. Четвертый этап: Отбор кодировщиков и формулировка инструкций по кодированию. Общий принцип кодировки – жесткий и мягкий. Пятый этап: Происходит кодировка данных. Шестой этап: Осуществляется подсчет данных и интерпретация результатов.

Квантитативная лингвистика.

Название «квантитативная лингвистика» достаточно условно, хотя и довольно широко используется в современной научной литературе. Оно характеризует междисциплинарное направление в прикладных исследованиях, в котором в качестве основного инструмента изучения языка и речи используются количественные или статистические методы анализа. Иногда квантитативная (или количественная) лингвистика противопоставляется комбинаторной лингвистике. В последней доминирующую роль занимает «неколичественный» математический аппарат теория множеств, математическая логика, теория алгоритмов и т.д.

Применение количественных методов при описании функционирования языка мало чем отличается от использования аналогичного инструментария в естественных и гуманитарных науках. Привлечение методов измерения и подсчета языковых реализаций позволяет, однако, существенно модифицировать представление о языковой системе и возможностях ее функционирования. В этом отношении квантитативная лингвистика оказывается важнейшим фактором, влияющим на лингвистическую теорию. Например, в сфере грамматики теоретическая лингвистика, как правило, ограничивается констатацией существования в русском языке системы падежей. Со структурной точки зрения этого, быть может, и достаточно. Между тем за рамками обсуждения остается весьма существенная информация о том, как часто используются различные падежи, какова динамка использования различных падежей с течением времени. Исследование такого рода позволило бы выявить тенденции развития падежной системы и на основе этого даже сформулировать гипотезы о будущем состоянии грамматической системы русского языка. С теоретической точки зрения использование статистических методов в языкознании позволяет дополнить структурную модель языка вероятностным компонентом, то есть создать структурно-вероятностную модель, обладающую значительным объяснительным потенциалом. Эту сторону использования количественных методов следует считать приложением статистики в языкознании. К моделям такого рода относится, например, «модель жизненного цикла слова», предложенная А. А. Поликарповым . Проведенный им квантитативный анализ показал, что в достаточно значительной временной перспективе имеется явная тенденция к увеличению степени абстрактности значений у многозначного слова — чем позже возникает значение, тем оно более абстрактно. Разработанная количественная модель позволяет делать интересные предположение об относительном «возрасте» различных частей речи, тенденций развития лексической системы языка и т.д. Из приведенного примера видно, что задача построения структурно вероятностной модели функционирования языка относится к теоретическим проблемам лингвистики и входит в компетенцию теории языка. В прикладной же области квантитативная лингвистика представлена прежде всего использованием фрагментов этой модели.

Дешифровка кодированного текста. В процессе дешифровки также могут использоваться данные о час<

Наши рекомендации