Как делать вещи при помощи слов

Список литературы

Остин Дж. Слово как действие // Новое в зарубежной лингвистике. Вып. 17. Теория речевых актов. - М., 1986.

Серль Дж. Р. Косвенные речевые акты // Там же.

Вежбицка А. Речевые акты // Там же. Вып. 16. Лингвистическая прагматика, 1985. http://lib.ru/

Корпусная лингвистика

Ко́рпусная лингви́стика — раздел языкознания, занимающийся разработкой, созданием и использованием текстовых (лингвистических) корпусов. Термин введён в употребление в 60-х годах XX века в связи с развитием практики создания корпусов, которому начиная с 80-х способствовало развитие вычислительной техники.

Лингвистическим корпусом называют совокупность текстов, собранных в соответствии с определёнными принципами, размеченных по определённому стандарту и обеспеченных специализированной поисковой системой. Иногда корпусом («корпус первого порядка») называют просто любое собрание текстов, объединённых каким-то общим признаком (языком, жанром, автором, периодом создания текстов).

Целесообразность создания текстовых корпусов объясняется:

представлением лингвистических данных в реальном контексте;
достаточно большой представительностью данных (при большом объёме корпуса);
возможностью многократного использования единожды созданного корпуса для решения различных лингвистических задач.

История

Первым большим компьютерным корпусом считается Брауновский корпус (БК, англ. Brown Corpus, BC), который был создан в 1960-е годы в Университете Брауна и содержал 500 фрагментов текстов по 2 тысячи слов в каждом, которые были опубликованы на английском языке в США в 1961 году. В результате он задал стандарт в 1 млн словоупотреблений для создания представительных корпусов на других языках. По модели близкой к БК в 1970-е годы был создан частотный словарь русского языка Засориной, построенный на основе корпуса текстов объемом также в 1 миллион слов и включавший примерно в равной пропорции общественно-политические тексты, художественную литературу, научные и научно-популярные тексты из разных областей и драматургию. По аналогичной модели был построен и русский корпус, созданный в 1980-е годы в Университете Уппсалы, Швеция.

Размер в один миллион слов достаточен для лексикографического описания только самых частотных слов, поскольку слова и грамматические конструкции средней частоты встречаются по несколько раз на миллион слов (со статистической точки зрения язык является большим набором редких событий). Так, каждое из таких обыденных слов, как англ. polite (вежливый) или англ. sunshine (солнечный свет) встречается в БК всего 7 раз, выражение англ. polite letter лишь один раз, а такие устойчивые выражения как англ. polite conversation, smile, request ни разу.

По этим причинам, а также в связи с ростом компьютерных мощностей, способных работать с большими объемами текстов, в 1980-е годы в мире было предпринято несколько попыток создать корпуса большего размера. В Великобритании такими проектами были Банк Английского (Bank of English) в Бирмингемском Университете и Британский Национальный Корпус (British National Corpus, BNC). В СССР таким проектом был Машинный Фонд русского языка, создававшийся по инициативе А. П. Ершова.

Современное состояние

Наличие большого количества текстов в электронной форме существенно облегчило задачу создания больших представительных корпусов размером в десятки и сотни миллионов слов, но не ликвидировало проблем: сбор тысяч текстов, снятие проблем с авторскими правами, приведение всех текстов в единую форму, балансировка корпуса по темам и жанрам отнимают много времени. Представительные корпуса существуют (или разрабатываются) для немецкого, польского, чешского, словенского, финского, новогреческого, армянского, китайского, японского и других языков.

Национальный корпус русского языка, создаваемый при РАН, содержит на сегодняшний день более 300 млн словоупотреблений.^[1]

Наряду с представительными корпусами, которые охватывают большой набор жанров и функциональных стилей, в лингвистических исследованиях часто используются и оппортунистические коллекции текстов, например, газеты (часто Wall Street Journal и New York Times), новостные ленты (Рейтер), коллекции художественной литературы (Библиотека Мошкова или Проект Гутенберг).

Проблемы

Проблема представительности

Корпус состоит из конечного числа текстов, но он призван адекватно отражать лексикограмматические феномены, типичные для всего объема текстов в соответствующем языке (или подъязыке). Для представительности важен как размер, так и структура корпуса. Представительный размер зависит от задачи, поскольку он определяется тем, как много примеров может быть найдено для исследуемых феноменов. В связи с тем, что со статистической точки зрения язык содержит большое число относительно редких слов (Закон Ципфа), для исследования первых пяти тысяч наиболее частотных слов (например, убыток, извиняться) требуется корпус размером около 10-20 миллионов словоупотреблений, в то время как для описания первых двадцати тысяч слов (незатейливый, сердцебиение, роиться) уже требуется корпус свыше ста миллионов словоупотреблений.

Проблема разметки

К первичной разметке текстов относятся этапы, обязательные для каждого корпуса:

токенизация (разбиение на орфографические слова)
лемматизация (приведение словоформ к словарной форме)
морфологический анализ

Веб как корпус

Использование веб-страниц

Второй способ заключается в автоматическом извлечении большого количества страниц из Интернета и их дальнейшем использовании в качестве обычного корпуса, что дает возможность провести его разметку и использовать лингвистические параметры в запросах. Этот способ позволяет быстро создать представительный корпус для любого языка в достаточной степени представленного в Интернете, но его жанровое и тематическое разнообразие будет отражать интересы пользователей Интернета.^[3]

Всё большую популярность в научной среде получает использование Википедии — как корпуса текстов.^[4]

Проект Татоэба

В 2006 году появился сайт Татоэба (Tatoeba), позволяющий на свободной основе добавлять новые и изменять существующие предложения на различных языках, связанные между собой по смыслу. В его основу лёг лишь англо-японский корпус, а уже сейчас число языков превышает 80, а число предложений — 600000^[5]. Любой желающий может добавлять новые предложения и их переводы, а при необходимости — бесплатно скачать целиком или частично все языковые корпуса.

Когнитивная лингвистика

Когнитивная лингвистика — направление в языкознании, которое исследует проблемы соотношения языка и сознания, роль языка в концептуализации и категоризации мира, в познавательных процессах и обобщении человеческого опыта, связь отдельных когнитивных способностей человека с языком и формы их взаимодействия.

Вообще, когнитивизм есть совокупность наук, объединяющая исследования общих принципов, управляющих мыслительными процессами. Таким образом, язык представляется как средство доступа к мыслительным процессам. Именно в языке фиксируется опыт человечества, его мышление; язык — познавательный механизм, система знаков, специфически кодифицирующая и трансформирующая информацию.

Объектом когнитивной лингвистики является язык как механизм познания.

Когниция

Предметом когнитивной лингвистики является человеческая когниция — взаимодействие систем восприятия, представления и продуцирования информации в слове. В значении единиц языка заложены познавательные структуры, что проявляется при образовании окказиональных слов. Например, у Пушкина находим — «Я влюблён, я очарован, словом, я огончарован». Большое воздействие на развитие когнитивной лингвистики оказывает семантика.

Основные направления

Теория современной когнитивной лингвистики состоит из нескольких индивидуальных исследовательских программ, которые созданы 6-7 учёными. При этом эти индивидуальные исследовательские программы не образуют единой теории.

В 90-е гг. XX в. появились 4 направления в когнитивизме:

1. Описание и объяснение ментального механизма, объясняющие взаимодействие стимула и реакции.

2. Главная роль в осуществлении мыслительной деятельности принадлежит субъекту; он инициатор и источник всех действий.

3. Исследование внутренней мыслительной природы человека.

4. Изучение когнитивных процессов в отношении с аффектами.

Слоговые языки

Апоха

(санскр. - исключение, отделение, различение) - логико-гносеологическая концепциябуддизма махаяны, утверждающая отрицательное или относительное значение понятий. Проистекает из концепции "недвойственности" (см. "Восемь "не"") и принципиальной иллюзорности всякой феноменальности, отнесения подлинной субстанциальности к миру чистых единых сущностей - дхарм. Всякий мыслительный процесс, выражающийся в понятиях, представляет собой конструирование, обобщающую абстракцию. Следовательно, любое понятие - универсалия. Поскольку мир единичных сущностей и мир универсалий никак не связаны (универсалии предполагают стабильность, постоянство значения, а дхармический поток реальности непостоянен, вечно изменчив и бесконечно многообразен), то понятия ничего не говорят о реальности, с которой они мысленно соотносятся. Их значение в том, что они каким-то образом указывают на специфику мыслительных процессов. Кроме того, слово как комбинация звуков, наделяемая субъективным и коммуникативно транслируемым смыслом, содержит указание на то, что называемый им предмет есть "А", следовательно, он не есть "не-А". Эти аспекты смысловой данности понятийной практики позволяют, по крайней мере, прояснить, чем не является данный предмет. Основатели концепции А. - Дигнага (ок. 450 - 520) и Дхармакирти (ок. 580 - 650), отрицая позитивное значение рационально-понятийного познания, утверждали ценность чувственного познания, просвещенного духовной практикой в соответствии с буддийскими истинами. Дхармоттара (ок. 750 - 810), представитель крайнего крыла школы йогачара, утверждает ложность всякого познания внешней феноменальности, ориентируясь на медитативную интроспекцию (вся феноменальная реальность, с его т. зр., есть дхармические образы, являющиеся в процессе медитации). Влияние концепции А. присутствует во всей логико-гносеологической литературе махаяны и особенно в дзэн-буддистской практике достижения сатори.

КАРАКИ (санскр. käraka, букв. — действующие) — индийская лингвистическая и лингвофилософская категория. Впервые система караков была разработана индийским грамматистом Пашни в труде “Аштадхьяи”, Панини не дает общего определения караков, однако из его описания этой системы можно сделать вывод, что караки — это роли, которые играют отдельные элементы (объекты, живые существа и т. д.) в совершении действия, обозначенного глагольным корнем. Всего в разделе I. IV.23—55 “Аштадхьяи” описаны семь “ролей”: ападана, илиотправная точка; сампрадана, или реципиент; карана, или инструмент; адхикарана, или локус; карт, или деятель; карма, или объект и хету, или причина. Патанджали рассматривает караки двояко: как свойство объекта, а именно его способность содействовать совершению действия, но также и как объект, обладающий этим свойством. Так, комментируя этот раздел “Аштадхьяи”, он утверждает (Махабхашья II.57.9. ad. III. 1.67.), что вещи становятся караками тогда, когда они принимают участие в совершении действия. Согласно Бхартрихари (Вакьяпадия III. 1.2—3), караки — садхана в его терминологии — есть именно способность объекта содействовать совершению действия. Эта способность является изначально присущей объекту и существует постольку, поскольку существует объект. Она проявляется тогда, когда объект оказывается вовлеченным в совершение действия. С точки зрения высшей реальности эта способность едина, но из-за множества следствий, которые она вызывает, и под влиянием ее выражения в языке она рассматривается как имеющая шесть основных типов — шесть караков Панини за исключением хету. Хету, согласно Бхартрихари, — это объект, который может вызвать следствие, вне зависимости от того, связан он с действием или нет, т. е. это “причина вообще”.

[1] Признак A можно сформулировать и как «релевантность/иррелевантность тона».

[2] В то же время относительно едва ли не большинства тюркских языков ведутся многолетние дискуссии о том, какова природа ударения в этих языках и даже каково место ударения в конкретных языках [Щербак 1970]. Имеющиеся описания заставляют подозревать, что по крайней мере в части тюркских языков ударения также нет.

[3] Решение вопроса о фонологичности/нефонологичности предсказуемого ударения зависит от понимания функции последнего. Полная предсказуемость ударения лишает его дистинктивных потенций, но является ли дистинк-/273//274/тивная функция ударения главенствующей? Можно считать, что предсказуемое ударение продолжает выполнять конститутивную (консолидирующую), кульминативную и ритмообразующую функции, и по крайней мере первая из них не может быть переадресована соответствующим аллофонам гласных (или согласных). В этом случае фиксированное неподвижное ударение фонологично, как функциональное средство языка, хотя и существенно отличается от разноместного и/или подвижного. Не вполне ясно, однако, является ли наличие просодической вершины слова в языке с фиксированным ударением всегда средством консолидации слогов в пределах слова — или же оно может расцениваться как следствие сочетания слогов по законам данного языка. При последней трактовке ударение становится чисто фонетическим явлением.

[4] Видимость наличия морфем короче слога создает так называемая эризация в китайском языке, например [p‘ar²] ‘тарелочка’, где значение уменьшительности передается как будто бы морфемой [r]. Внимательный анализ /269//270/ показывает, однако, что с фонологической точки зрения [r] следует считать отдельным слогом [Касевич, Спешнев 1974].

[5] Разница с русским примером типа ток + а → то‑ка заключается только в том, что в русском языке согласный эксплозивен как в начальнослоговом, так и в конечнослоговом положении, а в индонезийском конечнослоговой согласный имплозивен.

[6] Хотя доказать это бывает отнюдь не просто.

[7] Здесь использованы следующие сокращения названий языков: русск. — русский, скр. — санскрит, авест. — авестийский, греч. — греческий, лат. — латынь, чеш. — чешский, польск. — польский, англ. — английский, нем. — немецкий, арм. — армянский.

[8] Формулировку правил, отражающих эти законы, мы не приводим.

[9] Наличие в знаменателе цифры 2 объясняется тем, что в каждом языке основной словарь изменялся по-своему, поэтому, рассматривая пары слов из двух списков, мы получаем, соответственно, удвоенное время расхождения языков.

Как делать вещи при помощи слов

«КАК ДЕЛАТЬ ВЕЩИ ПРИ ПОМОЩИ СЛОВ» — книга Джона Остина (Austin . How to do things with Words: The William James Lectures delivered at Harvard University in 1955/ Ed. J. O. Urmson. Oxford: Clarendon, 1962). В этой книге, ставшей этапной для теории речевых актов, проявился интерес к языку как таковому, в отличие от «терапевтического» анализа обыденного языка в духе лингвистической философии. С точки зрения Остина, наш обычный язык воплощает все различения, которые люди сочли нужным провести, и все связи, которые они сочли нужным установить.

Остин подвергает критике подход, согласно которому предложения, главным образом заключают о фактах, и в силу этого они являются истинными или ложными. Он подчеркивает, что предложения, способные иметь истинностное значение, составляют лишь небольшую часть высказываний нашего обыденного языка. Среди остальных важное место занимают перформативные высказывания, произнесение которых означает не просто сказать нечто, а, скорее, выполнить определенный вид действия. Перформативы не являются истинными или ложными, и если они не достигают своей цели, то Остин называет их «неудачными».

Согласно Остину, утверждать, что р истинно, значит утверждать, что «р соответствует фактам», тогда как задача определения отношения корреспонденции не решена до сих пор. Однако это, несомненно, часть обыденного языка, которая как таковая едва ли может быть ошибочной, и Остин стремится разъяснить значение «соответствия» в терминах дескриптивных конвенций, соотносящих слова с типами ситуаций, и демонстративных конвенций, соотносящих предложения с действительными ситуациями, обнаруживаемыми в мире. Сказать, что «S есть Р», значит сказать, полагает он, что такую ситуацию, как та, на которую указывает это утверждение, принято описывать так, как ее сейчас описывают. В итоге Остин формулирует различие между «перформативными» и «констатирующими» высказываниями: перформативные высказывания могут быть «удачными» или «неудачными», но не истинными или ложными, тогда как «констатирующие» («дескриптивные») высказывания являются истинными или ложными.

Остин выделяет три вида акта употребления предложения, в терминах вида акта, который они исполняют: «локутивный» акт употребления предложения с целью сообщить некое значение; «иллокутивный» акт употребления высказывания с определенной «силой», когда, напр., кто-то предупреждает нас о чем-то; и «перлокутивный» акт, нацеленный на произведение некоторого воздействия посредством употребления предложения, когда, напр., кто-то не говорит нам прямо, но умеет предупредить нас о чем-то. Всякое конкретное высказывание выполняет и локутивные, и иллокутивные функции.

На первый взгляд кажется, что локутивные акты соответствуют констатирующим высказываниям, а иллокутивные — перформативным. Но Остин отрицает, что конкретное высказывание можно классифицировать как чисто перформативное или чисто констатирующее. По его мнению, констатировать — так же, как и предупреждать — значит, делать что-то, и мое действие констатирования подвержено разного рода «невезениям»; констатации могут быть не только истинными или ложными, но и справедливыми, точными, приблизительно истинными, правильно или ошибочно высказанными и т.д. Поэтому различение между перформативными и констатирующими высказываниями представляет собой лишь первое приближение к проблеме.

Речевой акт всегда проясняется в целом, и поэтому (вопреки мнению сторонников «логического анализа») вопрос об анализе «значения» как чего-то отличного от «силы» констатации не существует. Констатирование и описание суть просто два вида иллокутивного акта, и они не имеют той особой значимости, какой их обычно наделяла философия. «Истинность» и «ложность», вопреки распространенному среди философов мнению, не являются именами отношений или качеств; они указывают на «оценочное измерение» «удовлетворительности» слов, употребленных в предложении по отношению к фактам, на которые эти слова указывают. Отсюда следует, что различение между «фактическим» и «нормативным» должно уступить место другим философским дихотомиям.

Теория речевых актов - одно из направлений аналитической философии, созданное в конце 1940-х гг. оксфордским аналитиком Дж. Остином. Теория речевых актов учит тому, как действовать при помощи слов, "как манипулировать вещами при помощи слов" (это дословный перевод основополагающей книги Остина "How to do things with words" - в советском переводе "Слово как действие").

Прежде всего, Остин заметил, что в языке существуют глаголы, которые, если поставить их в позицию 1-го лица ед. числа, аннулируют значение истинности всего предложения (то есть предложение перестает быть истинным или ложным), а вместо этого сами совершают действие. Например, председатель говорит:

(1) Объявляю заседание открытым;

или священник говорит жениху и невесте:

(2) Объявляю вас мужем и женой;

или я встречаю на улице пожилого профессора и говорю:

(3) Приветствую вас, господин профессор;

или провинившийся школьник говорит учителю:

(4) Обещаю, что это никогда не повторится.

Во всех этих предложениях нет описания реальности, но есть сама реальность, сама жизнь. Объявляя заседание открытым, председатель самими этими словами объявляет заседание открытым. И я, произнося предложение (3), самим фактом произнесения его приветствую профессора.

Такие глаголы Остин назвал перформативными (от англ. performance - действие, поступок, исполнение). Предложения с такими глаголами были названы перформативными, или просто речевыми актами, чтобы отличить их от обычных предложений, описывающих реальность:

(5) Мальчик пошел в школу.

Оказалось, что перформативных глаголов в языке довольно много: клянусь, верю, умоляю, сомневаюсь, подчеркиваю, настаиваю, полагаю, расцениваю, назначаю, прощаю, аннулирую, рекомендую, намереваюсь, отрицаю, имею в виду.

Открытие речевых актов переворачивало классическую позитивистскую картину соотношения языка и реальности, в соответствии с которой языку предписывалось описывать реальность, констатировать положение дел при помощи таких предложений, как (5). Т. р. а. же учит, что язык связан с реальностью не проективно, а по касательной, что он хотя бы одной своей точкой соприкасается с реальностью и тем самым является ее частью.

Эта картина не вызвала шока, поскольку к тому времени было уже известно учение Витгенштейна о языковых играх , а речевые акты являются частью языковых игр.

Понятие истинности и ложности для речевых актов заменяется понятиями успешности и неуспешности. Так, если в результате речевого акта (1) заседание открылось, в результате речевого акта (2) состоялось бракосочетание в церкви, профессор ответил на мое приветствие (3) и школьник действительно хотя бы на некоторое время перестал шалить (4), то эти речевые акты можно назвать успешными.

Но если я говорю: "Я приветствую вас, господин профессор!" - а профессор, вместо того чтобы ответить на приветствие, переходит на другую сторону улицы, если мальчик, пообещав, что он "больше не будет", тут же начинает опять, если у священника к моменту бракосочетания был отнят сан и если собрание освистало председателя - эти речевые акты неуспешны.

Речевой акт может быть как прямым, так и косвенным. Забавные примеры косвенных речевых актов приводит американский аналитик Дж. Серль:

(6)Должны ли вы продолжать так барабанить?

Здесь под видом вопроса говорящий совершает речевой акт просьбы не барабанить.

(7) Если бы вы сейчас ушли, это никого не обидело бы.

Здесь говорящий смягчает речевой акт, который в прямом варианте звучал бы как "Немедленно уходите!". (8) Если вы замолчите, от этого может быть только польза.

Было бы лучше, если бы вы дали мне сейчас деньги.

Нам всем было бы лучше, если бы вы немедленно сбавили тон.

В 1960-е гг. было высказано предположение - так называемая перформативная гипотеза, - в соответствии с которым все глаголы являются потенциально перформативными и все предложения представляют собой потенциальные речевые акты. Согласно этой гипотезе "невинное" предложение (5) имеет молчаливый глубинный "зачин", подразумеваемые, но непроизносимые вслух слова (пресуппозицию):

(5а) Я вижу мальчика, идущего в школу, и, зная, что тебе это интересно, сообщаю тебе: "Мальчик пошел в школу".

Если перформативная гипотеза верна, то это равносильно тому, что вся реальность поглощается языком и деление на предложение и описываемое им положение дел вообще не имеет никакого смысла (ср. философия вымысла). Это соответствует представлениям о возможных мирах и виртуальных реальностях, согласно которым действительный мир - это лишь один из возможных, а реальность - одна из виртуальных реальностей.

Список литературы

Остин Дж. Слово как действие // Новое в зарубежной лингвистике. Вып. 17. Теория речевых актов. - М., 1986.

Серль Дж. Р. Косвенные речевые акты // Там же.

Вежбицка А. Речевые акты // Там же. Вып. 16. Лингвистическая прагматика, 1985. http://lib.ru/