Розвиток та становлення статистичної лінгвістики як науки
Прикладні аспекти статистичної лінгвістики. Психолінгвістика.
1. Проблематика статистичної лінгвістики з теоретичного та прикладного поглядів.
2. Основні галузі використання структурно-ймовірнісної моделі мови.
3. Психолінгвістика як практичне застосування лінгвістики
Література
Перебийніс В. С. Статистичні методи для лінгвістів: посібник.— Вінниця: "Нова книга", 2002.— О. 9-60.
Виноградов В.В. Лингвистические основы научной критики текста // ВЯ 1958 №2,3.
Виноградов В.В. Проблема авторства и теория стилей. М. 1961.
Марусенко М.А. Атрибуция анонимных и псевдонимных текстов методами прикладной лингвистики // Прикладное языкознание. СПб, 1996.
Минимально-необходимые статистические инструменты / Ошибки наблюдения и определение объема выборок из текста // Головин Б. Н Язык и статистика.— М: Наука, 1971.— С. 19-28; 50-62.
Носенко И. А.Начала статистики для лингвистов.— М.: Высшая школа, 1981.—157 с.
Пиотровский Р.Г., Бектаев К.Б., Пиотровская А.А. Математическая лингвистика. М. 1977.
Шайкевич А.Я. Дистрибутивно-статистический анализ в семантике // Приципы и методы семантических исследований. М. 1976.
Шайкевич А.Я. Количественные методы // Лингвистический энциклопедический словарь. М. 1990.
Психолінгвістика
Величковский Б. М. Когнитивная наука и психологические проблемы изучения интеллекта // Компьютеры и познание: очерки по когитологии. – М.: Наука, 1990. – С. 6–21.
Залевская А. А. Введение в психолингвистику. – М.: Российск. гос. гуманит. ун-т, 2000. – 382 с.
Залевская А. А. Перевод как моделирование и моделирование перевода // Проблемы семантики: Психолингвистические исследования. – Тверь, 1991. – С. 69–82.
Залевская А. А. Психолингвистический подход к проблеме концепта // Методологические проблемы когнитивной лингвистики / Под ред. И. А. Стернина. – Воронеж: ВГУ, 2001. – С. 36–44.
Петренко В. Ф. Основы психосемантики: Учеб. пособ. – М.: Изд-во Моск. ун-та, 1997. – 400 с.
Солсо Р. Когнитивная психология. – СПб.: Питер, 2002. – 592 с.
Фрумкина Р. М. Цвет, смысл, сходство (аспекты психолингвистического анализа). – М.: Наука, 1984. – 175 с.
Назва статистична лінгвістика є достатньо умовною, хоча достатньо широко використовується в сучасній науковій літературі. Ця назва характеризує міждисциплінарний напрямок у прикладних дослідженнях, у яких основним інструментом вивчення мови використовуються кількісні чи статистичні методи аналізу. Іноді статистичну (чи кількісну чи квантитативну лінгвістику) протиставляють комбінаторній лінгвістиці. В останній домінантну роль посідає «некількісний» математичний апарат – теорія множин, математична логіка, теорія алгоритмів тощо.
Розвиток та становлення статистичної лінгвістики як науки
Статистична лінгвістика виокремилася порівняно недавно, однак кількісні та статистичні методи до мови та мовлення застосовували тисячі років тому. Ще в античному світі (III ст. до н. є.) для творчості Гомера олександрійські граматики підраховували слова для визначення тих, які грапляться всього один раз протягом усього твору. Це робили, звичайно, вручну, а не автоматично, як тепер.
Середньовіччя (V-XV ст.) відоме особливою увагою до сакральних гекстів, зокрема, Біблії. Із метою узгодження різних текстів та перекладів (Святого Письма ерудити укладали повні списки його слів зі всіма випадками їхнього використання у конкретному тексті.
У XVII ст. з'явилася праця, що аналізує розподіл слів у грецькому перекладі Нового Заповіту методом, який майже не відрізняється від сучасного.
У XIX ст. укладають латинські та грецькі словопокажчики, а також за допомогою до статистичної лінгвістики звертається стенографія — швидкий дослівний запис усного мовлення за допомогою системи спеціальних умовних знаків, а також шляхом скорочення найчастотніших буквосполучень, слів, словосполучень, виразів. Одним з перших випадків стенографії вважають т.зв. Тіронські ноти, якими вільновідпущеник Тірон записував промови римського оратора Ціцерона.
Для вдосконалення системи стенографії первісно був призначений і частотний словник німецької мови Кедінґа (його уклали на матеріалі 11 млн. слів 6000 співробітників), виданий у Берліні 1898 р. А 1916 р. опубліковані "стенографічні гами" Ж. Есту, в яких встановлено винятково важливу залежність між частотою слова та його рангом.
Новим поштовхом до розвитку статистичної лінгвістики стало зростання популярності вивчення іноземних мов у середині XIX-поч. XX ст. Педагоги-лінгводидакти зрозуміли, що повністю оволодіти мовою за декілька років при декількох годинах занять на тиждень неможливо, тому вирішили обмежити словник найбільш частотними словами. Вирішення цієї проблеми зумовило появу багатьох словників основної лексики спочатку для англійської, а згодом і для німецької, французької та інших мов. Р. Елрідж, керівник невеликої фабрики, за 2 роки опрацював 250 статей загальною довжиною 44 000 слововживань і 1911р. видав "Шість тисяч загальновживаних англійських слів" для своїх робітників-емігрантів, що вивчають англійську мову. У 1920 р. Кеністон уперше вказав на те, що важливість слова пов'язана не лише із його частотністю, а й з тим, наскільки вживання слова пов'язане із певним колом текстів, тобто в якому із функційних стилів воно трапляється.
У 1928 р. побачив світ "Німецький частотний словник" (German frequency Word Book) Морґана, роком пізніше — "Німецький словник ідіом" (A German Idiom List) Xayxa, у цьому руслі також працювали науковці Пфеффер та Веґлер. Також з'явився "Порівняльний частотний словник першої тисячі слів англійської, французької, німецької та іспанської мов" (Comparative Frequency list on the First Thousand words in English, French, German and Spanish) Ітона,де наведено 1000 найчастотніших слів названих чотирьох європейських мов.
Увійшов в історію англійський мовознавець та педагог Палмер, що відібрав три тисячі слів, які дають змогу розуміти 95% тексту.
Під час воєн зростає потреба передати інформацію так, щоб її не міг зрозуміти противник. Тому посилилася увага до криптографії— науки про зашифровування та розшифрування повідомлень, "ламання кодів".
Справжній "вибух" статистичних досліджень відбувся з появою комп'ютерів. Вони уможливили максимальне спрощення механічної роботи, такої, наприклад, як карткування. Якщо раніше для обчислення кількості слововживань у тексті їх треба було рахувати "вручну", то зараз, перевівши текст в електронний вигляд, наприклад, за допомогою програми MicroSoftWord ці дані можна отримати автоматично (опція файл/властивості/статистика/ слова). Також використовують комп'ютерні програми автоматичної лематизації (зведення словоформ до початкової форми), можливості автоматичного сортування та пошуку слів, їх частин тощо.
Сьогодні лінгвостатистичні дослідження здійснюють у кожній країні з добре розвинутим мовознавством: Німеччині, Австрії, США, Австралії, Чехії, Словаччині, Польщі, Росії тощо. Функціонують міжнародні товариства та журнали: IQLA (International Quantitative Linguistics Association), Journal of Quantitative Linguistics, серія "Quantitative Linguistics".
Суттєвий внесок у розвиток цієї галузі мовознавства зробили Gabriel Altmann, Reinhard Kohler (Німеччина), Peter Grzybek (Австрія), Geiza Wimmer (Словаччина), Adam Pawlowski, Jadwiga Sambor (Польща), Валентина Перебийніс, Наталія Дарчук (Україна), Юхан Тулдава (Естонія), Раймунд Пиотровский (Росія) та ін.
Лінгвостатистичні дослідження в Україні почалися з 50-х pp. XX ст. Спочатку вони стосувалися відбору лексичного мінімуму іноземних мов, згодом сфера їх застосування значно розширилася. Зокрема, 1963 р. в Інституті мовознавства ім. О. О. Потебні АН УРСР організовано групу структурно-математичної лінгвістики, яка започаткувала планомірне статистичне дослідження українських текстів художнього, науково-технічного та соціально-політичного функціональних стилів, зокрема, виявлено їхні статистичні параметри. Результатом цього стилеметричного дослідження стали зокрема монографії та збірники "Статистичні та структурні лінгвістичні моделі" (К., 1966), "Статистичні пераметри стилів" (К., 1967), Перебийніс В. С. "Кількісні та якісні характеристики фонем сучасної української літературної мови" (К., 1970), "Структура мови та статистика мовлення" (К., 1974).
Досягнення наступного проекту — опис сполучуваності англійських іменників, прикметників та дієслів, у реалізації якого брали участь викладачі 42 вищих навчальних закладів колишнього Радянського Союзу — опубліковано в "Довіднику найбільш уживаних англійських словосполучень" за редакцією В. Перебийніс (М., 1986). Системні функційні характеристики словозмінної парадигми англійського дієслова, описані мовознавцями, доступні як в паперовому ("Методичні рекомендації з вивчення системних і функціональних характеристик словозмінних форм англійського дієслова", К., 1993), так і в електронному вигляді ("English conjugation: System and Functioning".CD-ROM, 2004).
Ще один великий проект, розпочатий ще у 60-х pp. XX ст. — укладання серії частотних словників: художньої прози, драми, поезії, публіцистики, наукової прози — триває; зокрема, залучено лабораторію комп'ютерної лінгвістикиКиївського національного університету імені Тараса Шевченка.
Центрами лінгвостатистичних досліджень, окрім названих, також можна вважати Київський національний лінгвістичний університет, Чернівецькийуніверситет імені Юрія Федьковича, Львівський національний університет імені Івана Франка, Національний університет «Львівська політехніка» та ін.