Місце проходження практики Кафедра прикладної лінгвістики Інституту комп’ютерних наук та інформаційних технологій Національного університету “Львівська політехніка”. Джерела пошуку матеріалів Дипломні роботи студентів спеціальності “прикладна лінгвістика” вимагають використання літератури як філологічного так і комп’ютерного спрямування. Основними джерелами стали періодичні видання, монографії та словники, які дають інформацію про теоретичну граматику англійської мови та основи комп’ютерної та прикладної лінгвістики. Потрібну літературу можна знайти в бібліотеці іноземних мов, у львівській науковій бібліотеці ім. В. Стефаника, бібліотеці Національного університету ім. Івана Франка та Національного університету “Львівська політехніка”. На сучасному етапі розвитку інформації невід’ємним джерелом пошуку також стає всесвітня мережа Інтернет, де можна знайти найновішу та досить достовірну інформацію. Методи дослідження Для опрацювання матеріалу дослідження застосовано такі методи: описовий метод – для виділення одиниць аналізу; метод дистрибутивного аналізу – для членування виділених одиниць з метою їхнього аналізу, класифікації та інтерпретації для використання отриманих даних під час формалізованого опису синтаксичних структур з прийменниковими зв’язками; метод моделювання – для побудови формальних моделей. Крім цього, використано елементи кількісного аналізу з метою встановлення частоти моделей досліджуваних структур і їхніх компонентів та співвідношення між отриманими показниками. Досягнення поставленої мети та вирішення конкретних завдань дослідження ґрунтується на загальних положеннях структурного методу. Це метод синхронного аналізу мовних явищ лише на основі зв’язків і відношень між мовними елементами, який використовується для встановлення структури мови і систематизації її одиниць (за М.П.Кочерганом). Структурний метод полягає у вивченні мови як цілісної функціональної структури, елементи й частини якої співвіднесені й пов’язані строгою системою лінгвальних відношень. Такий підхід до вивчення мови не тільки доцільний, а й необхідний, оскільки спрямований на вивчення внутрішньої організації самого механізму мови. Структурний метод реалізується в таких чотирьох методиках: - дистрибутивній; - безпосередніх складників; - трансформаційний; - компонентного аналізу. Дистрибутивний аналіз – методика дослідження мови на основі оточення (дистрибуції, розподілу) окремих одиниць в тексті. Можливість використання дистрибутивної методики при аналізі мовних явищ виходить із розуміння, що кожна мовна одиниця має своє особливе оточення, тобто в дистрибутивних властивостях мовної одиниці реалізуються її внутрішні властивості, які відображають її функціональну роль. Немає двох одиниць, оточення яких би повністю збігалося. Навіть коли дві одиниці абсолютно однаково звучать, то вони иають різне сусідство. На основі аналізу дистрибуції мовних елементів виділяють дистрибутивні класи. Існує таке дистрибутивне правило:якщо два елементи перебувають в одному й тому самому оточенні, то вони належать до одного класу. Дистрибутивний аналіз може бути використаний для аналізу мовних одиниць будь-якого рівня. За його допомогою можна встановлювати систему фонем і морфем будь-якої мови, значення полісемічних слів, семантичну відстань між словами певної лексико-семантичної категорії тощо. Дистрибутивний аналіз ставить такі завдання, тобто послідовні етапи аналізу: - сегментація тексту (мовленнєвого потоку) на одиниці певного рівня (звуки, морфи, слова тощо); - ідентифікація виділених одиниць, тобто об’єднання їх у певні класи (фонеми, морфеми, лексеми тощо); - виявлення відношень між виділеними класами. Існує три типи дистрибуції: доповняльна, контрастна та вільного варіювання. Це розрізнення дуже важливе для ідентифікації досліджуваних мовних одиниць. Мовні одиниці знаходяться у відношенні доповняльної дистрибуції, коли кожна з них трапляється в такій сукупності контекстів, у якій не трапляється жодна з інших, тобто коли мовні одиниці не трапляються в однакових оточеннях. Якщо ж мовні одиниці перебувають у тих самих оточення і при цьому розрізняють їх значення, то вони знаходяться в контрастній дистрибуції. Коли ж певні мовні одиниці трапляються у тому самому оточенні при цьому не розрізняють форм слів або значень, то вони знаходяться у стані вільного варіювання. Отже, дистрибутивний аналіз дає змогу точніше й об’єктивніше вивчати й описувати мовні явища. Оскільки результати цього аналізу можна формалізувати, то вони можуть бути інтерпретовані мовою математики. Практичного застосування дистрибутивний аналіз набуває не тільки у лінгвістичних дослідженнях, а й у машинному перекладі (перш ніж перекласти речення з багатозначним словом чи омонімами, машина на основі їх оточення повинна визначити значення цих неоднозначних форм), а також у методиці викладання мов у вищій і середній школі. Опис програмного продукту Метою роботи є побудувати всі можливі моделі зв’язків для прийменників of, in і to у синтаксичній структурі англійського речення, описати та проаналізувати їх, для того, щоб створити повну базу даних таких зв’язків, та визначити частотність моделей. Отримана інформація стане основою для алгоритмічних правил пошуку отриманих моделей в тексті, що може стати корисною частиною для модулів автоматичного перекладу. Побудова формальних моделей текстових даних є сферою, що лежить на межі між власне теоретичною лінгвістикою і прикладним дослідженням. Нові аспекти прикладного мовознавства пришвидшили вже розпочате проникнення у теоретичне мовознавство математичних методів, особливо теоретично-множинних, формально-логічних, статистико-ймовірнісних. Структурна та математична лінгвістики, що є ядром сучасного прикладного мовознавства, розробляють і вдосконалюють структурні та формальні методи аналізу і опису мови. Оскільки прийменник належить до найуживаніших граматичних класів англійської мови і відіграє в синтаксичній структурі речення роль одного з основних організаторів відношень і підпорядкувань, то дослідження його функціонування в реченні та формалізація його відношень є дуже важливою. В українському мовознавстві вже є спроби комплексного опису граматичних, позиційних та семантичних характеристик компонентів зон прийменникових зв’язків з метою побудови алгоритму їх виявлення в тексті (О.В.Бугаков). Моделі прийменникових зв’язків будувалися за таким зразком, зручним для використання у роботі з комп’ютером: In fact, for the first fifteen years of working here, I have to say I used that method. <Npl> <of> <VERBing> It's one that many of the younger porters in this town still employ. <Npl> <in> <PNdem> <Nsg> But just now, unfortunately, he's had to go to an important meeting. <VERBinf> <to> <an> <ADJpos> <Nsg> Для створення програмного продукту використовується програмне середовище Borland Delphi. Delphi – це програмне середовище візуального програмування і створення як додатків клієнт/сервер, так і загальних додатків для Windows. Це система швидкого розроблення додатків для Windows, так звана система RAD (Rapid Application Development). Delphi об’днує у єдиному середовищі високопродуктивний компілятор з мовою Object Pascal, візуальні механізми програмування, інструмент створення додатків-клієнтів для роботи з різними локальними і вилученими базами даних. Основою Delphi є графічне середовище розроблення додатків, яке називається інтегрованим середовищем розроблення (Integrated Development Environment, IDE ). Delphi, як і всяке сучасне середовище розроблення додатків засноване на об’єктно-орієнтованому програмуванні. В основі Delphi лежить об’єктно-орієнтоване програмування мовою Pascal, що Borland називає Object Pascal. Це доповнена (причому істотно) і змінена версія Borland Pascal 7.0. Завданням практичної частини дипломної роботи є побудова автоматичної програми аналізу досліджуваних синтаксичних структур з використанням середовища Delphi. Основу алгоритму такої програми складатимуть формальні моделі синтаксичних конструкцій англійської мови з прийменниковими зв’язками. Формальні моделі будуватимуться, беручи до уваги набір компонентів, які входять в ту чи іншу структуру, і залежать від певного прийменника, їхні формальні ознаки та функціональні характеристики; враховуватиметься також і частота моделей досліджуваних структур. Застосування такої програми вбачаємо корисним як додатковий модуль, що оптимізуватиме роботу машинних перекладацьких програм. Список використаної літератури: 1. Бугаков О.В. Зони прийменникових зв’язків у синтаксичній структурі українського речення // Мовознавство. – 2005. – №5. – С.75-87. 2. Ильиш Б.А. Строй современного английского языка. – Л.: Просвещение, 1971. – 366 с. 3. Кочерган М.П. загальне мовознавство. – К.: Видавничий центр “Академія”, 2003. – 442с. 4. Лингвистический энциклопедический словарь / Гл. ред В.Н.Ярцева. – М.: Советская энциклопедия, 1990. – 682 с. 5. Марчук Ю.Н. Основы компьютерной лингвистики. – М.: Изд-во МПУ “Народный учитель”, 2000. – 226 с. 6. Откупщикова М.И. Моделирование языка // Прикладное языкознание: Учеб. / Л.В.Бондарко, Л.А.Вербицкая, Г.Я.Мартыненко и др.; Отв. ред. А.С.Герд. – СПб.: Изд-во С.-Петербург. ун-та, 1996. – С.100-112. 7. Chomsky N. Syntactic Structures / with an introd. by D.W.Lightfoot. – 2-d ed. – Berlin; N.Y.: Mouton de Gruyter, 2002. – 117 p. 8. Ishiguro Kazuo. The Unconsoled. – L.-Boston: Faber and Faber Ltd., 1995. – 535 p. 9. www.clres.com 10. www.duboiscl.org 11. www.edict.com 12. www.eecs.umich.edy Abstract The theme of the diploma paper is Modeling of Prepositional Links in the Syntactic Structure of the English Sentence. The topicality of the theme is determined by the necessity of the formalized description of the syntactic structures, namely the prepositional syntactic structures of the modern English language, for further use of the received formal models in the programs of automatic language processing. The object of research are the syntactic structures of the English sentence with prepositional links. The subject of research is the analysis of the structural and functional characteristics as well as the components of the syntactic structures with prepositional links of the modern English language. The main goal of the pre-diploma internship is to gather and analyze theoretical material concerning linguistic modeling, text analysis, as well as those concerning the syntactic role of prepositions in the English sentence. The aim is to fully analyze the phrases, which include the three most frequently used prepositions in English, namely of, in, and to. The steps of the research include the following: - to find all possible models of prepositional links as well as to describe and analyze them; - to create a comprehensive database of all links of the given prepositions; - to determine the frequency of structural models of prepositional links, which would be used in creating the algorithmic rules. The modern English language has no developed case system in its nominal parts of speech and that is why the prepositions are very important for the sentence structure. When generalized, the function of the prepositions is defined as expressing the relations between words in a sentence. However, we would like to go deeper into the subject of the syntactical functions of prepositions. On the sentence level: a preposition is never a part of a sentence by itself; it enters the part of sentence whose main center is the subsequent noun or pronoun, or gerund. The prepositions do not connect parts of a sentence, but they stand within these parts. Depending on the aspect of reproduction models are divided into functional, structural and mixed. The structural models show the structure of the object being modeled, i.e. its important elements within the system of their relations. The functional models represent the object’s behavior in the society, and the mixed models include both aspects. Reproducing the structure of prepositional phrases we will deal with the structural models. We consider prepositions within the syntactic structure of the sentence, thus it is necessary to build models, which would be suitable for syntactic analysis according to parts of speech and members of sentence. This way of analysis is the most widespread for the systems that are practically in use. The research includes using distributional analysis. Distributional analysis is used for the text segmentation. This is an important step for unit identification, that is, distributing the units into classes and defining the relations among the latter. The created algorithm of finding such prepositional links in the text would be a useful part of automated language processing modules and may be used for machine translation. The software used for the practical part of the diploma paper is Borland Delphi. Borland Delphi is an object-oriented, visual programming environment to develop 32-bit applications for deployment on Windows and Linux. Using Delphi, it is possible to create highly efficient applications with a minimum of manual coding. Delphi provides a suite of Rapid Application Development (RAD) design tools, including programming wizards and application and form templates, and supports object-oriented programming with a comprehensive class library. The place of the pre-diploma internship is Department of Applied Linguistics, Institute of Computer Sciences and Informational Technologies of Lviv Polytechnic National University. All the necessary literature concerning both theoretical and practical parts of the diploma paper can be found in libraries and the Internet. A substantial number of the scientific articles, monographs, books in the grammar of the English language, linguistic modeling and text analysis have been gathered and worked on. |