Лабораторная работа №4. Частотный анализ поэтических текстов по начальной букве
Стремительно ворвавшись в школьный курс и продолжая все глубже проникать в предметные области, информационные технологии позволяют не только по-новому взглянуть на процесс обучения, но порой дают возможность анализировать предмет, в данном случае поэзию, с новых позиций.
Рассмотрим применение информационного анализа поэтических текстов на примере произведений поэта Н.М.Рубцова.
Произведение Звезда полейпоэта Николая Рубцова (1936-1971) впервые в школьной программе встречается в учебнике по литературе для 6-го класса общеобразовательных учреждений при изучении темы Родная природа в стихотворениях поэтов XX века. Здесь же для раскрытия этой темы приводятся соответствующие тексты стихотворений А. Блока (1880-1921), С. Есенина (1895-1925) и А. Ахматовой (1889-1966) [1].
Для того чтобы научить школьников шестого класса из стихотворных текстов выделять стихи о природе, в [1] предлагается найти и прочитать другие поэтические произведения о природе поэтов - классиков и современных поэтов.
В учебнике - хрестоматии для 7-го класса [2] при раскрытии темы Тихая моя родина, наряду с произведениями В. Брюсова (1873-1924), Ф. Сологуба (1863-1927), С. Есенина и Заболоцкого (1903-1958), Николай Рубцов представлен двумя стихотворениями - Тихая моя родина, Левитан (по мотивам картины «Вечерний звон»). Анализ стихотворений уже усложняется и ученикам предлагается указать литературные приемы, с помощью которых указанные авторы передают свое настроение через стихотворения о природе.
Наконец, в хрестоматии для 11-го класса тематика стихотворений Н. Рубцова расширяется, и школьники могут ознакомиться со следующими произведениями - «В минуту музыки», «Березы», «По дороге к морю», «Звезда полей», «Под ветвями больничных берез» [3].
В старших классах на уроках литературы учеников учат производить анализ произведений как исследовательское прочтение поэтического текста.
Однако изучение творчества того или иного поэта начинается ознакомлением с его биографией, так как «личное» всегда в той или иной мере отражается в произведениях автора.
Действительно, Николай Михайлович Рубцов родился в селе Емецк Архангельской области, расположенном на берегу Северной Двины. В раннем возрасте Н. Рубцов оказался в детском доме села Никольское Тотемского района Вологодской области.
В Никольском он окончил семилетнюю школу, а затем поступил в Тотемский лесотехникум. Получив в 1952 г. паспорт, Н. Рубцов уезжает в Архангельск, из которого в сентябре 1953 г. переезжает в г. Кировск Мурманской области, где учится некоторое время в горном техникуме. В начале 1955 г. он приезжает в Ленинград и работает на одном из заводов рабочим. В этом же году он призывается на военную службу на Северный флот.
Стихи Н. Рубцов писал еще в детском доме, но в Североморске во время службы на эскадренном миноносце он вошел в среду многих пишущих матросов и офицеров. Здесь он начал печататься во флотской газете «На страже Заполярья» и в альманахе «Полярное сияние».
Впервые годы после завершения флотской службы Н. Рубцов возвратился в Ленинград, работал кочегаром, потом шахтовщиком и учился в школе рабочей молодежи. В то время он начал посещать литературное объединение при заводской газете «Кировец», а позднее познакомился со многими молодыми поэтами Ленинграда. Печатался в «Кировце», в сборнике литераторов - рабочих «Первая плавка».
В 1962 г. Рубцов приехал в Москву и поступил в Литературный институт им. М. Горького. В 1963-1964 гг. написал свои знаменитые стихотворения «Звезда полей», «Тихая моя родина...», «Я буду скакать по холмам задремавшей отчизны», «Русский огонек» и др.
Первый сборник стихов «Лирика» вышел в 1965 г. В 1967 г. выходит его книга «Звезда полей», в 1969 - «Душа хранит», в 1971 - «Зеленые цветы». Последняя из названных книг вышла в свет уже после смерти поэта.
Тот факт, что произведения Н. Рубцова вошли в школьные учебники по литературе в «окружении» русских поэтов - классиков, говорит о значимости его творчества.
Действительно, проанализируем текст его стихотворения «Березы»:
Я люблю, когда шумят берёзы,
Когда листья падают с берёз.
Слушаю – и набегают слёзы
На глаза, отвыкшие от слёз.
Всё очнётся в памяти невольно,
Отзовётся в сердце и в крови.
Станет как-то радостно и больно,
Будто кто-то шепчет о любви.
Только чаще побеждает проза,
Словно дунет ветер хмурых дней.
Ведь шумит такая же берёза
Над могилой матери моей.
На войне отца убила пуля,
А у нас в деревне у оград
С ветром и с дождём шумел, как улей,
Вот такой же жёлтый листопад…
Русь моя, люблю твои берёзы!
С первых лет я с ними жил и рос.
Потому и набегают слёзы
На глаза, отвыкшие от слёз.
(пос. Приютино, 1957)
Стихотворение "Берёзы" было написано в 1957 году, когда Николай Рубцов, проходя службу на флоте, находился в отпуске в селе Приютино Ленинградской области. Оно относится к ранней лирике, но, несмотря на относительную незрелость поэта, в стихах прослеживаются темы, которые впоследствии пройдут через все его произведения: тема Родины и тема его поколения.
Испытывая сильное влияние творчества Сергея Есенина с его "страной берёзового ситца", Рубцов соединяет образ России с картинами берёзовых рощ: "Я люблю, когда шумят берёзы…", "Русь моя, люблю твои берёзы!" Впоследствии образ "берёзовой Руси" мы встретим во многих произведениях поэта: "Счастье", "Северная берёза"(1957), "У знакомых берёз"(1968), "Под ветвями больничных берёз"(1970), "Ферапонтово"(1970), "Я умру, когда трещат берёзы"(1970).
Шум берёз и картина падающих осенних листьев вызывают у поэта щемящее чувство любви к своей родине и тоски по отчему дому: "слушаю – и набегают слёзы на глаза, отвыкшие от слёз".
Мать поэта умерла в самом начале войны, отец воевал на фронте, а после войны жил с другой семьёй. Известно, что поэт рос в детском доме, находившемся на родине его матери в селе Никольском, которое он и считал своей малой родиной. Поэтому мы видим по тексту стихотворения, что образ шумящих берёз "…отзовётся в сердце и крови", потому что - "с первых лет я с ними жил и рос".
Несмотря на то, что Николай Рубцов был сиротой при живом отце и с детства познал суровые стороны жизни, у поэта мы видим стремление быть, как все, не видеть в своей судьбе уникальности, а, напротив, отождествить её с судьбой многих детей военного времени: могила матери, "на войне отца убила пуля"… Таким образом, одиночество и страдания, вызванные отсутствием отчего крова, трансформируются, перерастая в болезненную любовь к Родине, её святыням, в способность находить счастье и удовлетворение в общении с природой как с близким человеком: "…когда шумят берёзы, когда листья падают с берёз… станет как-то радостно и больно, будто кто- то шепчет о любви."
Интересно, что использование такого приёма, как повторение слов: "шумит такая же берёза" и в последующем четверостишии: "шумел… такой же желтый листопад" даёт возможность поэту соединить несоединенные в жизни судьбы родителей, доведя тему сиротства до обобщения.
Читая стихотворение, мы ощущаем русскую душу поэта не только в открывающихся перед нами образах, но и благодаря тому, что поэт использует здесь песенный приём, характерный для русского фольклора – повторение одинаковых слов в начале и в конце текста стихотворения: "…набегают слёзы на глаза, отвыкшие от слёз". Этот приём будет часто применяться автором на протяжении всей его творческой жизни. Известно, что Николай Рубцов часто исполнял свои стихи под аккомпанемент гитары. Вероятно, отсюда и родился приём, который дает возможность придать произведению законченность, округлость, приближая к жанру народной песни.
В заключение можно сказать, что в небольшом, камерном произведении, написанном в самом начале творческого пути, мы видим рождение характерных черт, поэтических образов и приёмов, которые в дальнейшем проявятся со всей полнотой в творчестве незаурядного русского поэта, представителя "эпохи шестидесятых", приложившего много сил, "чтоб книгу Тютчева и Фета продолжить книгою Рубцова" ("Я переписывать не стану…").
Такой литературоведческий анализ несомненно содержит элемент субъективизма, и он также не позволяет дать необъективную сравнительную оценку этого стихотворения с произведениями других поэтов, тексты которых используются для раскрытия указанных ранее тем.
Покажем, что такие несубъективные оценки можно производить с помощью информационных измерений.
Известно, что впервые числовые оценки поэтического текста выполнялись известным русским математиком Марковым А.А. в начале ХХ столетия. Сущность этих оценок сводилась к следующему: из романа Пушкина А.С. «Евгений Онегин» составлялся список всех слов, например, на начальную букву «а», затем, исходя из этого списка, подсчитывалась вероятность появления всех букв русского алфавита на втором месте после буквы «а», далее на третьем месте и т.д. По такой же схеме анализировались списки слов на другие начальные буквы.
Вероятностный процесс появления букв алфавита в определенных позициях слова Марков А.А. назвал случайным процессом, начинающимся с некоторого начального состояния. В указанном случае начальное состояние – это список слов на начальную букву «а».
В настоящее время в теории массового обслуживания такие случайные процессы стали называться цепями Маркова.
Следует заметить, что при анализе указанного произведения Маркову удалось накопить такой фактический материал по так называемым вероятностям перехода, который и по сей день служит надежной экспериментальной проверкой различных теорий массового обслуживания.
После исследований Маркова А.А. интерес к информационным измерениям текстов естественного языка возобновился только с установлением Шенноном следующей формулы для приближенных вычислений количественной меры информации
, (1)
где через Pi обозначена вероятность или частота i-го события, а суммирование производится по всем значениям Рi.
Величина Н измеряется в битах и ее часто называют энтропией информации. Формулу (1) стали применять при анализе кодов, используемых при передаче сообщений, составленных на каком-либо естественном языке.
Сам Шеннон не дал строгих правил вычисления частоты рi применительно к различным ситуациям. Некоторые исследователи под рi стали подразумевать частоты появления букв алфавита в текстах естественного языка, а величину Н стали трактовать как энтропию одной буквы текста. Измерения такого толка описаны, например, в [5].
В [6] описаны информационные измерения на основе формулы (1) в текстах различных естественных языков, но для вычисления частот предложены специальные схемы по угадыванию букв неизвестного текста.
Описанные информационные измерения устанавливают числовые характеристики естественного языка, которые имеют непосредственное отношение к проблеме передачи информации по различным линиям связи.
Однако в языкознании имеется направление, в рамках которого проводятся частотные измерения, выявляющие индивидуальность стиля писателя. Например, в одинаковых по объему текстах различных писателей производится частотный анализ появления слов метаязыка русского языка [7]. Так, при идентификации авторства романа «Тихий дон» в одном из Норвежских университетов частотный анализ использовался наряду с другими экспертными оценками.
Для применения формулы (1) в частотных измерениях литературных текстов необходимо ей придать иное толкование по сравнению с толкованием в теории передачи сообщений.
Действительно, для определения количественной меры детерминированной информации используется комбинаторная формула
, (2)
связывающая длину слова m с количеством N слов этой длинны, составленных из букв двоичного алфавита. Американский исследователь Л.Хартли в 1928г. отождествил максимальное количество информации Н с длиной слова m, т. е.
, (3)
Предположим, что имеет место N слов как объем некоторой статистической выборки, состоящей из нескольких групп слов. Следуя [4], предположим, что в пределах каждой группы слова имеют одинаковую длину. Обозначим через ni объем каждой группы слов, тогда очевидно, что
По формуле (2) вычислим длину слова из группы n1, после будем иметь
, (4)
Теперь вычислим разность левых и правых частей в формулах (2) и (4):
(5)
из (5) известно, что Н1 суть длина не идентифицированных слов. Аналогично можно составить следующие соотношения
…, (6)
составим среднюю статистическую сумму
,
которую с учетом (5)-(6) перепишем так:
(7)
Если в каждой группе слов их число равно единице (n1=1) и число групп k равно N, то формула (7) переходит в формулу Хартли (3). В противном случае обозначим через рi частоту появления слов i-ой группы, которую определим общеизвестным способом
(8)
Теперь после подстановки (8) в (7), получим формулу Шеннона (1). Этот вывод формулы Шеннона впервые выполнен в [7], из которого следует, что Н есть статистическая средняя длина всех не идентифицированных слов, входящих в данную выборку N, а рi – частота, или вероятность появления этих слов.
Таблица 1
а | б | в | г | д | е | ж | з | и | к | л | м | н | о | п | р | с |
т | у | ф | х | ц | ч | ш | щ | э | ю | я |
В дальнейшем при использовании формулы (1) для расчета количественной меры информации поэтических текстов под рi будет подразумеваться частота появления слов по начальной букве русского алфавита. Процедуру такого расчета с использованием программ Microsoft Word и Microsoft Excel продемонстрируем на примере текста стихотворения Николая Рубцова «Березы». Для этого напишем программу на языке макрокоманд. Так как любая программа требует отладки, будем проводить её посредствам сравнения получающихся в процессе написания программы результатов с образцами, представленными в виде рисунков.
1. Включение компьютера и вход в систему. Результат выполнения представлен на рисунке 1.
Рис. 1.
2. Запуск программы Microsoft Word.
Результат выполнения представлен на рисунке 2.
Рис. 2.
3. Открытие документа Microsoft Word. Параметры: - имя файла: «Березы.doc». Результат выполнения представлен на рисунке 3.
Рис. 3.
4. Замена символов в документе Microsoft Word. Параметры: - заменяемый символ: « »; - заменяющий символ: «^p». Результат выполнения представлен на рисунке 4.
Рис. 4.
5. Копирование в буфер обмена Microsoft Word.
6. Запуск программы Microsoft Excel.
Параметры: - рабочий стол. Результат выполнения представлен на рисунке 5.
Рис. 5.
7. Выбор активного листа.
Параметры: - лист: «Лист1». Результат выполнения представлен на рисунке 6.
Рис. 6.
8. Вставка из буфера обмена Microsoft Excel.
Параметры: - ячейка: A1. Результат выполнения представлен на рисунке 7.
Рис. 7.
9. Автозаполнение - формула.
Параметры: - ячейка: B2; - данные: «=ЛЕВСИМВ(A1)» - конечная ячейка: B107. Результат выполнения частично представлен на рисунке 8. Рис. 8.
10. Занесение заголовка в ячейку.
Параметры: - ячейка: D1, E1, F1, G1, H1; - данные: «№ п/п», «Буква», «Кол-во», «Рi», «Pi*Log(Pi;2)». Результат выполнения частично представлен на рисунке 9.
Рис. 9.
11. Автозаполнение - нумерация.
Параметры: - ячейка 1: «D2»; - ячейка 2: «D3»;
- конечная ячейка: «D29»; - данные 1: «1»;
- данные 2: «2»; Результат выполнения частично представлен на рисунке 10. Рис. 10.
12. Занесение заголовка в ячейку.
Параметры: - ячейка: E2-E29; - данные: «Таблица1». Результат выполнения частично представлен на рисунке 11. Рис. 11.
13. Автозаполнение - формула.
Параметры: - ячейка: F2; - данные: «=СЧЁТЕСЛИ(B:B;E2)» - конечная ячейка: F29. Результат выполнения частично представлен на рисунке 12. Рис. 12.
14. Занесение заголовка в ячейку.
Параметры: - ячейка: E30, G30; - данные: «N=», «H=». Результат выполнения частично представлен на рисунке 13. Рис. 13.
15. Занесение формул в ячейку.
Параметры: - ячейка: F30; - данные: «=СУММ(F2:F29)». Результат выполнения представлен на рисунке 14. Рис. 14.
16. Автозаполнение - формула.
Параметры: - ячейка: G2; - данные: «=F2/F$30»; - конечная ячейка: G29. Результат выполнения частично представлен на рисунке 15. Рис. 15.
17. Автозаполнение - формула.
Параметры: - ячейка: H2; - данные: «=ЕСЛИ(G2=0;0;-G2*LOG(G2;2))»; - конечная ячейка: H29. Результат выполнения частично представлен на рисунке 16. Рис. 16.
18. Занесение формул в ячейку.
Параметры: - ячейка: H30; - данные: «=СУММ(H2:H29)». Результат выполнения представлен на рисунке 17. Рис. 17.
18. Активизация несвязанного диапазона ячеек.
Параметры: - диапазон ячеек 1: «D1÷E29»; - диапазон ячеек 2: «G1÷G29». Результат выполнения представлен в таблице на рисунке 18. Рис. 18.
19. Копирование в буфер обмена.
Параметры: - ячейка-цель: «Лист2!A1». Результат выполнения представлен на рисунке 19.
Рис. 19.
20. Построение диаграммы.
Параметры: - диапазон данных: «C2÷C29»; - диапазон подписей: «B2÷B29»; - тип: «гистограмма»; - вид: «обычная гистограмма»; - название оси Х: «n»; - название оси Y: «Pi»; - размещение: «в отдельном листе». Результат выполнения представлен на рисунке 20.
Рис. 20.
21. Копирование в буфер обмена.
Параметры: - диапазон-источник: «A1÷C29»; - ячейка-цель: «D1». Результат выполнения представлен на рисунке 21. Рис. 21.
22. Сортировка данных.
Параметры: - диапазон: «E2÷F29»; - тип: «по возрастанию»; - сортировка: «Pi». Результат выполнения частично представлен на рисунке 22.
Рис. 22.
23. Построение диаграммы.
Параметры: - диапазон данных: «F2÷F29»; - диапазон подписей: «E2÷E29»; - тип: «гистограмма»; - вид: «обычная гистограмма»; - название оси Х: «n»; - название оси Y: «Pi»; - размещение: «в отдельном листе». Результат выполнения представлен на рисунке 23.
Рис. 23.
24. Активизация несвязанного диапазона ячеек.
Параметры: - диапазон ячеек 1: «D1÷F1»; - диапазон ячеек 2: «не чётные строки из диапазона D2÷F29». Результат выполнения представлен в таблице на рисунке 24. Рис. 24.
25. Копирование в буфер обмена.
Параметры: - ячейка-цель: «G1».
Результат выполнения частично представлен на рисунке 25.
Рис. 25.
26. Активизация несвязанного диапазона ячеек.
Параметры: - диапазон ячеек 1: «чётные строки из диапазона D2÷F29». Результат выполнения представлен в таблице на рисунке 26. Рис. 26.
27. Копирование в буфер обмена.
Параметры: - ячейка-цель: «G16».
Результат выполнения частично представлен на рисунке 27.
Рис. 27.
28. Сортировка данных.
Параметры: - диапазон: «G16÷I29»; - тип: «по убыванию»; - сортировка: «по столбцу I». Результат выполнения частично представлен на рисунке 28.
Рис. 28.
29. Построение диаграммы.
Параметры: - диапазон данных: «I2÷I29»; - диапазон подписей: «H2÷H29»; - тип: «гистограмма»; - вид: «обычная гистограмма»; - название оси Х: «n»; - название оси Y: «Pi»; - размещение: «в отдельном листе». Результат выполнения представлен на рисунке 29.
Рис. 29.
Для нормальной кривой распределения имеют физический смысл такие характеристики, как математическое ожидание х и среднее квадратичное отклонение s. Для вычисления этих величин в математической статистике имеют место следующие формулы
;
Рассчитаем эти характеристики для чего продолжим написание программы на языке макрокоманд.
30. Автозаполнение - формула.
Параметры: - ячейка: J2; - данные: «=A2*I2»; - конечная ячейка: J29. Результат выполнения частично представлен на рисунке 30. Рис. 30.
31. Занесение формул в ячейку.
Параметры: - ячейка: J30; - данные: «=СУММ(J2:J29)». Результат выполнения представлен на рисунке 31. Рис. 31.
32. Автозаполнение - формула.
Параметры: - ячейка: K2; - данные: «=(A2-J$30)*(A2-J$30)*I2»; - конечная ячейка: K29. Результат выполнения частично представлен на рисунке 32. Рис. 32.
33. Занесение формул в ячейку.
Параметры: - ячейка: K30; - данные: «=СУММ(K2:K29)^0,5». Результат выполнения представлен на рисунке 33. Рис. 33.
Для рассматриваемого стихотворения Рубцова эти числа оказались равными =14,79245, σ =4,366936.
Проделанные вычисления показали, что Н и σ, рассчитанные по кривой нормального распределения, оказываются близкими числами. Этот результат впервые получен в [8].
В Таблице 2 представлены результаты аналогичных расчетов над произведениями упомянутых авторов. Из этой таблицы следует, что кроме стихотворения «Видения на холме», все остальные имеют близкие значения величин энтропии информации.
Отсюда можно заключить, что отобранные стихотворения для изучения в школе имеют одинаковый качественный уровень.
Следует так же заметить, что при наборе стихотворного текста на клавиатуре компьютера, к работе зрительных рецепторов подключается моторика пальцев рук. Таким образом, активизируются несколько видов памяти, зрительная, моторная и ассоциативная. Возникающие, благодаря такой работе, дополнительные связи в коре головного мозга способствуют лучшему запоминанию стихотворных текстов и их дальнейшему осмыслению.
Таблица 2.
Автор | Название (первая строка) | N | H, бит | χ | σ |
Рубцов Н.М. | Березы | 4,116325 | 14,79245 | 4,366936 | |
Звезда полей | 3,847908 | 14,69136 | 3,667145 | ||
Тихая моя родина | 4,147141 | 14,70874 | 4,434269 | ||
Левитан | 3,763646 | 14,77083 | 3,536945 | ||
По дороге к морю | 4,231303 | 14,82569 | 4,717417 | ||
Видения на холме | 4,215583 | 14,74138 | 4,59345 | ||
Под ветвями больничных берез | 3,925454 | 14,66667 | 3,94888 | ||
В минуты музыки | 3,821215 | 14,76364 | 3,712209 | ||
А. Блок | Летний вечер | 3,721077 | 14,66 | 3,332327 | |
С. Есенин | Мелколесье. Степь и дали | 4,23653 | 14,65657 | 4,776122 | |
А. Ахматова | Перед весной бывают дни такие | 3,534892 | 14,82927 | 2,912567 | |
Б. Сологуб | Забелелся туман за рекой | 3,838506 | 14,83019 | 3,622445 |
По описанной выше схеме произведены расчеты сорока пяти стихотворений Николая Рубцова. Результаты этих расчетов систематизированы в таблице 3.
Таблица 3
№ | Названия стихотворения | Н бит | Число начальных букв с нулевыми частотами | Количество слов в стихотворении | Частоты слов на начальные буквы | ||
в | н | с | |||||
Элегия | 3,6294 | 0,0714 | 0,1 | 0,1 | |||
Ось | 4,0043 | 0,0349 | 0,0349 | 0,0349 | |||
На вокзале | 3,9064 | 0,144 | 0,08 | 0,072 | |||
Весна на берегу Бии | 4,0055 | 0,1145 | 0,0763 | 0,1069 | |||
Прощальная песня | 4,0215 | 0,0714 | 0,1264 | 0,1099 | |||
В лесу | 3,1878 | 0,119 | 0,0833 | 0,1905 | |||
Ветер всхлипывал словно дитя | 3,895 | 0,0811 | 0,054 | 0,126 | |||
У церковных берез | 3,9637 | 0,0923 | 0,0692 | 0,0615 | |||
В московском кремле | 7,1349 | 0,2143 | 0,2142 | 0,5357 | |||
Поэзия | 3,4573 | 0,1061 | 0,0682 | 0,1061 | |||
Сентябрь | 3,7171 | 0,0484 | 0,1613 | 0,129 | |||
По дороге к морю | 8,2939 | 0,3333 | 0,1 | 0,2333 | |||
Стоит жара | 4,0368 | 0,0877 | 0,0526 | 0,1754 | |||
Плыть, плыть | 6,4871 | 0,1429 | 0,3214 | 0,2143 | |||
Волнуется море | 4,1101 | 0,1449 | 0,058 | 0,1014 | |||
Гость молчит и я ни слова | 3,7901 | 0,1013 | 0,0886 | 0,1138 | |||
В пустыне | 3,7915 | 0,0909 | 0,039 | 0,1299 | |||
Увлекаюсь нечаянно | 3,4473 | 0,02 | 0,04 | 0,08 | |||
В горной деревне | 4,0075 | 0,075 | 0,05 | 0,1125 | |||
Мечты | 3,7149 | 0,2027 | 0,1351 | 0,0676 | |||
Видения на холме | 4,2156 | 0,1034 | 0,0862 | 0,0632 | |||
Грани | 4,0147 | 0,0714 | 0,1286 | 0,1143 | |||
По мокрым скверам проходит осень | 3,8397 | 0,0753 | 0,0968 | 0,1505 | |||
В полях смеркалось. Близилась гроза | 3,6658 | 0,0615 | 0,0615 | 0,0462 | |||
Привет Россия | 3,9456 | 0,1053 | 0,0877 | 0,1053 | |||
В горнице | 3,8638 | 0,1053 | 0,0877 | 0,1403 | |||
Родная деревня | 4,1048 | 0,0606 | 0,0606 | 0,0455 | |||
Вологодский пейзаж | 4,1059 | 0,1094 | 0,0469 | 0,1016 | |||
Далекое | 7,1822 | 0,3214 | 0,1786 | 0,4286 | |||
На вокзале | 3,7422 | 0,1382 | 0,0732 | 0,065 | |||
Старик | 3,7852 | 0,099 | 0,0693 | 0,0396 | |||
Сапоги мои - скрип да скрип | 3,8066 | 0,064 | 0,048 | 0,072 | |||
Памяти матери | 3,87 | 0,1309 | 0,0833 | 0,1905 | |||
В сибирской деревне | 4,0113 | 0,1111 | 0,0778 | 0,1333 | |||
Зимним вечерком | 3,9955 | 0,1 | 0,0667 | 0,05 | |||
Меж болотных стволов красовался восток огнеликий | 3,9847 | 0,186 | 0,059 | 0,098 | |||
Синенький платочек | 3,9445 | 0,1149 | 0,069 | 0,1724 | |||
Острова свои оберегаем | 3,9407 | 0,1196 | 0,0652 | 0,0761 | |||
А между прочим осень на дворе | 4,0818 | 0,1405 | 0,0577 | 0,0992 | |||
Есть пора - души моей отрада | 4,2165 | 0,0633 | 0,0886 | 0,0506 | |||
Старый конь | 3,9524 | 0,1389 | 0,0278 | 0,0694 | |||
Прекрасное небо голубое | 4,0479 | 0,0543 | 0,0326 | 0,0326 | |||
На реке Сухоне | 3,6389 | 0,1071 | 0,1607 | 0,1429 | |||
Добрый Филя | 3,9008 | 0,0357 | 0,0179 | 0,0714 | |||
Оттепель | 3,7292 | 0,0265 | 0,0177 | 0,0531 |
Анализ данных этой таблицы показывает, что количественная мера информации Н различна для каждого произведения и ее числовые значения для стихов Рубцова изменяются в довольно широких пределах. Все это означает, что числовые значения Н отражают литературные достоинства поэтических текстов.
Из таблицы 3 так же следует, что в стихах Рубцова частота появления слов на букву «в» лежит в приделах: 0,02≤р≥0,2143; соответственно на букву «н» – 0,0177≤р≥0,3214; и наконец на букву «с» –0,0349≤р≥0,5357.
Таблица 3 позволяет установить еще один из математических критериев, характеризующий индивидуальность творчества Н.Рубцова. Для этого изучим зависимость между энтропией информации Н и количеством слов в стихотворении N.
На плоскости НN построим совокупность точек, отражающих эту зависимость. Для этого в Excel набираем таблицу соответствия Н и N, заполняя столбцы А и В. Затем выделяем полученную таблицу и щелкаем на кнопке Мастер диаграмм. В открывшемся окошке выбираем точечную диаграмму и щелкаем на кнопке Далее. В шаге 3 называем ось х – Н, а ось y – N, на вкладке легенда убираем галочку Добавить легенду. В шаге 4 щелкаем мышью на слове «отдельном» и щелкаем на кнопке Готово.
Для дальнейших расчетов с использованием мастер-функции программы Excel переобозначим: y=H, x=N. Проверяем, связаны ли величины Н и N линейной зависимостью, т.е. имеет ли место функциональная зависимость. Для этого щелкаем правой клавишей мыши на одной из точек диаграммы. В открывшемся меню выбираем пункт – Добавить линию тренда. На вкладке Параметры ставим галочку около слов – Показывать уравнение на диаграмме и щелкаем на кнопке Ок. Чтобы придать диаграмме более удобный для просмотра вид делаем двойной щелчке на одной из осей диаграммы. В открывшемся окне выбираем вкладку Шкала и выставляем минимальное и максимальное значение так, чтобы данные занимали всю область построения диаграммы. Тоже самое делаем и для другой оси. В результате получится диаграмма, показанная на рис. 34.
Рис. 34
Из рис. 34 становится очевидным, что между величинами Н и N нет функциональной зависимости. Степень отличия реальной связи между Н и N от линейной в математической статистики устанавливается так называемым коэффициентом корреляции r.
Возможности программы Excel позволяют вычислить эту величину. Для этого возвращаемся на лист с таблицей данных. Щелкаем в свободной ячейке и щелкаем на кнопке Мастер функций. В категории Статистические выбираем функцию КОРРЕЛ и щелкаем на кнопке Ок. в открывшемся окошке в графе Массив1 вводим - A2:A46, в графе Массив2 вводим - B2:B46 и нажимаем кнопку Ок. Получившееся в ячейке число и есть коэффициент корреляции.
Оказалось, что для произведений Н.Рубцова коэффициент корреляции r оказался равным 0,175974. полученное таким образом значение r и есть еще один критерий индивидуальности творчества данного поэта.