Сравнение информационных спектров исследуемых текстов с информационным спектром текста автобиографии

Компьютерный анализ информационных характеристик текстового учебного материала.

Выполнил: ст. гр. И-49 Матвиенко Р.Н.

Проверил: профессор кафедры ИБТКС

В.В. Котенко

Таганрог – 2011

Исходные данные.

Вербальная текстовая информация источников:

Блок («1», «Пушкинскому дому», «Скифы», )

Тургенев («отрывок Рудин», «1», «Ася»)

Пушкин («Руслан и Людмила», «Сказка о золотом петушке», «Сказка о рыбаке и рыбке»)

Достоевский («Господин Прохарчин», «Роман в 9 письмах», «Ползунков»)

Гоголь («Нос», «Шинель», «Вий»)

Задание 1. Определение информационных характеристик текстового учебного материала.

Сравнение информационных спектров исследуемых текстов с информационным спектром текста автобиографии - student2.ru

Рисунок 1 - Информационные характеристики текстовых материалов «Блок - Двенадцать»

Сравнение информационных спектров исследуемых текстов с информационным спектром текста автобиографии - student2.ru

Рисунок 2 - Информационные характеристики текстовых материалов «Блок - Пушкинскому дому»

Сравнение информационных спектров исследуемых текстов с информационным спектром текста автобиографии - student2.ru

Рисунок 3 - Информационные характеристики текстовых материалов «Блок - Скифы»

Сравнение информационных спектров исследуемых текстов с информационным спектром текста автобиографии - student2.ru

Рисунок 4 - Информационные характеристики текстовых материалов «Пушкин - Руслан и Людмила»

Сравнение информационных спектров исследуемых текстов с информационным спектром текста автобиографии - student2.ru

Рисунок 5 - Информационные характеристики текстовых материалов «Пушкин - Сказка о золотом петушке»

Сравнение информационных спектров исследуемых текстов с информационным спектром текста автобиографии - student2.ru

Рисунок 6 - Информационные характеристики текстовых материалов «Пушкин - Сказка о рыбаке и рыбке»

Сравнение информационных спектров исследуемых текстов с информационным спектром текста автобиографии - student2.ru

Рисунок 7 - Информационные характеристики текстовых материалов «Тургенев - отрывок Рудин»

Сравнение информационных спектров исследуемых текстов с информационным спектром текста автобиографии - student2.ru

Рисунок 8 - Информационные характеристики текстовых материалов «Тургенев - Один»

Сравнение информационных спектров исследуемых текстов с информационным спектром текста автобиографии - student2.ru
Рисунок 9 - Информационные характеристики текстовых материалов «Тургенев - Ася»

Сравнение информационных спектров исследуемых текстов с информационным спектром текста автобиографии - student2.ru

Рисунок 10 - Информационные характеристики текстовых материалов «Гоголь - Нос»

Сравнение информационных спектров исследуемых текстов с информационным спектром текста автобиографии - student2.ru

Рисунок 11 - Информационные характеристики текстовых материалов «Гоголь - Шинель»

Сравнение информационных спектров исследуемых текстов с информационным спектром текста автобиографии - student2.ru

Рисунок 12 - Информационные характеристики текстовых материалов «Гоголь - Вий»

Сравнение информационных спектров исследуемых текстов с информационным спектром текста автобиографии - student2.ru

Рисунок 13 - Информационные характеристики текстовых материалов «Достоевский - Господин Прохарчин»

Сравнение информационных спектров исследуемых текстов с информационным спектром текста автобиографии - student2.ru

Рисунок 14 - Информационные характеристики текстовых материалов «Достоевский - Ползунков»

Сравнение информационных спектров исследуемых текстов с информационным спектром текста автобиографии - student2.ru

Рисунок 15 - Информационные характеристики текстовых материалов « Достоевский - Роман в 9 письмах»

Таблица 1-Информационнаяемкость, энтропия и избыточность заданных текстовых учебных материалов.

Автор Произведение Инф. емкость Энтропия Избыточность
Блок Двенадцать 9,7912 3,864 5,9272
Скифы 8,6724 7,7046 0,9678
Пушкинскому дому 7,6724 7,2339 0,4385
Пушкин Руслан и Людмила 12,0771 10,9402 1,8591
Сказка о золотом петушке 9,5527 8,3389 1,2138
Сказка о рыбаке и рыбке 9,2143 7,9827 1,2316
Гоголь Вий 12,4071 10,1501 2,2573
Шинель 12,014 9,8628 2,1512
Нос 11,7932 9,6037 2,1895
Тургенев Ася 12,641 10,1981 2,3474
Рудин 12,6865 9,9683 2,5335
Один 12,8162 4,7281 7,8971
Достоевский Господин Прохарчин 12,0526 9,3946 2,658
Ползунков 11,1662 8,8081 2,358
Роман в 9 письмах 10,9031 9,2657 1,6374
Матвиенко Автобиография   8,1898 7,3282 0,8616
             

Таблица 2Диапазон изменения и средние значения информационной емкости, энтропии и избыточности заданных текстовых учебных материалов.

Автор Инф. Емкость (букву добавить) Энтропия Избыточность Среднее значение емкости Среднее значение энтропии Среднее значение избыточности Диапазон изменения емкости Диапазон изменения энтропии Диапазон изменения избыточности
Блок 9,7912 3,864 0,9272 8,712 6,2675 0,7778 8,8704 - 9,5925 3,864 – 7,7046 0,4385 – 0,9272
8,6724 7,7046 0,9678
7,6724 7,2339 0,4385
Пушкин 12,0771 10,9402 1,8591 10,281 9,087 1,435 9,2143 - 12,7993 7,9827 - 10,9402 1,2138 - 1,8591
9,5527 8,3389 1,2138
9,2143 7,9827 1,2316
Гоголь 12,4071 10,1501 2,2573 12,071 9,872 2,199 10,5718 - 12,0771 9,6037 - 10,1501 2,1512 - 2,2573
12,014 9,8628 2,1512
11,7932 9,6037 2,1895
Тургенев 12,641 10,1981 2,3474 12,715 8,298 4,259 11,0641 - 11,8162 4,7281 - 10,1981 2,3474 - 7,8971
12,6865 9,9683 2,5335
12,8162 4,7281 7,8971
Достоевский 12,0526 9,3946 2,658 11,374 9,156 2,218 10,9031 - 12,4841 8,8081 - 9,3946 1,6374 - 2,658
11,1662 8,8081 2,358
10,9031 9,2657 1,6374
Матвиенко (Автобиография) 8,1898 7,3282 0,8616 8,1898 7,3282 0,8616 8,1898 7,3282 0,8616

Задание 2. Определение коэффициентов избыточности и вербальности.

Коэффициенты избыточности и вербальности рассчитываются по результатам, полученным в задании 1, согласно формулам:

Сравнение информационных спектров исследуемых текстов с информационным спектром текста автобиографии - student2.ru

Таблица 3-Коэффициенты избыточности и вербальности.

Автор Диапазон Сравнение информационных спектров исследуемых текстов с информационным спектром текста автобиографии - student2.ru Диапазон Сравнение информационных спектров исследуемых текстов с информационным спектром текста автобиографии - student2.ru
Блок 0,1364 - 0,1648 4,9359 - 6,3333
Пушкин 0,127 - 0,1452 5,8847 - 6,87
Гоголь 0,1905 - 0,201 3,9761 - 4,2486
Тургенев 0,1714 - 0,1959 4,1048 - 4,833
Достоевский 0,1502 - 0,2112 3,7353 - 5,6588
Матвиенко (Автобиография) 0,0507 - 0,0817 1,9353 - 2,5898

Задание 3. Информационный анализ текстового учебного материала.

По результатам, полученным в задании 2 рассчитать формулы:

Сравнение информационных спектров исследуемых текстов с информационным спектром текста автобиографии - student2.ru

Сравнение информационных спектров исследуемых текстов с информационным спектром текста автобиографии - student2.ru Сравнение информационных спектров исследуемых текстов с информационным спектром текста автобиографии - student2.ru

Таблица 4-Средние значения результатов идентификации.

Автор Сравнение информационных спектров исследуемых текстов с информационным спектром текста автобиографии - student2.ru Вmax Сравнение информационных спектров исследуемых текстов с информационным спектром текста автобиографии - student2.ru В Сравнение информационных спектров исследуемых текстов с информационным спектром текста автобиографии - student2.ru В Сравнение информационных спектров исследуемых текстов с информационным спектром текста автобиографии - student2.ru В
Блок 9,3081 7,8465 0,157 5,3684
Пушкин 10,5221 9,0872 0,1364 6,333
Гоголь 11,2263 9,0223 0,1963 4,0936
Тургенев 11,5222 9,4359 0,181 4,5228
Достоевский 11,5178 9,3269 0,1902 4,2571
Автобиография 8,1898 8,1898 0,0662 2,2626

Сравнение информационных спектров исследуемых текстов с информационным спектром текста автобиографии.

Сравнение информационных спектров исследуемых текстов с информационным спектром текста автобиографии - student2.ru

Рисунок 16 – Информационные спектры «Автобиография», «Блок – Двенадцать».

Сравнение информационных спектров исследуемых текстов с информационным спектром текста автобиографии - student2.ru

Рисунок 17 - Информационные спектры «Автобиография», «Гоголь – Вий».

Сравнение информационных спектров исследуемых текстов с информационным спектром текста автобиографии - student2.ru

Рисунок 18 - Информационные спектры «Автобиография», «Достоевский – Ползунков».

Сравнение информационных спектров исследуемых текстов с информационным спектром текста автобиографии - student2.ru

Рисунок 19 - Информационные спектры «Автобиография», «Пушкин – Сказка о рыбаке и рыбке».

Сравнение информационных спектров исследуемых текстов с информационным спектром текста автобиографии - student2.ru

Рисунок 20 - Информационные спектры «Автобиография», «Тургенев – Один».

Выводы:

1. Результаты проведенных исследований показывают, что каждому источнику текстовой вербальной информации соответствует строго определенные информационная емкость, средняя энтропия, средняя избыточность, средний коэффициент избыточности и средний коэффициент вербальности. Эти значения могут использоваться в качестве идентификаторов источников.

2. Каждому источнику текстовой вербальной информации соответствует строго определенные информационная емкость, средняя энтропия, средняя избыточность, средний коэффициент избыточности и средний коэффициент вербальности. Эти значения могут использоваться в качестве идентификаторов источников.

3. Применение в качестве идентификаторов полученных значений открывает возможность многофакторной идентификации источников вербальной информации.

4. Сравнение ширины спектра показало, что у писателей все показатели текстовой вербальной информации выше, чем у меня.

Наши рекомендации