Сравнение информационных спектров исследуемых текстов с информационным спектром текста автобиографии
Компьютерный анализ информационных характеристик текстового учебного материала.
Выполнил: ст. гр. И-49 Матвиенко Р.Н.
Проверил: профессор кафедры ИБТКС
В.В. Котенко
Таганрог – 2011
Исходные данные.
Вербальная текстовая информация источников:
Блок («1», «Пушкинскому дому», «Скифы», )
Тургенев («отрывок Рудин», «1», «Ася»)
Пушкин («Руслан и Людмила», «Сказка о золотом петушке», «Сказка о рыбаке и рыбке»)
Достоевский («Господин Прохарчин», «Роман в 9 письмах», «Ползунков»)
Гоголь («Нос», «Шинель», «Вий»)
Задание 1. Определение информационных характеристик текстового учебного материала.
Рисунок 1 - Информационные характеристики текстовых материалов «Блок - Двенадцать»
Рисунок 2 - Информационные характеристики текстовых материалов «Блок - Пушкинскому дому»
Рисунок 3 - Информационные характеристики текстовых материалов «Блок - Скифы»
Рисунок 4 - Информационные характеристики текстовых материалов «Пушкин - Руслан и Людмила»
Рисунок 5 - Информационные характеристики текстовых материалов «Пушкин - Сказка о золотом петушке»
Рисунок 6 - Информационные характеристики текстовых материалов «Пушкин - Сказка о рыбаке и рыбке»
Рисунок 7 - Информационные характеристики текстовых материалов «Тургенев - отрывок Рудин»
Рисунок 8 - Информационные характеристики текстовых материалов «Тургенев - Один»
Рисунок 9 - Информационные характеристики текстовых материалов «Тургенев - Ася»
Рисунок 10 - Информационные характеристики текстовых материалов «Гоголь - Нос»
Рисунок 11 - Информационные характеристики текстовых материалов «Гоголь - Шинель»
Рисунок 12 - Информационные характеристики текстовых материалов «Гоголь - Вий»
Рисунок 13 - Информационные характеристики текстовых материалов «Достоевский - Господин Прохарчин»
Рисунок 14 - Информационные характеристики текстовых материалов «Достоевский - Ползунков»
Рисунок 15 - Информационные характеристики текстовых материалов « Достоевский - Роман в 9 письмах»
Таблица 1-Информационнаяемкость, энтропия и избыточность заданных текстовых учебных материалов.
Автор | Произведение | Инф. емкость | Энтропия | Избыточность | ||
Блок | Двенадцать | 9,7912 | 3,864 | 5,9272 | ||
Скифы | 8,6724 | 7,7046 | 0,9678 | |||
Пушкинскому дому | 7,6724 | 7,2339 | 0,4385 | |||
Пушкин | Руслан и Людмила | 12,0771 | 10,9402 | 1,8591 | ||
Сказка о золотом петушке | 9,5527 | 8,3389 | 1,2138 | |||
Сказка о рыбаке и рыбке | 9,2143 | 7,9827 | 1,2316 | |||
Гоголь | Вий | 12,4071 | 10,1501 | 2,2573 | ||
Шинель | 12,014 | 9,8628 | 2,1512 | |||
Нос | 11,7932 | 9,6037 | 2,1895 | |||
Тургенев | Ася | 12,641 | 10,1981 | 2,3474 | ||
Рудин | 12,6865 | 9,9683 | 2,5335 | |||
Один | 12,8162 | 4,7281 | 7,8971 | |||
Достоевский | Господин Прохарчин | 12,0526 | 9,3946 | 2,658 | ||
Ползунков | 11,1662 | 8,8081 | 2,358 | |||
Роман в 9 письмах | 10,9031 | 9,2657 | 1,6374 | |||
Матвиенко | Автобиография | 8,1898 | 7,3282 | 0,8616 | ||
Таблица 2–Диапазон изменения и средние значения информационной емкости, энтропии и избыточности заданных текстовых учебных материалов.
Автор | Инф. Емкость (букву добавить) | Энтропия | Избыточность | Среднее значение емкости | Среднее значение энтропии | Среднее значение избыточности | Диапазон изменения емкости | Диапазон изменения энтропии | Диапазон изменения избыточности |
Блок | 9,7912 | 3,864 | 0,9272 | 8,712 | 6,2675 | 0,7778 | 8,8704 - 9,5925 | 3,864 – 7,7046 | 0,4385 – 0,9272 |
8,6724 | 7,7046 | 0,9678 | |||||||
7,6724 | 7,2339 | 0,4385 | |||||||
Пушкин | 12,0771 | 10,9402 | 1,8591 | 10,281 | 9,087 | 1,435 | 9,2143 - 12,7993 | 7,9827 - 10,9402 | 1,2138 - 1,8591 |
9,5527 | 8,3389 | 1,2138 | |||||||
9,2143 | 7,9827 | 1,2316 | |||||||
Гоголь | 12,4071 | 10,1501 | 2,2573 | 12,071 | 9,872 | 2,199 | 10,5718 - 12,0771 | 9,6037 - 10,1501 | 2,1512 - 2,2573 |
12,014 | 9,8628 | 2,1512 | |||||||
11,7932 | 9,6037 | 2,1895 | |||||||
Тургенев | 12,641 | 10,1981 | 2,3474 | 12,715 | 8,298 | 4,259 | 11,0641 - 11,8162 | 4,7281 - 10,1981 | 2,3474 - 7,8971 |
12,6865 | 9,9683 | 2,5335 | |||||||
12,8162 | 4,7281 | 7,8971 | |||||||
Достоевский | 12,0526 | 9,3946 | 2,658 | 11,374 | 9,156 | 2,218 | 10,9031 - 12,4841 | 8,8081 - 9,3946 | 1,6374 - 2,658 |
11,1662 | 8,8081 | 2,358 | |||||||
10,9031 | 9,2657 | 1,6374 | |||||||
Матвиенко (Автобиография) | 8,1898 | 7,3282 | 0,8616 | 8,1898 | 7,3282 | 0,8616 | 8,1898 | 7,3282 | 0,8616 |
Задание 2. Определение коэффициентов избыточности и вербальности.
Коэффициенты избыточности и вербальности рассчитываются по результатам, полученным в задании 1, согласно формулам:
Таблица 3-Коэффициенты избыточности и вербальности.
Автор | Диапазон | Диапазон |
Блок | 0,1364 - 0,1648 | 4,9359 - 6,3333 |
Пушкин | 0,127 - 0,1452 | 5,8847 - 6,87 |
Гоголь | 0,1905 - 0,201 | 3,9761 - 4,2486 |
Тургенев | 0,1714 - 0,1959 | 4,1048 - 4,833 |
Достоевский | 0,1502 - 0,2112 | 3,7353 - 5,6588 |
Матвиенко (Автобиография) | 0,0507 - 0,0817 | 1,9353 - 2,5898 |
Задание 3. Информационный анализ текстового учебного материала.
По результатам, полученным в задании 2 рассчитать формулы:
Таблица 4-Средние значения результатов идентификации.
Автор | Вmax | В | В | В |
Блок | 9,3081 | 7,8465 | 0,157 | 5,3684 |
Пушкин | 10,5221 | 9,0872 | 0,1364 | 6,333 |
Гоголь | 11,2263 | 9,0223 | 0,1963 | 4,0936 |
Тургенев | 11,5222 | 9,4359 | 0,181 | 4,5228 |
Достоевский | 11,5178 | 9,3269 | 0,1902 | 4,2571 |
Автобиография | 8,1898 | 8,1898 | 0,0662 | 2,2626 |
Сравнение информационных спектров исследуемых текстов с информационным спектром текста автобиографии.
Рисунок 16 – Информационные спектры «Автобиография», «Блок – Двенадцать».
Рисунок 17 - Информационные спектры «Автобиография», «Гоголь – Вий».
Рисунок 18 - Информационные спектры «Автобиография», «Достоевский – Ползунков».
Рисунок 19 - Информационные спектры «Автобиография», «Пушкин – Сказка о рыбаке и рыбке».
Рисунок 20 - Информационные спектры «Автобиография», «Тургенев – Один».
Выводы:
1. Результаты проведенных исследований показывают, что каждому источнику текстовой вербальной информации соответствует строго определенные информационная емкость, средняя энтропия, средняя избыточность, средний коэффициент избыточности и средний коэффициент вербальности. Эти значения могут использоваться в качестве идентификаторов источников.
2. Каждому источнику текстовой вербальной информации соответствует строго определенные информационная емкость, средняя энтропия, средняя избыточность, средний коэффициент избыточности и средний коэффициент вербальности. Эти значения могут использоваться в качестве идентификаторов источников.
3. Применение в качестве идентификаторов полученных значений открывает возможность многофакторной идентификации источников вербальной информации.
4. Сравнение ширины спектра показало, что у писателей все показатели текстовой вербальной информации выше, чем у меня.