Понятие о нейронных сетях: классификация, архитектура, возможности
Нейронные сети возникли из исследований в области искусственного интеллекта, а именно, из попыток воспроизвести способность биологических нервных систем обучаться и исправлять ошибки, моделируя низкоуровневую структуру мозга. Мозг состоит из очень большого числа (более 10,000,000,000) нейронов, соединенных многочисленными связями (в среднем несколько тысяч связей на один нейрон, однако это число может сильно колебаться). Нейроны - это специальные клетки, способные распространять электрохимические сигналы.
В последние несколько лет наблюдается взрыв интереса к нейронным сетям, которые успешно применяются в самых различных областях - бизнесе, медицине, технике, геологии , физике. Нейронные сети, нелинейные по своей природе, постепенно входят в практику там, где нужно решать задачи прогнозирования, классификации или и управления, т.к. являются большим шагом относительно ранее широко применявшегося линейного моделирования, т.к. в природе и технике встречается множество задач, где линейная аппроксимация неудовлетворительна. Кроме того:
- требующийся от пользователя набор эвристических знаний для успешного применения нейронных сетей, может быть гораздо скромнее, чем, например, при применении традиционных методов статистики,
- умеет сама опытным путем отбирать полезные ("важные, значимые") переменные, что позволяет первоначально выбирать их произвольно или включить все переменные, которые априори могут влиять на результат, с сокращением на последующих этапах.
- работает с данными и нечислового характера, которые можно представить в числовом виде (если они не принимают много разных значений),
- Нейронные сети учатся на примерах. Пользователь нейронной сети подбирает представительные данные, а затем запускает алгоритм обучения, который автоматически воспринимает структуру данных. Используются несколько алгоритмов обучения,
Основные понятия:плохо!
Дендрит, Аксон (отросток дендрита), Синапс (точка соединения дендрита и аксона),
3 вида ф-ии возбуждения при передаче сигнала:
- пороговая (в зависимости от соотношения входного сигнала и порогового значения).
- линейная (выходная активность пропорциональна входу),
- сигмоидальная (сходна с реальным, выход формируется непрерывно, но не линейно).
Архитектура НС:
Различают «слоистые» сети и «полносвязные» (объёмные) сети
Многослойный персептрон (MLP)
Радиальная базисная функция (RBF)
Сеть Кохонена В то время как все остальные сети предназначены для задач с управляемым обучением, сети Кохонена главным образом рассчитана на неуправляемое обучение.
ПРОГРАММА STATISTICA: основные опции и преимущества в сравнении с MS EXCEL и другими программными средствами
Как было показано в главах 1-8, пакет MS Excel благодаря простоте работы с ним и большому количеству полезных встроенных функций и процедур он позволяет решать многие простые прикладные задачи, связанные с обработкой данных. Но при этом потребность в серьезных методах прикладной статистики и анализа данных у пользователей MS Excel не всегда остается удовлетворенной.
Поэтому в большом количестве разрабатываются специальныестатистические пакеты. На мировом рынке наиболее успешным программным средством такого рода, по мнению авторитетных специалистов, является пакет прикладных программ STATISTICA, который по сравнению с другими программами предоставляет пользователям наиболее богатые возможности по обработке данных. Росту популярности системы STATISTICA в нашей стране способствует появление русифицированной версии, распространяемой компанией STATSOFT RUSSIA, г. Москва.
От большинства других программных продуктов для Windows система STATISTICA выгодно отличается тем, что состоит из отдельных программ - модулей, каждый из которых содержит конкретный метод обработки данных. Кроме того, данные из Excel можно легко импортировать в STATISTICA или работать в системе непосредственно с файлами Excel.
Работа с Таблицами данных
Таблицы данных STATISTICA основаны на технологии мультимедийных таблиц, разработанной компанией StatSoft. Система работает как с исходными данными, так и с численными и текстовыми результатами анализов. Таблица данных STATISTICA является двумерной таблицей, которая может содержать практически неограниченное число наблюдений (строк) и переменных (столбцов), при этом каждая ячейка может содержать неограниченное количество символов. Данные в системе STATISTICA организованы в виде набора наблюдений и переменных.
Окно таблицы данных состоит из нескольких основных частей.
Заголовок окна. В области «Заголовок окна» отображается название таблицы данных вместе с принятым стандартным расширением (.sta), а также содержится число переменных и наблюдений.
Информационное поле располагается в верхнем левом углу окна таблицы данных. Для того, чтобы выделить всю таблицу данных, следует нажать в нижнем правом углу области «Информационное поле». Для ввода или редактирования текста в области «Информационное поле» следует нажать дважды.
Заголовок. Дважды нажмите в области Заголовок, сверху окна над именами переменных, для того, чтобы ввести или изменить текстовую информацию. Для выделения самой области Заголовок (например, при форматировании) нажмите в верхнем левом углу (указатель мыши при этом принимает вид ). Нажмите CTRL+ENTER или ALT+ENTER для ввода новой строки (иногда вам необходимо увеличить высоту поля для того, чтобы видеть несколько строчек текста).
Имена наблюдений. Эти ячейки, расположенные в левой части окна Таблицы данных, содержат имена для каждого наблюдения. Для ввода или редактирования текста дважды нажмите на любом Имени наблюдения. Для выделения самих Имен наблюдений (например, при форматировании) нажмите один раз в левой части Имени наблюдения (указатель мыши при этом принимает вид ). Для того чтобы выделить всю строку наблюдения (для редактирования), нажмите один раз в средней или правой части Имени наблюдений (указатель мыши при этом принимает вид ). Для выделения блока Имен наблюдений, (не выделяя сами строки), выберите команду Выбрать только имена наблюдений в контекстном меню Таблицы данных. Для автоматической подгонки ширины полей Имен наблюдений дважды нажмите на правой границе любого поля Имя наблюдения (указатель мыши при этом принимает вид ). На рисунке выше ячейки Имена наблюдений содержат первые инициалы и фамилии респондентов. Заметим, что Имена наблюдений необязательно присутствуют в окне Таблицы данных, и вы можете их скрыть (отключите опцию Показать имена наблюдений в меню Вид). В том случае, если их нет, отображаются только номера наблюдений.
Имена переменных. Эти ячейки, расположенные в верхней части каждого столбца, содержат имена переменных. Для просмотра спецификаций отдельной переменной дважды нажмите в поле Имя переменной. Для выделения самого поля Имя переменной (например, при форматировании) нажмите один раз в верхней части поля Имя переменной (указатель мыши при этом принимает вид , вместо ). Для выделения всего столбца переменной (например, при редактировании) нажмите один раз в нижней части поля Имя переменной (указатель мыши при этом принимает вид ). Для автоматической подгонки ширины столбца дважды нажмите на правой границе поля Имя переменной (указатель мыши при этом принимает вид ). На рисунке выше первые две ячейки Имя переменной содержат текст Gender и Advert. Вы можете также использовать опции поля Имя переменной для отображения номеров переменных вместо имен, для отображения длинных имен переменных и/или названия типов переменных в Таблице данных. Все эти функции доступны в меню Вид - Имена переменных.
Данные (и редактирование внутри ячеек). Оставшаяся область Таблицы данных содержит сами данные, представленные в виде наблюдений и переменных. Кроме того, можно включать в Таблицу данных любых другие внедренные или связанные объекты (например, мультимедийные объекты, Макросы). Текст в ячейках может иметь практически неограниченную длину (обычно в настройках системы STATISTICA она ограничена 1,000 символами для предотвращения случайной вставки большого объема нежелательной информации в одну ячейку).
Параметры форматирования
Таблицы данных STATISTICA поддерживают большое количество параметров форматирования, включая форматирование ячеек, форматирование внутри ячеек, форматы, шаблоны Таблицы данных, пользовательские форматы и формат выбранных наблюдений.
Форматирование ячеек. Форматирование ячеек позволяет выделять отдельные ячейки, чтобы их можно было отличить от других ячеек Таблицы данных. Вы можете присвоить некоторый формат одной ячейки или целому блоку ячеек.
Форматирование внутри ячеек. Форматирование внутри ячеек контролирует отображения данных внутри каждой ячейки. Например, если в ячейке задан текст "Lot 1245,", вы можете определить формат так, что "1245" будет отображаться полужирным шрифтом, а слово "Lot" - стандартным.
Форматы. Форматы используются в Таблицах данных STATISTICA для быстрого применения последовательности команд форматирования. Используя Диспетчер форматов, вы можете создавать и редактировать различные форматы, а также применять их к некоторым частям Таблицы данных. См. также: Форматы - обзор, Создать новый Формат, Применить Формат, Изменить Формат, Удалить Формат, Переименовать Формат и Сохранить Формат.
Шаблоны таблицы данных. Шаблоны Таблицы данных используются в Таблицах данных STATISTICA для определения форматов специальных элементов в целой Таблице данных. Используя диалоговое окно Шаблоны Таблицы данных, вы можете создавать различные форматы элементов Таблицы данных.
Форматы выбранных наблюдений (доступны на вкладке «Системные» в диалоге Шаблоны Таблицы данных) позволяют выделять ячейки, которые были выбраны с помощью заданных условий выбора наблюдений.