Показатели качества работы нейронной сети

Обучение нейронной сети с учителем — это настройка ее весов и смещений, минимизирующая некоторый функционал ошибки, зависящий от ошибок сети, то есть разности между желаемыми и реальными сигналами на выходе сети. В процессе обучения сети оцениваются три вида ошибок:

1. Ошибка конкретного выхода сети на конкретном входном векторе.

2. Ошибка всех выходов сети, например, средняя ошибка, при конкретном входном векторе. Эта ошибка показывает, насколько правильным является ответ сети на конкретный входной вектор.

3. Ошибка всех выходов сети по всему набору обучающих примеров. Эта ошибка показывает, насколько хорошо сеть усвоила закономерности обучающего набора данных.

При обучении сети наиболее применяемыми градиентными методами не гарантируется достижение глобального минимума функционала ошибки. Обычно достигается один из локальных минимумов. Поэтому производятся многократные эксперименты по обучению сети. Из-за случайного задания начальных значений весов и смещений средняя ошибка в каждом эксперименте будет различной. По минимуму средней ошибки выбирается лучший вариант параметров сети. Для выбора лучшего варианта желательно оценивать не только среднее значение ошибки, но и среднеквадратическое отклонение ошибки, по которому можно получить погрешность вычисления функционала ошибки.

В качестве функционалов ошибок используются следующие функционалы [1, 2, 38]. Чаще всего функционалы основаны на сумме квадратов ошибок (SSE — sum squared error)

Показатели качества работы нейронной сети - student2.ru ,

где Показатели качества работы нейронной сети - student2.ru — ошибка Показатели качества работы нейронной сети - student2.ru ‑го выхода сети, Показатели качества работы нейронной сети - student2.ru — желаемая величина (целевое значение) Показатели качества работы нейронной сети - student2.ru ‑го выхода сети, Показатели качества работы нейронной сети - student2.ru — полученное значение выхода.

Для упрощения записи в и в последующих формулах используется один индекс. В случае вычисления ошибки всех выходов сети по всему набору обучающих примеров подразумевается суммирование по всем выходам и всем примерам.

Очень часто используется среднеквадратическая ошибка (MSE — mean-square error)

Показатели качества работы нейронной сети - student2.ru .

При выводе формул обучения будем использовать вариант ошибки MSE

Показатели качества работы нейронной сети - student2.ru .

Коэффициент Показатели качества работы нейронной сети - student2.ru введен для упрощения дальнейшего анализа. Дело в том, что в градиентных методах обучения важно направление вектора градиента, которое определяется суммой квадратов ошибок. Постоянный множитель выбирается с учетом простоты формул.

Иногда используется ошибка RSE — root squared error

Показатели качества работы нейронной сети - student2.ru .

Дляпредотвращает чрезмерного роста весов и смещений в процессе обучения используется комбинированная ошибка [2, 38]

Показатели качества работы нейронной сети - student2.ru ,

где Показатели качества работы нейронной сети - student2.ru — весовой коэффициент (в [38] по умолчанию принят Показатели качества работы нейронной сети - student2.ru ); Показатели качества работы нейронной сети - student2.ru — значения весов и смещений; Показатели качества работы нейронной сети - student2.ru — число весов и смещений.

Функционал Показатели качества работы нейронной сети - student2.ru включает среднеквадратическую ошибку с весом Показатели качества работы нейронной сети - student2.ru и штрафную функцию Показатели качества работы нейронной сети - student2.ru с весом Показатели качества работы нейронной сети - student2.ru .

Средняя квадратическая ошибка с учетом уровня надежности обучения [2] используется в классификаторах

Показатели качества работы нейронной сети - student2.ru ,

где Показатели качества работы нейронной сети - student2.ru – уровень надежности обучения.

Рекомендуются [2] следующие значения Показатели качества работы нейронной сети - student2.ru : Показатели качества работы нейронной сети - student2.ru — для двоичного интерпретатора; Показатели качества работы нейронной сети - student2.ru — для кодирования номером канала; Показатели качества работы нейронной сети - student2.ru — для порядковой интерпретации ( Показатели качества работы нейронной сети - student2.ru — размерность вектора входного сигнала). Уровень надежности вводится для обеспечения устойчивой работы сети. Работа сети считается устойчивой, если при изменении выходных сигналов на величину, меньшую Показатели качества работы нейронной сети - student2.ru , интерпретация ответов не изменяется. Например, при кодировании номером канала и Показатели качества работы нейронной сети - student2.ru , сигнал на выходе нейрона, идентифицирующем класс, будет не менее чем в два раза больше, чем на других нейронах.

Среднеквадратическая ошибка с весами позволяет корректировать влияние отдельных обучающих примеров

Показатели качества работы нейронной сети - student2.ru ,

где Показатели качества работы нейронной сети - student2.ru — вес Показатели качества работы нейронной сети - student2.ru ‑го примера в обучающей выборке.

Например [2], если обучающие примеры принадлежат нескольким классам и Показатели качества работы нейронной сети - student2.ru является величиной, обратной числу примеров в соответствующем классе, то классы с разным числом примеров будут оказывать примерно одинаковое влияние на процесс обучения.

Известно [1], что при решении задач классификации в качестве функции активации целесообразно применять функцию softmax . Тогда выход сети трактуется как вероятность принадлежности входного вектора определенному классу. В качестве функционала ошибки в этом случае используется кросс‑энтропия (перекрестная энтропия) [39]. Если сеть производит классификацию входных векторов на два класса, то сеть имеет единственный выход. В качестве функции активации логистическая функция (2.7). В случае пакетного режима обучения ошибка по всему набору обучающих примеров равна [1]

Показатели качества работы нейронной сети - student2.ru ,

где Показатели качества работы нейронной сети - student2.ru — требуемое (целевое) значение выхода сети при подаче примера Показатели качества работы нейронной сети - student2.ru , Показатели качества работы нейронной сети - student2.ru — реальное значение выхода сети при подаче примера Показатели качества работы нейронной сети - student2.ru , Показатели качества работы нейронной сети - student2.ru — число примеров в обучающей выборке.

Если сеть производит классификацию входных векторов более чем на два класса, то в качестве функции активации рекомендуется использовать функцию softmax (2.11). Функционал ошибки всех выходов сети по всему набору обучающих примеров тогда будет иметь вид [1]

Показатели качества работы нейронной сети - student2.ru ,

где Показатели качества работы нейронной сети - student2.ru — требуемое (целевое) значение выхода Показатели качества работы нейронной сети - student2.ru сети при подаче примера Показатели качества работы нейронной сети - student2.ru , Показатели качества работы нейронной сети - student2.ru — реальное значение выхода Показатели качества работы нейронной сети - student2.ru сети при подаче примера Показатели качества работы нейронной сети - student2.ru , Показатели качества работы нейронной сети - student2.ru — число выходов сети, Показатели качества работы нейронной сети - student2.ru — число примеров в обучающей выборке.

Чем ближе вероятностное распределение выходных величин сети к целевому, тем меньше значение кросс‑энтропии.

Наши рекомендации