Основные нейросетевые модели
В настоящее время известно очень много различных нейросетевых моделей или парадигм, как их принято называть в литературе, посвященной теории нейронных сетей. Под парадигмой в теории НС подразумевается совокупность архитектуры построения НС и алгоритмов их функционирования, включая процессы обучения и выполнения требуемых пользователю операций. Такими операциями, в зависимости от имеющихся задач могут быть распознавание объектов, прогнозирование, аппроксимация многомерных отображений, кластеризация, сжатие данных, выделение и анализ признаков и другие.
Все новые нейросетевые парадигмы, наилучшим образом приспособленные к решению тех или иных задач. За несколько десятков лет, в течение которых активно и интенсивно изучаются НС и возможности их приложения к различным областям, выработано множество вариантов нейросетевых архитектур, и в настоящее время существует такое множество различных типов НС, что вряд ли кто-нибудь сможет указать их точное число. Большинство из них рождаются в процессе разрешения конкретных задач. Потом выясняется, что подход, примененный для одной проблемы, может быть успешно использован и для другой предметной области. Часть разработанных архитектур НС оказываются настолько удачными, что широко распространяются в самых различных приложениях. Каждой нейросетевой архитектуре присущ собственный метод обучения, ориентированный на конкретную организацию взаимосвязей в ней. Поэтому обычно рассматриваются не просто архитектуры НС, а комплекс из организации элементов сети, нейронов, в виде слоев и метода обучения или алгоритма достижения НС состояния, обеспечивающего выполнение ею требуемых действий. Такой комплекс получил название нейросетевой парадигмы.
НС также разделяются на сети прямого распространения и сети с обратными связями.
В сетях прямого распространения связи между элементами не образуют циклов. Поэтому сети прямого обычно распространения формируют отклик на входной сигнал достаточно быстро. Для большинства таких сетей в дополнение к чисто нейросетевым методам обучения могут использоваться традиционные оптимизационные численные методы (например, метод сопряженных градиентов и др.).
В НС с обратными связями связи между нейронами могут образовывать циклы. В некоторых НС после получения входного сигнала должно пройти несколько, иногда достаточно много итераций, для получения ответа. Обычно сети с обратными связями обучать сложнее, чем сети прямого распространения.
Ниже перечислены основные нейросетевые парадигмы:
I. Обучение без учителя:
1. Сети с обратными связями:
а) аддитивная модель Гроссберга (Additive Grossberg - AG);
б) шунтированная модель Гроссберга (Additive Grossberg - SG);
в) бинарная модель адаптивного резонанса (Binary Adaptive Resonance Theory - ART1);
2. Сети без обратных связей:
- обучающая матрица (Learning Matrix - LM);
- обучение с усилением ведущих компонент (Driver- Reinforcement Learning - DR);
- линейная ассоциативная память (Linear Associative Memory - LAM).
II. Обучение с учителем:
1. Сети с обратными связями:
- модель состояний мозга (Brain-State-in-a-Box - BSB);
- модель нечетких когнитивных соответствий (Fuzzy Congitive Map - FCM);
- машина Больцмана (Boltzman Machine - BM);
2. Сети без обратных связей:
- персептрон (Perceptron);
- адалин, мадалин (Adaline, Madaline);
- обратное распространение ошибки (Backpropagation - BP).
Нейросетевые технологии имеют свои преимущества и недостатки. Преимуществами можно назвать гибкость и адаптивность результирующих алгоритмов, потенциальную возможность достижения высокого быстродействия за счет использования архитектур с массовым параллелизмом, возможность быстрого создания работоспособных систем без трудоемкого построения корректных математических моделей и их исследования. Возможность построения систем на основе известных нейросетевых парадигм, доказавших свою работоспособность в конкретных приложениях, так же возможность наращивания возможностей после запуска системы в работу и способность НС к переобучению для изменения характеристик при модификации.
Недостатками можно назвать отсутствие формализованной теории выбора необходимых моделей, то что нет строгих оценок скорости сходимости, что приводит к необходимости основываться на эмпирических оценках при анализе таких систем, нехватку квалифицированных кадров в области нейрокомпьютинга, это приводит к трудностям восприятия нейросетевой технологии специалистами в предметных областях [13].
Цели и задачи исследования
В современных условиях усложнение радиоэлектронных средств приводит к ряду проблем при оценке качества и надежности изделий из-за ряда трудно выявляемых скрытых дефектов. Поэтому одним из решений является прогнозирование их будущих состояний, а в частности ИП. Сейчас основной проблемой является отсутствие прогнозных моделей для многих ЭРИ.
Цель данной работы разработка прогнозной модели и анализ ее эффективности на примере качества работы стабилитронов. Из большого числа методик и прогнозных моделей предпочтение было отдано формализованному методу со структурной моделью – нейросеть, так как при расчетах она дала наименьшую погрешность вычислений, нежели, чем с использованием регрессии или метода экстраполяции.
Регрессионные модели, имеющие слишком малую сложность, могут оказаться неточными, а модели, имеющие избыточную сложность, могут оказаться переобученными. Экстраполяция, при большом периоде упреждения дает недостоверность прогнозных данных.
В данной работе были использованы нейронные сети с радиальными базисными функциями, которые моделируют произвольную нелинейную функцию с помощью всего одного промежуточного слоя, тем самым избавляя разработчика от необходимости решать вопрос о числе слоев.
Для достижения поставленной цели следует решить следующие задачи:
- создание математических прогнозной модели на основе нейросетей;
- синтез прогнозной модели при постоянной обучающей выборке;
- синтез прогнозной модели при переменной обучающей выборке;
- прогнозирование значений Uст при t=1000ч по значениям t=25ч, t=100ч.
Предлагаемая модель прогнозирования качества полупроводниковых приборов позволит существенно сократить интервал обучения, может найти широкое применение при анализе качества радиоэлектронной аппаратуры.
В ходе контроля на качество, устанавливаются:
- качество маркировки;
- правильность заполнения сопроводительной документации;
- полнота комплектации;
- работоспособность изделия.
Тем самым, мы можем определить, будет ли работоспособно наше изделие, по пришествию 1000ч. Это позволит, повысить надежность изделий, где будет применены данные ЭРЭ, что позволит экономить вкладываемые денежные средства.