Типы данных прогнозирования

Типы прогнозирования

Построение прогноза и связанные с ним построение и экспериментальная проверка (верификация) вероятностно-статистической модели обычно основаны на одновременном использовании информации двух типов:
- априорной информации о природе и содержательной сущности анализируемого явления, представленной, как правило, в виде тех или иных теоретических закономерностей, ограничений, гипотез;
- исходных статистических данных, характеризующих процесс и результаты функционирования анализируемого явления или системы.

Можно выделить следующие основные этапы прогнозирования.

1-й этап (постановочный) включает в себя определение конечных прикладных целей прогнозирования; набора факторов и показателей (переменных), описание взаимосвязей между которыми нас интересует; роли этих факторов и показателей – какие из них, в рамках поставленной конкретной задачи, можно считать входными (т.е. полностью или частично регулируемыми или хотя бы легко поддающимися регистрации и прогнозу; подобные факторы несут смысловую нагрузку объясняющих в модели), а какие – выходными (эти факторы обычно трудно поддаются непосредственному прогнозу; их значения формируются как бы в процессе функционирования моделируемой системы, а сами факторы несут смысловую нагрузку объясняемых).

2-й этап (априорный, предмодельный) состоит в предшествующем построению модели анализе содержательной сущности изучаемого процесса или явления, формировании и формализации имеющейся априорной информации об этом явлении в виде ряда гипотез и исходных допущений (последние должны быть подкреплены теоретическими рассуждениями о механизме изучаемого явления или, если возможно, экспериментальной проверкой).

3-й этап (информационно-статистический) заключается в сборе необходимой статистической информации, т.е. регистрации значений участвующих в анализе факторов и показателей на различных временных и (или) пространственных тактах функционирования моделируемой системы.

4-й этап (спецификация модели) включает в себя непосредственный вывод (опирающийся на принятые на 2-м этапе гипотезы и исходные допущения) общего вида модельных соотношений, связывающих между собой интересующие нас входные и выходные переменные. Говоря об общем виде модельных соотношений, мы имеем в виду то обстоятельство, что на данном этапе будет определена лишь структура модели, ее символическая аналитическая запись, в которой наряду с известными числовыми значениями (представленными в основном исходными статистическими данными) будут присутствовать величины, содержательный смысл которых определен, а числовые значения – нет (их обычно называют параметрами модели, неизвестные значения которых подлежат статистическому оцениванию).

5-й этап (исследование идентифицируемости и идентификация модели) состоит в проведении статистического анализа модели с целью «настройки» значений ее неизвестных параметров на те исходные статистические данные, которыми мы располагаем. При реализации этого этапа «прогнозист» должен сначала ответить на вопрос, возможно ли в принципе однозначно восстановить значения неизвестных параметров модели по имеющимся исходным статистическим данным при принятой на 4-м этапе структуре (способе спецификации) модели. Это составляет так называемую проблему идентифицируемости модели. А затем, после положительного ответа на этот вопрос, необходимо решить уже проблему идентификации модели, т.е. предложить и реализовать математически корректную процедуру оценивания неизвестных значений параметров модели по имеющимся исходным статистическим данным. Если проблема идентифицируемости решается отрицательно, то возвращаются к 4-у этапу и вносят необходимые коррективы в решение задачи спецификации модели.

6-й этап (верификация модели) заключается в использовании различных процедур сопоставления модельных заключений, оценок, следствий и выводов с действительностью. Этот этап называют также этапом статистического анализа точности и адекватности модели. При пессимистическом характере результатов этого этапа необходимо возвратиться к этапу 4, а иногда и к этапу 1. Если же этап верификации модели дает положительные результаты, то модель может быть непосредственно использована для построения прогноза в соответствии с описанной выше общей схемой (10).

В описании содержания 1-го этапа процедуры прогнозирования речь шла, в частности, о необходимости определения конечных прикладных целей прогнозирования. Это подразумевает, в частности, и определение требуемого типа прогноза. Тип прогноза определяется двумя факторами:
горизонтом прогнозирования и
иерархическим уровнем прогнозируемого показателя.

По горизонту прогнозирования прогнозы делятся на краткосрочные (на 1-2 такта времени вперед), среднесрочные (на 3-5 тактов) и долгосрочные (более чем на 5 тактов времени вперед).

По уровню прогнозируемого показателя целесообразно выделять макро-, мезо- и микропрогнозы. Все, что связано с прогнозированием показателей, характеризующих деятельность фирм, компаний и предприятий, относится к микроуровню. Мезо- (региональный и отраслевой уровни) и макропрогнозы используются при описании внешней среды.

Следует подчеркнуть, что в реальности бизнесмен, руководитель предприятия может, конечно, успешно вести бизнес и не владеть методами построения математических моделей прогнозирования. Однако в условиях ужесточающейся конкуренции знание этих методов предоставляет бизнесмену и его бизнесу порой не менее значимые конкурентные преимущества, чем завоевание определенной доли рынка или получение выгодного кредита.

Типы данных прогнозирования

В системах анализа многомерных данных можно выделить три основных типа данных, анализ которых позволяет производить прогнозирование бизнес процессов.

3 типа данных, анализ которых позволяет производить прогнозирование бизнес процессов:

Агрегированные данные

Пользователя, занимающегося анализом, редко интересуют детализированные данные. Более того, чем выше уровень пользователя (руководителя, управляющего, аналитика), тем выше уровень агрегации данных, используемых им для принятия решения.

Пример.

Имеется фирма по продаже компьютеров. Коммерческого директора такой фирмы мало интересует вопрос: "Какого цвета компьютеры успешнее всего продает менеджер Петров: черного или серебристого?" Для него важно, какие модели, и какие цвета предпочитают в данном регионе. Его также мало интересует детализация на уровне контракта, часа или даже дня. Например, если выяснится, что Celeron серебристого цвета чаще покупают в утренние часы, этот факт скорее заинтересует психиатра, а не коммерческого аналитика. Для правильного формирования склада ему важна и необходима информация на уровне декады, месяца или даже квартала.

Исторические данные

Важнейшим свойством данных в аналитических задачах является их исторический характер. После того как зафиксировано, что Петров в июне 2005 г . продал 2 компьютера Celeron и 12 компьютеров Pentium, данные об этом событии становятся историческим (свершившимся) фактом. И после того, как информация об этом факте получена, верифицирована и заведена в БД, она может быть сколько угодно раз считана оттуда, но уже не может и не должна быть изменена.

Историчность данных предполагает не только высокий уровень статичности (неизменности) как собственно данных (например: Петров продал в 2004 г . 51 компьютер Celeron), так и их взаимосвязей (например: в 2004 г . Петров работал в г.Сумы; в 2004 г . продавались компьютеры модели Celeron). А это, в свою очередь, дает возможность использовать специализированные, основанные на предположении о статичности данных и их взаимосвязей методы загрузки, хранения, индексации и выборки.

Прогнозируемые данные

Когда говорится о неизменности и статичности данных в аналитических системах, имеется в виду неизменность исключительно исторических данных (данных, описывающих уже произошедшие события). Существенным моментом является то, что такое предположение ни в коем случае не распространяется на Прогнозируемые данные (данные о событии, которое еще не происходило).

Например, если строится прогноз об объеме продаж на сентябрь 2005 г . для менеджера Петрова, то, по мере поступления фактических (исторических) данных за 2004 г ., эта цифра будет многократно изменяться и уточняться. Более того, достаточно часто прогнозирование и моделирование затрагивает не только будущие, еще не произошедшие, но и прошлые, уже свершившиеся события. Например, анализ: "а, что будет (было бы)... если (бы)..?", строится на предположении о том, что значения некоторых данных, в том числе и из прошлого, отличны от реальных. И для ответа на вопрос: "Какой был бы прогноз по объему продаж компьютеров Celeron для менеджера Петрова на сентябрь 2005 г ., если бы объем продаж компьютеров Celeron в сентябре 2004 г . у него возрос на тот же процент, что объем продаж Pentium" потребуется не только вычислить новое, еще не существующее значение Объема Продаж, для еще не наступившего сентября 2005 г ., но и предварительно вычислить гипотетическое значение Объема продаж, за уже прошедший сентябрь 2004 г .

В свою очередь, к оперативным данным, отражающим состояние некоторой предметной области в данный текущий момент времени, не применимы такие понятия, как прошлое или будущее. Для них существует единственное понятие - сейчас, а их основное назначение - адекватное детализированное отображение текущих событий (изменений), происходящих в реальном мире.

Пример.

Менеджер Петров продал еще один компьютер Celeron; менеджера Петрова перевели из Сумского филиала фирмы в Шосткинский.

Вместе с тем изменчивость оперативных данных ни в коем случае не подразумевает их близость по свойствам к прогнозируемым данным. Между ними существует коренное различие. оперативным данным, в отличие от прогнозируемых, присуще свойство общезначимости, и обычно все пользователи работают с одним и тем же экземпляром данных. После того как в оперативную систему заведены данные о том, что Петров продал еще один компьютер, эта информация сразу же должна стать доступной всем заинтересованным в ней пользователям. Причем до тех пор, пока это изменение не зафиксировано, ни какой другой пользователь не имеет права изменять строку с информацией о продажах Петрова.

Существенно иная ситуация с прогнозируемыми данными. Они носят, скорее, личностный (индивидуальный) характер. Вполне реальна ситуация, когда коммерческий директор фирмы и управляющий региональным отделением одновременно решили получить прогноз возможного объема продаж на 2006 г . для Петрова. Однако каждый из них делает собственный прогноз. Каждый из них может использовать свои функции прогнозирования, и, даже если применяется один и тот же метод (или функция), прогноз может основываться на различных исторических интервалах, и результаты, по всей вероятности, будут различны. Поэтому каждый из них работает с собственным экземпляром прогнозируемых данных (хотя эти данные и относятся формально к одной и той же личности, виду деятельности и времени), и эти данные не должны смешиваться. Конечно, вполне вероятно, что один из этих вариантов будет принят в качестве плановых показателей для Петрова. Но после того как прогноз утвержден в качестве плана, данные просто перейдут в другую категорию и станут историческими.

Наши рекомендации