Требования к исходному временному ряду
1) Сопоставимость уровней ряда, которая достигается в результате одинакового подхода к наблюдениям на разных этапах формирования ряда динамики. Уровни во временных рядах должны выражаться в одних и тех же единицах измерения, рассчитываться для одного и того же интервала времени, по одной и той же методике, охватывать одни и те же элементы, принадлежащие одной территории, относящейся к неизменной совокупности.
Различают два рода несопоставимости: первый обусловлен внутренними причинами развития показателя и не может быть устранен, второй вызван внешними причинами, как правило, связанными с методологическими особенностями наблюдений за исследуемым показателем.
Несопоставимость первого рода чаще всего проявляется в стоимостных показателях. Даже в тех случаях, когда значения этих показателей фиксируются в неизменных ценах (при наличии методики такого пересчета), их часто трудно сопоставить. Такого рода несопоставимость временных рядов не может быть устранена чисто формальными методами и может лишь учитываться при содержательной интерпретации результатов статистического анализа. Несопоставимость, источником которой являются методологические измерения в системе наблюдений за значениями показателя, в большинстве случаев поддается устранению с помощью формальных методов и приемов. Так, если произошло слияние каких-то ведомств или выделение некоторой подотрасли в самостоятельную отрасль, данные ряда динамики за предыдущие годы должны быть пересчитаны в соответствии с новой структурой. Аналогично, если происходят территориальные изменения, необходимо всю предшествующую информацию о динамике пересчитать с учетом нового территориального деления.
Несопоставимость исходных данных, обусловленная изменениями терминологии, классификаций, методик расчета отдельных показателей, также устраняется путем пересчета более ранних наблюдений.
Пересчет этот обычно весьма трудоемок, к тому же не всегда позволяет обеспечить требуемую точность, поэтому частые методологические изменения значительно снижают информационную ценность временных рядов, затрудняют их анализ.
2) Достаточность числа наблюдений (т.е. числа уровней ряда), а также выполнение условия равных промежутков времени между последовательными уровнями ряда. Достаточное число наблюдений определяется в зависимости от цели проводимого исследования динамики. Если целью является описательный статистический анализ, то в качестве изучаемого интервала времени исследователь может выбрать любой, по своему усмотрению. Если же целью исследования является построение модели динамики и прогнозирование на ее основе, то число уровней исходного динамического ряда в этом случае должно не меньше, чем в три раза превышать период упреждения прогноза. А в случае использования квартальных или месячных данных для исследования сезонности и прогнозирования сезонных процессов исходный временной ряд должен содержать квартальные либо месячные данные не менее чем за четыре года, даже если требуется прогноз на 1-2 квартала (месяца).
Во временном ряду не должно быть пропущенных наблюдений. Пропуски наблюдений обусловлены обычно недостатками в сборе информации, а иногда и изменениями в системе показателей. Так, иногда принимается решение о нецелесообразности учета некоторого показателя, а через год-два становится очевидной его аналитическая значимость, и возвращаются к его учету, между тем информационная ценность динамического ряда уже значительно снижена отсутствием данных за пропущенное время. Чтобы использовать такой ряд для анализа динамики необходимо восстановить пропущенные данные либо косвенными методами (по другим показателям), либо самым простым способом – путем вычисления среднего значения из двух соседних.
3) Однородность, т.е. отсутствие нетипичных, аномальных наблюдений, а также изломов тенденций
Аномальность приводит к смещению оценок и, следовательно, к искажению результатов анализа. Поэтому все случаи аномальности должны быть выявлены и исследованы их причины. Изломы тенденций свидетельствуют об изменении закономерностей протекания процесса или об изменении методики вычисления значений показателя и поэтому для моделирования закономерностей, определяющих текущее и, возможно, будущее развитие процесса также необходимо исследовать причины изменения тенденций. Если значение на конце временного ряда «выпадает» из общей тенденции, то без дополнительной содержательной информации о причинах «выброса» на конце ряда не представляется возможным определить, является ли это наблюдение аномальным или свидетельствует о наличии изменения тенденции, поэтому в этом случае также важно провести качественный анализ происходящих изменений.
По причинам различают аномальные значения двух типов:
аномальные значения, возникающие вследствие ошибок измерения показателя, записи и передачи информации;
аномальные значения, отражающие объективное развитие процесса, но сильно отклоняющиеся от общей тенденции (например, резкое снижение урожайности в засушливые годы).
Аномальные наблюдения, обусловленные первой причиной, необходимо исключать из временного ряда и заменять расчетными значениями (самый простой способ замены – в качестве нового значения принять среднее из двух соседних значений).
Аномальные значения второго типа могут исключаться из исходного временного ряда и заменяться расчетными при оценке статистических характеристик динамики и построении модели, но должны учитываться при расчете возможной величины отклонений фактических значений от модели.
Среди причин изломов тенденции тоже можно выделить две:
изменение методики расчета показателя;
изменение объективных закономерностей развития процесса (например, сокращение основных фондов ряда предприятий и отраслей в период перехода на новые условия хозяйствования), сюда же можно отнести изломы тенденций, связанные с различными катастрофическими явлениями (например, резкое сокращение жилого фонда в результате землетрясения или резкое сокращение поголовья скота в каком-либо районе, вызванное эпидемией).
Если излом тенденции обусловлен изменением методики расчета показателя, то уровни, предшествующие излому тенденции, могут быть использованы в оценке характеристик динамики и для построения модели при условии их пересчета согласно новой методике. В случаях, когда такой пересчет невозможен, эти уровня ряда должны быть исключены из рассмотрения.
Если излом тенденции отражает изменение закономерностей развития процесса, то в качестве информационной базы для статистического анализа могут быть использованы только значения, начиная с момента времени, соответствующего последующему излому тенденций.
Аналогично тому, как анализируются причины аномальности и изломов тенденции в середине ряда, исследуются причины «выпадения» значений на конце временного ряда: последовательно осуществляется поиск причины «выброса»:
изменение методики расчета;
закономерное или катастрофическое изменение тенденции;
объективные разовые отклонения от тенденции;
ошибки измерения, передачи или записи информации.
В зависимости от установленной причины «выброса» решается вопрос об использовании «выпадающего» наблюдения и всего ряда в статистическом анализе. Если причиной выброса является изменение методики, то производится пересчет предшествующих уровней ряда согласно новой методике и все они могут быть использованы в дальнейшем анализе. В случае изменения закономерностей развития на последнем уровне ряда, теряет смысл моделирование и экстраполяция (перенесение в будущее) ранее действовавших закономерностей развития. Для описания и исследования новых закономерностей обычно используются не статистические, а экспертные методы. Объективное разовое отклонение от тенденций и «выброс», обусловленный ошибками измерения, записи или передачи информации, должны быть заменены на расчетные значения, и тогда временной ряда с замененными последними значениями может быть использован для оценки статистических характеристик динамики и построения модели развития.