Теоретические положения. Восстановление пропусков наблюдений и приведение рядов к многолетнему периоду

Восстановление пропусков наблюдений и приведение рядов к многолетнему периоду основано на построении регрессионных уравнений с одним или несколькими предполагаемыми аналогами, которые имеют как более продолжительный период наблюдений, так и данные наблюдений в те годы, которые были пропущены на рассматриваемой станции. В частном случае такие регрессионные зависимости могут быть построены и между разными метеорологическими характеристиками на одной станции, например, между температурой воздуха и осадками.

Последовательность приведения к многолетнему периоду состоит в следующем:

- все уравнения, удовлетворяющие условиям эффективности, располагаются в порядке убывания коэффициентов корреляции;

- восстанавливаются погодичные значения метеорологической характеристики приводимого пункта за период совместных наблюдений в пунктах-аналогах по уравнению с наибольшим значением коэффициента корреляции;

- далее используются уравнения регрессии, коэффициенты корреляции которых меньше предыдущего, но больше всех остальных;

- поэтапное восстановление погодичных значений метеорологической характеристики продолжается до тех пор, пока не будут использованы все уравнения регрессии, отвечающие условиям эффективности.

Уравнение множественной линейной регрессии, по которому осуществляется восстановление, имеет следующий вид:

Y= k0+k1Y1 +k2Y2+...+ kjYj+ ...+klYl ( 25 )

где Y - значения метеорологической характеристики в приводимом пункте, Yj - значения метеорологической характеристики в пунктах-аналогах, k0 - свободный член, kj - коэффициенты уравнения регрессии при j= 1,2,....,l, l - число пунктов-аналогов.

Ранее рекомендовались следующие условия для эффективного уравнения связи рассматриваемого пункта с аналогами (Нормативный документ СП 33-101-2003):

n’³6 - 10, R³Rкр, R/sR³ Aкр, k/sk³ Bкр , ( 26 )

где n’ – число совместных лет наблюдений в приводимом пункте и пунктах-аналогах (n’³6 при одном аналоге, n’³10 при двух и более аналогах); R – коэффициент парной или множественной корреляции между значениями гидрометеорологического элемента в приводимом пункте и их значениями в пунктах-аналогах; Rкр – критическое значение коэффициента парной или множественной корреляции (обычно задается ³0.7); k – коэффициенты уравнения регрессии; sk – средняя квадратическая погрешность коэффициента уравнения регрессии; Aкр, Bкр – соответственно критические значения отношений R/sR и k/sk (обычно задается ³2.0).

Если хотя бы одно из условий (26) не выполняется и хотя бы один из коэффициентов уравнения регрессии не удовлетворяет четвертому условию (k/sk³Bкр), то это уравнение не используется для приведения к многолетнему периоду.

Критический анализ условий (26) показал, что условие R/sR ³Aкр является избыточным и может быть исключено, т.к. величина доверительного интервала для R функционально зависит от n’ и R и при n’³6.0 и Rкр³0.7 коэффициент R всегда будет статистически значим. Также известно, что:

Теоретические положения. Восстановление пропусков наблюдений и приведение рядов к многолетнему периоду - student2.ru , (27)

где: se – среднее квадратическое отклонение остатков (разностей между фактическими и расчетными значениями) sY – стандартное (среднее квадратическое) отклонение приводимого к многолетнему периоду ряда.

Тогда отношение se/sY характеризует относительную погрешность расчетного значения. При R=0.7 погрешность будет равна 51%, что достаточно много. Поэтому следует по крайней мере принять Rкр³0.75, что соответствует погрешности около 44%. Чтобы исключить ложные корреляции следует ввести предельное расстояние от приводимой стации – радиус круга (Radкр), внутри которого выбираются аналоги (в км), а также остановиться на условии n’³10. Кроме того, чтобы исключить наличие отдельных «выбросов» восстановленных данных можно ввести предельную относительную погрешность: отношение se к восстановленному значению (Yp) и (или) к исходной вариации ряда (sY). В данном случае предельная относительная погрешность принята равной 20%. В результате новый вариант условий (26) будет следующим:

Rad³Radкр, n’³10, R³0.75, k/sk ³ 2, sε/Yp ≤Δ’кр (20-40%), sε/sY ≤Δкр (20-40%) ( 28 )

Очевидно, что для некоторых характеристик, у которых восстановленное значение может быть нулевым (например, температура воздуха), потребность в условии se/Yp≤Δ’кр отпадает.

Восстановленные данные, полученные по уравнению (25) на основе метода наименьших квадратов (МНК) имеют систематически заниженную дисперсию. Исключение систематической смещенности дисперсии восстановленных данных осуществляется путем введения поправки в восстановленные значения метеорологической характеристики, в результате которой несмещенные восстановленные величины определяются по следующей формуле:

Теоретические положения. Восстановление пропусков наблюдений и приведение рядов к многолетнему периоду - student2.ru , ( 29 )

где Qi - значения метеорологических характеристик, рассчитанные по уравнению регрессии (25), Теоретические положения. Восстановление пропусков наблюдений и приведение рядов к многолетнему периоду - student2.ru Теоретические положения. Восстановление пропусков наблюдений и приведение рядов к многолетнему периоду - student2.ru - среднее значение приводимого ряда за совместный с пунктом - аналогом период.

Получить восстановленное значение важно, но недостаточно. Вторым немаловажным аспектом восстановления является оценка его эффективности. Для оценки эффективности восстановленных по (25) значений был разработан ряд показателей. Стандартная погрешность восстановления определяется по формуле (27), а в качестве наиболее информативных показателей обобщенных оценок восстановления приняты:

- количество восстановленных лет (абсолютное ∆n и относительное Δn’(%) =(N-n)/n*100%);

- отношение дисперсии восстановленных значений к дисперсии наблюденных значений (критерий Фишера), характеризующее однородность восстановления;

- критерий Стьюдента для оценки однородности среднего восстановленных значений по отношению к среднему наблюденных данных.

При этом, следует отметить, что два последних показателя оценки однородности средних и дисперсий имеют значение в том случае, если число наблюденных и восстановленных данных примерно одинаковое.

Наши рекомендации