Анализ распределения пассажирских перевозок в пригородном сообщении на основе статистических методов
Каган Д.З., к.ф.-м.н.
Толкачева О.Н.
Сибиркина О.М.
Аннотация
В работе проводится анализ распределения пригородных перевозок на железнодорожном транспорте по времени. Строится математическая модель, позволяющая прогнозировать объемы пассажирских перевозок при наличии небольших выборочных данных, оценивается качество модели. Рассмотрены основные факторы, влияющие на показатели перевозок. Используются статистические и эконометрические методы. Рассматриваемые методы позволяют по небольшим данным анализировать интенсивность и степень загруженности пригородного движения
Ключевые слова
Пригородное железнодорожное движение, пассажирские перевозки, отбор факторов, множественная регрессия
Пригородное железнодорожное движение необходимо для нормальной работы экономики региона. Четкая организация пригородных перевозок имеет большое значение для обеспечения жизнедеятельности города и области [1]. Важно правильно организовать работу и ритмичность движения пригородных поездов. Поезда бывают чрезвычайно перегружены в час пик, при этом, в другие периоды они могут перевозить совсем небольшое количество пассажиров. Правильная организация пассажирских перевозок может быть ключевым фактором конкурентоспособности и привлекательности компании [2, 3].
Целью данного исследования является выявление и анализ факторов, оказывающих влияние на посадку пассажиров в вагон пригородной электрички. Анализ и прогнозирование распределения пассажиров по времени суток может стать базой для принятия решений, повышающих качество использования подвижного состава, ритмичность движения, тем самым повышающим и качество транспортного обслуживания пассажиров [4]. В дальнейшем, используя полученные расчеты, мы можем прогнозировать, как изменится число пассажиров при изменении расписания электричек, предлагать варианты увеличения или уменьшения интенсивности движения поездов в различные периоды суток.
Например, в час пик можно использовать самые длинные составы поездов, а в периоды с низким объемом перевозок можно использовать короткие составы c меньшим количеством вагонов. Пригородные пассажирские перевозки, как известно, являются убыточными и дотируются государством. Выбор подвижного состава, соответствующего пассажирообороту на данный момент времени может оптимизировать финансовые результаты, сократить убытки пригородных компаний.
В исследовании мы исходим из того, что у нас есть некоторый, возможно, очень неполный набор данных о существующем распределении перевозок.
В качестве примера применения статистических методов для прогнозирования пассажирских перевозок, рассмотрим и проанализируем данные о станции Ярославского направления, откуда пассажиры едут в направлении Москвы.
Предположим, что для этой станции есть частичные данные о посадке на поезд, населенности на момент приезда на станцию (т.е. количестве человек, находящихся в вагоне на текущий момент времени), и данные о начальной точке отправления электрички.
Имеющиеся данные представлены в таблице 1. В таблице приводятся сведения о посадке и высадке пассажиров для электричек, проходящих через станцию, следующих в направлении центра. Для пригородных поездов имеются следующие данные: время приезда электрички, B – число человек, севших на поезд на рассматриваемой станции, A – число вышедших на этой станции и V – населенность – количество пассажиров, находящихся в поезде в момент приезда. В таблице указаны только те поезда, о которых имеются данные. С помощью рассматриваемых методов можно оценить значения показателей для тех поездов, о которых данные отсутствуют.
Как можно увидеть, час пик для поездок в центр приходится на утро, особенно, на период с 7 до 8 часов. Период минимальной посадки пассажиров – после 9 часов вечера. Средняя посадка в утренний час пик превышает посадку для вечернего времени почти в 20 раз.
Таблица 1 – Данные о посадке и высадке пассажиров, пользующихся электричками на станции
№ | Время | B | A | V | S (НАЧАЛЬНАЯ ТОЧКА) | BM, СРЕДНЕЕ |
7:22:00 | 764,5 | |||||
7:49:00 | 764,5 | |||||
8:00:00 | 220,0 | |||||
8:14:00 | 220,0 | |||||
8:21:00 | 220,0 | |||||
9:12:00 | 244,3 | |||||
9:22:00 | 244,3 | |||||
9:49:00 | 244,3 | |||||
10:01:00 | 219,3 | |||||
10:15:00 | 219,3 | |||||
10:28:00 | 219,3 | |||||
11:01:00 | 177,7 | |||||
11:12:00 | 177,7 | |||||
11:16:00 | 177,7 | |||||
12:07:00 | 181,3 | |||||
12:24:00 | 181,3 | |||||
12:55:00 | 181,3 | |||||
13:19:00 | 189,0 | |||||
13:37:00 | 189,0 | |||||
13:49:00 | 189,0 | |||||
14:35:00 | 90,3 | |||||
14:52:00 | 90,3 | |||||
14:41:00 | 90,3 | |||||
15:40:00 | 38,0 | |||||
16:04:00 | 91,7 | |||||
16:17:00 | 91,7 | |||||
16:40:00 | 91,7 | |||||
17:00:00 | 99,5 | |||||
17:07:00 | 99,5 | |||||
17:17:00 | 99,5 | |||||
17:44:00 | 99,5 | |||||
17:35:00 | 99,5 | |||||
17:54:00 | 99,5 | |||||
18:11:00 | 80,7 | |||||
18:46:00 | 80,7 | |||||
18:50:00 | 80,7 | |||||
19:11:00 | 68,8 | |||||
19:24:00 | 68,8 | |||||
19:39:00 | 68,8 | |||||
19:53:00 | 68,8 | |||||
20:15:00 | 69,0 | |||||
20:38:00 | 69,0 | |||||
20:54:00 | 69,0 | |||||
20:58:00 | 69,0 | |||||
21:10:00 | 38,8 | |||||
21:22:00 | 38,8 | |||||
21:44:00 | 38,8 | |||||
21:49:00 | 38,8 | |||||
22:00:00 | 39,0 |
Для анализа данных и прогнозирования применяются различные эконометрические и статистические методы. Наиболее распространенным из этих методов является построение множественной регрессии [5]. Этот метод успешно применяется для многих экономических и технических исследований, в т.ч. и транспортной тематики [6]. При использовании этого метода выбирается зависимая (объясняемая) переменная Y и несколько независимых (объясняющих) переменных, далее строится функция объясняемой переменной от объясняющих.
Предполагается построение регрессии, где в качестве зависимой переменной Y рассматривается посадка на поезд – B. В качестве факторов, влияющих на посадку, рассматриваются следующие показатели:
S (начальная точка) – фиктивная переменная, равная 1, если данная станция является начальной для электрички и 0 в противоположном случае.
V (population) –населенность на момент приезда на станцию.
Однако, главным фактором, определяющим значение посадки на поезд в данный момент времени, будет именно время прибытия поезда, но не в чистом виде. В час пик количество людей, садящихся на поезд будет во много раз больше среднего. В какие-то периоды, наоборот, посадка будет очень маленькой.
Чтобы учесть и в дальнейшем проанализировать суточную неравномерность, необходимо найти фактор, связанный со временем, таким образом, чтобы для каждого периода он отражал интенсивность пассажиропотока в этот момент на этой ветке.
В качестве такого главного фактора выбирается среднее значение (BM) вошедших в поезда на данной станции за некоторый интервал времени, например, за часовой интервал. BM равен среднему значению посадки по всем пригородным поездам, проходившим через станцию, в направлении центра в течение часа.
При этом также возможны различные варианты выбора главного фактора. В зависимости от объема имеющихся данных, мощности вычислительных средств и программного обеспечения, интенсивности движения поездов на станции можно использовать разные интервалы времени, фиксированные интервалы со скользящими концами для каждого поезда.
В общем случае также нужно учитывать и такие факторы, как перенаселенность и перенаселенность предыдущего поезда; интервал, который прошел с момента прибытия предыдущего поезда.
Для построения регрессии, воспользуемся возможностями стандартной программой MS Excel. Учитывая стиль вычислений Excel выберем в качестве главного фактора среднее значению посадки в течение часа BM, другими факторами возьмем населенность V и S (начальная точка).
Уравнение регрессии с тремя отобранными факторами будет выглядеть следующим образом:
B = 15,43+1,06*BM-12,24*S-0,06*V
где B – посадка на поезд, BM – средняя посадка за час, V – населенность поезда в момент прибытия на станцию.
Главный показатель качества регрессии, коэффициент детерминации R2 равен 0,83. Таким образом, наша регрессия объясняет вариацию значений посадки на 83% – это высокий показатель для регрессий.
Проведя оценку соответствия регрессионной модели данным, можно признать, что данная модель является хорошей. Множественный коэффициент корреляции равен 0,91, следовательно, сила связи между признаком B и совокупностью объясняющих факторов сильная. С помощью F-критерия Фишера мы подтвердили статистическую значимость уравнения множественной регрессии в целом.
Коэффициент при ВМ имеет очень высокую статистическую значимость, это подтверждает правильность выбора главного фактора. Значение t-статистики для BM значительно превосходит требуемый уровень.
Наименее значимым фактором оказалась населенность V. В соответствии с методами эконометрического анализа, уменьшим количество факторов, убрав наименее значимый фактор. Тогда уравнение регрессии будет выглядеть следующим образом:
B=-2,37+0,99*BM+20,92*S
Данная регрессионная модель также имеет хорошее качество, ее коэффициент детерминации составляет 82%, уравнение регрессии является значимым согласно F-критерия Фишера. Таким образом, факторы, которые оказывают самое большое влияние на посадку – это BM (мера интенсивности посадки пассажиров на данной станции в течении данного часа) и S, является ли станция начальной точкой движения поезда.
Влияние населенности на момент приезда электрички на станцию оказалось не значимо. Это означает, что на данной станции количество человек в прибывшем на станцию поезде не влияет на решение человека сесть в данную электричку. Вероятность того, что человек останется ожидать следующую электричку очень мала. Это, возможно, связано с тем, что, во-первых, на рассматриваемой станции движение не очень интенсивное, и интервалы между поездами довольно значительны. А во-вторых с тем, что станция находится ближе к началу движения в сторону Москвы, поэтому, поезда, приходящие на станцию, еще не достигают максимальных показателей населенности. Для станций, расположенных ближе к конечной точке назначения, стоит ожидать большей значимости фактора населенности.
Используя полученное уравнение регрессии, можно рассчитать прогнозные значения посадки на электрички в зависимости от времени прихода поезда и других факторов. Данную методику можно значительно усовершенствовать, используя разнообразные статистические методы. Тогда потребуется использование специального программного обеспечения. Однако, данный метод дает высокие показатели точности, реализуется с помощью стандартных программ и может быть использован для анализа и прогнозирования объемов передвижения пассажиров на пригородных поездах. Можно также посчитать коридоры – доверительные интервалы для количества пассажиров в различные интервалы времени.
Список использованной литературы
1. Экономика железнодорожного транспорта: учебник / Н.П. Терёшина, В.Г. Галабурда, В.А. Токарев и др.; под ред. Н.П. Терёшиной, Б.М. Лапидуса.– М.: ФГОУ – Учебно-методический центр по образованию на железнодорожном транспорте. 2011.– 676 с.
2. Горбачев П.Ф. Моделирование спроса на перевозку пассажиров в пригородном сообщении / П.Ф. Горбачев, В.И. Крикун // Восточно-Европейский журнал передовых технологий. – 2013. – № 3 (62). – С. 12-15
3. Ширяев, С.А. Исследование удовлетворенности пассажиров качеством транспортного обслуживания в пригородном сообщении / С.А. Ширяев, О.В. Устинова, В.А. Гудков // Известия ВолгГТУ. Серия, Наземные транспортные системы. – 2011. – Вып. 4. – №. 12 (85). – С. 107-108.
4. Соколов Ю.И., Лавров И.М. Повышение качества транспортного обслуживания // Экономика железных дорог. 2015. № 8. С. 76-81.
5. Шанченко Н.И. Лекции по эконометрике: учебное пособие для студентов высших учебных заведений, обучающихся по специальности «Прикладная информатика (в экономике)» / Н.И. Шанченко. – Ульяновск: УлГТУ, 2008. – 139 с.
6. Епишкин И.А., Тихомиров А.Н., Фроловичев А.И. Применение экономико-математических методов при анализе показателей по труду и заработной плате на железнодорожном транспорте. // Современные проблемы управления экономикой транспортного комплекса России: конкурентоспособность, инновации и экономический суверенитет // Труды международной научно-практической конференции. – М.: МИИТ, 2015, С. 40-44.
УДК 331.5