ПРАКТИЧЕСКИЕ АСПЕКТЫ СТАТИСТИЧЕСКОГО МОДЕЛИРОВАНИЯ И ПРОГНОЗИРОВАНИЯ ПРЕСТУПНОСТИ НА ОСНОВЕ ДАННЫХ РЯДОВ ДИНАМИКИ
Аннотация и ключевые слова
Аннотация (русский):
Цель работы состоит в практической реализации регрессионных моделей преступности, которые покажут комплексное воздействие различных социально-экономических факторов на состояние преступности в России, определят прогноз на ближайшую перспективу. Результатом данного исследования является построение линейной многофакторной регрессионной модели и прогнозной ARMA-модели с тремя вариантами прогноза. На основе корреляционного анализа определены факторы, имеющие наиболее сильную связь с переменной, характеризующей преступность. Модель множественной регрессии показала взаимосвязанное влияние отдельных факторов на состояние преступности в рамках разработанного уравнения. Качество полученных моделей подтверждено оценочными тестами на статистическую значимость. В качестве исходных данных исследования выступили официальные статистические данные российской статистики за 1992–2020 годы, а также использован массив данных из более 500 наблюдений.

Ключевые слова:
преступность, прогноз, модель преступности, регрессия, статистический анализ, статистические данные
Текст
Текст произведения (PDF): Читать Скачать


В предыдущей статье «Особенности статистического моделирования и прогнозирования преступности: теоретический аспект» нами был проведен анализ источников литературы, который обозначил результаты исследования отечественных и зарубежных авторов и показал эффективные модели и методики прогнозирования, а также группы факторов, оказывающие высокое влияние на развитие криминальной обстановки. Практическая реализация рассмотренных методик в отдельных странах показала различную достоверность (качество) прогнозных значений. 
При этом в мировой практике наибольшую распространенность получили следующие методы прогнозирования: экстраполяция, моделирование, метод экспертных оценок [1]. Высокие показатели получили: метод случайной лесной регрессии (точность прогнозирования до 97 %), метод экспоненциального сглаживания Хольта с ежемесячной сезонностью, логистическая регрессия и нейросетевая модель, простая линейная экстраполяция, а также некоторые другие методы, показавшие наибольшую эффективность применительно к конкретным пространственно-временным характеристикам и отдельным типам преступности [2, с. 61–70]. 
В данной работе представлены практические результаты моделирования и прогнозирования преступности в Российской Федерации на основе построения регрессионных моделей по данным динамических рядов.
Для реализации инструментария моделирования и прогнозирования регистрируемой преступности выбраны методы построения линейной модели множественной регрессии и построение авторегрессионной модели [3; 4]. Использование выбранных методик позволит показать величину зависимости преступности от других переменных, благодаря которым можно осуществить планирование мероприятий, направленных на снижение преступности [5].

Таблица 1
Перечень показателей, использованных для проведения 
корреляционно-регрессионного анализа
МДля исследования влияния различных факторов на состояние преступности в Российской Федерации были выбраны данные Росстата по показателям, представленным в таблице 1 [6, с. 35].
Таким образом, было выделено 19 переменных (в том числе зависимая переменная Y). Показатели отражены в  динамике за 1992–2018 годы в собственных величинах. С целью недопущения искажения результатов анализа из-за влияния накопленной инфляции стоимостные показатели учитывались в сопоставимых ценах базисного 1992 года. В качестве зависимой переменной, характеризующей состояние преступности, взят показатель «число зарегистрированных преступлений» (тыс. ед.). Далее были выделены корреляционные связи Y с влияющими переменными (табл. 2), рассмотренными в таблице 1. 
Интерпретируя полученные результаты, следует обратить внимание на то, что наиболее тесная связь наблюдается между факторами: X1, Х2, X5, X11, Х12, Х16, Х18 и Y. Степень влияния остальных факторов на количество лиц, совершивших преступления, невысокая. При этом следует отметить, что показатели динамических рядов могут быть подвержены влиянию тенденции (наличие тренда), поэтому может наблюдаться явление ложной корреляции. 
В программной среде Gretl нами с использованием метода наименьших квадратов была построена линейная модель множественной регрессии. Попытка усовершенствовать модель за счет включения в нее временного тренда показала отсутствие такой необходимости (переменная времени статистически не значима), поэтому в итоговую модель после анализа на мультиколлинеарность методом инфляционных факторов (табл. 3) были включены компоненты, показанные на рисунке 1.

Таблица 2
Коэффициенты парной корреляции зависимой переменной Y 
и независимых переменных Х1 – X18

Таблица 3
Коэффициенты парной корреляции зависимой переменной Y 
и независимых переменных Х1 – X18

Для проверки обоснованности применения линейной модели были выполнены тесты на нелинейность: нелинейность (квадраты), нелинейность (логарифмы). Результат теста на нелинейность (квадраты) показал: р-значение = P (Хи-квадрат > 10,181) = 0,117234; 0,117234 ˃ 0,05. Таким образом, гипотеза о корректности линейной модели не отвергается. Тест на нелинейность (логарифмы) показал: р-значение = P (Хи-квадрат > 7,4114) = 0,284469; 0,284469 ˃ 0,05, что также не отвергает нулевую гипотезу о корректности линейной модели.
С учетом полученных результатов (рис. 1) модель можно характеризовать следующим образом. Множественный коэффициент корреляции R = 0,9582 показывает, что теснота связи между количеством зарегистрированных преступлений и факторами, включенными в модель, высокая. Множественный коэффициент детерминации (R-квадрат) D = 0,9182, то есть 91,82 % вариации числа зарегистрированных преступлений объясняется вариацией изучаемых факторов. Проверка значимости коэффициента множественной корреляции путем сравнения фактического и табличного значений F-критерия (тест Фишера) показала адекватность модели (Fфакт = 37,39 ˃ Fтабл = 2,60, при вероятности ошибки α = 0,05). Таким образом, тест Фишера подтвердил значимость всей модели. Достоверность по уровню значимости критерия Фишера (значимость F = 7,62609E-10) значительно меньше 0,05. Таким образом, модель является статистически значимой. 
Проверка справедливости выдвинутой гипотезы путем сравнения расчетного критерия значимости с критическим уровнем значимости (p < 0,05) показала значимость гипотезы по всем включенным в модель факторам. Тест Стьюдента (tфакт ˃ tтабл = 2,086) также подтвердил статистическую значимость всех факторов. Статистика Дарбина-Уотсона  (DW ≈ 2,0  при d1 = 0,925 и d2 = 1,974) показала отсутствие автокорреляции остатков. Тест Уайта подтвердил нулевую гипотезу об отсутствии гетероскедастичности (LM = 7,46554; р-значение = P (Хи-квадрат > 7,46554) = 0,82538 ˃ 0,05). Тестирование модели с использованием методики Бриша-Пэгана также подтвердило гипотезу об отсутствии гетероскедастичности (LM = 4,621814; р-значение = P (Хи-квадрат > 4,621814) = 0,593148 ˃ 0,05).
Тест на нормальное распределение ошибок подтвердил гипотезу о том, что остатки распределены по нормальному закону (Хи-квадрат = 1,87978; р–значение = 0,39067 ˃ 0,05). Результаты теста Рамсея (RESET-тест) на ошибку спецификации указали на то, что в модели не хватает одного или нескольких важных объясняющих факторов (F(2, 18) = 9,84742; р-значение = P (F(2, 18) > 9,84742) = 0,00129097; 0,00129097 < 0,05). Здесь следует отметить, что на информационных ресурсах Росстата, МВД, прокуратуры не раскрыта статистическая информация по отдельным важным показателям (факторам), характеризующим, например, эффективность работы правоохранительных органов (количество раскрытых/нераскрытых преступлений), численный состав МВД и так далее, либо такая информация раскрыта за относительно небольшой временной интервал, что не позволило ее учесть при построении регрессионной модели.

Используя приведенные коэффициенты и учитывая результаты проведенных тестов, составлено уравнение модели:

Ŷ= –4,543,93 + 2,22 ∗ X1 – 0,00254 ∗ X4 ∗ 21,9 ∗ X9 + 1,23 ∗ X13 + 0,513 ∗ X14 + 0,00226 ∗ X15

где Ŷ– число зарегистрированных преступлений, тыс. ед.
Комплексное влияние на объемы преступности в рамках данной модели оказывают факторы: X1, X4, X9, X13, X14, X15.
На основе данной модели трудно прогнозировать состояние преступности, поскольку невозможно определить поведение всех влияющих факторов, включенных в модель на перспективу. Для прогнозирования в среде Gretl нами была построена ARMA-модель (2, 0) со следующими характеристиками: уровень надежности – 95 %, R2 = 0,79. Значения информационных критериев следующие: AIC = 404,42, HQC = 406,13, BIC = 409,89. Использован точный метод максимального правдоподобия. Динамический ряд (1992–2020) предварительно был протестирован на стационарность (ADF-тест), ряд оказался стационарным в уровнях ряда. Модель успешно прошла все основные тесты на статистическую значимость: тест на нормальное распределение ошибок, тест на отсутствие ARCH-процессов, LM-тест на отсутствие автокорреляции. Уравнение модели имеет следующий вид:

yt= 2626,42 + 1,18243 ∗ yt-1– 0,371075 ∗ yt-2 + et
где yt – число зарегистрированных преступлений, тыс. ед.
В рамках данной модели нами рассчитаны варианты прогноза на среднесрочную перспективу 2021‒2023 годов (рис. 2): 
– расчетный прогноз (предсказание): 2021 год – 2 161,418 тыс. ед., 2022 год – 2 292,636 тыс. ед., 2023 год – 2 404,295 тыс. ед.;
– позитивный сценарий: 2021 год – 1 732,938 тыс. ед., 2022 год – 1 629,096 тыс. ед., 2023 год – 1 608,084 тыс. ед.;
– негативный сценарий: 2021 год – 2 589,899 тыс. ед., 2022 год – 2 956,177 тыс. ед., 2023 год – 3 200,506 тыс. ед.
Таким образом, расчетный прогноз показывает незначительный рост регистрируемой преступности на среднесрочную перспективу, остальные варианты свидетельствуют, соответственно, снижение и значительный рост показателя. При этом реализация конкретного сценария будет зависеть от эффективности проводимой государством социально-экономической политики.

Следует отметить, что данная модель не может прогнозировать реальные объемы преступности, поскольку значительная их часть латентна и не регистрируется. При этом разработка методик прогнозирования общего объема преступности актуальна и требует выработки новых подходов к количественной оценке не учитываемых (из-за их латентности) показателей.
Подводя итог проведенному исследованию, отметим следующие основные результаты:
– выделены статистически значимые факторы, оказывающие взаимосвязанное влияние на состояние преступности в рамках полученной многофакторной модели: количество заключенных, количество разводов, численность населения с денежными доходами ниже величины прожиточного минимума, численность студентов, обучающихся по программам подготовки специалистов среднего звена, численность студентов, обучающихся по программам бакалавриата, прибыло в Российской Федерации из стран СНГ и стран дальнего зарубежья;
– разработанная прогнозная ARMA-модель показала три варианта прогноза регистрируемой преступности. Реализация того или иного варианта будет зависеть от эффективности реализуемой государством социально-экономической политики. 
Использование прогностического подхода в практике деятельности аппарата государственного управления способствует повышению качества принятия управленческих решений. Проведение дальнейших исследований, направленных на совершенствование моделей и инструментов моделирования, будет способствовать формулировке более точных выводов относительно взаимосвязи между различными параметрами состояния преступности.

Список литературы

1. Пилюгина Т. В., Пичкуренко Е. А., Вендина А. А. Математические методы прогнозирования преступности // Aspectus. 2015. № 1. С. 98-103.

2. Пилюгина Т. В., Натура Д. А. Использование метода математического моделирования при прогнозировании региональной преступности в вопросах ее предупреждения // Всероссийский криминологический журнал. 2017. Т. 11. № 1. С. 61-70.

3. Богданова М. В., Паршинцева Л. С., Квачко В. Ю. Методика моделирования и прогнозирования преступности в Российской Федерации // Правовая информатика. 2019. № 4. С. 50-62.

4. Осипов В. А. Некоторые аспекты прогнозирования развития преступности экстремистской направленности в Российской Федерации // Вестник Белгородского юридического института МВД России имени И. Д. Путилина. 2019. № 4. С. 17-22.

5. Маркина С. А. Оценка и прогнозирование экономической преступности в системе обеспечения экономической безопасности // Известия Юго-Западного государственного университета. Серия: Экономика. Социология. Менеджмент. 2019. Т. 9. № 6 (35). С. 147-162.

6. Буньковский Д. В., Капустюк П. А. Экономические факторы, влияющие на развитие организованной преступности // Деятельность правоохранительных органов в современных условиях: сборник материалов XXII международной научно-практической конференции: в 2 т. Иркутск, 2017. С. 35-39.


Войти или Создать
* Забыли пароль?