Импутация данных муниципальной статистики
https://doi.org/10.34020/2073-6495-2020-3-277-286
Аннотация
Рассмотрена ключевая проблема проведения статистического анализа на массиве данных муниципальной статистики: наличие существенного количества пропущенных данных. Приведено понятие и виды импутации данных. Обосновано применение метода K ближайших соседей для проведения импутации на этапе использования данных официальной статистики, содержащихся в Базе данных показателей муниципальных образований. Предложен авторский алгоритм восстановления пропусков в массиве данных показателей муниципальной статистики с использованием системы STATISTICA . Верификация результатов импутации проведена путем сравнения распределений исходных и восстановленных данных на основе критерия согласия Пирсона .
Об авторе
Т. Б. СкрипкинаРоссия
Скрипкина Татьяна Борисовна, старший преподаватель, кафедра статистики
Новосибирск
Список литературы
1. Бурдун Г.Д., Марков Б.Н. Основы метрологии. М.: Изд-во стандартов, 1985. 120 с.
2. Зайков К.А. К вопросу оценки уровня инновационного потенциала субъектов Российской Федерации // Вестник НГУЭУ. 2019. № 1. С. 134–151.
3. Бых А.И., Высоцкая Е.В., Рак Л.И., Порван А.П., Болибок Е.Е., Сватенко О.А. Выбор метода восстановления пропущенных данных для оценки сердечно-сосудистой деятельности подростков // Восточно-Европейский журнал передовых технологий. 2010. № 3/4 (45). С. 4–7. [Электронный ресурс]. URL: https://cyberleninka.ru/article/n/vybor-metoda-vosstanovleniya-propuschennyh-dannyh-dlya-otsenki-serdechno-sosudistoy-deyatelnosti-podrostkov/viewer
4. Ковтун А. Развитие и совершенствование процессов обработки данных выборочных обследований. [Электронный ресурс]. URL: https://www.gks.ru/free_doc/new_site/rosstat/smi/prezent23-2013/kovtun.pdf
5. Лемешко Б.Ю., Чимитова Е.В. О выборе числа интервалов в критериях согласия типа c2 // Заводская лаборатория. Диагностика материалов. 2003. Т. 69. С. 61–67. URL: https://www.researchgate.net/publication/315333672_O_vybore_cisla_intervalov_v_kriteriah_soglasia_tipa_X2
6. Приказ Росстата от 07.12.2018 N 732 «Об утверждении Методологических положений по организации процессов производства официальной статистической информации». [Электронный ресурс]. URL: http://www.consultant.ru/document/cons_doc_LAW_313411/ (дата обращения: 13.03.2020).
7. Фабрикант М.С. Модель-ориентированный подход к отсутствующим значениям: множественная импутация в многоуровневой регрессии посредством R (на примере анализа опросных данных) // Социология: методология, методы, математическое моделирование. 2015. № 41. С. 7–29. [Электронный ресурс]. URL: https://www.elibrary.ru/download/elibrary_26539204_98997170.pdf
8. Фомина Е.Е. Обзор методов и программного обеспечения для восстановления пропущенных значений в массивах социологических данных // Гуманитарный вестник. 2019. № 4. С. 1–12. [Электронный ресурс]. URL: http://www.hmbul.ru/articles/611/611.pdf
9. Хрестоматия практико-ориентированного комплекса учебно-методических материалов по курсу «Организация выборочных обследований». Межгосударственный статистический комитет Содружества Независимых государств. С. 42. URL: http://www.cisstat.com/Trainig_courses/CIS_training_course_Organization_of_sample_surveys/CIS_training_course_Organization_of_sample_surveys_07%20-%20reader.pdf
Рецензия
Для цитирования:
Скрипкина Т.Б. Импутация данных муниципальной статистики. Вестник НГУЭУ. 2020;(3):277-286. https://doi.org/10.34020/2073-6495-2020-3-277-286
For citation:
Skripkina T.B. Imputation of Municipal Statistics Data. Vestnik NSUEM. 2020;(3):277-286. (In Russ.) https://doi.org/10.34020/2073-6495-2020-3-277-286