Comparative Analysis of Missing Values Imputation Methods: A Case Study in Financial Series (S&P۵۰۰ and Bitcoin Value Data Sets)

سال انتشار: 1403
نوع سند: مقاله ژورنالی
زبان: انگلیسی
مشاهده: 30

فایل این مقاله در 24 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_IJFIFSA-8-1_003

تاریخ نمایه سازی: 29 اردیبهشت 1403

چکیده مقاله:

The accurate imputation of missing values in time series data is paramount for maintaining the integrity and reliability of analyses and predictions. This article investigates the effica-cy of various missing values imputation methods, encom-passing well-known machine learning and statistical tech-niques. Moreover, for a better understanding, they imple-mented two financial data time series: S&P ۵۰۰ and Bitcoin markets spanning from ۲۰۱۶ to ۲۰۲۳ on a daily frequency. Initially utilizing complete datasets, controlled missingness was introduced by randomly removing ۴۵ data points. Then, these methods applied multiple imputation strategies for estimating and substituting these missing values. Experi-mental evaluation yielded insightful findings regarding the performance of the different methods. The examined ma-chine learning methods, including k-Nearest Neighbors (k-NN), Random Forest, Deep Learning, and Decision Trees, consistently outperformed their statistical counterparts, such as Mean Imputation, Regression Imputation, Hot-Deck Im-putation, and Expectation-Maximization Imputation. Nota-bly, Random Forest emerged as the most effective method, showcasing superior performance in terms of accuracy and robustness. Conversely, the Mean Imputation method exhibited com-paratively inferior outcomes, suggesting its limited suitabil-ity for financial time series data. This research contributes to the ongoing discourse on data integrity within finance ana-lytics and serves as a comprehensive guide for practitioners seeking optimal missing values imputation methods. The empirical evidence provided herein advances the under-standing of imputation techniques' relative performance and their application in financial data, facilitating enhanced de-cision-making processes and yielding more reliable predic-tions.

نویسندگان

Mahdi Goldani

Assistant Prof., Department of Finance, Hakim Sabzevari University, Sabzevar, Iran.

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • Abidin, N. Z., Ismail, A. R., & Emran, N. A. ...
  • Acuna E, Rodriguez C (۲۰۰۴). The treatment of missing values ...
  • Cham, H., & West, S. G. (۲۰۱۶). Propensity score analysis ...
  • Chen, Y. C. (۲۰۲۲). Pattern graphs: a graphical approach to ...
  • Dantan, E., Proust-Lima, C., Letenneur, L., & Jacqmin-Gadda, H. (۲۰۰۸). ...
  • Dany'el Irawan, N., Wijono, W., & Setyawati, O. (۲۰۱۷). Perbaikan ...
  • Demirtas, H. (۲۰۱۸). Flexible imputation of missing data. Journal of Statistical ...
  • Dong, Y., & Peng, C. Y. J. (۲۰۱۳). Principled missing ...
  • Husson, F., Josse, J., Narasimhan, B., & Robin, G. (۲۰۱۹). ...
  • Ismail, A.R., Abidin, N.Z., & Maen, M.K. (۲۰۲۲). Systematic Review ...
  • Jadhav, A., Pramod, D., & Ramanathan, K. (۲۰۱۹). Comparison of ...
  • Jerez, J. M., Molina, I., García-Laencina, P. J., Alba, E., ...
  • Kang, H. (۲۰۱۳). The prevention and handling of the missing ...
  • Lakshminarayan, K., Harp, S. A., & Samad, T. (۱۹۹۹). Imputation ...
  • Lan, Q., Xu, X., Ma, H., & Li, G. (۲۰۲۰). ...
  • Lin, T. H. (۲۰۱۰). A comparison of multiple imputation with ...
  • Lin, W. C., & Tsai, C. F. (۲۰۲۰). Missing value ...
  • Little, R. J., & Rubin, D. B. (۱۹۸۹). The analysis ...
  • Little, R. J., & Rubin, D. B. (۲۰۱۹). Statistical analysis with ...
  • Marsh, H. W. (۱۹۹۸). Pairwise deletion for missing data in ...
  • Moeinol, H. H., et al. (۲۰۲۲). An approach for handling ...
  • Moinul, M., Amin, S. A., Kumar, P., Patil, U. K., ...
  • Park, J., Müller, J., Arora, B., Faybishenko, B., Pastorello, G., ...
  • Rahman, M.G., & Islam, M.Z. (۲۰۱۱). A Decision Tree-based Missing ...
  • Rahman, M.G., & Islam, M.Z. (۲۰۱۴). iDMI: A novel technique ...
  • Ratolojanahary, R., Ngouna, R. H., Medjaher, K., Junca-Bourié, J., Dauriac, ...
  • Raymond M, Roberts D (۱۹۸۷). A comparison of methods for ...
  • Rubin, D. B. (۱۹۷۶). Inference and missing data. Biometrika, ۶۳(۳), ۵۸۱-۵۹۲ ...
  • Saha, S., Ghosh, A., Bandopadhyay, S., & Dey, K.N. (۲۰۱۹). ...
  • Schouten, R. M., Lugtig, P., & Vink, G. (۲۰۱۸). Generating ...
  • Sidek, R. M., et al. (۲۰۱۶). A review of missing ...
  • Stavseth, M. R., Clausen, T., & Røislien, J. (۲۰۱۹). How ...
  • Strike K, Emam KE, Madhavji N (۲۰۰۱). Software cost estimation ...
  • Tang, F., & Ishwaran, H. (۲۰۱۷). Random forest missing data ...
  • Tang, F., & Ishwaran, H. (۲۰۱۷). Random forest missing data ...
  • Tutz, G., & Ramzan, S. (۲۰۱۵). Improved methods for the ...
  • Wang, Z., Zhao, B., Guo, H., Tang, L., & Peng, ...
  • Zhang, Y., Li, M., Wang, S., Dai, S., Luo, L., ...
  • Zhang, Y., Liu, J., Liu, H., Lu, Y., Wang, S., ...
  • Zhang, Z. (۲۰۱۶). Missing data imputation: focusing on single imputation. Annals ...
  • نمایش کامل مراجع