Методика выбора входных признаков для алгоритмов машинного обучения
https://doi.org/10.56304/S2304487X22010114
Аннотация
В данной работе описана методика выбора (отбора) признаков для обучения различных алгоритмов машинного обучения. Методика основана на известных методах отбора признаков, может быть использована в качестве обработки данных для решения задачи классификации с помощью алгоритмов машинного обучения. Методика состоит из нескольких этапов: вычисление оценки каждого признака с помощью существующего метода перетасовки признаков (Feature shuffling) на основе ряда метрик качества (scoring parameters) модели машинного обучения; обработка собранного массива данных для разделения на два класса (релевантные и нерелевантные признаки) с помощью алгоритма кластеризации К-средних; удаление нерелевантных признаков из общего набора данных для дальнейшего использования в обучении SVM классификатора; оценка точности классификации алгоритма. Особенность методики заключается в применении сразу нескольких метрик качества для улучшения показателя точности и гибкости модели, а также в использовании ансамбля алгоритмов машинного обучения для отбора лучших признаков. В рамках исследования был проведен ряд экспериментов для получения результатов эффективности методики. В качестве набора входных данных для классификатора использовались показания электромиографического (ЭМГ) сигнала мышечной активности, собранных специализированным датчиком, где каждый набор данных соответствует отдельному жесту (классу). В ходе обработки из сигнала был выделен и отобран с помощью разработанной методики ряд признаков для составления входного набора данных для дальнейшего обучения SVM классификатора. Обученная модель была использована для интерпретации жестов в команды управления роботизированного устройства в реальном времени. Применение методики обеспечило более высокую точность распознавания жестов по сравнению с методами, которые используют одну метрику качества модели машинного обучения для отбора признаков.
Об авторах
В. В. ТагуновРоссия
115409
Москва
К. Я. Кудрявцев
Россия
115409
Москва
А. И. Петрова
Россия
115409
Москва
Т. И. Возненко
Россия
115409
Москва
Список литературы
1. Quitadamo L. R., Cavrini F., Sbernini L., Riillo F., Bianchi L., Seri S., Saggio G. Support vector machines to detect physiological patterns for EEG and EMG-based human–computer interaction: a review // Journal of neural engineering, 2017. V. 14. № 1. P. 011001.
2. Будко Р. Ю. Распознавание мышечных усилий по сигналу лицевой электромиограммы в режиме реального времени / Р. Ю. Будко, Н. Н. Чернов, А. Ю. Будко // Научный вестник Новосибирского государственного технического университета. – 2018. – № 2. – С. 59–74.
3. Семендаров А. В. Выбор структуры и гиперпараметров svm для эффективного решения задач классификации сигналов электромиографии / А. В. Семендаров // Научный взгляд в будущее. – 2019. – Т. 1. – № 14. – С. 23–33.
4. Khokhar Z. O., Xiao Z. G., Menon C. Surface EMG pattern recognition for real-time control of a wrist exoskeleton. // Biomedical engineering online, 2010. V. 9. № 1. P. 1–17. doi: 10.1186/1475-925X-9-41
5. Brownlee J. How to choose a feature selection method for machine learning // Machine Learning Mastery, 2019. V. 10.
6. Soledad G. Alternative Feature Selection Methods in Machine Learning. Available at: https://trainindata.medium.com/alternative-feature-selection-methods-in-machine-learning-7ed8142d594 (accessed 04. 04. 2022)
7. Pedregosa F., Varoquaux G., Gramfort A., Michel V., Thirion B., Grisel O., Blondel M., Prettenhofer P., Weiss R., Dubourg V., Vanderplas J., Passos A., Cournapeau D., Brucher M., Perrot M., Duchesnay E. Scikit-learn: Machine learning in Python // Journal of machine Learning research, 2011. V. 12. P. 2825–2830.
8. Voznenko T. I., Gridnev A. A., Kudryavtsev K. Y., Chepin E. V. The Decomposition Method of Multi-channel Control System Based on Extended BCI for a Robotic Wheelchair // Advances in Intelligent Systems and Computing, 2020. V. 948. P. 562–567. doi: 10.1007/978-3-030-25719-4_73
9. Voznenko T. I., Gridnev A. A., Chepin E. V., Kudryavtsev K. Y. The command interpretation in decomposition method of multi-channel control for a robotic device // Procedia Computer Science, 2020. V. 169. P. 152–157. doi: 10.1016/j.procs.2020.02.127
10. Voznenko T. I., Gridnev A. A., Chepin E. V., Kudryavtsev K. Y. Comparison Between Coordinated Control and Interpretation Methods for Multi-channel Control of a Mobile Robotic Device // Advances in Intelligent Systems and Computing, 2021. V. 1310. P. 558–564. doi: 10.1007/978-3-030-65596-9_68
11. Kapur A., Kapur S., Maes P. AlterEgo: A personalized wearable silent speech interface // In 23rd International conference on intelligent user interfaces, 2018. P. 43–53. doi: 10.1145/3172944.3172977
Рецензия
Для цитирования:
Тагунов В.В., Кудрявцев К.Я., Петрова А.И., Возненко Т.И. Методика выбора входных признаков для алгоритмов машинного обучения. Вестник НИЯУ МИФИ. 2022;11(1):51-58. https://doi.org/10.56304/S2304487X22010114
For citation:
Tagunov V.V., Kudryavtsev K.Y., Petrova A.I., Voznenko T.I. Feature Selection Method for Machine Learning Algorithms. Vestnik natsional'nogo issledovatel'skogo yadernogo universiteta "MIFI". 2022;11(1):51-58. (In Russ.) https://doi.org/10.56304/S2304487X22010114