검색 상세

기계학습의 소개: 예측모형을 위한 지도학습 이론을 중심으로

An Introduction to Machine Learning Focusing on Predictive Models Using Supervised Learning

초록/요약

최근 기계학습과 정보통신기술의 발달로 인해 예측모형의 정확도가 크게 향상되었다. 이에 따라 교육 분야를 포함한 사회과학 전반에 걸쳐 지도학습에 기반한 예측모형에 관한 관심이 점차 높아지고 있다. 이 논문의 목적은 지도학습을 처음 접하는 사회과학 분야 연구자들에게 지도학습의 기본개념과 이론적 틀을 소개하는 것이다. 이를 위해 이 논문은 다음과 같은 핵심 주제를 중심으로 지도학습을 소개하고자 하였다. 첫째, 지도학습은 전통적인 최적화 문제로 정의된다. 둘째, 지도학습의 가장 큰 과제는 데이터로부터 일반화 가능한 관계나 패턴만을 학습하여 학습된 관계나 패턴이 새로운 데이터에도 잘 적용될 수 있도록 하는 것이다. 셋째, 최적의 예측모형이란 예측모형을 사용해서 이루고자 하는 목적과 관련지어서만 의미 있게 정의될 수 있다. 이러한 핵심 주제를 중심으로 이 논문에서는 기계학습의 정의, 인공지능에서 학습의 필요성, 통계적 학습이론, 지도학습의 다양한 성능평가지표, 앙상블 방법, 클래스 불균형 데이터, 지도학습의 학습과정, 표현학습을 소개하였다. 논의에서는 지도학습에 기반한 예측모형을 교육 분야 연구에 적용할 수 있는 방법과 한계점에 대해 논의하였다.

more

초록/요약

Recent developments in machine learning and information and communications technology have dramatically improved the accuracy of predictive models. Therefore, various fields in social science including psychology are paying more attention to predictive models based on machine learning. The goal of this article was to introduce the key concepts and theoretical framework of supervised learning to those researchers who do not have much background on the topic. To that end, this article introduced supervised learning with three main themes. First, supervised learning can be defined based on the framework of a traditional optimization problem. Second, the key task of supervised learning is to learn the relationships and patterns that can be generalized to previously unseen data. Third, optimal predictive models can be meaningfully defined only when discussed in relation to the ultimate goals for using the models. Focusing on these main themes, this article introduced the definition of machine learning, statistical learning, performance metrics, ensemble methods, class imbalance data, and representation learning. In the discussion, some limitations of a machine learning approach were also discussed.

more