검색 상세

경험적 모델과 머신러닝 기법을 활용한 SNS 사용자 분류방법 비교: 플리커 데이터의 관광객 분류방법

Comparison of Tourists Classification Methods of Geotagged Photos: Empirical Models and Machine Learning Approaches

초록/요약

플리커는 위치, 시간, 사진 등의 정보를 포함하고 있어 관광 분야에서 활용이 높은 SNS 가운데 하나이다. 플리커 데이터를 활용하여 관광객의 특성을 분석하기 위해서는 플리커에 사진을 업로드한 사용자 가운데 관광객을 구분하는 것이 필수적이다. 실제 플리커의 메타데이타에는 사용자의 거주지 정보를 기재하게 되어 있지만 정확하게 기재한 사용자의 비율은 40% 미만이다. 본 연구는 플리커 사용자 가운데 관광객과 거주자를 구분하기 위해 경험적 모델과 기계학습 방법을 적용하고, 정확도를 평가하여 어떠한 방법을 사용할지 제안하고자 하였다. 경험적 방법에는 시간적 임계치, 최다 사진 촬영 국가, 최장 체류 국가, 최다 방문 국가를 기준으로 거주국을 추정하는 4가지 방법을, 기계학습 방법에는 로지스틱 회귀, 서포트벡터머신, 의사결정나무, 랜덤포레스트, 인공신경망 모델의 5가지 방법을 적용하였다. 적용 결과 경험적 방법에서는 최장 체류 국가를 기준으로 거주국을 추정하는 방법이, 기계학습 방법에서는 랜덤포레스트 방법이 가장 정확도가 높게 도출되었다. 그러나 관광객 구분에 있어서 정확도뿐 아니라 특이도도 주의 깊게 고려해야 할 항목임을 알 수 있었으며, 연구 목적에 따라 다른 방법이 선택될 수 있음을 제안하였다.

more