검색 상세

거리영상 기반 보행환경의 정성적 평가 예측을 위한 딥러닝 모델 개발

Development of a Deep Learning Model to Predict the Qualitative Evaluation of a Walking Environment based on Street View Images

초록/요약

도시의 시각적 형상은 근린에 대한 사람들의 인식을 형성하는 중요한 요소이다. 최근 컴퓨터 비전 분야의 발전과 거리영상 플랫폼의 활성화로 ‘아름다움’, ‘활기참’, ‘안전성’, ‘보행성’등과 같은 도시 건조환경에 대한 사람들의 인식을 분석하려는 연구가 시도되고 있다. 선행연구들은 거리영상에 대한 사람들의 정성적 평가를 데이터셋으로 활용하여 거리영상에 대한 감성 점수를 예측하는 모델을 개발하고 있다. 대표적으로 샴네트워크(Siamese network)와 랭킹함수(ranking function)를 학습하는 손실함수(loss function)로 구성되고 특정 감성에 대한 각 이미지의 순위를 실수로 반환하는 모델을 제안하고 있다. 그러나 도시의 건조환경의 특성이 두드러지지 않는 경우 모델의 정확도를 높이는 것은 한계가 있다. 따라서 본 연구에서는 이미지의 전역적 특징과 이미지를 패치로 나눈 지역적 특징도 함께 학습하는 모델을 제안했다. 모델의 유용성을 평가하기 위해 전주시의 카카오 거리영상을 수집하고, 사람들의 보행환경에 대한 쌍별비교(pairwise comparison) 결과를 학습데이터로 하여 보행환경(walkability)점수를 예측하는 모델을 구현하고, 정확도를 측정했다. 제안된 모델은 기존 연구와 비교하였을 때 가장 높은 정확도를 나타냈다. 본 연구의 방법은 건조환경에 대한 사람들의 인식을 학습할 때 도시의 규모와 관련 없이 효과적으로 거리영상의 특징을 학습할 수 있는 모델로 사료된다.

more

초록/요약

The visual appearance of a city is an important factor in shaping perception of the neighborhood. With the recent development of the computer vision, research has attempted to analyze perceptions of urban built environments such as 'beauty', 'lively', 'safety', and 'walking‘. Using the training set that represent perception of street view images, previous studies have developed models that predict the score of the image on a particular emotion. Typically, they have proposed models based on Siamese network and a loss function that learns the rank that returns the rank of each image on a particular emotion. However, if the characteristics of the built environment are not distinctive, there is a limit to increasing the accuracy of the model. Therefore, we propose a model that learns both regional features on images by dividing each image into patches and global features. To evaluate the effectiveness of our model, we collected Kakao streetview images of Jeonju, implemented the model to predict the walkability score using the pairwise comparison data and measured accuracy. Our model records the highest accuracy compared to the existing studies. Our model is considered to effectively learn the characteristics of streetview images regardless of the size of the city.

more