검색 상세

사람에서 컴퓨터 자동화로의 연결을 위한 탐색 : 객체 인식(Object Detection) 딥러닝 알고리즘 YOLO4, 자세 인식(Pose Detection) 프레임워크 MediaPipe를 활용한 음악 프로그램의 여성 신체 대상화, 선정적 화면 검출 연구

From Human Coding to Automated Detection : Detecting Visual Images of Female Body Objectification and Sexualized Poses from TV Music Programs Using YOLO4 and MediaPipe

초록/요약

본 연구는 방송 음악 프로그램을 대상으로 여성 신체 대상화 및 선정적 화면의 자동화된 검출을 위한 규칙을 찾는 연구이다. 그동안 사람에 의해 수동으로 연구되었던 화면 이미지를 자동화된 컴퓨터 알고리즘으로 추출하기 위해 어떠한 규칙을 적용해야 하는지 시험해 보았다. 연구는 2021년 3월 2째주에 지상파 3사 음악 프로그램에 방송된 걸그룹 브레이브걸스의 ‘롤린’ 댄스 화면을 대상으로 각 방송사 화면을 비교하며 진행되었다. 선행 연구에 기반하여 여성 신체가 대상화되는 이미지와 선정적 이미지를 12개의 화면 이미지로 구분하고, 방송 카메라 앵글이 이들 장면을 잡아낼 때 이전 화면과 달라지는 특질을 찾고자 하였다. 연구 방법으로는 영상 화면의 프레임 추출과 딥러닝에 기반한 YOLO4 객체 감지 알고리즘, 동작 감지 프레임워크인 MediaPipe를 활용하였다. 본 연구의 결과를 요약하면 다음과 같다. 우선, 여성 신체가 대상화되는 화면에서는 장면 전환이 일어나면서 이전 화면 대비 화면에 등장하는 사람의 수가 급격히 줄어드는 규칙이 발견되었다. 그런데, 이러한 규칙이 반드시 여성 신체가 대상화되는 화면에만 적용되는 것은 아니어서, 오히려 선정적 화면을 회피하는 방식으로도 확인되었다. 따라서, 추가적인 규칙으로 화면에 사람 얼굴이 등장여부를 동시적으로 적용해야 화면이 여성 신체를 대상화하는지 아니면 선정적 화면을 회피하는 방식의 카메라 앵글 화면인지 검출할 수 있는 것으로 나타났다. 부가적인 연구 문제로 지상파 방송 3사 화면의 대상화 및 선정적 화면 빈도를 살펴본 결과 MBC가 다른 방송사보다 상대적으로 대상화 및 선정적 화면이 적은 것으로 나타났다. 동작 검출을 해보니 MBC 화면에서 신체 하체부위의 화면이 다른 방송사보다 더 적게 검출되었다. 본 연구는 1개 걸그룹의 1개 노래에 대한 분석이라는 한계를 가지지만, 그동안 사람에 의한 수동 연구방법으로 연구된 방송 영상 이미지 연구를 자동화된 양적 연구를 통해 대용량 방송 화면에 적용하기 위해 어떠한 규칙이 적용되어야 하는지 탐색한 연구라는 의의를 가진다.

more

초록/요약

The goal of this research is to examine patterns of objectification and sexualization of the female body in music programs on television. The study's goal is to identify rules for automated visual image detection of body objectification and sexualization. To do so, previous qualitative study findings were used to identify target images and the cutting-edge object-detection deep learning algorithm, YOLO4 (You Only Look Once), and MediaPipe, a framework for deep learning-based pose detection, were used to search for patterns. As this is a one-of-a-kind study linking body objectification and algorithm-based object detection, the case for analysis must be carefully chosen, taking into account random effects from unplanned camera movements caused by real-time broadcasting. The dance to the song 'Rollin' by the female group 'Brave Girls' had already been broadcasted earlier in 2017. Thus, the on-stage choreography and camera movements associated with the song were already known, making them suitable for research data. The study used music programs that aired on three broadcasting networks, KBS, MBC, and SBS, during the second week of March, 2021. To fine-tune the patterns, 12 screen images were selected by extracting keyframes from the song's original music videos. The study's findings are summarized below. To begin, when the scene transition is associated with a significant decrease in the number of people in the visual frame in comparison to the previous frame, it is frequently associated with female body objectification. Because body objection is associated with an emphasis on a specific body-part in the absence of a face, this is essentially a zoom-in technique transited from a wide-angle view of the scene. This rule, however, is insufficient for detecting objectified visual images; it can also be applied to screen images that avoid sexualized images in the given dance choreography. As a result, an additional rule is required to exclusively find images of female body objectification, and it is discovered that detecting human faces on the screen appears to be a good measure. In other words, unless the human faces on the screen do not appear with the scene transition that shows a dramatic decrease in the number of humans in the scene, a visual flow of images can be considered female body objectification. The study also compared the levels of objectification across broadcasting networks and found that MBC has a lower proportion of sexualized images than that of other networks. On MBC's music program, the MediaPipe framework for pose detection discovered fewer scene images with lower body parts than others. The findings of this study suggest that computer vision research can be used to detect female objectified bodies and sexual images in television programs.

more