View : 611 Download: 0

텍스트 마이닝 기법을 이용한 유튜브 생물다양성 영상 콘텐츠 분석

텍스트 마이닝 기법을 이용한 유튜브 생물다양성 영상 콘텐츠 분석
Other Titles
The Analysis of YouTube Biodiversity Content Using Text Mining Technology
Issue Date
대학원 에코크리에이티브협동과정
이화여자대학교 대학원
This study began with the premise that the improving public's awareness of biodiversity and active scientific communication are needed. However, research on the current status analysis of biodiversity content is still insufficient. Therefore, in line with the rapid growth of the video service market and policy support, video content produced and shared on Korea YouTube was set as an analysis target. In order to check whether there are differences in content types depending on the country, the US case was also analyzed. The purpose is to infer the main topics and trends by applying text mining techniques to text collected from the video. In order to achieve the purpose, text data of video titles, descriptions, and hashtags were crawled on YouTube to analyze keywords, LDA topic modeling, and Word2vec model-based related words to interpret what topics and characteristics biodiversity contents showed. As a result of the biodiversity contents analysis, it was confirmed that in Korea, insects, fish, and reptiles were the main targets of the content and consisted of contents such as collection and breeding. On the other hand, in the case of content in the United States, it was found that observation of the life history of large reptiles such as wild mammals and crocodiles was the most main topic. In both countries, it was confirmed that content was being produced focusing only on species diversity in the concept of biodiversity. In addition, there was a difference in the types of creatures dealt with and the behavior of video producers.;본 연구는 대중의 생물다양성에 대한 인식 제고와 대중을 위한 활발한 과학커뮤니케이션이 필요로 하다는 전제에서 시작되었다. 그러나 아직까지 생물다양성 콘텐츠의 현황 분석에 대한 연구는 부족한 실정이다. 따라서 동영상 서비스 시장의 급격한 성장과 정책적 지원에 발맞추어 국내 유튜브 상에서 제작 및 공유되는 영상 콘텐츠를 분석 대상으로 설정하였다. 국가에 따라 콘텐츠 유형의 차이가 있는지도 확인하기 위해 미국의 사례도 함께 비교 분석하였다. 영상에서 수집한 텍스트 데이터를 텍스트 마이닝 기법을 적용하여 주요 주제와 트렌드를 추론하는데 목적을 둔다. 상기 목적을 달성하기 위해 유튜브 웹 페이지에서 영상 제목, 소개글, 해시태그의 텍스트 데이터를 크롤링하여 핵심어 분석, LDA 토픽모델링, Word2vec 모델 기반 연관어 분석을 진행하여 생물다양성 콘텐츠가 어떤 주제와 특징을 보이는지 해석하였다. 한국과 미국의 생물다양성 콘텐츠 분석의 결과 국내의 경우 곤충, 어류, 파충류를 주요 대상으로 하며 채집, 사육과 같은 활동으로 내용이 이루어져 있는 것을 확인하였다. 반면 미국의 콘텐츠의 경우 야생의 포유류, 악어와 같은 대형 파충류의 생활사 관찰을 가장 대표적인 주제로 가진다는 것을 파악하였다. 두 국가 모두 생물다양성의 개념에서 종 다양성에만 초점을 맞춰 콘텐츠가 제작되고 있음을 확인하였다, 또한 다루어지는 생물의 종류와 생물을 대하는 행동 양식에서 차이를 보였다. 본 연구를 통해 한국과 미국 유튜브에서 공유되고 있는 생물다양성 콘텐츠에 대한 주제와 트렌드를 확인할 수 있었다. 유튜브 생물다양성 콘텐츠는 종 다양성과 일부 생물 분류군에만 주제가 한정되어 있다는 것을 알 수 있었다. 또한 그 내용이 생물에 대한 정확한 지식 및 정보 전달보다는 생물을 대상으로 하는 영상 제작자의 행동 양식에 집중되어 있는 것을 확인하였다. 따라서 인간 중심에서 생물을 다루는 콘텐츠에서 벗어나 보다 생태친화적인 내용의 영상 콘텐츠의 유입이 필요할 것이라 생각된다.
Show the fulltext
Appears in Collections:
일반대학원 > 에코크리에이티브협동과정 > Theses_Master
Files in This Item:
There are no files associated with this item.
RIS (EndNote)
XLS (Excel)
