View : 901 Download: 0

초중등 학생들의 게재용 작문을 통한 키워드 및 토픽 분석에 관한 연구

초중등 학생들의 게재용 작문을 통한 키워드 및 토픽 분석에 관한 연구
Other Titles
A Study on the Analysis of Keywords and Topics in the Published Writing Scripts of Elementary and Middle School Students
Issue Date
교육대학원 소프트웨어교육전공
이화여자대학교 교육대학원
21세기 지식정보화 사회와 제4차 산업혁명의 시대 흐름에 따라 교육현장에서는 많은 변화를 요청받고 있다. 과거에는 정책 의사결정자들이 관련 쟁점을 분석하고 적절한 대응 체제를 구축 및 구조화하는 데 충분한 시간이 있었지만 현재는 각종 정보가 실시간으로 생성·유통됨에 따라 정책을 결정하고 시행하는 데 충분한 시간을 확보할 수 없는 상황이다. 또한, 학교현장에서 교사가 모든 학생들의 내면화 표출을 인지할 충분한 시간을 제공할 수 없으며 학생들이 내면화를 표출하지 않을 경우 교사가 파악하는 것은 불가능하다. 따라서 제4차 산업혁명 시대 흐름과 학생들의 내면화 인지 불능에 따라 빠르고 효율적으로 대처하기 위해서는 텍스트마이닝(Text Minning) 기법과 같은 새로운 방법론을 활용하여 직·간접적으로 교육정책을 분석하고 학생들의 내면화를 파악할 필요성이 나타나고 있다. 텍스트마이닝은 자연어 처리과정(Natural Language Processing: NLP)에 기반하여 문서 자료들로부터 유의미한 정보를 추출하여 가공하는 기법으로서, 코퍼스(Corpus)에서 중요단어를 추출하여 다른 단어와의 연계성을 파악하거나 범주를 탐색하는 등의 분석이 수행된다. 텍스트마이닝 기법에서 주목받고 있는 분석기법은 ‘자동화된 텍스트 내용 분석’ (Automated Text Content Analysis)이며, 이 기법은 텍스트마이닝을 일관적, 체계적으로 분석할 수 있다. 또한, 데이터의 수집·가공·분석 과정이 알고리즘(Algorithm) 형태로 공개되기 때문에 연구의 투명성과 재현가능성(Reproducibility)까지 확보할 수 있다. 국내 교육 분야에서 자동화된 텍스트 내용 분석을 활용하는 연구가 실시되고 있다. 관련 연구로는 ‘텍스트 네트워크 분석(Text Network Analysis)’과 ‘토픽 모델링(Topic Modeling)’을 활용하여 학교 현장에서 교과서의 핵심어구 및 경향성 관련 쟁점 및 여론을 분석한 연구가 진행되었다. 이들 선행연구는 교육 분야에 텍스트마이닝 기법을 이용하여 쟁점과 여론 연구를 폭넓게 하였다는 데 의의가 있다. 그러나 대부분의 선행연구에서는 상용 서비스를 이용해 분석하였기 때문에 데이터의 수집, 가공, 분석 방법이 투명하게 공개되지 않았으며, 교육학 분야의 전문적 지식이 내포되지 않아서 전국적 여론 추이 분석에 머무른 경향이 있다. 또한, 정보 비공개 등의 이유로 접근제한과 분석 한계로 인해 여전히 관련 연구는 부족한 실정이다. 이에 본 연구에서는 텍스트마이닝 분석 기법을 활용하여 초·중등학생들의 작문을 통해 키워드 및 토픽 분석에 관한 연구를 수행하였다. 웹크롤링(Web Crawling)을 이용하여 2019년 5월부터 9월까지 5개월 동안 경상북도교육청 정보센터 e-독서친구와 한국독서문화재단 글나라넷, 인천 □□초등학교, 인천△△초등학교 2곳에서 발행된 교지를 대상으로 데이터를 수집하였다. 수집한 데이터를 형태소 분석한 후 워드클라우드(Word Cloud) 및 단어 빈도분석, 토픽 분석을 하였다. LDA를 기반으로 하여 토픽 분석을 위한 전반적인 과정이 연구 과정을 통해 이루어졌으며, 연구 이론을 입증하기 위한 추후 실험이 수행되고 분석되었다. 본 연구에 사용되는 작문 데이터는 백일장, 독후감, 편지, 일기로 구성되어있으며 학생들의 토픽을 파악하여 적절한 교육의 목표와 커리큘럼을 수립하는데 중요한 자료가 된다. 또한, 학생들이 작성한 작문 결과물을 토픽 분석을 실시하여 교육현장에 필요한 궁극적인 지향점을 제시하였다.;In the era of the 21st century knowledge and information society and the era of the 4th Industrial Revolution, many changes are taken upon in the educational field. In the past, decision makers had enough time to analyze relevant issues and establish the appropriate systems, but now that various information is generated and distributed in real time, they cannot propose good policies in short time. Also, at school sites, teachers cannot provide enough time to recognize all students' global attitude and it is impossible for them to figure it out personality. Therefore, it is necessary to analyze education policies directly and indirectly, and identify writing capability of students, using new methodologies such as text mining techniques, to cope with the current text mining approaches and students' inability to recognize writing skills and mind maps for better writing scripts. Text-mining is a technique for extracting and processing meaningful information from document based on natural language processing (NLP), and analysis is carried out by extracting important words from the Corpus to identify links with other words or generating the corresponding categories. Analyzer has the drawing attention in text-mining technique is ‘Automated text content analysis’, which can analyze text-mining consistently and systematically. In addition, the collection, processing, and analysis processes of data are processed in the form of algorithms, thus ensuring transparency and reproducibility of research results. Research is being conducted to analyze automated text contents in the domestic education sector. A related study was done to analyze issues and public topics related to the core phrase and textbooks at school sites using ‘text network analysis’ and ‘topic modeling’. These preceding studies are meaningful in that they have used text-minning techniques in the education sector to broaden issues and public research. However, in most prior studies, data collection, processing, and analysis methods were not disclosed transparently because they were analyzed using commercial products, and the lack of specialized knowledge in the field of education tends to remain in the analysis of related governmental research results. In this thesis, keywords and topics are supposed to analyze writing scripts of elementary and middle school students using text-minning analysis techniques. For the five months from May to September 2019, the data were collected from E-bookfriend of the information center of the Gyeongsangbuk-do Office of Education, the Gulnara, □□ Elementary School in Incheon and △△ Elementary School in Incheon. After analyzing the data collected, Word Cloud, word frequency, and topic analysis were applied to get results. Based on LDA, the overall process for topical analysis was done through the research process, and later experiments were conducted and analyzed to prove the research objectives. The composition data used in this study consists of a poetry and prose, a book report, a letter, and a diary, and is important to understand the topics of students and to establish appropriate educational goals and curricula. In addition, the results of the composition prepared by the students will be given a topical analysis to provide the ultimate direction needed for the educational field.
Show the fulltext
Appears in Collections:
교육대학원 > 소프트웨어교육전공 > Theses_Master
Files in This Item:
There are no files associated with this item.
RIS (EndNote)
XLS (Excel)
