View : 124 Download: 0

BERTopic을 활용한 인공지능 교육 연구 동향 분석

Title
BERTopic을 활용한 인공지능 교육 연구 동향 분석
Other Titles
A study on Analyzing Trends in Artificial Intelligence in Education Research Using BERTopic
Authors
박예지
Issue Date
2024
Department/Major
교육대학원 AI융합교육전공
Keywords
인공지능 교육, BERTopic, 토픽모델링, 동향 분석, 교육분야 인공지능
Publisher
이화여자대학교 교육대학원
Degree
Master
Advisors
이선복
Abstract
본 연구는 인공지능 교육 연구의 최신 동향과 연구 주제 분포를 파악하여 인공지능 교육 발전을 위한 시사점을 도출하고 향후 연구 방향 설정에 이바지하는 것을 목적으로 한다. 이를 위해 알파고의 등장으로 인공지능 교육의 필요성이 제기된 2016년부터 딥러닝 기술 혁신으로 등장한 생성형 인공지능에 관한 담론이 활성화된 2023년 9월까지 SCOPUS 데이터베이스에 등재된 1,084편의 인공지능 교육 연구 학술 문헌 초록을 수집하여 텍스트 마이닝 기법의 하나인 토픽모델링 분석을 실시하였다. 본 연구는 동향 연구에 보편적으로 사용되어 온 토픽모델링 기법인 LDA의 한계를 보완하고 인공지능 교육 연구의 세부 토픽과 키워드를 효과적으로 도출할 수 있도록 문장 임베딩에 기반한 토픽모델링 기법인 BERTopic을 활용하였다. 연구 목적의 달성을 위해 본 연구는 다음의 세 가지를 연구 문제로 한다. 첫째, 인공지능 교육 연구의 주요 토픽은 무엇인가? 둘째, 인공지능 교육 연구의 주요 키워드는 무엇인가? 셋째, 인공지능 교육 연구의 동향은 어떠한가? 분석 대상으로 권위 있는 국제 학술 저널 데이터베이스인 SCOPUS에서 인공지능 교육 연구의 동향 분석에 적합한 학술 가치를 지닌 문헌을 수집하였다. 연구 목적에 부합하는 문헌을 수집하기 위해 인공지능, 기계학습, 딥러닝에 교육과 초ㆍ중ㆍ고를 의미하는 키워드를 조합하여 검색하였으며 2016년부터 2023년 9월까지 총 1,084편의 문헌 영문 초록을 분석 대상으로 선정하였다. 토픽모델링에는 LDA의 한계를 극복하기 위해 최근 등장한 BERTopic을 이용하였다. BERTopic의 임베딩에 SBERT 언어모델‘all-MiniLM-L6-v2’을 이용하였으며 텍스트 본래의 구조를 유지하기 위해 데이터 전처리는 최소화하였다. 임베딩의 차원 축소에 UMAP, 군집화에 HDBSCAN을 이용하였으며 HDBSCAN에 의한 계층적 밀도 기반 군집화에 따라 토픽 수가 자동으로 결정되게 하였다. 모델 업데이트 시 추가로 표제어 추출과 불용어 처리를 수행하여 토픽 해석이 용이하게 하였다. 토픽모델링 분석 결과, 인공지능 교육 연구의 18개 토픽과 토픽별 키워드가 도출되었다. 첫째, 양적 규모를 확인한 결과 전체 토픽 중 가장 많은 연구가 이루어진 것은 ‘인공지능 교육을 위한 기반 조성’으로 인공지능 교육을 위한 교육과정과 교수ㆍ학습 프로그램 개발 연구, 인공지능에 관한 교육 주체의 인식 조사 연구 등이 수행되었다. 인공지능 소양에 관한 논의도 함께 이루어졌으나 인공지능 윤리 교육은 독립적인 토픽으로 도출되지 않았다. 선행 연구와 달리‘학업 성공 예측’이 두 번째로 높은 비율을 차지하였으며 인공지능 모델로 학습자의 성공과 이탈 등을 예측하여 조기에 지원 대책을 마련하고자 하는 연구가 수행되었다. ‘인공지능을 활용한 학생 참여 중심 수업’ 역시 큰 비중을 보여 교수자의 지식 전달 중심에서 학습자의 능동적 참여에 기반한 역량 강화중심으로 변모한 교육 기조의 양상을 재확인하였다. 이때 인공지능 도구의 활용 가능성이 다각도로 탐색되고 있다. 둘째, 시간의 흐름에 따른 토픽 분포의 변화를 살폈을 때 2016년과 2019년에는 ‘인공지능을 활용한 학생 참여 중심 수업’이 가장 많이 연구되었으며 이 토픽은 이후에도 등락이 있으나 꾸준한 연구가 이어지고 있다. 2017년과 2018년에는 ‘학업 성공 예측’이 가장 활발히 연구되었으나 2019년 주춤한 뒤 다시 반등하였다. 2020년부터는 ‘인공지능 교육을 위한 기반 조성’ 연구가 널리 수행되고 있으며 다른 토픽에 비해 압도적으로 많은 연구물이 축적되었다. ‘교육에서 인공지능 챗봇의 협력적 활용’ 연구는 2020년 이전까지 미비하다 이후 계속 증가하는 추세를 보였다. 셋째, 인공지능 교육을 목적과 관점에 따라 이해 교육, 활용 교육, 융합 교육으로 구분하였을 때 세 영역의 연구가 모두 수행되었다. 이 중 이해 교육 관련 연구가 2020년 이후 많이 증가하여 각국 정책에 힘입어 인공지능이 교육 의 내용으로 본격 연구되기 시작한 시점이 확인되었다. 인공지능 교육의 연구 대상은 초등, 중등, 고등 교육으로 다양하였으며 게임 기반 교육, 프로젝트 기반 교육 등 수업 혁신 기법을 활용한 이해 교육 방안이 논의되었다. 활용 교육은 다양한 교과 교육의 관점에서 연구되었으며 인공지능 수업 도구의 활용 뿐 아니라 기술의 활용, 플랫폼의 활용으로 이어졌다. 인공지능의 역할도 교과 교육 지원, 맞춤형 교육을 위한 보조 교사로서의 활용, 협력 학습에서의 활용, 개인화된 학습 환경 구성 등 다양한 형태로 확장되고 있다. 융합 교육은 내용 의 융합과 방법으로써의 융합이 두루 연구되었다. 연구 결과를 바탕으로 향후 연구에 대한 시사점은 다음과 같이 도출하였다. 첫째, 인공지능 윤리 교육 연구가 더욱 강화되어야 한다. 현재 인공지능 윤리 교육 연구는 초기 단계로 쟁점, 딜레마에 기반한 개별 교육 프로그램 개발 연구가 주로 수행되고 있으나 가짓수가 많지 않다. 인공지능 윤리와 인공지능 거버넌스에 관한 논의를 선례로 초ㆍ중ㆍ고 및 전 생애에 걸친 체계적인 윤리 교육 체계를 마련하여 연구 사례를 국내외에 선제적으로 제안하여야 한다. 둘째, 인공지능을 활용한 교육 문제 해결 시 발생 가능한 윤리 문제를 예방하기 위해 교육 분야 인공지능 윤리 원칙의 활성화 방안을 강구해야 한다. 특히 인공지능 활용 능력이 교수자 개인의 역량에 편중된 초ㆍ중등 교육 분야에서 준칙에 의거한 의사결정이 이뤄지도록 디지털 전환에 앞서 세부 가이드라인 및 체크리스트를 보급하고 안내할 방안을 마련해야 한다. 더불어, 교육용 인공지능 개발자 및 교수자, 학습자의 인공지능 개발과 활용 준거가 될 윤리 원칙의 적극적인 교육과 지속적인 개선을 위한 연구가 계속되어야 한다. 셋째, 인공지능 교육에 적합한 교수ㆍ학습 모형 개발 및 검증을 위한 연구가 적극적으로 수행되어야 한다. 교육과정과 교수ㆍ학습 프로그램 개발에 관한 연구물이 축적된 것에 비해 인공지능 교육에 적합한 수업 설계 원리를 집약한 모형 개발 및 모형의 안착을 위한 폭넓은 검증은 미흡하다. 전 교과를 아울러 인공지능 소양 함양을 위한 구조화되고 체계적인 융합 수업 설계가 강조되고 있는 만큼 수업 설계의 기틀이 되는 모형 개발과 보급이 중요한 시점이다. 수업 혁신 기법을 적용한 국내외 모형 개발 사례와 인공지능 교육 우수 사례를 종합적으로 검토하여 효과적인 모형 개발, 검증 연구가 이뤄져야 한다.;The purpose of the study is to derive implications for the development of Artificial Intelligence(AI) in education by grasping the latest trends in AI in education research and the distribution of research topics, and contribute to setting directions for future research. To achieve this, the study conducted text mining analysis using the BERTopic, a sentence embedding-based topic modeling method, on 1,084 abstracts of AI in education academic literature registered in the SCOPUS database. The study utilized BERTopic to complement the limitations of Latent Dirichlet Allocation(LDA), a commonly used topic modeling method in trend research, and effectively extract detailed topics and keywords in AI in education research. In order to achieve the research objectives, this study formulates three research questions. First, what are the major topics in AI in education research? Second, what are the main keywords in AI in education research? And third, what are the trends in AI in education research? For the analysis, academic literature with scholarly value suitable for analyzing trends in AI in education research was collected from the prestigious international academic journal database, SCOPUS. In order to collect literature aligned with the research objectives, a search was conducted using combinations of keywords such as AI, machine learning, deep learning, and education mainly across elementary, middle, and high school levels. A total of 1,084 documents with English abstracts from 2016 to September 2023 were selected as the subjects of analysis. To overcome the limitations of LDA in topic modeling, the study employed the recently introduced BERTopic. SBERT language model ‘all-MiniLM-L6-v2’ was used for embedding in BERTopic, and data preprocessing was minimized to maintain the original structure of the text. UMAP was used for dimensionality reduction in embedding, HDBSCAN for clustering, and the number of topics was automatically determined based on hierarchical density-based clustering by HDBSCAN. Additional lemmatization and stop-word removal were performed during model updates to facilitate topic interpretation. The results of the topic modeling analysis revealed 18 topics and their corresponding keywords in AI in education research. First, in terms of quantitative scale, the topic with the most research activities was ‘Establishing Foundations for AI Education’. Studies in this area focused on the development of educational curricula and instructional programs for AI education, as well as surveys on the awareness of educational entities regarding AI. Discussions on AI literacy were also present, but ethical education did not emerge as an independent topic. In contrast to prior research, the second-highest proportion was related to ‘Academic Success Prediction’ where research aimed to predict learners' success and failure using AI models, facilitating the early development of support measures. ‘Active Learning Utilizing AI’ also held significant importance, highlighting a shift in educational paradigms from knowledge transmission by instructors to competency enhancement based on active learner participation. The potential use of AI tools in various dimensions is being explored within this context. Second, when examining the changes in topic distribution over time, it was found that in 2016 and 2019, ‘Active Learning Utilizing AI’ was the most researched topic, and steady research in this area has continued since then. In 2017 and 2018, ‘Academic Success Prediction’ was the most actively researched, but after a decline in 2019, it rebounded. From 2020 onwards, research on ‘Establishing Foundations for AI Education’ has been widely conducted, accumulating an overwhelmingly large number of studies. Research on the ‘Collaborative Use of AI Chatbots in Education’ was limited before 2020 but has shown a continuous increasing trend since then. Third, when categorizing AI in education into ‘AI education’, ‘AI-enabled education’, and ‘AI convergence education’ according to its purpose and perspective, research has been conducted in all three areas. Among them, research related to AI education has increased significantly since 2020, indicating a point where AI began to be studied as a substantive part of education, driven by policies in various countries. The research subjects of AI in education varied from elementary, secondary, and higher education, discussing educational approaches such as game-based education and project-based education as innovative teaching methods. AI-enabled education has been studied from the perspective of various subject education, leading to the use of technology and platform as well as the use of AI instructional tools. The role of AI has expanded in various forms, such as educational support, utilization as an assistant teacher for personalized education, and collaboration in cooperative learning. AI convergence education has been researched in terms of content and methodological integration. Based on the research results, the implications for future research were derived as follows. First, research on AI ethics education should be further activated. Currently, research on AI ethics education is in its early stages, and research on the development of individual education programs based on issues and dilemmas is mainly conducted, but there are not many. With discussions on AI ethics and AI governance as a precedent, a systematic ethics educationsystem for K-12, higher education and lifelong learning should be established to preemptively propose cases. Second, efforts should be made to promote AI ethics principles in the education sector to prevent potential ethical issues arising from the use of AI in educational problem-solving. Particularly in the field of elementary and secondary education, where AI utilization skills may be biased towards individual instructors, guidelines and checklists should be disseminated and provided before digital transformation. Continuous research is needed to actively educate and improve ethical principles for AI development and utilization among education-focused AI developers, instructors, and learners. Third, research should be actively conducted to develop and verify instructional design models suitable for AI education. While there has been an accumulation of studies on curriculum development and instructional program development, extensive verification for the development of a model that integrates instructional design principles suitable for AI education and the settlement of the model is insufficient. Given the emphasis on structured and systematic convergence lesson designs for cultivating AI literacy across all subjects, it is crucial to develop and disseminate foundational models for lesson designs. Effective model development and verification research should be conducted by comprehensively reviewing the best cases of AI education applying instructional innovation techniques.
Fulltext
Show the fulltext
Appears in Collections:
ETC > ETC
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

BROWSE