View : 615 Download: 0

BERT 감성분석과 LSTM 모델을 활용한 코스피지수 방향성 예측 연구

Title
BERT 감성분석과 LSTM 모델을 활용한 코스피지수 방향성 예측 연구
Other Titles
KOSPI Index Movement Prediction Combining BERT sentiment analysis and LSTM neural networks
Authors
장서희
Issue Date
2023
Department/Major
대학원 빅데이터분석학협동과정
Publisher
이화여자대학교 대학원
Degree
Master
Advisors
신경식
Abstract
본 연구의 목적은 한국 코스피지수 방향 예측 정확도의 향상을 위해 뉴스 정보의 감성을 반영하여 딥 러닝(Deep Learning) 예측모델을 통해 그 효과성을 입증하는 데에 있다. 뉴스 정보의 감성을 분석하기 위해서는 최신 자연어 처리(Natural Language Process, NLP) 기법인 BERT(Bidirectional Encoder Representations from Transformers)를 응용하여 한국어에 적용 가능한 KoBERT(Korean BERT) 모델을 사용하였으며, 예측 정확도를 높이기 위해 사용된 방법론은 시계열 데이터와 같은 시퀀스 데이터에 대해 기존 RNN(Recurrent Neural Network) 모델의 기울기 소실 문제를 극복한 LSTM(Long Short-Term Memory) 모델을 적용하여 연구의 목적을 달성하였다. 학습 데이터로는 코스피지수의 일별 OHLC(Open, High, Low, Close), 거래량의 수치적 자료와 함께 원/달러 환율, 원/위안 환율, 원/엔 환율의 거시경제지표를 사용하였으며, 뉴스기사 헤드라인 및 본문 데이터를 수집하여 사용하였다. 데이터 수집 기간은 2018년 3월부터 2022년 8월까지이다. 감성변수 투입 여부에 따른 예측 모델의 정확도를 비교하고, 방향성 예측 결과에 대한 평가척도로는 정확도 지표와 F1-score, 민감도(Sensitivity)와 특이도(Specificity)를 채택하였다. 연구 결과에서 확인할 수 있듯이, 예측 모델의 파라미터를 고정한 채 실험을 수행하여 감성 변수 투입 이후의 코스피지수 방향성 예측력 향상을 입증하였다. 뉴스 기사 감성 정보를 변수에 추가한 모델은 63%의 정확도를 보이며 수치형 자료와 거시경제지표만을 조합한 모델보다 약 7% 높은 성능을 보였다. 본 연구를 통해 텍스트 감성분석을 이용한 금융지수 방향성 예측에 있어 뉴스와 같은 사회적, 심리적 정보와 최신 자연어 처리 기술 KoBERT의 조합이 한국 코스피지수 방향성의 예측력 향상에 또한 기여한다는 사실을 확인하였다.;The purpose of the study is to prove the effectiveness of a deep learning prediction model by reflecting the emotional information of the news articles to improve the prediction accuracy of the KOSPI(Korea Composite Stock Price Index). In order to analyze the sentiment of news information, the KoBERT(Korean BERT) model applied with BERT(Bidirectional Encoder Representations from Transformers), the latest natural language processing technique, was used. The methodology used to increase the prediction accuracy achieved the purpose of the study by applying the LSTM(Long Short-Term Memory) model that overcomes the gradient vanishing problem of the existing RNN(Recurrent Neural Network) model to sequence data such as time series. As the training data, macroeconomic indicators of KRW/USD exchange rate, KRW/CNY exchange rate, KRW/JPY exchange rate were used along with daily OHLC(Open, High, Low, Close) and trading volume of the KOSPI, and headline and body of news articles were collected and used. The period is from March 2018 to August 2022. The accuracy of the prediction model according to the input of emotional variables was compared, and F1-score, sensitivity and specificity were selected as evaluation criteria for the directional prediction result. As can be seen from the results of the study, an experiment was conducted while the parameters of the predictive model were fixed, and the improvement of the directional predictive power of the KOSPI index after the input of emotional variables was demonstrated. The model which was including news article sentiment information showed 63.1% accuracy and showed higher performance than the model using numeric variables and macroeconomic indicators. Through this study, it was confirmed that the reflection of social and psychological information in predicting the direction of the financial index using text sentiment analysis also contributes to the improvement of the predictive power of the direction of the KOSPI index.
Fulltext
Show the fulltext
Appears in Collections:
일반대학원 > 빅데이터분석학협동과정 > Theses_Master
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

BROWSE