View : 244 Download: 0

Full metadata record

DC Field Value Language
dc.contributor.advisor이민수-
dc.contributor.author이미경-
dc.creator이미경-
dc.date.accessioned2023-02-24T16:30:21Z-
dc.date.available2023-02-24T16:30:21Z-
dc.date.issued2023-
dc.identifier.otherOAK-000000201929-
dc.identifier.urihttps://dcollection.ewha.ac.kr/common/orgView/000000201929en_US
dc.identifier.urihttps://dspace.ewha.ac.kr/handle/2015.oak/264058-
dc.description.abstract시계열 패턴 분류 과제에서 범주형 데이터가 중요한 정보를 담고 있는 경우들이 존재한다. 또한, 시계열 데이터의 자체 특성이나, 측정 환경과 관련된 데이터는 범주형 데이터의 형태로 표현되는 경우가 많기 때문에 시계열 데이터의 패턴 분류에 범주형 데이터를 효과적으로 반영하여 분석하는 것은 다양한 분야에서 활용될 수 있다. 시계열 데이터와 범주형 데이터를 함께 분석하는 기존 연구들은 범주형 데이터 자체를 의미 있는 데이터로 인코딩하는 데에 초점을 두었다. 반면, 본 연구에서는 시계열 데이터와 범주형 데이터를 결합하는 텐서곱 기반의 데이터 융합 (Data Fusion) 기법을 통해 범주형 데이터의 특성을 반영하는 범주형-공간적 시계열 데이터를 생성하고, 생성된 데이터에 대한 처리 과정에서 범주형 데이터의 정보가 효과적으로 반영되도록 딥러닝 기반의 1×1 합성곱 연산을 사용한다. 본 연구에서는 이를 기반으로 설계된 TP-PC(Tensor Product – Pointwise Convolution) 모듈과, 해당 모듈을 사용한 딥러닝 네트워크인 TP-PCNet(Tensor Product – Pointwise Convolution Network)를 제안한다. 제안하는 기법을 3가지 데이터셋에 적용한 결과, 제안하는 기법이 시계열 데이터만을 사용하여 패턴 분류를 수행한 경우와, 기존의 범주형 데이터 분석 기법을 통해 분류를 수행한 경우 모두에 대해서 더 높은 성능을 보임을 확인하였다. 본 연구는 의미 있는 범주형 데이터를 시계열 패턴 분류에 효과적으로 반영하는 경우 분류 성능을 높일 수 있음을 보였으며, 제안하는 기법이 기존의 범주형 데이터 분석 기법보다 효과적으로 범주형 데이터를 반영하면서도 경량화된 네트워크 구조를 갖는다는 점에서 의의가 있다. 추가적으로, 제안하는 기법의 성능은 범주형 데이터의 중요도에 따라 영향을 받으며, 회귀 과제보다 분류 과제에 더 적합함을 보였다.;Categorical data often contains important information for time series pattern classification. In addition, since the characteristics or measurement environment of time series data are often expressed in the form of categorical data, time series pattern classification combined with categorical data can be applied to various fields. Existing studies that analyze time series data and categorical data together have focused on encoding the categorical data into meaningful data. On the other hand, this paper combines time series data and categorical data through proposing a data fusion method based on a tensor product. After tensor product, categorical-spatial time series data that effectively reflects the information of categorical data is generated. Then, to process the categorical-spatial time series data reflecting this categorical information, a deep learning analysis technique based on 1×1 convolutionm was used. This paper proposes a TP-PC (Tensor Product – Pointwise Convolution) module based on the technique, and TP-PCNet (Tensor Product – Pointwise Convolution Network), a deep learning network using the module. This paper conducted experiments applying the proposed method to three different datasets. As a result, the proposed model’s time series classification performance was better than either using only time series data or using existing categorical data analysis techniques. This paper showed that classification performance can be improved when meaningful categorical data is effectively reflected in time series pattern classification. And the proposed method reflects categorical data better than the existing method while having a lightweight network structure. Additionally, this paper showed that the performance of the proposed method is affected by the importance of categorical data, and is more suitable for classification tasks than regression tasks.-
dc.description.tableofcontentsⅠ. 서론 1 A. 연구의 배경 1 B. 연구 문제 정의 2 C. 연구 방법 4 D. 본 연구의 기여점 4 Ⅱ. 관련 연구 5 A. 텐서곱 관련 이론 5 B. 11 합성곱 관련 이론 9 C. 범주형 데이터 및 인코딩 관련 이론 11 D. 범주형 데이터 처리 기법 관련 기존 연구 13 E. 시계열 데이터와 범주형 데이터를 함께 분석하는 기존 연구 14 F. 텐서곱을 사용한 딥러닝 기법과 관련된 기존 연구 15 G. 공간적 특성을 갖는 시계열 데이터에 대한 분석 관련 기존 연구 15 Ⅲ. TP-PC 모듈의 설계 16 A. 텐서곱을 사용한 시계열 및 범주형 데이터의 데이터 융합 기법 17 B. 11 합성곱을 사용한 딥러닝 기반 융합 데이터 처리 기법 23 Ⅳ. TP-PCNet의 설계 28 A. 임베딩을 사용한 범주형 데이터 표현 28 B. TP-PC 모듈 29 C. LSTM 기반 시계열 패턴 분류 29 Ⅴ. TP-PC 모듈, TP-PCNet의 구현 30 Ⅵ. 실험 32 A. 실험 개요 32 B. 실험 환경 34 C. 실험 데이터셋 35 1. 데이터셋 1 : EEG 패턴 분류 관련 데이터셋 35 2. 데이터셋 2 : ECG 패턴 분류 및 회귀 예측 관련 데이터셋 36 3. 데이터셋 3 : 교통량 패턴 분류 관련 데이터셋 37 4. 데이터셋 4 : 전력 발전량 회귀 예측 관련 데이터셋 37 D. 비교 모델 38 1. 제안하는 기법의 검증 실험 관련 비교 모델 39 2. 범주형 데이터의 중요도 관련 비교 모델 49 3. TP-PC 모듈의 11 합성곱 커널 수 선정 관련 비교 모델 50 4. 비교 모델 설계에 대한 상세 설명 52 E. 실험 별 상세 설명 53 1. 실험 1 : 제안하는 기법의 유효성 검증 실험 53 2. 실험 2 : 범주형 데이터의 중요도 관련 실험 54 3. 실험 3 : 회귀 과제에의 제안하는 기법 적용 실험 54 4. 실험 4 : 회귀 과제에서의 범주형 데이터의 중요도 관련 실험 54 5. 실험 5 : TP-PC 모듈의 커널 개수 선정 관련 실험 55 F. 실험 결과 및 분석 57 1. 실험 1 57 가. 실험 1-1 57 나. 실험 1-2 59 다. 실험 1-3 61 라. 실험 1-1, 1-2, 1-3에 대한 종합적 성능 분석 63 마. 실험 1-1, 1-2, 1-3에 대한 파라미터 수와 학습 소요 시간 분석 65 바. 실험 1-4 68 2. 실험 2 71 3. 실험 3 72 4. 실험 4 75 5. 실험 5 77 Ⅶ. 결론 및 향후 연구 78 A. 결론 78 B. 한계점 78 C. 확장 가능성 79 D. 향후 연구 80 참고문헌 81 ABSTRACT 87-
dc.formatapplication/pdf-
dc.format.extent10535863 bytes-
dc.languagekor-
dc.publisher이화여자대학교 대학원-
dc.subject.ddc000-
dc.titleTP-PCNet-
dc.typeMaster's Thesis-
dc.title.subtitle시계열 데이터 패턴 분류를 위한 효과적인 범주형 데이터 융합 및 딥러닝 기반 분석 기법-
dc.title.translatedTP-PCNet : Time Series Pattern Classification based on Effective Categorical Data Fusion and Deep Learning Analysis Method-
dc.creator.othernameLee, Mikyeong-
dc.format.pageviii, 88 p.-
dc.identifier.thesisdegreeMaster-
dc.identifier.major대학원 인공지능·소프트웨어학부-
dc.date.awarded2023. 2-
Appears in Collections:
ETC > ETC
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

BROWSE