View : 37 Download: 0

CNN을 활용한 IoT스트림 데이터 패턴 분류 기법

Title
CNN을 활용한 IoT스트림 데이터 패턴 분류 기법
Other Titles
IoT Stream data pattern analysis using Convolution neural network model
Authors
김경주
Issue Date
2019
Department/Major
대학원 컴퓨터공학과
Publisher
이화여자대학교 대학원
Degree
Master
Advisors
이민수
Abstract
오늘날 사물인터넷(Internet of Things) 환경의 발달로 다양한 IoT 데이터가 생성되고 있고 이를 수집, 관리를 위한 빅데이터 기술이 중요해지고 있다. 여러 분야에서 빅데이터의 활용도가 증가함에 따라 IoT 데이터 분석을 위해 딥러닝 기술이 접목되어 유의미한 결과를 도출해내기 위한 연구들이 진행되고 있다. 주로 데이터 간의 관계를 분석하는 데이터 마이닝에서 더 나아가 새로운 모델을 생성하고 이를 기반으로 예측 및 분류를 하도록 하는 방법들로 이루어져 있으며, 딥러닝은 현재 데이터를 기반으로 학습하여 미래를 예측하여 새로운 결과를 도출해내는 것이 핵심이다. 실시간으로 유입되는 IoT 데이터의 방대한 양을 처리하기 위한 방법으로 딥러닝을 활용하여 효율적인 데이터 분석이 이루어지게 된다면, 패턴이나 특정 경향성을 추측하여 기록 추세, 데이터 분석 결과에 기반한 사고 예측 등의 문제를 해결할 수 있다. 현존하는 데이터 분석에서 더 나아가 분석 결과를 토대로 새로운 결과를 도출하여 새로운 해석이 가능해지기 때문에 딥러닝의 필요성이 대두되고 있다. IoT 데이터의 특성인 시계열 데이터 분류로는 미래의 특정 값을 예측하는 방법과 패턴 분석을 통한 미래의 경향 파악의 방법으로 나뉜다. 하지만 매시간마다 수집되는 IoT 데이터 특성상 외부 요인이나 IoT 센서 기기의 결함 등으로 인해 데이터가 수집되는 동안 일정한 값들이 불안정할 수 있기 때문에 예측 값의 정확도가 낮아질 수 있는 등의 어려움이 발생할 수 있다. 따라서 이러한 IoT 데이터 분석에 있어 발생하는 한계점을 극복하고 미래의 특정 값이 패턴 분류를 통한 데이터의 흐름을 파악할 수 있는 데이터 분석 분류 문제를 해결하고자 했다. 딥러닝 모델 중 합성곱 신경망(Convolutional neural network)은 이미지 처리에 최적화된 알고리즘으로 알려져 있지만, 본 논문에서는 합성곱 신경망을 활용하여 IoT 데이터인 연속적 데이터를 분류(classification)화 하는 작업을 통해 데이터 패턴 분류에 관한 연구를 진행하였다. 또한 앞서 언급한 시계열 데이터 특성상 분석할 때 발생할 수 있는 몇 가지 한계점들을 극복하고자 사전에 데이터 전처리를 통해 분류에 좀 더 용이하도록 하였다. 그리고 모델의 조건 즉, 레이어의 구성 요소와 모델을 구성하는 레이어의 개수, 모델의 학습 횟수 등의 조건을 고려하여 상황별로 나누어 파라미터 값들을 조절해가면서 실험을 진행하였고, 이를 통해 데이터의 세트 크기와 각 특징의 크기에 별로 조건을 다르게 하여 각 특성이 훈련과 실험에 활용된 다른 성질의 데이터 세트에 어떤 모델과 파라미터들이 적합한지에 대한 여러 가지 분석을 통해 레이어가 깊고 배치 크기를 크게 잡고 학습시킨 모델이 IoT 데이터의 특성인 시계열 데이터 패턴 분류의 최적화된 모델의 구조라는 결론을 도출했다.;These days due to the development of the Internet of Things environment, big data technology is becoming important for collecting and managing data. As the utilization of big data increases in various fields, studies are being conducted to draw meaningful results by incorporating deep learning technology into Internet of Things(IoT) data analysis. Data mining is mainly holding an important role for analyzing the relationship between data. However deep learning has strength in analyzing the current based data for creating a model to predict and classify. Using deep learning as a method for handling a large amount of real-time IoT data to extract efficient outcome result from big data, it will be able to classify the specific pattern and trends such as feature trends or preventing an accident and will be efficiently utilized in various fields. Deep learning is emerging because new interpretations are possible by deriving new results based on the analysis results, in addition to existing data analysis. Time-series data classification, which is a characteristic of IoT data, is divided into a method of predicting future specific values and a method of classifying trends through pattern analysis. However, due to the nature of IoT data collected every hour, certain values may become unstable during the collection of data due to external factors or defects of IoT sensor devices, which may cause difficulties such as lower accuracy of predicted values. Therefore, the final purpose of this work is to overcome the limitations of IoT data analysis and solve the problem of data analysis classification that can figure out the flow of data through pattern classification of future specific value is the final purpose. With deep learning model, the convolution neural network is known to be an algorithm optimized for image processing. In this paper, we classify data patterns by classification of continuous data, which is IoT data. Also in order to overcome some limitations that may occur when analyzing the pattern of time series data mentioned above, we add some preprocessing to make the neural network model to be more accurate. The experiment we handled in this paper, is conducted by adjusting the parameter values according to the conditions of the model, such as number of neural network’s hidden layer and find the proper condition for each datasets with different feature length and size of the whole dataset used for experiments to find the best model condition for classification.
Fulltext
Show the fulltext
Appears in Collections:
일반대학원 > 컴퓨터공학과 > Theses_Master
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE