View : 814 Download: 0

Analysis of Domestic Cause of Death Data Using Big Data Visualization Technique

Title
Analysis of Domestic Cause of Death Data Using Big Data Visualization Technique
Other Titles
빅데이터 시각화 기법을 이용한 국내 사망원인 자료 분석
Authors
오래은
Issue Date
2019
Department/Major
대학원 통계학과
Publisher
이화여자대학교 대학원
Degree
Master
Advisors
이은경
Abstract
사망원인 통계는 의료 및 보건 정책을 수립하고 실행하는 데에 있어 중요하게 고려되는 지표이다. 이에 사망원인 자료를 이용한 다양한 선행 연구들이 있었지만, 대부분은 사망원인 자료에 대한 통계적인 기술을 숫자 및 표를 이용하여 제시하였고, 사망자 구성 또는 사망원인 추이를 그림을 통해 시각적으로 분석한 시도는 없었다. 본 논문에서는 1997년부터 2016년까지 20년 동안 국민 전체를 대상으로 입수된 사망 신고서를 기초로 조사된 사망원인 자료에 대해, 다양한 시각화 기법들을 활용하여 자료의 특성을 파악하고 분석하였다. 막대 그래프(Bar Graph)를 이용하여 연령대별 남/여 사망자 비율을 살펴보았고, 그 결과 80대 이상을 제외한 모든 연령대에서 남성 사망률이 여성을 앞지르는 것을 확인하였다. 생키 다이어그램(Sankey Diagram)을 이용해 연령대와 성별에 따른 주요 사망원인 계통을 살펴보았고, 청년층에서는 ‘외인’과 ‘분류되지 않은 증상’이, 중/장년층에서는 ‘신생물’과 ‘순환계통 질환’이 주요 사망원인 계통임을 확인하였다. 노년층에서는 ‘호흡계통 질환’이 중요한 계통으로 부상하였다. 히트 맵(Heat Map)을 이용하여 상위 20개 사망원인에 대한 20년간 사망률 추이를 나타낸 결과 알츠하이머, 심장 질환, 폐렴, 자살에 대해서는 증가 추세를, 뇌혈관 질환, 간 질환, 운수사고에 대해서는 감소 추세를 확인하였다. 사망원인 중 외인에 대해서는 선 그래프(Line Graph)를 이용해 연/월별 추이를 나타냈다. 운수사고와 연기 및 불에 노출에 대해서는 연별 추이를 나타내는 선 그래프의 피크를 통해 지역별 대형 운수사고 및 화재를 파악하였다. 익사 및 자살의 경우 연령대별로 월별 추이를 살펴본 후, 다른 연령대와 비교하여 독특한 양상을 보인 10대 사망자에 대해 연별 추이를 추가적으로 살펴보았다.;Cause-of-death statistics is considered as an important indicator in establishing and implementing medical and health policies. There have been various precedent studies using cause-of-death data, but most of them have presented descriptive statistics of the data using numbers and tables, and there has been no attempt to analyze it visually. In this thesis, we use various visualization techniques to analyze the characteristics of cause-of-death data from 1997 to 2016, obtained from the entire population. Using Bar Graphs, we examined mortality rate by age group and sex. As a result, mortality rate of men outperformed that of women in all age groups except for the age group of the 80s and older. Sankey Diagrams were used to examine the major systems of cause-of-death by age group and sex. The lower the age group, ‘external causes’ and ‘unclassified symptoms’ accounted for the majority. In the middle age group, ‘malignant neoplasm’ and ‘circulatory system disease’ were identified as major cause-of-death systems. In the elderly, ‘respiratory system disease’ emerged as a critical cause-of-death system. We used Heat Maps to examine the 20-year-trends of the mortality rate for the top 20 causes-of-death, and confirmed that ‘malignant neoplasm’ is the leading cause-of-death. The mortality rates of ‘Alzheimers’s disease’, ‘heart disease’, ‘pneumonia’ and ‘suicide’ are increasing, while the mortality rates of ‘cerebrovascular disease’, ‘liver disease’ and ‘transport accident’ are decreasing. Among the eight external causes-of-death, we examined four items; ‘transport accident’, ‘drowning’, ‘exposure to fire’ and ‘suicide’, by showing yearly and monthly trends of mortality rate using Line Graphs. Through peaks of the line graphs, we were able to grasp some large-scale transport accidents and fires that resulted in many deaths. In the case of drowning and suicide, we first looked at monthly trends or mortality rate by age group, and then we investigated yearly trends or mortality rate only for teenagers, which showed a unique pattern compared to other age groups.
Fulltext
Show the fulltext
Appears in Collections:
일반대학원 > 통계학과 > Theses_Master
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

BROWSE