View : 207 Download: 0

온톨로지 기반 빅데이터 분석에 따른 식품안전 위험도 예측

Title
온톨로지 기반 빅데이터 분석에 따른 식품안전 위험도 예측
Other Titles
Prediction on Food Safety Risk Attached to Social Big Data Analysis Based on Ontology
Authors
배지영
Issue Date
2016
Department/Major
대학원 식품영양학과
Publisher
이화여자대학교 대학원
Degree
Doctor
Advisors
조미숙
Abstract
산업화 시대 이후 급증한 식품안전 사고는 국민 식품 소비를 위축시키고 막연한 공포감 조성으로 올바른 식품섭취를 유지할 수 없도록 한다. 실제 한국 소비자의 식품에 대한 불안감은 매우 높은 것으로 나타나고 있으며 이에 대한 대응책을 마련하고자 정부와 식품업계, 학계 등은 고심하고 있다. 본 연구는 식품안전에 대한 소비자의 인식과 위해요인에 대한 버즈를 인터넷 상에서 빅데이터로 추출하고, 그 관계성과 위험 요인이 무엇인지 알아보는 것이 목적이다. 하지만 기존의 연구처럼 설문지기법이나 질적 연구가 아닌 빅데이터를 활용함으로써 신뢰도와 활용도를 높이고자 하였다. 트렌드를 반영한 위해요인을 도출하며 나아가 위험요인를 예측할 수 있는 모형을 만드는데 최종 목적을 두고 있기 때문이다. 이에 본 연구는 빅데이터 추출을 위한 식품안전 온톨로지를 개발한 뒤 빅데이터 추출과 분석을 거쳐 최종적으로 위험도 예측 모형을 제시하였다. 연구1에서는 Noy&mcguinness(2001)가 제시한‘Ontology Development101’의 방식을 따라 식품안전에 대한 온톨로지 개발을 목표로 하였다. 본 연구에서는 식품안전 관련 온톨로지의 범위를 개인이 접할 수 있는 식품의 모든 유형을 포함하지만, 식품과 관련해 기존에 일어났던 사건이나 사고, 또는 사고가 일어날 가능성이 높다는 연구가 나온 범위 내에서 온톨로지를 개발하였다. 결과, 예방요인·생성요인·결과요인·사회관계요인의 대분류와 그에 따른 중분류, 소분류로 온톨로지를 개발할 수 있었다. 식품안전에 대한 온톨로지는 처음 개발됐다는 데에 의의가 있다. 연구2에서는 빅데이터 분석을 통해 식품안전 인식에 대한 위험요인을 예측하고자 하였다. 연구는 온라인 뉴스와 소셜미디어(SNS) 등 인터넷 웹을 통해 수집된 소셜 빅데이터를 대상으로 하였다. 분석에서는 온라인 뉴스 사이트 160개와 게시판 14곳, 트위터(SNS), 블로그 4개, 카페 2개 등 모두 181개의 온라인상의 채널이 포함됐다. 소셜빅데이터는 이곳 채널들을 통해 수집할 수 있는 텍스트를 기반으로 한 웹문서(버즈)로 정의하였다. 식품안전 관련 토픽(topic)은 2011년부터 2014년까지 4개년간 매년 3/4분기(7,8,9월달)를 총 12개월 동안의 것을 수집했으며 총 470,131건 (2011년: 100,475건, 2012년: 107,919건, 2013년: 140,706건, 2014년: 121,031건)의 텍스트(Text) 문서를 최종적으로 본 연구의 분석에 포함시켰다. 식품안전 토픽은 모든 관련 문서를 수집하기 위해 ‘식품안전’이라는 토픽을 사용하였으며, 토픽과 같은 의미로 사용되는 토픽 유사어와 수집의 정확도를 떨어트리는 불용어도 지정했다. 소셜 빅데이터를 수집하는 방법은 크롤러(Crawler) 프로그램을 이용하는 방법을 사용하였고, 이후 주제분석을 거쳐 수집된 명사형 어휘들을 유목화(categorization)하여 분석의 틀로 사용하였다. 결과는 크게 다섯 가지를 분석했다. 첫 번째로 용어의 단순 빈도를 살펴봤다. 두 번째는 시계열 추이다. 세 번째는 연관성예측이다. 네 번째는 영향 요인 분석이다. 마지막으로 위험도 예측을 했다. 빈도분석에서 식품안전에 대한 불안 감정은 23.2%로 기존 연구와 비슷한 수준이었다. 생애주기별 대상자 중에서는 ‘영아’와 ‘노인’이, 폐해 중에서는 ‘건강위협’이, 질병 중에서는 ‘암’,‘치매’에 대한 우려가 높았다. 예방 요인으로는 ‘인증제’와 ‘법 규정’에 가장 관심을 두고 있었고 나라별로는 ‘일본’을 가장 우려하고 있었다. 또한 시계열별 추이에서는 식품안전 관련 버즈는 오전 6시경부터 증가하여 오전 11시경 급감하고 다시 13시 이후 급감하다 다시 13시 이후 증가해 17시 이후 감소하며 20시 이후 증가해 23시 이후 급감하는 패턴을 보였다. 식품안전과 관련된 식품명의 대한 불안감정은 월별로 약간의 차이를 보였지만 농산물이 1위, 수산물이 2위라는 점에서는 변함이 없었다. 다만 7월이‘음료’에 대한 불안감정이 약간 높았다. 식품안전에 대한 감정간의 연관성 예측을 알아본 결과로는 긍정의 감정은 {도움, 효과, 보호, 신선}=> {풍부}에 가장 강하게 연결돼 있었다. 즉,‘도움, 효과, 보호, 신선’이라는 단어가 언급됐을 때 인터넷 사용자들이 안전하게 느끼는 감정을 나타낼 확률(‘풍부’라는 긍정적 단어가 언급될 확률)이 이들 키워드가 언급되지 않았을 때보다 6.84배 더 높게 나타났다. 부정적 감정과의 연관성 비교로는 ‘문제, 수치, 불구, 의심’이 언급되었을 때 그렇지 않았을 때보다 불안한 감정을 나타내는(‘피해’가 언급될) 확률이 10.25배 더 높았다. 한편 위해요소와 감정과의 연관성 예측에서는 ‘중금속, 식품첨가물, 화학조미료, 자연독소’가 포함되었을 때‘불안’이라는 부정적 감정이 그렇지 않았을 때보다 2.3배 더 강했다. 식품안전에 영향을 미치는 요소에 대한 회귀분석으로는 미디어, 대상, 질병, 폐해, 인증제, 안전예방, 위생활동, 판매처, 식품, 위해요소, 채널 총 11개 상위 요소에 대해서 식품 안전 감정에 어떤 영향을 미치는지 분석했다. 미디어 요인에서는 방송 요인이 가장 영향력이 컸다. 질병요인에서는 알레르기성질환, 사망, 기타질환은 부적 영향을 미쳐 식품이 위험하다는 감정에 영향을 미치는 것으로 나타났다. 폐해요인에서는 환경파괴, 건강위협, 정신건강위협, 사회불안이 식품이 위험하다는 감정에 대부분 영향을 미치는 것으로 나타났다. 인증제 요인은 대부분 정적인 영향을 미칠 것으로 가정했으나 식품관련 인증제도만 긍정적 영향을 미쳤다. 식품 안전 예방 요인으로는 식품관련 정책만이 긍정적인 감정을 형성하는 데 영향을 준 것으로 나타났다. 식품위해요소 요인 중에서는 GMO, 방사능물질, 방사선, 기생충, 식품첨가물, 동물용의약품, 화학조미료, 소독제, 자연독소, 부정불량식품, 오염, 광우병이 부정적 감정에 영향을 미치는 요소로 꼽혔다. 식품안전 관련 위험 예측에서는 미디어 요인에서는 방송요인이, 대상요인에 따라서는 환자 요인이, 질병요인에서는 사망요인이, 위해요인 중에서는 방사능물질요인 있을 때 불안한 감정이 가장 높았다. 예방 요인에서는 검사 요인이, 위생활동에서는 조리기구용이 요인이, 판매처 요인에서 직거래 요인이 있을 때 안전한 감정이 가장 높게 나타났다. 본 연구는 한국인의 식품안전 인식에 관해 소셜빅데이터를 수집하고 이를 분석해 식품안전에 대한 감정, 우려요인, 관계요인 등을 밝히고 식품안전에 대한 위험요인을 예측한 것에 의의가 있다. 기존의 설문지방식이나 질적연구방법과는 다른 대규모의 데이터를 바탕으로 했다는데 연구 결과의 신뢰성과 타당성이 있다. 하지만 연구 대상의 버즈가 4년간 매년 한 분기(3/4)분기(총 12개월)에 국한돼 있다는점, 분석에 사용할 수 있는 독립변수에 제한이 있다는 점 등에서 한계가 있을 수 있다. 그러나 빅데이터 분석은 국민의 식품 안전 감정이나 위험 요인을 실시간으로 파악할 수 있으며 향후 사건 사고 대처에 유용하게 쓰일 수 있다. 식품산업 활성화와 안전성 확보, 바람직한 식생활 영위 등을 위해서는 향후 빅데이터를 이용한 더욱 다양한 분석틀이 마련되어야 할 것이다.;Food safety incident which has highly increased since industrial age constricts food consumption of citizens and hinders proper food consumption by creating vague fear. Actual anxiety of consumers in Korea on food turned up to be extremely high. Government, food industries, and academia are have been addressed to retain countermeasure against it. Objective of this study is to extract buzz about consumer's recognition on food safety and hazardous factor using big data and investigate its relationship with risk factors. However, as its final goal is to derive hazard factors reflected trends and furtherly make risk factor prediction model, this study utilized big data in order to promote credibility and utilization rather than questionnaire or qualitative research methods which have been used in previous studies. Hence, in this study, risk prediction model was finally suggested after development of food safety ontology in order to extract and analyze big data. Object of study 1 was to develop ontology on food safety in accordance with methods of 'Ontology Development 101' suggested by Noy & Mcguinness(2001). Though scope of ontology related to food safety covers all categories of food personnel can face, ontology was developed in scope where there are precedent cases, accident and scope which turned out to be with high possibilities for accidents. As a result, class 1 such as result, prevention factors, forming factor, result factor and social relationsihp factors and class 2 as well as class 3 following to class 1 were developed. This is the first study which developed ontology on food safety was developed. Study 2 cares to predict risk factors for recognition on food safety using big data analysis. The purpose of this study was social big data which were aggregated through internet, including domestic SNS(Social Network Service) and online news gadgets and so on. In frequency analysis, anxiety on food safety turned out to be similar with previous studies as 23.2%. 'Infant' and 'The senior' among targets for each life cycle, 'Health threat' among hazards, 'Cancer' and 'Dementia' among disease were highly being anxious. 'Certification' and 'Regulatory system' were mostly being interested as prevention factor while 'Japan' was mostly being concerned among countries. In time series analysis, buzz related to food safety appears to be a pattern that it skyrockets from 6 AM, shrinks from 11 AM, skyrockets from 13 and shrinks after 17 PM, skyrockets after 20 PM and shrinks after 23 PM. Though anxiety on name of food related to food safety appeared to be different with respect to month, agricultural products were 1st while fishery products were still 2nd. Merely, anxiety on 'Beverage' was high to a certain extent in July. As a result of prediction for correlation among emotions on food safety, positive emotion was strongly connected to {Assistance, Effect, Protection, Freshness}=> {Richness}. For regression analysis on factors which affect food safety, how 11 upper factors(Media, target, disease, certification, preventive activities for safety, hygiene factor, and channel) affect emotion related to food safety was analyzed. Interesting result is that internet factor raises anxiety and accusing programs is the one reduces anxiety. For disease factor, allergic disease, death, other disease, and food poisoning affect negative effect on emotion that food is dangerous. For hazardous factor, environment destruction, health threat, and social unrest turned out to mostly affect on emotion that food is dangerous. Though certification factor was primarily supposed to affect static effect, only certification related to food affected positive effect. For food safety prevention factor, only policy related to food turned out to affect positive emotion. Among food hazardous factors, GMO, radioactive matter, parasite, food additive, artificial seasoning, disinfectant, natural toxin, contamination, and bovine spongiform encephalopathy were selected to be factors which affect on negative emotion. As a result of prediction on risk related to food safety, broadcasting factor among media factors, patient factor among target factors, death factor among disease factors, and radioactive matter factor among hazard factors turned out to mostly affect anxieties. Inspection factor among prevention factors, easiness for cooking utensils among hygiene factors, and direct transaction factor among source of transaction turned out to mostly affect positive emotion which means safe. This study is significant as this study collected social big data related to recognition of Korean on food safety, analyzed them, derived emotion, concerned factors, aggregated relation among factors on food safety, and predicted risk factors on food safety. Analysis based large amount of data rather than previous questionnaire method or qualitative research method has contributed credibility and feasibility of its result. However, there could be limitation because buzz of study target was limited to every one quarter for four years(3/4 quarter every year. Total 12 months) and independent parametors which could be used during analysis wer limited. However, big data analysis can be used to grasp emotion of citizens on food safety or risk factor at real time and utilized for further countermeasure for incidents. More various analysis frames using big data should be furtherly developed in order to facilitate food industry, attain food safety, and lead desirable dietary life.
Fulltext
Show the fulltext
Appears in Collections:
일반대학원 > 식품영양학과 > Theses_Ph.D
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE