View : 1430 Download: 0

음식점 평가 후기에 나타난 논증 및 양보 표현 분석

Title
음식점 평가 후기에 나타난 논증 및 양보 표현 분석
Other Titles
Analyse de quelques expressions d'argumentation et de concession en vue de construction de base de données
Authors
강현정
Issue Date
2016
Department/Major
대학원 불어불문학과
Publisher
이화여자대학교 대학원
Degree
Master
Advisors
이수미
Abstract
본 논문은 실제 코퍼스를 수집하여 이를 언어학 이론을 바탕으로 분석하고 해석하여 자동분류를 위한 데이터베이스의 구축을 목적으로 한다. 텍스트 마이닝(Text Mining)은 컴퓨터 공학에서 사용하는 용어로서 대규모의 문서에서 의미 있는 정보를 추출하는 것인데, 그 중의 한 유형인 오피니언 마이닝(Opinion Mining)은 온라인상의 방대한 텍스트 문서로부터 사용자의 의견과 평가를 찾아내는 기술이다. 그리고 본 연구도 이 오피니언 마이닝에 속한다. 오피니언 마이닝은 궁극적으로 찬성 혹은 반대 의견을 제시하는 것이지만 그 의견을 긍정이나 부정으로 명확하게 분류하는 것은 쉽지 않다. 예를 들어 “맛있지만 비싸다”와 같은 의견을 부정적인 평가로 봐야할지, 아니면 긍정적인 평가로 봐야할지는 모호하다. 기존의 연구들도 평가에 나타난 어휘들을 기반으로 분석하였지만 그들은 문맥을 배제하고 통계적인 방법을 활용하였기 때문에 정확성이 떨어지는 한계가 있었다. 본 논문에서는 평가가 애매한 표현들을 중심으로 그 표현이 사용된 상황을 최대한 참조하여 분석함으로써 이들을 객관적으로 분류할 수 있는 방법을 모색하였다. 연구 대상은 La Fourchette와 협력하는 레스토랑들 중, 미슐랭가이드에서 별 한 개를 받은 프랑스 요리 레스토랑으로 한정하였다. 그리고 La Fourchette의 후기들 중, 화자의 판단이 분명하게 드러나 있는 표현으로 선택하였다. La Fourchette는 레스토랑 예약과 관련된 휴대폰 어플리케이션이자 사이트로서 프랑스에서 인지도가 높다. 무엇보다도 이 어플리케이션을 통해 레스토랑을 예약하고 이용한 고객들만이 레스토랑에 대해 점수를 매기고 후기를 남길 수 있기 때문에 신뢰도가 높은 편이다. 본 논문은 논증 표현, 양보 표현, 그리고 정도 표현을 중심으로 분석하였다. 논증 표현과 관련해서는 Ducrot와 Anscombre의 논증의 ‘mais’ 이론에 근거하여 앞의 내용과 뒤의 내용이 전혀 다른 상황으로 전개되는 ‘mais’ 그리고 조건의 ‘si’를 분석하였다. 양보 표현에서는 ‘mais’와는 달리 긍정 및 부정의 정보를 나란히 나열하는데, 이는 덴마크 언어학자인 Gettrup과 Nølke의 불어 양보 표현 연구를 중심으로 살펴보았다. 마지막으로 정도 표현에 대해서는 Goose와 Grevisse의 « Nouvelle grammaire française »를 기초로 하여 분류하였다. 그 결과, 논증 표현인 ‘mais’의 경우, 기본적으로 선행절이 결론 r를 지향한다면 후행절은 반대의 결론 non-r를 지향한다. 그러나 이와는 달리 ‘mais’의 역전을능이 약하게 작용한다든지, ‘mais’의 고유한 기능을 갖고 있지만 선∙후행절의 논증방향이 동일한 경우도 관찰되었다. 양보 표현에서는 역전기능이 없어 문장의 전체 방향은 바뀌지 않았다. 양보 부사(‘cependant', ‘pourtant’ 등)는 전경을 도입해 신정보를 전개하였고 양보 종속접속사(‘même si’)는 배경을 도입해 주제를 제시하였다. 또 한편으로는 정도 표현과 평가 어휘의 결합에 따라 평가의 정도는 다양해졌다. 정도 표현은 상급(‘bien’, ‘très’, ‘beaucoup’, ‘un peu’ 등)과 최상급(‘absolument’, ‘extrêmement’, ‘parfaitement’, ‘peu’, ‘trop’ 등), 두 가지 범주로 나누었고 더불어 어휘들도 완전함을 지향하는 긍정·부정 어휘(‘parfait’, ‘excellent’, ‘catastrophique’ 등), 긍정·부정적인 가치가 내재되어 있는 어휘(‘bon’, ‘délicieux’, ‘décevant’ 등) 그리고 중립적이거나 문맥에 따라 바뀔 수 있는 어휘( 'inventif', 'identifiable', 'actuel' 등), 총 5개의 범주로 분류하였다. 이를 바탕으로 논증 표현, 양보 표현 그리고 어휘들에 값을 부여하고 계산을 거쳐 긍정 및 부정적인 평가로 분류하는 대안을 모색하였다. 최근에는 SNS나 블로그를 통해 사용자가 작성한 후기가 급격히 늘어나고 있는 상황에서 온라인 텍스트에 대한 분석은 가치가 있다. 그리고 이를 해석하고 적용하기 위해서는 언어학적인 연구가 선행되어야 한다. 현재로서 본 작업은 아직 시작하는 단계에 불과하며 앞으로는 이러한 어휘정보에 대한 빅데이터의 축적이 요구된다.;Cette étude a pour objet d'analyser des avis sur les restaurants comportant les expressions argumentatives et concessives et de déterminer si l’opinion dégagé est positif ou négatif. Depuis l'arrivé du web, les réseaux sociaux tel que Facebook ou Twitter ont révolutionné les modes de communication. Les internautes sont à la fois producteurs et consommateurs de l’information: ils partagent un contenu généré par d'autres utilisateurs en développant des relations interpersonnelles. Alors on consulte souvent les avis des autres, avant d'acheter un produit ou recevoir des services. Ainsi, aujourd’hui les réseaux sociaux sont devenus la technologie la plus utilisée dans la communication par ordinateur. Dans ce contexte, l’étude des opinions, sentiments, émotions ou jugements d’évaluation à partir de Big Data, alors une masse considérable de données se généralise de plus en plus. L'étude se compose de deux parties: dans la première partie, nous avons essayé de circonscrire la notion de l'argumentation et de la concession, et puis on les a appliquées dans le corpus. Il y avait eu des analyses qui classifient les lexiques en positif et négatif. Cependant on se rendre compte que cette stratégie ne suffit pas, car dans les expressions argumentatives et concessives, il peut y avoir un avis à la fois positif et négatif. De ce fait, nous avons d'abord abordé le ‘mais’ argumentatif, celui la description a été proposée par Anscombre et Ducrot et puis le si conditionnel. Ces linguistes distinguent deux ‘mais’ : le ‘mais’ rectificatif et le ‘mais’ qui fonctionne comme connecteur argumentatif, et c'est ce dernier ‘mais’ qu'on a pu observer dans notre corpus. Dans une phrase du type "P mais Q", Q possède plus de force argumentatif en faveur de la conclusion opposée. Puis Morel distingue trois types de concession : la concession logique, la concession rectificative et la concession argumentative. Ces trois types ont des valeurs d'opposition, de restriction et de conséquence. Dans la deuxième partie, nous avons classifié les expressions argumentatives et concessives, les lexiques et les expressions de degré en les attribuant une note pour déterminer leur polarité(positive ou négative). Dans le processus de traitement automatique d'une phrase "P mais Q", Q aurait plus d'importance du fait de la force argumentative. Les expressions concessives ont aussi une importance relative entre les deux propositions mais pas autant que celle des premières. Selon une analyse de Gettrup et Nølke, inspirés des théories élaborées par Blumenthal, on a pu diviser ces expressions par la structure en arrière-plan et premier plan. Malgré les promesses attendues par la fouille d’opinion, il y a quand même certaines limites à propos des données recueillies. Par exemple, les auteurs des données recueillies sont ni identifiés, ni certifiés, donc ces données ont la possibilité d’être manipulée. Néanmoins les nouvelles technologies pourront être plus efficaces que les hommes dans le but de chercher les informations convenables. Il ne faut tout simplement pas s’en remettre entièrement à la machine, ce logiciel ne devrait pas s’occuper de tout. De ce fait, un travail supplémentaire par des humains serait nécessaire. Ce travail n'est qu'un début, mais c’est à cet égard que je pourrais apporter ma contribution.
Fulltext
Show the fulltext
Appears in Collections:
일반대학원 > 불어불문학과 > Theses_Master
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

BROWSE