View : 907 Download: 0

에이전트의 젠더에 따른 음성 인터페이스 디자인 연구

에이전트의 젠더에 따른 음성 인터페이스 디자인 연구
Other Titles
A study on Voice Interface Design based on the agent’s gender: Focusing on genderlect and task analysis
Issue Date
대학원 융합콘텐츠학과
이화여자대학교 대학원
Following the rapid growth of smart speakers was the development of voice-based artificial intelligence(AI) technology that raises social concerns on the interaction of conversation widely adopted by AI services. In particular, female biased persona of smart speakers has become a main target of criticism. This study focuses on the voice interface of smart speakers in Korean language, analyzes what kind of design is made from the gender perspective, and examines its direction. To do this, the structure of voice interface service has been investigated to examine the use of language as a dimension of expression, as well as the contents of the task handled as a dimension of execution in relation to gender design. First, the language as the subject of the design is analyzed through linguistics—sociolinguistic methods which deal with genderlect. The tasks have been examined using the analysis of the voice interface design element and the HCI 's user perception test. The literature reviews were done in three major areas. First, genderlect in sociolinguistics has been studied. In particular, the research trends of genderlect from the ‘language and gender’ in sociolinguistics has been reviewed and to set the criteria for analyzing the use of genderlect in smart speakers, the characteristics of gender in terms of vocabulary, grammar and the pragmatics were summarized. Second, gender studies in the Voice User Interface(VUI) has been examined. Gender factors can be involved in persona and script design in the range of voice interface design. It appears to be evident that many AI services adopt female personas following research that indicate that users tend to prefer female voices. However, there were critical comments about approaching the gender design through simple user survey without taking account of the cultural and social context. In existing HCI(Human-Computer Interaction) researches, there were cases that analyzed the gender stereotypes of the persona with user cognitive experiment that revealed that users give more positive evaluation when the gender stereotypes of topics and gender of voice were matched. Third, design guidelines that cover AI and VUI were studied. From the social and public viewpoint of AI guidelines and robot ethics, it has been recommended that gender be approach in the direction of preventing discrimination. The design guidelines provided by Amazon and Google guided how to handle offensive contents that include gender-related topics and effective conversational strategies consistent with female genderlect. The genderlect analysis of Korean smart speakers was conducted by analyzing the speech collected through interviews with five personas (Clova, Kacao, Aria, Genie, and Google). The characteristics of female genderlect were widely found in all five personas, and ‘Genie’ used female genderlect most frequently. On the other hand, ‘Google’ gave a gender neutral impression with a balanced mix of female and male genderlect. The key focus that is more important that the selection of gender is how the quantitative volume of female genderlect matters and how specific expressions can strengthen the gender stereotypes. Overusing vocabularies that emphasizes women' s attributes unnecessarily or strengthen the stereotypes of women 's preferences is a direction to be avoided in gender design. To analyze the correlation between gender and task of AI voice, the research was carried out through quantitative experimentation. An online survey was used to assess the perceived intelligence of each persona for four tasks (feminine tasks - cooking, parenting, masculine tasks - car, security). Unlike the previous studies, which favored male voice for masculine tasks, the study revealed that most respondents preferred female voice. However, in terms of intensity of preference, there was a consistent tendency to prefer genderlect that is consistent with the gender stereotype of the topic. In the "parenting" topic, a lower preference of matched gender between the voice and topic was observed among respondents with higher levels of gender equality awareness. This suggests that gender stereotypes in the conversational topic are complex with varying degrees and tendencies, and that the analysis of gender distribution in real context in the topic may be the basis for understanding the gender stereotypes which is never mentioned in existing studies. This study suggests that UX design method generally used by reflecting users’ needs and preferences may reflect the bias of real world to the VUI design in the design process of an AI agent. In addition, the study applied sociolinguistics to examine language, the subject of conversation design, that could be meaningful in understanding the context of language use. The study also has significance as it examines the factors that make up the gender stereotype in language, analyzes and presents detailed elements to enable designers to adjust it to an appropriate level. In the future studies, it will be possible to evaluate the gender preference and factor analysis in the expanded labor area. In addition, by expanding the application of sociolinguistic approach, the present state of Korean honorific dialogue and gender neutral conversation style research can be interesting and meaningful research topics. The study hopes to contribute to the future direction of voice interface design that help strengthen social virtue.;스마트 스피커의 급격한 성장 뒤에는 음성 기반 인공 지능 기술의 발전이 있었던 한편 대화 방식의 상호 작용이 확산되면서 여러 가지 사회적인 우려도 발생했다. 그 중 스마트 스피커의 여성 편향된 페르소나에 대한 비판이 있었다. 본 연구는 한국어를 다루는 스마트 스피커의 음성 인터페이스에 주목하여 젠더 관점에서 어떤 디자인이 이루어져 있는 지 분석하고 그 방향성을 살펴보고자 한다. 이를 위해 음성 인터페이스 제품의 구조를 살펴 표현의 차원으로 사용되는 언어, 실행의 차원으로 다루어지는 과업의 내용이 젠더 디자인과 어떻게 관계하는지 연구했다. 우선 디자인 대상이 되는 언어는 언어학, 그 중에서도 성별어(genderlect)를 다루는 사회언어학 연구 방법을 통해 젠더가 언어로 표현되는 구체적 모습을 분석했다. 과업의 내용을 접근하는 방식은 음성 인터페이스 디자인 요소 분석과 이에 따른 HCI의 사용자 인지 조사 방법을 활용했다. 선행 연구는 크게 세 가지 방향에서 진행되었다. 첫째, 사회언어학에서의 성별어 연구를 진행했다. 특히 사회언어학의 언어와 성(language and gender)에서 다루는 성별어의 연구 동향을 살펴보고 스마트 스피커의 성별어 사용을 분석하기 위한 기준을 세우기 위해 성별어의 특징을 어휘, 문법, 화용의 차원에서 정리했다. 두 번째, 음성 인터페이스(VUI: Voice User Interface)에서 젠더 연구를 살펴보았다. 음성 인터페이스 디자인의 범위 중 페르소나와 대본 디자인에 젠더 요소가 관여될 수 있음을 확인했다. 또한 사용자들이 여성의 음성을 선호하는 경향이 명백하다는 연구를 기반으로 많은 인공지능 서비스가 여성 페르소나를 채택했음을 알 수 있었다. 그러나 문화적 맥락에 따라 구성되는 젠더의 표현을 단순한 사용자 조사를 통해 접근하는 방식에는 비판적 지적이 있었다. HCI(Human-Computer Interaction) 선행 연구에서는 페르소나의 젠더 전형을 사용자 인지 실험으로 분석한 사례들이 있었는데 공통적으로 음성이 다루는 주제의 젠더 전형과 음성의 젠더가 일치할 때 더 긍정적인 평가를 받았다. 세 번째로는 인공지능, 음성 인터페이스를 다루는 디자인 가이드라인을 살펴보았다. 인공지능/로봇윤리라는 공공적인 관점에서 젠더는 차별을 방지하는 방향에서 접근할 것을 권하고 있었다. Amazon과 Google이 제공하는 디자인 가이드라인에서는 젠더 주제와 관련해 조심해야 하는 원칙들과 여성어의 화용적 특징을 대화 전략으로 가이드하고 있음을 확인했다. 한국어 스마트 스피커의 성별어 분석은 5개 페르소나(클로바, 카카오, 아리아, 지니, 구글)와의 인터뷰를 통해 수집된 발화를 담화 분석하는 방식으로 진행되었다. 분석 결과, 5개 페르소나 모두 여성어의 특징이 광범위하게 드러나고 있었고 특히 지니는 여성적 표현을 빈번하고 전면적으로 사용했다. 반면 구글은 여성어와 남성어가 균형있게 혼용되어 젠더 중립적인 인상을 주었다. 어떤 젠더를 채택하느냐의 차원을 넘어 주목할 지점은 양적인 차원에서 여성어가 빈번하게 사용되고 있다는 것에 더해 사용되는 성별어의 구체적 표현이 젠더 고정관념을 강화시키는 방식으로 작동되는 사례들이 있었다는 사실이다. 여성 취향의 고정관념을 불필요하게 강화하고 여성의 속성을 필요 이상 강조하는 어휘들이 과하게 사용되는 경향은 젠더 디자인에 있어 피해야 할 방향이라 보았다. 인공지능 음성의 젠더와 과업 간 상관관계 분석을 위해서는 정량적인 실험을 통한 연구를 수행했다. 남녀 음성의 피드백으로 자극물을 만들어 온라인 설문 조사를 통해 성별 전형이 있다고 추정되는 4개의 과업(여성적 과업-요리, 육아, 남성적 과업-자동차, 경호/보안)에 대한 각 페르소나의 유능감을 평가했다. 그 결과, 남성적 과업에 대해 남성 목소리를 선호했던 기존 연구와는 달리 대부분 여성 목소리를 선호하는 것으로 드러났다. 그러나 선호의 강도 관점에서 볼 때 주제의 젠더 성향에 따라 일관된 경향성이 관찰되었다. 그리고 ‘육아’ 주제에서 성평등 의식 수준이 높을수록 성별 전형에 맞는 음성의 젠더를 덜 선호하는 방향으로 상관관계가 있었다. 이는 주제의 성별 전형성이 정도와 경향성을 가진 복잡한 대상이며 기존 연구에서 생략된, 주제의 성별 전형성 판별에 대해 성역할 분포에 따른 분석이 젠더와 주제를 연관 지어 이해할 수 있는 바탕이 될 수 있음을 시사한다. 본 연구는 인공지능 에이전트의 디자인 과정에서 현실 세계의 사용자를 충실히 이해하고 반영하는 기존 사용자 경험 디자인 방법들에서 관점을 달리하여, 사용자의 충실한 반영이 현실 세계의 편견을 함께 반영할 수 있음을 젠더 디자인을 중심으로 확인하였다. 또한 음성 인터페이스에서 디자인 대상으로 다루고 있는 언어 그 자체에 대한 연구를 사회언어학의 방법론을 차용하여 시도하였고 이를 통해 젠더 전형을 이루고 있는 요인을 살펴보고, 디자이너들이 이를 적절한 수준으로 조절하여 활용할 수 있도록 상세 요소들을 분석하여 제시했다는데 연구의 의의가 있다. 향후 확장된 노동 영역의 젠더 선호도 평가와 요인 분석이 가능하리라 생각된다. 또한 사회언어학적 접근을 확장하여 한국어 특유의 경어법 구현 현황, 젠더 중립적인 대화 스타일 연구 등이 흥미롭고 의미 있는 후속 연구 주제가 될 수 있을 것이다. 이러한 연구들이 미래에 더욱 광범위해질 음성 인터페이스 디자인이 올바른 사회적 미덕을 강화하는 방향으로 나아갈 수 있도록 기여하기를 기대한다.
Show the fulltext
Appears in Collections:
일반대학원 > 융합콘텐츠학과 > Theses_Ph.D
Files in This Item:
There are no files associated with this item.
RIS (EndNote)
XLS (Excel)
