View : 533 Download: 0

음성 인식 및 합성 엔진을 이용한 VoiceXML 네비게이터의 설계 및 구현

Title
음성 인식 및 합성 엔진을 이용한 VoiceXML 네비게이터의 설계 및 구현
Authors
이선남
Issue Date
2002
Department/Major
과학기술대학원 컴퓨터학과
Publisher
이화여자대학교 과학기술대학원
Degree
Master
Abstract
VoiceXML은 음성인식 및 음성합성과 같은 음성처리기술을 이용하여, 시각에 의존하는 기존의 웹을 벗어나 음성 및 시각을 모두 활용할 수 있는 새로운 정보 서비스 패러다임으로 제시되고 있다. VoiceXML을 이용한 음성정보서비스를 제공할 경우, 마크업 언어형태로 작성된 시나리오를 인터프리터를 통해 서비스하기 때문에 시나리오 변경 요구 시 재프로그램해야 하는 기존 음성정보서비스 시스템의 문제점을 쉽게 개선할 뿐만 아니라, 음성정보서비스의 개발자가 음성인식·음성합성과 같은 기술적인 문제와는 독립적으로 시나리오를 작성할 수 있다는 이점이 있다. VoiceXML을 이용하여 음성정보시스템을 구현하면 많은 이점이 있음에도 불구하고, 웹을 통해 VoiceXML 서비스를 사용하기 위한 분야의 관련 연구가 미흡하다. 특히 웹 사이트와 함께 네비게이션 하면서 VoiceXML 시나리오에 따른 음성정보를 사용할 수 있는 VoiceXML 활용도구가 개발되지 않았다. 이것은 VoiceXML을 사용하기 위한 가장 기본적이고 필수적인 도구로서, 본 논문에서는 웹의 시각적인 정보를 활용함과 동시에 VoiceXML의 음성적인 정보도 함께 활용할 수 있는 VoiceXML 네비게이터를 제안한다. VoiceXML 네비게이터를 개발하기 위해서는 다음의 두 가지 연구가 필요하다. 첫 번째로 음성 시나리오를 웹 브라우저에 보여주기 전에 VoiceXML 문서가 표현하는 음성 시나리오를 처리하기 위하여, 엘리먼트간에 계층 구조를 가지고있는 VoiceXML 문서를 XML 문서 모델링을 위해 정의된 DOM 트리 형태로 표현하여 구문을 검증한 후, 각 태그의 설정된 기능을 실행하도록 해석하는 인터프리터의 설계·개발이 필요하다. 두 번째로 웹 상에서 음성서비스를 가능하게 하기 위하여 인터프리터와 음성인식엔진, 음성합성엔진을 결합하는 기술과 VoiceXML과 웹의 시각적인 언어인 HTML을 연계하는 기술이 필요하다. 본 논문에서는 인터프리터 설계 방법과, 인터프리터와 음성엔진 결합, 그리고 VoiceXML과 HTML의 연계를 위한 설계 방법을 제안하고, VoiceXML 네비게이터를 개발한다. 이를 통해 음성 입출력의 기술적인 문제에 대한 지식없이도 VoiceXML 문서를 이용하여 모든 사용자가 음성 포털 시스템을 쉽게 구축할 수 있는 환경을 제공하였다.;VoiceXML is suggested by new information service's paradigm which can be used visual interface or voice interface using automatic speech recognition and text to speech, otherwise existing web can just support visual interface. If we use voice information service system using VoiceXML, we can figure out the problem which existing information service system has. It has to be reprogrammed if existing information service system asked to update the senario, but VoiceXML information service system doesn't need to reprogram because it is interpreted markup language by Interpreter. Therefore the developer doesn't need to care about the technology like speech recognition or text to speech. Although VoiceXML has many advantages, the research about VoiceXML system based on the web is not sufficient. Especially, VoiceXML navigator which can be navigated web site by voice and heard voice information at that same time is not developed yet. VoiceXML navigator is basic and essential tool for using VoiceXML, it has to be developed. Therefore it is very necessary to develope VoiceXML navigator for using visual interface of web site and voice information of VoiceXML together. The two studies is required for developing VoiceXML navigator, because VoiceXML's syntax is different form XML's it. At first, it is required the design and implementation of interpreter. Interpreter present the VoiceXML document which has hierarchy among elements of DOM tree, and it validate the VoiceXML syntax considering their hierarchy, then it execute the action which has to do. Next, it is required the integration between interpreter and speech engine like automatic speech recognition or text to speech for voice service based on the web. In this work, we suggest the design of interpreter, the design of integration between interpreter and speech engine, and develope the VoiceXML navigator. This paper will bring easy development system of Voice portal system for anyone without any knowledge about speech technology.
Fulltext
Show the fulltext
Appears in Collections:
일반대학원 > 컴퓨터공학과 > Theses_Master
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

BROWSE