실시간 무선 비디오 전송을 위한 효율적인 Transcoder의 구조 연구

Efficient Transcoder Architecture for Real-time Wireless Video Transmission
과학기술대학원 정보통신학과
梨花女子大學校 科學技術大學院
무선 비디오는 다가오는 모바일 커뮤니케이션에서 가장 중요한 어플리케이션 중 하나다. 트랜스코딩은 무선 환경을 통한 실시간 비디오 전송 시 컨텐츠 소비자에게 효율적인 서비스를 제공할 수 있다. 본 논문은 이들 트랜스 코딩 기법 중 bit rate reduction transcoding, temporal resolution reduction transcoding, spatial resolution transcoding 을 지원함으로써 무선 비디오 전송 시 적합한 트랜스코더의 효율적인 하드웨어 구조를 제시하고, 이를 C언어를 사용하여 구현한 후 그 결과를 비교하였다. Bit rate reduction transcoding은 open-loop 구조를 사용하여 수행하였다. Cascaded pixel domain transcoding 구조와 비교하여 프레임 메모리를 사용하지 않았으며, DCT/IDCT 연산을 수행하지 않았다. Temporal resolution reduction transcoding은 open-loop 구조를 그대로 이용하여 B 프레임만을 스킵하였다. B 프레임 스킵으로 모션 벡터 재추정 과정 및 움직임 보상 연산을 생략할 수 있다. Spatial resolution reduction 트랜스코딩은 DCT 도메인에서 움직임 보상과 down conversion 을 수행하였으며 픽셀 도메인 구조에 비해 10%~30%정도 낮은 CPU time을 필요로 하였다. Bit rate, frame rate, spatial resolution을 모두 변화시킨 최종 실험 결과 입력 파일 전체 크기의 약 3%까지 파일 크기를 줄일 수 있었다.;Wireless video is one of the most important applications supported by upcoming mobile communication systems. Transcoding of video content is one key technology to provide a seamless interaction between content creation and consumption. This thesis proposes an efficient hardware architecture for wireless video transmission using bit rate reduction transcoding, temporal resolution transcoding, and spatial resolution transcoding. The proposed transcoder is designed and verified in C programming language. Bit rate reduction transcoding is implemented as an open-loop architecture. Compared with cascaded pixel domain transcoding architecture, open-loop architecture needs no frame memory and DCT/IDCT operation. Temporal resolution reduction transcoding is also implemented as an open-loop architecture. By skipping only B frames, there is no need for motion vector re-estimation and motion compensation. Spatial resolution reduction transcoding consists of motion vector scaling algorithms, DCT-domain down conversion, and motion compensation in DCT domain. DCT domain operation needs about 10%~30% lower CPU time than pixel domain operation. Combined transcoding including bit rate reduction transcoding, temporal resolution reduction transcoding and spatial resolution reduction transcoding can reduce the input file size down to 3% of the original size while maintaining reasonable image quality.
