431 0

MPEG-4 IVC를 위한 압축 성능 향상 기법

Title
MPEG-4 IVC를 위한 압축 성능 향상 기법
Other Titles
Efficient Compression Methods for MPEG-4 IVC
Author
이승호
Alternative Author(s)
Lee, Seung-ho
Advisor(s)
장의선
Issue Date
2017-08
Publisher
한양대학교
Degree
Master
Abstract
표준 영상 압축 기술은 MPEG (Moving Picture Experts Group)과 VCEG (Video Coding Experts Group)에서 주도적으로 표준화 작업을 진행하며, 전 세계에서 다양한 기업, 기관들이 참여하여 개발한다. 이 기술은 어떠한 개인 및 단체라도 일정한 기술 이용료를 지불하면 누구나 사용할 수 있으며, 이는 멀티미디어 산업의 밑거름이 되어 서비스 품질 향상 및 산업의 성장에 큰 공헌을 하였다. 최근 수년간 스마트 기기의 성능이 급격하게 향상되고 보급화가 빠르게 이루어지면서 동영상 스트리밍 서비스를 필두로 한 영상 콘텐츠 서비스의 수요가 크게 증가하였다. 그리고 이에 따라 원활한 서비스 제공에 꼭 필요한 영상 압축 기술의 수요 또한 급격히 증가하였다. 일반적으로 표준 영상 압축 기술의 이용료는 기술 활용 규모가 크면 클수록 1인당 이용료 액수가 줄어드는 경향이 있으나, 매우 많은 사람들이 영상 콘텐츠 서비스를 이용하면서 지불해야 하는 이용료 액수가 오히려 증가하게 되었다. 이에 영상 압축 기술을 저렴하게 이용할 수 있거나 혹은 기술 이용료를 받지 않는 영상 압축 기술에 대한 수요가 점점 커지게 되었다. 이를 위해 MPEG에서는 기술 이용료를 면제하는 Type-1 라이선스 기술로 구성된 영상 압축 기술에 대한 표준화 작업을 진행하기로 결정하였다. 이렇게 시작된 Type-1 영상 압축 기술 표준화는 IVC (Internet Video Coding), WVC (Web Video Coding), VCB (Video Coding for Browser), 이 3가지 영상 압축 기술을 토대로 진행하게 되었다. 본 논문에서는 MPEG-4 IVC의 압축 성능을 향상시키기 위해 두 가지 기술을 제안한다. 하나는 매크로블록 문맥 구조와 관련된 기술로서 디코더에 적용 가능한 기술이며, 휘도 신호(Y)의 압축 효율을 향상시키는 것을 목적이다. IVC는 16x16 크기의 매크로블록을 다양하게 분할하여 16x8, 8x16, 8x8 크기로도 활용하며, 각 매크로블록은 Forward, Backward, Multi-hypothesis 등 다양한 예측 기술을 사용한다. 이러한 구조를 표현하기 위해, 기존 IVC 매크로블록 문맥 구조는 8x8 매크로블록을 제외한 나머지 매크로블록에 대해서 분할 정보와 해당 매크로블록이 사용한 예측 모드를 합쳐 하나의 값으로 표현하는 구조이다. 그러나 이러한 구조는 사용 가능한 예측 모드 수와 매크로블록 분할 가지 수가 증가할수록 표현해야할 가지 수가 급격하게 증가하여 압축 성능 저하를 초래하게 된다. 이 문제를 해결하기 위해 기존 IVC 매크로블록 문맥 구조를 정보 엔트로피(Entropy) 관점에서 분석하여 효율적으로 압축할 수 있는 매크로블록 문맥 구조를 제안한다. 다른 하나는 영상 압축 과정 가운데 하나인 양자화 과정에서 매크로블록의 색차 DC 계수 조정하여 압축 효율을 향상시키는 기술이다. 이 제안 기술은 인코더에서 적용시킬 수 있으며, 색차 신호(U, V)의 압축 효율을 향상시키는 것이 목적이다. 대부분의 코덱은 RDOQ (Rate Distortion Optimization on Quantization) 기술을 사용하며, 이 기술은 양자화 단계에서 계수 값을 조정함으로써 압축 효율을 향상시킨다. IVC 또한 다른 코덱과 마찬가지로 RDOQ 기술을 적용하였으나, 현재 IVC에서 사용하는 RDOQ 기술은 휘도 신호의 압축 효율은 크게 향상시킨 반면에, 색차 신호의 압축 효율을 현저하게 저하시켰다. 본 논문에서는 IVC RDOQ 기술이 불러오는 색차 신호의 압축 효율 저하를 방지하기 위하여, 매크로블록의 색차 계수 값 중에서 DC 계수 값을 조정하여 색차 신호의 압축 효율을 향상시키는 방법을 제안한다. 제안하는 효율적인 매크로블록 문맥 구조를 ITM (IVC Test Model) v9.0에서 적용시켜 성능 변화를 측정한 결과, Low delay (IPPP) 환경과 Random access (IBBP) 환경에서 Y를 기준으로 각각 0.9%, 1.0%의 BD-rate 이득을 얻을 수 있었다. 또한 색차 DC 계수 조정 방법을 ITM v10.0에 적용시켜 비교한 결과, Low delay (IPPP) 환경에서 Y를 기준으로 0.3%의 BD-rate 손실이 발생했지만, U에서 5.1%의 BD-rate 이득을, V에서 6.6%의 BD-rate를 얻을 수 있었다. 그리고 Random access (IBBP) 환경에서는 Y에서 0.3%의 BD-rate 손실이 발생했으나, U에서 6.2%의 BD-rate 이득을, V에서 7.3%의 BD-rate 이득을 얻을 수 있었다.; Standard video compression technology is standardized by MPEG (Moving Picture Experts Group) and VCEG (Video Coding Experts Group). Many companies and institutions from around the world participate in standardization process. Anyone or any organization can use the standard video compression technology, if they pay a royalty, and it has greatly contributed to not only the development of multimedia industry but also improving quality of multimedia service. In recent years, as smart devices have improved performance and became widespread, the demand for video contents service (e.g. video streaming service) has been increasing. And also the demand for video compression technology has grown sharply for smooth video contents service provision. Generally, the more technology users are many, the more royalty for video compression technology is decreased, however, the royalty has grown greatly because too many people use the video contents services. Accordingly, it is increased of a demand for video compression technology which can be utilized inexpensively or has no royalty. Consequently, MPEG has standardized the video compression technology which consists of Type-1 license technology that is exempt from the royalty. The Type-1 video compression technology standardization has progressed with three technologies: IVC (Internet Video Coding), WVC (Web Video Coding), VCB (Video Coding for Browser). In this paper, we proposed two methods for improving the performance of MPEG-4 IVC: one proposed method is related to macroblock syntax structure. It can be applied to decoder device and the purpose of proposed method is improving the compression efficiency of luminance signal (Y). In IVC, 16x16 macroblock can split into 3 macroblock types: 16x8, 8x16, and 8x8. And each macroblock type includes various prediction techniques such as Forward, Backward, and Multi-hypothesis, etc. In the macroblock syntax structure of original IVC, the split information and the prediction mode information are represented by one value, except 8x8 macroblocks. This structure leads to degradation of compression performance when the number of macroblock type or prediction mode is increased. To solve this problem, we analyzed IVC macroblock syntax structure from the viewpoint of information entropy and propose the efficient macroblock syntax structure. The other proposed method is adjusting a chrominance DC coefficient of macroblock in quantization step which is one of encoding processes. It can be applied to encoder device, and its purpose is enhancing the compression performance of chrominance signal (U, V). Most codecs have RDOQ (Rate Distortion Optimization on Quantization) technique and this technique increases the compression efficiency with adjusting coefficients in quantization step. IVC also has RDOQ technique like other codecs and it improves the compression efficiency of luminance signal, however, it decreases the compression efficiency of chrominance signal remarkably. In order to prevent degradation of the chrominance signal compression performance which caused by IVC RDOQ technique, we propose the method for enhancing the compression efficiency of chrominance signal by adjusting the DC coefficient among the chrominance coefficients of the macroblock. We implemented the proposed macroblock syntax on ITM (IVC Test Model) v9.0, and compared compression efficient between the original method and the proposed method. As a result, the proposed method gains 0.9% Y BD-rate in low delay environment than the original method. Also, it gains 1.0% Y BD-rate in random access environment. We also implemented the chrominance DC coefficient adjustment method on ITM v10.0, and compared compression efficient between it and the original method. In consequence, the proposed method loses 0.3% Y BD-rate, however, it gains 5.1% U BD-rate and 6.6% V BD-rate in low delay environment. In random access environment, it loses 0.3% Y BD-rate either, nevertheless, it gains 6.2% U BD-rate and 7.3% V BD-rate.
URI
http://hdl.handle.net/20.500.11754/33674http://hanyang.dcollection.net/common/orgView/200000431005
Appears in Collections:
GRADUATE SCHOOL[S](대학원) > COMPUTER SCIENCE(컴퓨터·소프트웨어학과) > Theses (Ph.D.)
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE