HEVC는 전송이나 저장의 편의를 위해 비디오 데이터의 표현에 필요한 정보의 표현량을 줄이는 압축 방법 중 하나이다. 비디오 압축은 크게 무손실 압축(Lossless coding), 손실 합축(Lossy coding)으로 구분된다.
- 무손실 압축(Lossless coding)
- 데이터의 손실이 허용되지 않는 소수의 의료 분야나 군사 분야
- 압축 후 데이터량은 줄어들어도 화질은 차이 없음
- 손실 합축(Lossy coding)
- 대부분의 비디오 압축
- 압축률이 높아질수록 손실되는 데이터가 많아짐
압축률이 높고 화질 저하가 적을 수록 좋은 압축 코덱이며, 이를 평가하기 위한 방법은 크게 객관적(objective)인 방법과 주관적(Subjective)인 방법으로 나뉜다.
객관적 화질
- 수학적 공식에 의해 화질 수준 정도를 도출해 내는 방식
- 정확한 계산방법 존재 ➡ 정확/안정적 결과, 비교적 빠른 시간에 결과 도출
- 대표적인 예시: PSNR(Peak Signal to Noise Ratio)
PSNR
$$\text{PSNR}=10\cdot \log_{10}(\frac{\text{MAX} ^2}{\text{MSE}})$$
- 원 영상 대비 열화(Artifact) 영상의 에러 비율을 이용해 화질 평가
- 신호의 최대치에 대한 잡음의 비율을 수치화
- 사용 목적: 생성 혹은 압축된 영상 화질에 대한 손실 정보의 양 평가
- PSNR이 높을수록 손실이 적음
율-왜곡(RD: Rate-Distortion) 방법
: 최종 압축된 스트림의 비트레이트(Bitrate)를 동시에 고려
- 비트 레이트(BitRate): 압축된 데이터 양
- Distortion: 화질 손상 정도
(1) BD-rate metric의 필요성
코덱 성능 비교 예시


(2) RD-rate 계산

1) 비교 구간 설정


2) Bitrate 스케일 조정


3) 면적 차 게산 및 RD-rate 계산
$$\text{avg} = \frac{\text{AREA}_{\text{text}} - \text{AREA}_{\text{ref}}}{\text{max} \text{PSNR} - \text{min} \text{PSNR}}$$
$$\text{BD}- \text{rate} = 10^{\text{avg}} - 1$$
주관적 화질
MOS(Mean opinion score) test
- DSCQS (Double-Stimulus Continuous Quality Evaluation)


비디오의 인지 품질 측정 방법
MOS test를 대체할 수 있는 객관적 화질 평가 방법 연구 활발히 진행
- 미디어 스트림의 전송 또는 저장이 이루어진 후, 복호화 과정을 거쳐 복원된 신호를 이용하여 영상의 품질을 평가하는 방법
- 전 참조법(FR: Full-Reference): 참조 영상의 모든 정보 이용
- 감소 참조법(RR: Reduced-Refenrence): 참조 영상에서 추출된 일부 정보 이용
- 무참조법(NR: No-Reference): 참조 영상 정보를 전혀 이용X
- 복원된 영상 신호를 이용하지 않고 복원되기 이전의 비트스트림 정보 or 복원 과정에서 발생하는 파라미터 등을 이용하여 복원 영상의 품질을 예측, 평가하는 방법
- P.NAMS, P.NBAMS