Page tree
Skip to end of metadata
Go to start of metadata

 

 映像符号化標準は,主にITU-R,ITU-T,ISO/IEC JTC1/SC29/WG11 (MPEG)の国際標準化機関によって作られています.このうちITU-Rはデジタル放送の非圧縮映像フォーマットを規定し,ITU-TとISO/IECは主に映像圧縮符号化を規定しています.これまでに作られた標準を時間の流れに沿い,図6-45に示します.

 

図6-45 映像符号化標準の系譜

国際標準化機関であるITU-R,ITU-T,ISO/IEC (MPEG)が作ってきた標準の歩みです.ITU-Rはテレビジョン放送で用いるディジタル映像フォーマットの標準を作っているのに対し,ITU-TとISO/IECは映像の圧縮符号化に取り組んでいます.ITU-Tはテレビ会議など通信分野に注力し,MPEGは蓄積分野のアプリケーションから活動を開始しましたが,最近では両標準化団体が共同で多様なアプリケーションに使える汎用映像符号化標準を作っています.

 

 勧告ITU-R BT.601[6-31]はSDTVの映像フォーマットを,BT.709[6-30]はHDTVの映像フォーマットを,BT.1769[6-42]とBT.2020[6-43]はUHDTV(Ultra-High Definition TeleVision,4K/8Kテレビ)の映像フォーマットと詳細なパラメータを定義しています.
 映像圧縮符号化標準の最初は,1次群速度(日米では1.5 Mbit/s,欧州では2 Mbit/s)でテレビ会議の映像を送るためのITU-T H.120[6-44]です.この標準は完成した技術を持ち寄るタイプの標準化作業であったため,世界統一標準とはならず,基本的に二つの技術からなります.片方は欧州提案によるフレーム間予測符号化の方式,もう一方は日本提案による動き補償フレーム間予測符号化の方式です.両者には互換性がありません.
 この標準化作業の反省と,ISDNでの利用を想定したさらに低ビットレート(具体的には1次群速度の数分の1,384 kbit/sさらには2x64 kbit/sなど)で使える映像圧縮符号化標準を国際共同作業で作ることになり1990年にH.261[6-7]が制定されました.この標準は,技術的には動き補償フレーム間予測とDCTを用いるハイブリッド符号化を適用した最初の標準であり,作業方法的にもレファレンス・モデル手法というグループが協力して技術を作り上げる手法(第10.5節参照)を確立した点で,後の映像符号化に関する標準化作業の基礎となりました[6-45].
 その後は,高圧縮化,高品質化,汎用符号化の道を辿ります.汎用符号化とは,一つの標準で多様なアプリケーションに対応できるようにすることです.1990年前後には,ITU-Tではテレビ会議のようなリアルタイム会話形サービスの為にH.261を,放送番組伝送のためにJ.80[6-46],J.81[6-47]を作り,MPEGではCDのような蓄積メディアにマルチメディア番組を収容するためにMPEG-1 (ISO/IEC 11172-2)[6-38]を作る,というようにアプリケーション対応で各標準化機関が独自の標準を用意していました.しかし,それでは標準化作業に無駄が生じるうえに,アプリケーション間でビットストリームを共用することができなくなるという配慮で汎用符号化のアプローチがとられました.その為にはアプリケーション毎の要求条件を把握することが重要になります.
 H.261以降のH.26X,MPEG-Yシリーズ映像符号化標準を図6-46に示します.汎用符号化を目指すということは,そのような標準は世の中に一つあればよい訳ですから,通信分野を主な対象としていたITU-Tと放送,蓄積分野を主な対象としていたMPEGの共同作業が行われ,H.262|MPEG-2(共通テキスト標準),H.264|MPEG-AVC(Advanced Video Coding,ツインテキスト標準),H.265|MPEG-HEVC(High Efficiency Video Coding,ツインテキスト標準)が作られました.ここで共通テキスト標準とは,一つの標準文書を両標準化機関が承認する標準を意味し,ツインテキスト標準とは両機関の標準は技術的に同一であるが標準文書が一字一句同じとは限らない,それぞれの機関独自の記述もあり得る標準を意味しています.「|」(縦棒)の記号は共通あるいはツインテキスト標準を意味します.

 

図6-46 映像符号化標準の進化

ITU-TとISO/IECが単独に作業した映像符号化標準と共同で作業した映像符号化標準の系譜です.映像符号化標準が目指すのは第一に圧縮効率の向上ですので,縦軸は符号化効率を定性的に示しています.

 

 各世代の映像圧縮符号化標準は,まず符号化効率の向上が図られ,それに加えて多様なアプリケーションから要求される機能性の向上が図られてきました.符号化効率向上は世代を重ねる毎に従来の2倍(ビットレートでは1/2)が目安で,それを達成出来なければ新たな標準として成立していない,ということです.図6-47に,符号化効率向上のために各標準で採り入れられた新たな技術を示します.また各標準は機能性の面でも向上が図られていて,具体的な項目を図6-47に併せて示します.

 

図6-47 符号化標準の圧縮ツールと機能の進化

映像符号化標準は,大きくは圧縮率の向上と機能性の向上を目指して進化してきました.歴代の標準で加えられた圧縮ツールと機能性を示しています.

 

 まとめとして,図6-48に,いろんなアプリケーションで使われる映像符号化の実用的なビットレートを示します.

 

図6-48 実用的な映像符号化ビットレート

いろいろな分野で使われる映像符号化標準の実用的なビットレートを示しています.符号化制御技術の進歩で,同じ標準であったとしてもより少ないビットレートで同じ品質を得ることができますので,ここに示したビットレート値は現時点での目安と受け取って下さい.

 

 現代の映像符号化標準は,予測と変換を組み合わせたハイブリッド符号化を枠組みとしています.予測と変換はどのように符号化効率向上に貢献してきたのでしょうか.あくまで定性的な議論ですが,歴代標準における両者の貢献割合を図6-49に示します.精緻な動き補償フレーム間予測を行うことで,符号化効率は向上してきました.これを突き詰めると,将来は完全な予測ができ,予測誤差を送る必要がなくなって,変換の出番はなくなるような印象を受けるかもしれません.

 

図6-49 ハイブリッド符号化における予測と変換の貢献度

符号化効率向上に予測と変換がどのように貢献したかを定性的に示しています.予測をより精緻にすることで符号化効率向上が図られてきましたが,変換は予測では対処できないシーンチェンジなどで有効であり,欠かすことはできません.

 

 しかし,動き補償フレーム間予測では対処できない場面があります.それは映像の始まりの画面や,カメラ切換などシーンチェンジが起きた場合の画面です.これらには予測に使う元の画面が存在しませんので,原理的にフレーム内の符号化を行わなければなりません.DCTのような変換はフレーム内符号化の強力なツールです.従って,映像圧縮符号化には変換を欠かすことができません.もちろん,予測があたらなくて誤差が沢山生じる中間的な場面もあります.ここでも変換が役に立ちます.ハイブリッド符号化の枠組みは,H.265/HEVCの次の標準でも生き残っているであろうと予想されます.
 高度な予測や高度な機能性には,符号化と復号に多量の信号処理が必要になります.映像codecは専用のLSIもしくは汎用のプロセッサで動くソフトウェアの形で設計されます.いずれの場合も単位面積あたりのトランジスタ数が1〜3年で倍増するというムーアの法則に支えられ,符号化アルゴリズムの高度化による信号処理量の増大を吸収してきました.ムーアの法則については,コラム6-5でもう少し詳しく触れます.また,コラム6-6では,初代のハイブリッド符号化標準であるH.261と最新の標準であるH.265/HEVCでどれだけ高度化・複雑化しているかを,作業に要した人的資源や標準のページ数で示しています.

  • No labels