コラム10-2 音声符号化と映像符号化で異なる標準化文化
音声符号化も映像符号化も,アナログの原信号に含まれる冗長度を除き,同じ品質をできるだけ低いビットレートのディジタル符号列に変換する過程です.着目する冗長度に,情報理論的な冗長度と人間の耳の聞こえ方,目の見え方に関わる感覚的冗長度の双方があることも共通しています.
しかし,符号化標準へのアプローチや標準化の作業方法には際だった違いがあります.
まず何を標準化対象にするかを比較します.
音声符号化標準(少なくともITU-Tの音声符号化標準)では符号化方法,ビットストリーム,復号方法の三者です.Bit exact規定と呼ばれ,標準に従う限り,どの製品であれ,全く同じビットストリームを発生し,復号器出力も同じで全く同じ音声品質となります.古典的な公衆電話網では,網の構成要素に対し,符号化を含め,電話音声の品質配分を定めていたことに由来するアプローチです.
一方,映像符号化では標準化対象はビットストリームと復号器で,Decoder規定と呼ばれます.ビットストリームの制約を守る限り符号器は実装の自由に委ねられますので,映像符号化では標準に従っていても,同一の入力映像に対し多様な品質の映像が出力される結果となります.このアプローチには,ビットストリームの規定に従いながら時代とともに符号化方法を工夫することで,高品質化を図ることができる特徴があります.デジタル放送では,用いるビットレートは同じでも放送開始当時に比べ現在の品質は向上しています.
もう一つの違いは,標準化作業の進め方が競争的か協力的かです.
音声符号化では,システム規模が比較的小さくて一社で全ての技術を開発し最適化することができるため,できあがった製品の特性で勝負する傾向があります.
一方映像符号化ではシステム規模が大きくて,一社で全体を仕上げるには手に余り,本文でレファレンス・モデル手法を説明しましたように,多くの参加者が協力して開発し最適化することが行われています.
同じ符号化の標準化でありながら,音声と映像ではその進め方に文化の違いを感じます.