VTVジャパン テレビ会議教科書

テレビ会議教科書 VTVジャパン株式会社

ホーム / 6. メディア符号化 / 6.2 音声符号化 / 6.2.4 音声符号化品質

6.2.4 音声符号化品質

 符号化した音声を復号して得られる再生音には,符号化歪みが含まれ,ビットレートが低くなるほど,品質は劣化します.音声品質の測定は,第5.1節で説明しました主観評価実験により行われます.符号化品質を物理量の測定により評価する方法も試みられていますが,未だ不十分で,符号化結果を聞いて人がどのように感じるかを尋ねる方法に頼っています.

1) 電話音声の符号化品質

 狭帯域(300〜3400 Hz)電話音声の符号化方式とそのビットレートならびに符号化品質を図6-20に示します[6-23].ITU-T勧告の符号化方式と各地域携帯電話の符号化方式を比較しています.ITU-T G.711が電話の基準で,各符号化方式はG.711に近い品質を実現すべく設計されています.この図は1996年時点に作られましたので,移動通信の音声符号化は第2世代のものです.

図6-20 狭帯域音声符号化品質
図6-20 狭帯域音声符号化品質

固定電話ならびに携帯電話の符号化品質です.固定電話で使われたG.711からIP電話や携帯電話のために低ビットレート化をはかった各符号化方式の品質が示されています.いずれも64 kbit/sのG.711より少し劣化する品質で,技術の進歩により数kbit/sにまで削減されました.当初の携帯電話ではビットレートが優先され,固定電話に比べ品質は犠牲にせざるを得ませんでした.

2) 広帯域および超広帯域音声の符号化品質

 第3世代以降の移動通信音声符号化品質を図6-21に示します[6-24].帯域が狭帯域から広帯域へ,さらに超広帯域へと高品質化しながら,所要ビットレートは12〜24 kbit/sで変わらないことがわかります.また,符号化処理遅延も30 ms程度と会話形サービスに必要な低遅延を保っています.

図6-21 広帯域および超広帯域音声符号化品質
図6-21 広帯域および超広帯域音声符号化品質

最近の携帯電話ではAMR-WBの使用により7 kHz広帯域音声が用いられ,固定電話より高品質になっています.第5世代ではさらに14 kHz帯域超広帯域音声の使用が予定されています.これらは,スピーカとマイクロホンによるハンズフリー(handsfree)通話にも耐えられます.

3) サウンドの符号化品質

 サウンド(フルバンド音声)の符号化は,ポータブル音楽再生デバイスに用いられているMP3 (MPEG Audio Layer III)や日本のディジタルテレビ放送に用いられているAAC (Advanced Audio Coding)のMPEG標準が代表的です.これらの品質評価結果を図6-22に示します[6-25].原音と比べ,どの程度劣化しているかが表されています.なお,MP3の評価については,Layer I, IIとの比較,普及への努力など,興味深い舞台裏が参考文献[6-26]に語られています.
 AACとその拡張版について.評価結果に基づく主観特性の向上模様を図6-23に示します[6-27].インターネットでの利用を意識して,低ビットレートでの動作に注力されてきたことがわかります.

図6-22 サウンド符号化品質(MP3とAAC)
図6-22 サウンド符号化品質(MP3とAAC)

サウンド符号化の基準はステレオ・サウンドを1.411 Mbit/s(1チャネル当たり706 kbit/s)でディジタル化するCD (Compact Disc)の方式です.MP3やAACは128 kbit/sでそれに近い品質を実現します.

図6-23 サウンド符号化品質(AAC, HE-AAC v1, v2)
図6-23 サウンド符号化品質(AAC, HE-AAC v1, v2)

ビットレートに制限のあるインターネットでもサウンドを用いたサービスが盛んになり,低ビットレート化が求められています.AACを基に,低ビットレート化技術を採り入れたHE-AAC (High Efficiency Advanced Audio Coding)方式では48 kbit/s程度でもCDに近い品質を実現します.