5.5 テレビ電話とテレビ会議の比較
筆者のNTT研究所における本格的職業人生活は,1969年に画像通信をテーマとして始まりました.ちょうどテレビ電話の研究開発が盛り上がっている時期です.テレビ電話は生活の質を向上させるに違いないと思ったことが,刷り込みとなったのでしょう,以来テレビ電話,テレビ会議とその周辺で50年近くを過ごす結果となりました.
相手を見ながら電話するというテレビ電話のコンセプトは,第2.1節で述べましたように,電話サービスが始まったのと時を同じくして人々が思いついたものと想像されます.そして,一例を図5-32に示しますが,テレビ電話は未来社会を描いた図には必ずと言ってよいほど描かれてきました.このように自然な発想のサービス,商品は遅かれ早かれ普及するのが常で,ファクシミリや携帯電話はその好例です.しかし,テレビ電話は,新たなネットワークが登場する度に救世主と期待されながら,結局立ち上がることなく消えて行き,いまだ「夢」のままです.
テレビ電話は夢の通信と目され,未来予測に繰り返し登場してきました.これは比較的最近の一例です.2001年には既にISDNテレビ電話,インターネットによるテレビ電話,携帯電話によるテレビ電話は登場していましたが,それでも「フツー」にはなっていなかった現れです.
一方,テレビ電話と全く同じ技術で実現されるテレビ会議は,ビジネスツールとして広く受け入れられ「目標」の域に達しています.そこでは,テレビ電話について言われるような抵抗感をあまり聞くことはありません.どちらもディスプレイ上の相手と話すことには変わりがないですし,テレビ会議室の両側にたまたま一人ずつしか参加者がいない場合,テレビ電話しているのと同じことになるのにも拘わらずです.
一体何故だろう,というのが長年の筆者の疑問です.ここでは,いくつかの側面からこの問題を考察します.
1) テレビ電話の居心地の悪さはどこから?
電話に置き換わるとの大きな期待に包まれ登場した1970年前後のテレビ電話は,米国の先例を含め人々の受け入れるところとはなりませんでした.自らの体験でもテレビ電話によるコミュニケーションは何かぎこちなく,繰り返し使おうという意欲を起こさせません.その反応は生まれたときからテレビ映像に慣れ親しんだ世代でも変わりません.
テレビ電話が世の中に受け入れられない結果となって,1970年代後半,人と人とのコミュニケーションについて,通信システムがどのような心理要因で評価されているか,通信システムは相互にどのように関係づけられるかが研究されました[5-40][5-41].
実験室にいくつかのテレビ電話,テレビ会議のシステムを作り,そこで実験参加者に模擬的な会話(3分間)や会議(30分間)を行って貰います.参加者の印象はSD法(Semantic Differential Method,意味差判別法)により図5-33に示すような沢山の形容詞対の線上にマークすることで表わされます.この多次元データに対し,主成分分析により形容詞対間の相関性を利用して少数の主成分を抽出し,通信システムの評価に対する寄与率を求めます.そして各主成分の評点を通信メディア間で比較します.SD法はもともと言葉の感情的意味を分析する手法として開発されました.
SD法(Semantic Differential Method,意味差判別法)は多くの形容詞対で通信メディアの印象を尋ね,その結果を統計処理することで評価の主成分を抽出し,その得点を算出します.
音声のみの電話,動画によるテレビ電話,スナップショットを1秒間に1回更新する静止画テレビ電話について3分間の自由会話で得られた結果を図5-34に示します.寄与率43%の第I主成分は,そこに含まれる形容詞対から「心の平静さ・落ち着き」と解釈され,音声だけの電話に比べ相当に劣る結果となっています.テレビ電話の際に経験する居心地の悪さに符合する結果です.
一方,5人対5人で1セッションあたり約30分間の面談,テレビ会議,音声会議により旅行計画の立案,パズル解き,ディベートを行ったときの実験結果を図5-35に示します.寄与率33%の第I主成分は「心理的結合度」あるいは「一体感・臨場感」と解釈され,第IV主成分までには,テレビ電話で支配的な心の平静さ・落ち着きは現れていません.
映像の存在がテレビ電話ではマイナスに作用し,テレビ会議ではプラスに作用している結果となりました.
テレビ会議の体験では,「心理的結合度」あるいは「一体感・臨場感」と解釈される形容詞対が第I主成分を構成し,テレビ会議は面談に近い得点になっています.また第IV主成分までには,「心の平静さ・落ち着き」と解釈される成分は抽出されていません.
2) 会議に関わる情報と映像の役割
テレビ会議は複数対複数の通信です.複数の参加者を相手に話すときは,どのタイミングで発言すれば良いかを判断するうえで,相手が何に関心を持っているかを把握することが大切です.極端には,電話会議で経験することですが,トイレに行くなど席をはずしてしまった,あるいは居眠りしているなど,応答できない状況にある人に話しかけると極めて気まずい思いをします.相手参加者の映像があれば,状況把握に役立ちます.
一方テレビ電話は一人対一人の通信で,相手の関心は自分にあるのが普通です.その点では,映像の存在により新たに加わる情報は少ないと言えます.勿論,相手の映像を見ることで,ボディランゲージや雰囲気を汲み取ることができることは映像のもたらす効用です.
一般に会議の際に受け取る聴覚情報と視覚情報を,会議内容に関わる案件情報と会議進行に関わる情報に分けて図5-36に示します.会議案件に関する情報は,基本的に言葉で伝えられます.PC画面で表示される文書やスライド情報など会議案件に関わる視覚情報もありますが,どちらかと言えば補助的です.従って,視覚情報なしの会議はあり得ますが,聴覚情報なしの会議は成り立ちません.
テレビ会議に関わる視聴覚情報を,会議案件に関わる情報と会議進行に関わる情報に分けて列挙しています.会議案件情報は,主に聴覚情報(すなわち音声)で伝えられ,会議進行に関わる情報は主に視覚情報(すなわち映像)で伝えられています.図5-35の結果と見比べますと,映像の役割は一体感・臨場感を再現することにあると理解できます.
これに対し,会議の進行に関わる情報は,視覚情報が中心です.雰囲気を把握する,発言に対する反応を見る,発言のタイミングを計る,などの役割を果たします.聴覚情報も,部屋内外の騒音を含めて状況把握に貢献しますが,どちらかと言えば補助的です.
すなわち,複数の参加者がいるテレビ会議では,臨場感や現実感を伝え会話の流れを円滑にする役割を担うが故に映像は欠かせません.ここで映像と記したのは,動画像の意味です.図5-37に,画像として
- 多階調動画(通常のテレビ映像)
- 2値動画(白黒の線画であるが動きはリアルタイムに表現される)
- 多階調ではあるが4秒に1コマ更新の静止画像
- 多階調静止画像
とした場合の,会議後の印象を尋ねた実験結果を示します[5-42].
静止画,二階調動画,多階調動画の画像会議システムをいくつかの特性で比較評価した実験結果です.テレビ会議にとって現実感を再現することが最も大事で,多階調動画に次いで2値動画が高得点を得ていて,動いていることが現実感を醸し出し,話者の識別に役立っていることがわかります.
注目すべきは,テレビ会議に本質的な現実感に関する評価結果です.多階調動画が高い得点であるのは予想通りですが,次に来ているのは2値動画で,多階調の静止画やコマ落とし画像より高く評価されています.白黒の線画というのは画像としては不完全な表現方法ではありますが,リアルタイムの動きを伝えていることが現実感につながっていると理解できます.すなわち,現実感を伝えるのはリアルな動きだということです.また,話し手の識別に関しても2値動画は静止画像より優れていて,動きの役立っていることが示されています.ただし2値動画のシステムは不自然で,不快と受け取られています.
3) テレビ電話は電話に置き換わる?
テレビ電話システムは,1970年前後にいろんな所で試され,人々が初めてテレビ電話による通信を体験することになりました.その一つとしてNEC社内における利用者の反応が次のように伝えられています[5-43].
「取り付けた当初は,どうしても珍しさが先に立ち,上役はよろこび,下役はしぶい顔.なぜなら上役は気安く誰にでもかけてくる.下役は上役を呼び出すのが,何んとなく気が引ける.したがって,いつも呼び出されるのは下役ということになるからである」
NTT社内でもテレビ電話機を幹部に配って試験していたとき,テレビ電話の呼び出しに応じたある幹部が部下からのものであったため「何だ君か」との反応を示したエピソードが残されています[5-44].
また,テレビ電話に言われているマイナス要因[5-45]は次のようにまとめられます.
- 化粧なしの顔でテレビ電話に出られない
- 普段着のままでテレビ電話に出たくない
- 散らかった部屋を見られたくない
- 他のことをしながら話せない
これら利用者の反応は,テレビ電話を電話に置き換わる通信手段と期待し,両者を比較した結果現れたのではないかと推測されます.テレビ電話への上記期待は,第2.3.4項 2)で引用したAT&T幹部J. P. Molnar氏のメッセージ[5-46](図5-38に原文該当箇所を示します)に如実に表れています.
しかし,現代の電話は,コードレス電話,携帯電話によって究極の形に進化したと考えられ,当初の面談の代替手段から,電話でなければできない新たな通信シーンを開拓したと言えます.すなわち,テレビ電話がそれを置き換える必要はない,あるいはできないのではないでしょうか.
電話で話すことが物理的に移動して面会することの代わりになったように,テレビ電話が20世紀末までに電話に置き換わり,移動して人に会う用事の多くも不必要になると予測しています.
4) テレビ電話は訪問に代わる手段と考えたら?
上記3)のテレビ電話に対する反応は,テレビ電話が相手の人を訪問することに代わる手段と考えたらどうなるでしょうか.下役が前触れなく上役の前に現れることは憚られますし,逆に上役は自由に下役を訪ねて声をかけることが許されています.
来客があるのであれば,化粧なしや普段着で応対することはないですし,散らかった部屋があれば片付けるか隠すかするでしょう.他のことをしながら応対するのは礼を失しています.
このようにテレビ電話は,映像があることで面談に近い通信メディアに変貌したと言えます.テレビ会議は面談のインタフェースを具体化して成功したように,テレビ電話も「電話」の形ではなく「面談」の形を志向すべきと思われます.
それでは,多くの人が使っているiPhone,Skype,その他無料通話アプリによる家族メンバ間のテレビ電話はどうでしょうか.我が家でも図5-39のような「面談」が展開されています.親しい家族メンバの間であれば,予告なしに訪れたり訪れられたりしても歓迎されますので,テレビ電話も使われるということになります.
5) 電話,テレビ電話,テレビ会議,面談の間の関係
図5-40に示しますように,通信手段として通常の電話を片方の端に,実際に会って話しをする面談をもう一方の端に置いて線を引き,テレビ電話やテレビ会議がその線上のどこに位置するかを考えてみます.
テレビ電話とテレビ会議が,電話と面談の間のどこに位置するかを提起しています.テレビ会議は面談寄りであることは間違いありません.テレビ電話は電話寄りに位置すると目されてきましたが,実際には映像の存在により面談寄りのメディアと考えられます.
テレビ会議は,その名からもまたサービスコンセプトからも,電話よりは面談寄りに置くことに異論はないと思われます.
テレビ電話はどうでしょうか.名前からは図5-40「テレビ電話(1)」のように電話寄りということになるのでしょうが,果たしてそれでよいのでしょうか.もし図5-40「テレビ電話(2)」のように面談寄りが正解だとすれば,呼び出し音に応じた途端に相手の映像が現れるような事態は,予約なしの訪問者がドアを叩くなり顔を出すことに等しいと考えられます.
いろいろな通信メディアが通信スペース(ここでは通信シーンの全体をスペースと呼んでいます)のどの部分を占めるかを,概念的に図5-41に示します.テレビ電話開発時の期待はa)のようにテレビ電話が電話のスペースを占めかつ面談の多くを代替するということでした.実際にはb)のように電話は面談を越える新たなスペースを占め,テレビ会議が面談の一定部分を代替し,テレビ電話はテレビ会議の一部分を占めると考えられます.電話は確かにその領域を広げたのですが,最近ではe-mailがその多くを代替するようになったことが着目されます.
電話,テレビ電話,テレビ会議,面談が対象とする通信シーンを考察しています.電話は面談を代替する以上の通信シーンを作り出しましたし,テレビ電話は電話を置き換えるよりは面談を置き換える通信シーンを対象としています.
6) 新サービス普及の過程
テレビ電話は試作品を研究所内に設置して試用する段階で受け入れられず,テレビ会議は試みの段階から繰り返し使われました.新たな通信サービスが普及する過程を推察すると,図5-42のように表わされます[5-47].ここで新サービスが実線のループを辿れば成功ですし,点線のループでは失敗です.一度使ってみた人が次に使う気になるか否かが鍵になります.また,新サービスの普及は利用者がそのサービスの存在を知ることから始まりますが,宣伝活動のほかに利用経験者による口コミの効果が大きいと考えられます.その点,サービスを提供する側からは,定期的に利用してくれる人を見つけ,かつ好印象を与え続けることが重要です.
最初の潜在ユーザが新たな通信サービスを利用し,好印象を得て使い続ける,それを新たな潜在ユーザに伝えて顕在化させれば成功のループです.逆に最初の利用で印象が悪ければ,失敗のループを辿ります.
北海道大学・山本強氏は普及する技術の第一法則として「成功する技術は,稚拙な段階から普及する」を挙げています[5-48].実例としてインターネットとテレビ電話が対比されています.原文を引用します.
「10年前(筆者注:1990年代初め)日本のインターネットは幹線が64 kbps,アクセス線は9600 bpsという今から考えれば貧弱な構造だったが,電子メールが使えるならばということで大学関係では急速に普及した.同じ頃,家庭向けのテレビ電話も技術的に使える段階にあったが,その後はあまり普及しなかった.その違いはどこにあるのだろうか? テレビ電話は,端末が10万円を切れば普及する,カラー画面になれば普及するとかいわれたものだが,実現できるようになった今でも普及したという話は聞かない」
筆者としては悔しい思いもありますが,甘んじて受けなければなりません.テレビ,e-mail,webブラウザーによる情報閲覧などは,試しの段階から人々を魅了しました.
因みに山本氏は成功する技術の第二の法則として「成功する技術は,説明がくどくない」を挙げています.
7) 結論
ここまで議論しましたように,テレビ電話を電話寄りに位置づけて設計し,繰り返し試みたことが,ボタンの掛け違いだったというのが筆者の結論です.テレビ電話は,電話ではなくむしろ足を運んで人を訪問するようなインタフェースを備えるべきです.人を訪ねるとすれば,あらかじめ日時を予約し,ドアを叩いて許しを得てから面会します.また,実際の訪問者とは客間で応対する訳ですから,当事者間の話しを第三者が見聞きすることはない,閉じた空間を当事者だけで共有するという感覚も,考慮する必要があるでしょう.
人の話しを聞く,人に話しをするというのは,基本的な欲求であるだけでなく,究極のエンターテイメントだと思います.女性の得意な立ち話しを持ち出すまでもありません.若い人の話しから新鮮な感覚を受け取る,年輪を重ねた人からは一言の後ろに数十年の重みを感じ取る,無限の広がりがあります.離れて暮らしているなど,いろんな理由で面談がかなわない人たちがテレビ電話を通じて会話を楽しむ,追い求めるに値します.