2010年の3月に,米国 Willow Garage社のテレプレゼンスロボッ トTexai に,HARKと音環境を可視化するシステムを移植し,遠隔ユーザが音源 方向をカメラ映像に表示し,特定方向の音源の音だけを聞く機能を実現し た1. テレプレゼンスロボットでの音情報提示の設計は,前節で説明をした 「聴覚的アウエアネスがキーテクノロジである」というこれまでの経験に基づ いている.
具体的なHARKの移植とTexaiへの HARK 関連モジュールの開発は次の2工程に 分けられる.
Texaiへのマイクロフォン搭載,インパルス応答の測定及びHARKの移植,
Texai制御プログラムが走るROS (Robot Operating System) への HARK インタフェースとモジュールの実装.
図1.11に最初に設置したマイクロフォンの設置状況を示す. このロボットを使用する講義室と大食堂に置き,それぞれ5度間隔でインパルス 応答を測定し,音源定位の性能を測定した.次に,見栄え,さらには,マイク ロフォン間のクロストークを減少させるためにTexai に頭を付けることを検討 した.具体的には,雑貨店で見つけた竹製のサラダボールである.最初に付け たものとほぼ同じ直径になる辺りに MEMS マイクロフォンを設置した (図1.11).同様にインパルス応答を測定し,音源定位性能について 評価を行った.その結果,両者の性能はそれほど変わらないことが判明した.
GUI については,Visual Information-seeking matraの,overview と filter を実装した.図1.13に示した Texai自身の斜め下の全方位の画像の中央から出ている矢印が, 話者の音源方向である.矢印の長さは音量を表している. 図中では3名の話者がしゃべっていることが分かる. Texaiのもう1つのカメラの画像が右下に,リモートオペレータの 画像が左下に示されている. 図中の円弧は,filter で通過させる範囲を示す.この円弧内に ある方位から届いた音は,リモートオペレータに送られる. データは図1.14に示したように The Internet を通じて行われる.
GUIと,リモートオペレータ用の操作コマンド群はすべてROSモジュール として実装されるので,図1.15に示した 方法で HARK を組み込むようにした.図中の茶色が HARKシステムである. ここで開発したモジュールは,ROS の Web サイトから入手可能である.
これら一連の作業は頭部の加工,インパルス応答の測定,予備実験, GUIと操作コマンド群の設計を含めて1週間で終了できた. HARKやROSの高いモジュール性が,生産性向上に寄与したと考えられる.
Footnotes