2.2.1 音声ファイルの音源定位

\includegraphics[width=.5\linewidth ]{fig/recipes/LearningHARK_002_01_1}
(a) メインシート \includegraphics[width=.8\linewidth ]{fig/recipes/LearningHARK_002_01_2}
(b) イタレーターシート
Figure 2.5: Waveファイルを入力とした音源定位のネットワークファイル

音源定位をするための最も簡単なネットワークファイルの例として, 録音済みの音声データ(マルチチャネルのWaveファイル)を使って音源定位し, その結果を表示するシステムを図 2.5に示す.

各モジュールのプロパティの設定に関しては HARK  ドキュメントの 6.2章のモジュールリファレンスを参照されたい.

音源定位が含まれた HARK  ネットワークファイルのサンプルを, Samples で提供している. 使用しているHARKのバージョンもしくは使いたいモデルを含む “HARK音声認識セット” をダウンロードすること. ダウンロードした “HARK音声認識セット” を解凍し,解凍先のディレクトリの中で次のコマンドを実行する.

harkmw sep_rec_offline.n 2SPK-jp.wav

すると,図 2.6のような音源定位結果を見ることができる. この音源定位結果を表示するウィンドウが出力されれば,音源定位は正しくできている.

\includegraphics[width=90mm]{fig/recipes/LearningHARK_002_02_1.eps}
Figure 2.6: sep_rec_offline.n 実行時の音源定位結果のスナップショット