Problem
ひとつながりの音なのに定位結果がぶつぎれになる
音の定位結果がすべてつながってしまう
ときに読む.
Solution
SourceTracker モジュールの PAUSE_LENGTH プロパティの値を適切に設定すればよい.
SourceTracker モジュールを DisplayLocalization モジュールに接続し,定位結果を表示する.
適当な文章を読み上げて定位結果を見る.
定位結果が途切れる: PAUSE_LENGTH の値を大きくする.
定位結果がつながりすぎる: PAUSE_LENGTH の値を小さくする.
Discussion
SourceTracker モジュールの PAUSE_LENGTH プロパティの目的は,発話の息継ぎなどで LocalizeMUSIC モジュールの MUSIC スペクトルのパワーが下がっても, 連続した音声として定位し,適切に音声認識させることである. 人の発話に限らず,実際は途切れている音でも連続した音として定位するために使用することが出来る. 人の発話の定位が目的ならばデフォルトの値を使用すればよい.
このパラメータの単位はミリ秒である. 従って,PAUSE_LENGTH の値が実際に何 msec に対応するかは AudioStreamFromMic や AudioStreamFromWave モジュールで指定される サンプリング周波数 (SAMPLING_RATE),FFTのステップ幅 (ADVANCE) に依存する. すべてデフォルト (サンプリング周波数:16000 Hz,ステップ幅:160 pt) の場合,PAUSE_LENGTH の値を 変えることは,1 (msec) 変更することに対応する.
See Also
HARK ドキュメント:SourceTracker モジュール