サンプルネットワークの全カテゴリーを表 14.1 に示す. カテゴリーは 5 つあり,各カテゴリーのサンプルネットワークと サンプルの実行に必要なファイルは,表中右列のサンプルディレ クトリに挙げたディレクトリに保存してある.
サンプルネットワークの実行には,各ネットワークファイル名 に対応したスクリプトを実行する.ネットワークファイルに与える 引数の設定値や,必要な設定ファイルを記述してある. 例えば demo.n というネットワークファイルがあったとすると, ネットワークを実行するスクリプトファイル名は,demo.sh である. “.” より前の文字列を共通化してある.ただし,demo.sh は, 使用環境に依存した設定項目を含む場合があり,確認なしに実行すると 思わぬ結果を招く場合がある.正しい設定方法は,各サンプルネット ワークの解説中に示してある.
カテゴリー名 |
サンプルディレクトリ名 |
|
1 |
録音ネットワーク |
Record |
2 |
音源定位ネットワーク |
Localize |
3 |
音源分離ネットワーク |
Separation |
4 |
音響特徴量抽出ネットワーク |
FeatureExtraction |
5 |
音声認識ネットワーク |
Recognition |
各サンプルのカテゴリーの概要を以下に示す.
録音ネットワーク
HARK の AudioIO カテゴリーのモジュールを使ったサンプルである. 基本的な録音サンプルとしてモノラル録音,ステレオ録音を含む. ステレオ録音とモノラル録音は,ほとんどのハードウェア環境で動作する.
音源定位ネットワーク
HARK の Localization カテゴリーのモジュールを使ったサンプルである. 特に LocalizeMUSIC の使用サンプルとなっている. 音源定位結果をDisplayLocalization を使って画面表示し, SaveSourceLocation を使ってファイルに保存するサンプルを用意した. オフラインで音源定位処理を確認できるように,8ch 録音音声を予め用意した. オフライン処理のため, AD/DA を必要とせず, HARK インストール済みであればどの計算機でも動作可能である. オンライン定位処理を実行するためには, HARK がサポートするマルチチャネル録音用の AD/DA が必要である.
音源分離ネットワーク
HARK の Separation カテゴリーのモジュールを使ったサンプルである. 特に GHDSS または,GHDSS と HRLE の使用サンプルとなっている. オフライン処理のため, AD/DA を必要とせず, HARK インストール済みのパソコンであればどのパソコンでも動作可能で ある.オンライン定位処理を実行するためには, HARK がサポートするマルチチャネル録音用の AD/DA が必要である.
音響特徴量抽出ネットワーク
HARK の FeatureExtraction カテゴリーのモジュールを使ったサンプルである. 特に MSLSExtraction と MFCCExtraction の使用サンプルとなっている. 1ch 録音音声からオフラインで音響特徴を抽出するサンプルを用意した.
音声認識ネットワーク
HARK の 音声認識 (Automatic Speech Recognition; ASR) と (Missing Feature Mask; MFM) カテゴリーのモジュールを使ったサンプルである. 具体的には 信頼度の低い特徴量を隠すマスクを生成するモジュール MFMGeneration と、計算した特徴量をJuliusへ送信するモジュール SpeechRecognitionClient のを用いたサンプルである. 8ch 録音音声にオフライン音源定位処理を適用するサンプルを用意した.