HARK クックブック
HARK クックブック
奥乃 博
中臺 一博
高橋 徹
武田 龍
中村 圭佑
水本 武志
吉田 尚水
大塚 琢馬
柳楽 浩平
糸原 達彦
はじめに
はじめてのHARK
はじめての録音
はじめての音源定位
はじめての音源分離
はじめての音声認識
よくある問題と解決方法
うまくインストールできない
うまく録音できない
うまく定位できない
うまく分離できない
うまく認識できない
デバッグモジュールを作りたい
デバッグツールを使いたい
マイクロホンの接続をチェックしたい
マイクロホンアレー
マイクロホン数はいくつがいい?
マイクロホン配置はどうしたらよい?
どんなマイクロホンを使えば良い?
自分のロボットにマイクロホンを搭載したい
サンプリングレートはどう設定したらいいい?
別のA/D変換器を使いたい。
入力データの作成
多チャネル録音したい
インパルス応答を計測したい
インパルス応答から音声データを合成したい
ノイズデータを加えたい
音響モデルと言語モデル
音響モデルを作りたい
マルチコンディション学習
追加学習
MLLR/MAP 適応
言語モデルを作りたい
FlowDesigner
コマンドラインから引数を与えて起動したい。
他のネットワークファイルからノードをコピーしたい
for ループのように指定した回数だけ繰り返し処理をしたい
音源定位
はじめに
音源定位のパラメータをチューニングしたい
マイクロホンアレイの一部だけを使いたい
同時に複数の音を定位したい
定位できているかどうかを確認したい
音源定位がまったくでない / 出すぎる
音源定位結果が細かく切れてしまう / 全部繋がってしまう
音源分離した音の先頭が切れてしまう
音源の高さや距離も推定したい
定位結果をファイルに保存したい
音源分離
はじめに
分離音をファイルに保存したい
音源分離のパラメータをチューニングしたい
マイクロホン配置だけから音源分離したい
ファンノイズなどの定常ノイズのせいで音源分離がうまくいかない
分離音に入っている雑音を後処理で減らしたい
音源やロボットが移動する状況で分離したい
特徴量抽出
はじめに
ミッシングフィーチャマスク (MFM) の閾値の設定の仕方がわからない
特徴量をファイルに保存したい
音声認識
設定ファイル(.jconfファイル)を作りたい
その他
窓長とかシフト長の適切な値が知りたい
MultiFFT
に使う窓関数はどれを使えばよいか知りたい
PreEmphasis
の使い方は?
進んだ使い方
ノードを作りたい
システムの処理速度をあげたい
他のシステムとHARKを接続したい
モータを制御したい
サンプルネットワーク
はじめに
サンプルネットワークのカテゴリー
ドキュメントの表記とサンプルネットワークの実行方法
録音ネットワークサンプル
ALSA準拠デバイスによる録音
無線 RASP による 8ch 録音
TD-BD-16AD-USB による録音
RASP24 による録音
音源定位ネットワークサンプル
オフライン音源定位
オンライン音源定位
音源分離ネットワークサンプル
オフライン音源分離
オフライン音源分離 (HRLE を使った後処理あり)
オンライン音源分離 (HRLE を使った後処理有り・無し)
音響特徴量抽出ネットワークサンプル
はじめに
MSLS
MSLS+
MSLS
MSLS+Power
MSLS+
MSLS+Power+
Power
MSLS+
MSLS+
Power
MSLS+
MSLS+
Power+前処理
音声認識ネットワークサンプル
音声認識の実行
音声認識率の評価
HARK クックブック