はじめに

本ドキュメントでは,HARKを使う際によくおこる問題とその解決策について記述する. 料理本に作りたい料理とその作り方が書いている構成と類似しているので, ここでは問題と解決策の組をレシピと呼ぶことにする.

2章 初めてのHARK

 
初めてHARK を使う人のためのレシピを収録している.音声の録音, 音源定位,音源分離,音声認識までを順番に解説していくので, 初めてHARKを使う人はこの章のレシピを順番に読んでいこう.

3章 よくある問題と解決方法

 
よくある問題,たとえばインストールができないとか,録音できない などの解決方法に関するレシピを収録している.問題があればまず ここを見よう.また,デバッグの方法に関するレシピもある.

4章 マイクロホンアレー

 
マイクロホンアレーの設計に関するレシピを収録している. マイクの数や種類,ロボットやシステムにどう設置するかなどが分からないとき は,この章を参照しよう.

5章 入力データの作成

 
HARK への入力データの作成方法に関するレシピを収録している. 具体的には,録音の方法とインパルス応答の測定方法などである. また,シミュレーションで録音データを作成することもできるので, その方法もかかれている.

6章 音響モデルと言語モデル

 
HARK が音声認識器としてサポートしている Julius は,音響モデルと言語モデルが必要である. この章では,それらの作り方に関するレシピを収録している.

7章 FlowDesigner

 
HARK によるシステム構築は,ミドルウェア FlowDesigner 上でノー ドを置き,それらを繋ぐことで行う.ここでは,FlowDesigner の使い方に関するレシピを収録している.

8章 音源定位

 
音源定位に関するレシピを収録している. 音源定位システムの作り方からパラメータチューニング, デバッグまでカバーしている.

9章 音源分離

 
音源分離に関するレシピを収録している. ここでも音源定位同様,システムの作り方から チューニング,よくある問題に関するレシピがある.

10章 特徴量抽出

 
音声認識を行うためには,分離した音から特徴量を抽出する 必要がある.ここでは,音声認識でよくつかわれる特徴量や その抽出方法,信頼度に基づいて特徴量を取捨選択する ミッシングフィーチャマスクに関するレシピが収録されている.

11章 音声認識

 
音声認識はオープンソースソフトウェア Julius を使うことを 前提としている.ここでは,その設定ファイルの作り方に関する レシピを収録している.

12章 その他

 
他の章に入らないレシピを収録している. たとえば 短時間周波数解析に使う窓の選び方などである.

13章 進んだ使い方

 
HARK に新しい機能を追加したり, HARK と別のシステムを接続するなど,HARK の枠を越えたいときに つかえるレシピを収録している.

14章 サンプルネットワーク

 
ここでは様々なサンプルのネットワークファイルを 収録している.まずはこのサンプルを見てネットワークを作成して みるとよいだろう.