はじめに

HARKでは,現時刻に得た特徴量(静的特徴量)に加えて,いくつか追加の特徴量な どを選べる.

  1. デルタ項 過去の特徴量の変化も考慮した特徴量(動的特徴量)

  2. パワー項 音量

  3. デルタパワー項 音量の変化

  4. 前処理の有無 高周波領域の強調 (PreEmphasis ),平均除去

ここでは,6種類のサンプルを用意した (表 14.12) 左列に,ネットワークファイルを,中列に,ネットワークを 動かすためのシェルスクリプトファイルを,右列に処理内容を示している.

これらはすべてオフライン処理であるが,AudioStreamFromMic を接続すれば オンラインで特徴量抽出もできる. また,MSLS 特徴量に関するサンプルのみであるが, MSLSExtraction を MFCCExtraction に入れ替えれば MFCC 特徴量も抽出できる.

: 音響特徴量抽出ネットワーク一覧.

ファイル名

デルタ項

パワー項

デルタパワー項

前処理

表記

demo1.n

       

MSLS

demo2.n

Yes

     

MSLS+$\Delta $MSLS

demo3.n

 

Yes

   

MSLS+Power

demo4.n

Yes

Yes

Yes

 

MSLS+$\Delta $MSLS+Power+$\Delta $Power

demo5.n

Yes

 

Yes

 

MSLS+$\Delta $MSLS+$\Delta $Power

demo6.n

Yes

Yes

Yes

Yes

MSLS+$\Delta $MSLS+$\Delta $Power+前処理