本ノードは,入力ベクトル中から指定した次元要素を削除し, ベクトルの次元を減らしたベクトルを出力する.
無し.
どんなときに使うのか
音響特徴量やミッシングフィーチャーマスクベクトルなどの ベクトル型の要素の中から不要な要素を削除し,次元数を減らすときに使う.
通常,特徴量の抽出処理は,静的特徴に続いて,動的特徴量を抽出する. その際に,静的特徴が不要となる場合がある.不要な特徴量を削除するには, 本ノードを使用する.特に対数パワー項を削除することが多い.
典型的な接続例
MSLSExtraction や MFCCExtraction で対数パワー項を計算し,その後, Delta を用いると,デルタ対数パワー項を計算できる. 対数パワー項を計算しなければデルタ対数パワーを計算できないため,一度 対数パワー項を含めて音響特徴量を計算してから,対数パワー項を除去する. 本ノードは,通常 Delta の後段に接続し,対数パワー項を削除 するために用いる.
パラメータ名 |
型 |
デフォルト値 |
単位 |
説明 |
SELECTOR |
<Vector<int> > |
次元インデックスからなるベクトル |
||
(複数指定可) |
入力
: Map<int, ObjectRef> 型.音源 ID と特徴量ベクトルの Vector<float> 型のデータのペア.
出力
: Map<int, ObjectRef> 型.音源 ID と特徴量ベクトルの Vector<float> 型のデータのペア.
パラメータ
: Vector<int> 型.値域は,0 以上入力特徴量の次数未満.いくつ指定してもよい.1次元目と3次元目の要素を削除し,入力ベクトルを 2次元減らす場合は, <Vector<int> 0 2> とする. 次元指定のインデクスが 0 から始まっていることに注意.
本ノードは,入力ベクトル中から不要な次元要素を削除し, ベクトルの次元を減らす.
音声信号を分析すると,分析フレームの対数パワーは,発話区間で大きい傾向がある. 特に有声部分で大きい.従って,音声認識において対数パワー項を音響特徴量に取り 入れることで認識精度の向上が見込める.しかしながら,対数パワー項を直接特徴量 として用いると,収音レベルの違いが音響特徴に直接反映される.音響モデルの作成 に用いた対数パワーレベルと収音レベルに差が生じると音声認識精度が低下する. 機器の設定を固定しても,発話者が常に同一レベルで発話するとは限らない. そこで,対数パワー項の動的特徴量であるデルタ対数パワーを用いる.これにより, 収音レベルの違いに頑健で,かつ発話区間や有声部分を表す特徴を捉えることが可能 となる.