6.4.1 Delta

6.4.1.1 ノードの概要

本ノードは,静的特徴ベクトルから動的特徴量ベクトルを求める. 特徴抽出ノードである MSLSExtraction や MFCCExtraction の後段に 接続するのが一般的な使い方である. これらの特徴量抽出ノードは,静的特徴ベクトルを求めると共に,動的 特徴量を保存する領域を確保している.この時の動的特徴量は,0 に 設定されている.Delta ノードでは,静的特徴ベクトル値を使って 動的特徴量ベクトル値を計算し,値を設定する.従って,入出力で ベクトルの次元数は変らない.

6.4.1.2 必要なファイル

無し.

6.4.1.3 使用方法

どんなときに使うのか

静的特徴から動的特徴量を求める場合に本ノードを使う. 通常,MFCCExtraction や MSLSExtraction の後に用いる.

典型的な接続例

\includegraphics[width=120mm]{fig/modules/Delta}
Figure 6.56: Delta の典型的な接続例

6.4.1.4 ノードの入出力とプロパティ

Table 6.51: Delta パラメータ表

パラメータ名

デフォルト値

単位

説明

FBANK_COUNT

int 

13

 

静的特徴の次元数

入力

INPUT

: Map<int, ObjectRef> 型.音源 ID と特徴量ベクトルの Vector<float> 型のデータのペア.

出力

OUTPUT

: Map<int, ObjectRef> 型.音源 ID と特徴量ベクトルの Vector<float> 型のデータのペア.

パラメータ

FBANK_COUNT

: int 型である.処理する特徴量の次元数. 値域は,正の整数. 特徴量抽出ノードの直後に接続する場合は, 特徴量抽出で指定した FBANK_COUNT を指定. ただし,特徴量抽出でパワー項を使用するオプションを trueにしている場合は, FBANK_COUNT + 1 を指定する.

6.4.1.5 ノードの詳細

本ノードは,静的特徴ベクトルから動的特徴ベクトルを求める. 入力の次元数は,静的特徴と動的特徴の次元数を合せた次元数である. FBANK_COUNT 以下の次元要素を静的特徴とみなし,動的特徴量を計算する. FBANK_COUNT より高次の次元要素に動的特徴量を入れる.

フレーム時刻 $f$ における,入力特徴ベクトルを,

  $\displaystyle \boldsymbol {x}(f) $ $\displaystyle = $ $\displaystyle [x(f,0),x(f,1),\dots ,x(f,P-1)]^{T} $   (93)

と表す.ただし,$P$ は,FBANK_COUNT である.

  $\displaystyle \boldsymbol {y}(f) $ $\displaystyle = $ $\displaystyle [x(f,0),x(f,1),\dots ,x(f,2P-1)]^{T} $   (94)

出力ベクトルの各要素は,

  $\displaystyle y(f,p) $ $\displaystyle = $ $\displaystyle \left\{ \begin{array}{ll} x(f,p), & {if~ ~ } p=0, \dots , P-1, \\ \displaystyle w \sum _{\tau =-2}^{2} \tau \cdot x(f+\tau ,p), & {if~ ~ } p=P, \dots , 2P-1, \end{array} \right. $   (95)

である.ただし,$w = \frac{1}{\sum _{\tau =-2}^{\tau =2} \tau ^2}$ である. 図 6.56Delta の入出力フローを示す.

\includegraphics[width=120mm]{fig/modules/DeltaIO.eps}
Figure 6.57: Delta の入出力フロー.