本ノードは,静的特徴ベクトルから動的特徴量ベクトルを求める. 特徴抽出ノードである MSLSExtraction や MFCCExtraction の後段に 接続するのが一般的な使い方である. これらの特徴量抽出ノードは,静的特徴ベクトルを求めると共に,動的 特徴量を保存する領域を確保している.この時の動的特徴量は,0 に 設定されている.Delta ノードでは,静的特徴ベクトル値を使って 動的特徴量ベクトル値を計算し,値を設定する.従って,入出力で ベクトルの次元数は変らない.
無し.
どんなときに使うのか
静的特徴から動的特徴量を求める場合に本ノードを使う. 通常,MFCCExtraction や MSLSExtraction の後に用いる.
典型的な接続例
パラメータ名 |
型 |
デフォルト値 |
単位 |
説明 |
FBANK_COUNT |
13 |
静的特徴の次元数 |
入力
: Map<int, ObjectRef> 型.音源 ID と特徴量ベクトルの Vector<float> 型のデータのペア.
出力
: Map<int, ObjectRef> 型.音源 ID と特徴量ベクトルの Vector<float> 型のデータのペア.
パラメータ
: int 型である.処理する特徴量の次元数. 値域は,正の整数. 特徴量抽出ノードの直後に接続する場合は, 特徴量抽出で指定した FBANK_COUNT を指定. ただし,特徴量抽出でパワー項を使用するオプションを trueにしている場合は, FBANK_COUNT + 1 を指定する.
本ノードは,静的特徴ベクトルから動的特徴ベクトルを求める. 入力の次元数は,静的特徴と動的特徴の次元数を合せた次元数である. FBANK_COUNT 以下の次元要素を静的特徴とみなし,動的特徴量を計算する. FBANK_COUNT より高次の次元要素に動的特徴量を入れる.
フレーム時刻 $f$ における,入力特徴ベクトルを,
$\displaystyle \boldsymbol {x}(f) $ | $\displaystyle = $ | $\displaystyle [x(f,0),x(f,1),\dots ,x(f,P-1)]^{T} $ | (93) |
と表す.ただし,$P$ は,FBANK_COUNT である.
$\displaystyle \boldsymbol {y}(f) $ | $\displaystyle = $ | $\displaystyle [x(f,0),x(f,1),\dots ,x(f,2P-1)]^{T} $ | (94) |
出力ベクトルの各要素は,
$\displaystyle y(f,p) $ | $\displaystyle = $ | $\displaystyle \left\{ \begin{array}{ll} x(f,p), & {if~ ~ } p=0, \dots , P-1, \\ \displaystyle w \sum _{\tau =-2}^{2} \tau \cdot x(f+\tau ,p), & {if~ ~ } p=P, \dots , 2P-1, \end{array} \right. $ | (95) |
である.ただし,$w = \frac{1}{\sum _{\tau =-2}^{\tau =2} \tau ^2}$ である. 図 6.55 に Delta の入出力フローを示す.