はじめての録音

Problem

HARK を使って音声を録音してみたいが，やり方が分からない． HARK を初めて使うので，なにをすればいいか分からない．

Solution

HARK をオンラインで動かそうとすると，マイクからの音声入力は避けられない．また，録音はHARK の基本でもあるので，初めて HARK を使う人は，ここから試していこう．ただし，単純に録音をするだけなら録音/再生ツール wios を使えば良い．使い方は HARK ドキュメントか，レシピ多チャネル録音したいを参照．

録音デバイス

まずは，録音デバイスを用意しよう．音源定位や音源分離には多チャネルの録音デバイスを用意する必要がある．ただし，単に録音するだけなら，マイクをコンピュータのマイク端子に差せばよい．録音デバイスの詳細は HARK ドキュメントのデバイスの章を参照．

ここでは，ALSA デバイスを前提とする．ターミナルで， arecord -l を実行してみよう．たとえば，このような出力が得られるはずだ．card から始まる行に，接続したデバイス名があることを確認しよう．

card 0 Intel [HDA Intel], device 0 AD198x Analog [AD198x Analog]
  Subdevices 2/2
  Subdevice #0 subdevice #0
  Subdevice #1 subdevice #1
card 1 ** [***], device 0 USB Audio [USB Audio]
  Subdevices 1/1
  Subdevice #0 subdevice #0

ALSAでは，デバイス名は，card と subdevice の二つで指定する．例えば，card 0 の subdevice 1 に対応するデバイス名は plughw:0,1 である．良く分からない場合は，plughw:0,0 を使っておこう．

録音ネットワーク

次に，録音ネットワークを作成しよう．図 2.1と図 2.2 を参考に作っていこう．パラメータのほとんどはデフォルト値でよいが，表 2.1 に示したパラメータだけは自分で設定しよう．

デバイスのチャネル数，サンプリング周波数は使用するデバイスの仕様を確認して決めよう．デバイス名は，上で決めた名前を使おう．録音フレーム数(frames)は，次の録音時間(duration)の計算式から逆算できる．

$\displaystyle duration [sec] = ( LENGTH + (frames - 1) * ADVANCE ) / SAMPLING\_ RATE$

ただし，上記の変数たちは AudioStreamFromMic のパラメータ．例えば，すべてデフォルト，サンプリング周波数 16000Hz で，5秒録音したいなら，以下の計算から，498にすればよい．

$\displaystyle 5 [sec]$

$\displaystyle =$

$\displaystyle (512 + (frames - 1) * 160) / 16000$

$\includegraphics{fig/recipes/demo-RecordALSA1ch-MAIN}$

: MAIN (subnet サブネットワーク)

$\includegraphics{fig/recipes/demo-RecordALSA1ch-MAIN_LOOP-SaveWavePCM}$

: MAIN_LOOP (iterator サブネットワーク)

: 録音ネットワークのパラメータ

ノード名	パラメータ名	型	意味と設定値
Iterate	MAX_ITER	`int`	録音フレーム数 (`498`)
AudioStreamFromMic	CHANNEL_COUNT	`int`	デバイスのチャネル数 (`8`)
AudioStreamFromMic	SAMPLING_RATE	`int`	デバイスのサンプリング周波数 (`1600`)
AudioStreamFromMic	DEVICETYPE	`string`	使用するデバイスの種類 (`ALSA`)
AudioStreamFromMic	DEVICE	`string`	使用するデバイス名 (`plughw:0,0`)

録音の実行

完成したネットワークを実行してみよう．録音できれば，チャネルの数だけファイル sep_0.wav, sep_1.wav...ができているはずだ．適当なプレーヤーで再生しよう．たとえば，次のようにすればよい．

    aplay sep_0.wav

トラブルシューティング

これでうまくいけばよいが，失敗する場合は，次のことを確認しよう．また，レシピうまく録音できないも確認しよう．

マイク接続: プラグが抜けていたり，緩んでいないかを確認し，しっかり接続する．
プラグインパワー: 録音デバイスがプラグインパワーに対応している時問題ないが，そうでない時は，外部電源を供給する必要がある．電池の残量や電源スイッチを確認しよう．
別の録音ソフトで確認: 他のソフトウェアでも録音できない場合は，OS やドライバの設定，録音デバイスの接続または設定を調べよう．
デバイス名が間違い: デバイスを複数使用しているときは，名前を間違えている可能性も考えよう．arecord -l でもう一度確認しよう．あるいは，いろいろ別のデバイスも試してみよう．

Discussion

SaveWavePCM が最も簡単だが，ヘッダが不要な場合は，SaveRawPCM を使うと 16bit リトルエンディアンで書き込まれた raw ファイルとして保存もできる．その場合のネットワークを図 2.3 に示す．この場合，録音ファイルの拡張子は .sw になる．

$\includegraphics{fig/recipes/demo-RecordALSA1ch-MAIN_LOOP-SaveRawPCM}$

: MAIN_LOOP (iterator サブネットワーク)

raw ファイルの読み込みと表示は，python の numpy，pylab モジュールを使っ次のように実現できる．

        import numpy, pylab
        waveform = numpy.fromfile("sep_0.sw", numpy.int16)   
        pylab.plot(waveform)
        pylab.show()

raw ファイルの再生は, aplay に，ファイル形式とサンプリング周波数を与えれば可能だ．

        aplay -c 1  -r 16000 -f S16_LE sep_0.sw

raw ファイルにヘッダを付加すれば，wav ファイルへの変換もできる． soxを使えば簡単だ．例えば，16kHz で録音したファイル sep_0.sw を sep_0.wav に変換するには，次のようにすればよい．

        sox -r 16000 -c 1 --bits 16 -s sep_0.sw sep_0.wav