だいぶん前に実験したまま放置していた FFT によるエンジン回転数の推定,窓関数とか折り返しノイズとか新たな知識を仕入れたので,エンジン回転推定精度が上がるかと思って,昔のコードを引っ張りだして試してみた.
で,余計な風切り音とかが入っていない純粋なエンジン音だけ入っている動画を探して見つけたのがこれ.(人の動画)
これだけクリアに音が入っているなら,エンジン回転数も推定しやすいだろうと思っていたら,予想に反してタコメータが暴れまくる(;´д⊂)
んー? と思って,スペクトル解析結果をわかりやすいように画像化してみた.
縦が周波数 (≒エンジン RPM) で横が時間,白いほどその周波数の音量が大きいことを示している.
この図から,なんとなくタコメータのグラフっぽいものが読み取れると思うけど,問題なのは,正解は一番上の線なのに対しそれとほぼ同じ音量で,コピーっぽい線が何本か現れている.これならタコが暴れるのも納得.
人間の耳 (と言うか自分の耳) では,一番大きいエンジン音以外の音はあんま聞こえないんだけどなぁ.機械にとってはそうではないみたい.
音声認識とか画像認識とか,自然データ相手の解析は難しいね.
0 件のコメント:
コメントを投稿