ユーザーブロマガは2021年10月7日(予定)をもちましてサービスを終了します

人生余詰めさん のコメント

ある程度ご存知かもしれませんが、
・ホワイトノイズによるテスト
・カットオフ周波数による音質の判定
どちらもあまり意味がありません。

この手のものは人間の知覚特性に基づいたものなので、一般的な音源の官能テストに限ります。
一般的に、iTunesのAACは、かなり優秀とされています。
下のURLが示す実験結果では、Opus>AAC(iTunes)>ogg>=mp3>>faac という結果になっています。
http://listening-test.coresv.net/results.htm

個人的にはAAC自体は、優秀なのですが、オープンソースなfaac、fdk aacがイマイチなので、オープンソースなlameが最強なmp3と比べると煩わしさを感じますね・・・。

>>2
qaacは、単なるwrapperで実態はitunesです。
No.3
37ヶ月前
このコメントは以下の記事についています
こんにちは!今回は AACエンコーダの音質比較 を書きます! 最近ffmpegでの生放送が増えてきました。 ffmpegには 内蔵エンコーダ の他に(自分でビルドしないといけませんが) faac や fdk_aac もあってどれを使えばいいの><って人も多いはず! はず! というわけで各エンコーダとおまけで生放送では使えませんが一般的な用途でよく使われる neroAacEnc と iTunes のAACエンコーダで音質を調べた結果を書きます! この記事では どこまで高い周波数が出てるかで音質を比較します。 そのため必ずしもここに書かれている結果通りの音質に感じない場合があります。 また一般的な音楽ではなく ホワイトノイズを用いて調べてますので 一般的な音楽で調査すると違う結果になる可能性があります。 また実際に一般的な音楽でも検証してみましたがある程度違う結果も出ています。 ホワイトノイズでの結果はあくまで参考程度に留めておいて下さい。 以上の点をあらかじめご了承頂いてお読みになって下さい 。 今回は上にも書きましたがホワイトノイズを用いて調べます。 まずAudacityで3秒間のホワイトノイズのWAVファイルを作成しました。 作成したwavファイルを各エンコーダでAACにエンコード、 ffmpegで再びWAVファイルに戻しWaveSpectraで波形、周波数を調べました。 ビットレートは音声がAACの放送でもっともよく使われていると思われる(勝手に思っている) 96kbps と音質重視の場合使ってるかもしれない 128kbps で調査しました。 まずはエンコードする前のホワイトノイズのWAVから見てみましょう。 ここに出ている 22050.0Hz が劣化していないときの状態です。(44100.0Hzの半分) 劣化するとグラフの右端までいかず途中で崖のように落ち込むのですが その崖の手前でどこまで出ているかで比較します。 最初は 96kbps から見ていきます。まずは 内蔵エンコーダ(vo_aacenc) からです。 13910.4Hz まで出ています。画像を見れば崖のようになっているのがわかると思います。 崖下になるとほとんど音が出ていない状態です。 音声を圧縮する際は人間に聞こえにくい高音域を削るので削られている状態ですね。 次は faac です。 10282.1Hz まで出ています。さっきの vo_aacenc より低いですね。 ここまで下がると音質の劣化がはっきりと感じられます。 ちなみに faac はこちらも使用者が多いXSplit等にも使われているそうです。 次は fdk_aac です。 14233.4Hz まで出ています。ffmpegに内蔵できるエンコーダの中ではもっとも高いです。 96kbpsのAACで放送するときはこちらをおすすめします。 ちなみに fdk_aac にはafterburnerという品質を上げるオプションがあるのですが 今回使う場合と両方試してみたところどちらも同じ結果になりました。 ここからは生放送での使用 外 となります。次は neroAacEnc です。 18637.0Hz まで出ています。先ほどまでと比べるとかなり高い数値です。 動画に使うなどの用途でAACに変換する場合はこちらをおすすめします。 最後に iTunes です。 14071.9Hz まで出ています。 fdk_aac より若干低い程度ですが neroAacEnc には遠く及ばない数値になっています。 コマンド記述の必要がなく簡単に使えるのであまり音質を気にしない人にはいいかも。 ここまでが 96kbps の音質比較になります。 まとめてみると生放送用途では fdk_aac > 内蔵エンコーダ > faac ということになります。 ただ 内蔵エンコーダ でも悪くはないと思うのでビルドが面倒、わからないという方は 内蔵エンコーダ で十分だと思います。よほどいい環境と耳でなければわからないと思います。 つづいて 128kbps の結果を見てみます。まずは 内蔵エンコーダ から。 19929.0Hz まで出ています。数値的に見るとかなりいいです が いろんな楽曲で試してみたところここまでの数値が出ることは少なかったです。 なのでこの結果はホワイトノイズ特有の結果として見て下さい。 詳しくは後述。 次は faac です。 15923.8Hz まで出ています。 96kbpsのときは一番悪い結果でしたが 128kbpsの今回はそこそこの数値になっています。 安定もしているのでおすすめできます。 次は fdk_aac です。 15396.2Hz まで出ています。 faac とは 逆に96kbpsのときはいい結果でしたが 128kbpsの今回はあまり良くない結果になっています。 高ビットレートではあんまりかも。 ここからはまた生放送での使用 外 となります。次は neroAacEnc です。 19929.0Hz まで出ています。さすがに高い数値が出ていますね。 128kbpsでも動画に使うなどの用途でAACに変換する場合はこちらをおすすめします。 最後に iTunes です。 15923.8Hz まで出ています。 faac と同じ数値ですね。 neroAacEnc には及びませんが悪くはないと思います。 ここまでが 128kbps の音質比較になります。 これをまとめると生放送用途では 内蔵エンコーダ > faac > fdk_aac となりますが 前述のとおり内蔵エンコーダで一般的な音楽等をエンコードすると結果が変わってきます。 ここからはインストやボーカル入り混じった数曲で検証した結果を書いていきます。 内蔵エンコーダ では周波数がどこまで高い数値が出るかが安定しないことがわかりました。 それにホワイトノイズのときのような高い数値は一瞬すら出なかった曲も多いです。 曲の傾向からどうやら音の少ない、ボーカル曲等は数値が低くなりやすく 音の多い曲では数値が高くなりやすいみたいです。(それでもホワイトノイズより低いです) ホワイトノイズ自体が音の塊のようなものなので高い数値で安定したのかもしれません。 生放送用途では数値が低くなりやすい音の傾向(声中心、BGM小さめ)だと思うので128kbpsのときは 内蔵エンコーダ は推奨できません。 例として図を貼っておきます。 この音源(ポップン20サントラよりThe Sealer)を 内蔵エンコーダ で128kbpsでエンコしても 安定してる時でもこの程度の音質になります。同条件の faac や fdk_aac より低いです。 faac は完全に安定とはいきませんがかなりホワイトノイズのときと近い結果が出ています。 なので生放送用途で128kbpsのAACを使いたいときはときはこちらを推奨します。 fdk_aac はかなり安定しています。様々なジャンルの数曲で調べましたが すべてホワイトノイズとまったく同じ結果が出ました。 生放送用途で96kbpsのAACを使いたいときはこちらを推奨します。 かなり長くなりましたが自分なりの結論を出すと ・ 生放送用途で96kbpsのAACを使いたいときはfdk_aac ・ 生放送用途で128kbpsのAACを使いたいときはfaac ・ 動画や音楽など生放送用途ではないときはneroAacEnc ・ (ビルドが面倒なら内蔵エンコーダでもそこまで変わらない) となります。長々とお付き合いいただきありがとうございました。 また fdk_aac を使う場合は低ビットレートでも音が破綻しにくい HE-AAC を使うことができます。48kbps程度でもAACの96kbps程度の音質が実現できるので使用を視野にいれるべきでしょう。( ただし音声ビットレートを上げても音質が上がりにくいというデメリットもあります ) 需要があれば HE-AAC でのエンコーダ、ビットレートごとの音質比較もやろうと思ってます!(と言ってもfdk_aacとaacplusぐらいしか知らないけど・・・) もしも見たいって人がいらっしゃったらコメントよろしくお願いします! また生放送とは関係ないおそらくリスナーさんは得しないことを書いてごめんなさい>< また書くこと思いついたら書くのでよろしくお願いします。 今度は音ゲーのこと書けたらいいなぁ… そろそろ設定以外のことも書いていきたいH2NOでした。それでは今回はこれで。
アドレス確保兼ねて作りました!

自分用だけど他の誰かの役にもしかしたら立つかもしれないメモ的なものを書くかも的な