ビット落ちへの対処、あれこれ(^^;

前回は「ココロの中には、このビット落ちの問題をもう少し何とかできないものかという思いはあります。そして、思いだけでなく、いろいろと馬鹿げたチャレンジを繰り返している最中です。」と書きました。今回は、このチャレンジの経過報告をしてみたいと思います。
いろいろとご意見やアドバイスをいただけると有り難いです。

ビット落ちは基本的に回避できるのか?

ネット上の情報をあれこれ探ってみると、意見は二つに分かれます。当然のことながら「できる」と「できない」の2つなのですが、圧倒的に「できない」が優勢です。

デジタル領域でビット落ちを引き起こさずに音量を減衰させる事ができた!!と主張しているメーカー(ソニーです^^;)もあるのですが、その原理がいまいち上手く理解できません。

「S-Master PROのパルスハイトボリュームは、パルスの高さを増減することで音量を調節。例えば、パルスの高さを半分にすることで、音量を半分に絞ることができます。パルスの高さの調整は、パワードライバーに電圧を供給している電源の電圧で制御。デジタル領域でデータを操作しないため、情報の消失がなく、小音量から大音量まで、広い範囲でディテールを損なわず高音質を維持できます。」

私の理解が不十分なのかもしれませんが、せっかくデジタルで操作しているプロセスのど真ん中に電圧の増減というアナログ的な操作が挟み込まれるのはぞっとしません。
さらに、その電圧の増減をどのようにして実現しているのかも詳しく書かれていません。まさか抵抗を挟み込んで調節しているわけではないでしょうから、おそらくはスイッチング操作で流れ込む電流量を調節して電圧を増減させているのでしょう。
どちらにしても、ぞっとしない話ではあります。

また、この手法がソニー以外で使われたという話は聞きませんから、見かけ上はビット落ちを引き起こさなくてもバーター関係で失うものが多いと判断されているのかもしれません。

と言うことで、デジタル領域で音量を調節する限りビット落ちは避けられないというのが多数派です。
そして、この「避けられない」という事を前提として、いろいろな対処法が編み出されています。

ビット変換で対処する

CD規格は16ビットです。
これがもし、32ビットだったらどうでしょう。

まず、誤解のないように最初に確認しておきますが、デジタルデータとしてのビット数は、フルで送り出していれば16ビットであろうと32ビットであろうと音質面での差はほとんどありません。
ビット数が大きければ大きいほど音質的に優れていると考えるのは間違いです。ですから、「24ビットの音にしても利用者にはなんの得にもならない」というのはそういう面においては正しい見解です。
しかし、デジタルデータをデジタル領域であれこれと弄りたい人にとっては、決して「何の特にもならない」話ではないのです。

以下の話は細かい数字が並んで煩わしいのですがご容赦ください。

「1ビット」のダイナミックレンジは概ね「6dB」ですから、「32ビット」のダイナミックレンジは「192dB」になります。人間の耳のダイナミックレンジ(120dB)を考えれば、32ビットという数字は完全にオーバークオリティです。
しかし、この無駄とも思えるオーバークオリティの部分を使うことで音質の劣化を招かずに音量の調整を行うことができます。

つまり、32ビットで記録されていれば、72dB減衰させてもまだ120dBのダイナミックレンジが確保できます。
72dBといえば、フルパワーで鳴り響いているオーケストラをほぼ無音にできるほどの減衰量です。つまり、オーケストラを無音にするレベルまでボリュームを絞っても、さらにその下に「人間の耳のダイナミックレンジ」に匹敵する情報量を確保できているのです。
言葉をかえれば、オーケストラをほぼ無音にできるレベルまでボリュームを絞り込んでも、人間が音として関知できる最小レベルの音は決してノイズの中に埋もれてしまうことはないのです。さらに言えば、「人間の耳のダイナミックレンジ」に匹敵する120dBを減衰してもまだ72dbの余裕がありますから、理論的には一切のクオリティの劣化なく自由自在に音量を調整することができます。
この調整能力こそが32ビット録音の最大のメリットなのです。

CDの規格が策定された当時は、デジタル情報はフルで送り出し、ボリュームはアンプの側でアナログ的に減衰させるものでしたから、ビット数は16もあれば充分だったのでしょう。デジタル領域のど真ん中で音量が調節されるような時代が来るとは想像もしなかったのでしょう。
もちろん、その規格を策定した時代に32ビットを要求するのは無理はあるでしょうが、せめて24ビットにならなかったのかという「恨み」は残ります。

ちなみに、24ビットであればダイナミックレンジは概ね「6×24」で144dBです。
144dBのダイナミックレンジがあれば、48dB減衰してもCD規格のダイナミックレンジである96dBは確保できます。48dBと言う幅では32ビットのように「自由自在」に音量を調節するには役不足ですが、イコライジングによって発生する「オーバーライド」に対処するには十分なクオリティです。

とは言え、CD規格の16ビットで記録された音源が世界を制覇している現状では、今さらどこかのメーカーが24ビットや32ビットで配信を始めても手遅れです。
「音」を聞きたいオーディオマニアであればそう言うレアな音源を探し求めて聞けば要求は満たされるでしょうが、「音楽」を聞きたいオーディオマニアにとっては、聞きたい音楽の99パーセント以上は16ビットで録音され16ビットで発売されているのですから、基本的には16ビットの音源を相手にするしかありません。

ならば、CD規格である16ビットの音源をデジタル領域で減衰させたいときは、その直前において24ビット、もしくは32ビットに変換させるというのが有力な手段として浮かび上がってきます。
これが、「ビット変換で対処する」方法です。

そして、この変換は簡単に実現できます。

MPDであれば、設定ファイルの「/etc/mpd.conf」を以下のように書き直して再起動させるだけです。

root@cubox:~# vi /etc/mpd.conf

# An example of an ALSA output:
#
audio_output {
type “alsa”
name “CuBox”
device “hw:1,0” # optional
# format “44100:16:2” # optional
# mixer_device “default” # optional
# mixer_control “PCM” # optional
# mixer_index “0” # optional
# use_mmpa “yes”
# buffer_time “2900000”
# period_time “1400000”
priority “FIFO:53”
dsd_usb “yes”
}

となっている太字の部分のコメントアウトを外して「16→24」と書き直すだけです。

format “44100:24:2″ # optional

書き直した後に再起動して設定の変更を反映させます。

root@cubox:~# /etc/init.d/mpd restart

これだけです。
また、ビット数の変換はサンプリング周波数の変換とは違ってPCにもそれほど大きな負荷はかけません。
例えば、サンプリング周波数を44.1kHzから88.2kHz変換させると、「CuBox」の場合はCPUの負荷が30%程度まであがりますが、ビット数の変換だけだと上がっても3%程度までです。この数値は、変換をしないで再生したときとほとんど差はありません。ですから、専用のコンバーターを導入しなくても、ソフト的な対応で十分ではないかと思われます。

さて、問題は変換することによる音質の変化です。
既に何度も述べているのですが、アップサンプリングは明らかに響きが薄くなります。44.1kHzの音源は44.1kHzで再生するのがベストだと信じています。
しかし、ビット数を変換させるだけならば、それほど音質への影響はないように思うのですが、一部にはそれでも「音がなまる」という意見も散見します。しかし、個人的にはほとんど音質の差は感じ取れません。
ですから、デジタルイコライザを挟み込んで音を創りたいときには、16ビットから24ビットに変換しておくことは必須の手続きと言えるかもしれません。
おそらく、この方法がビット落ちに対処する「王道」だと思います。

  1. 16ビットの音源をMPDでソフト的に25ビットに変換してから送り出す。
  2. 「GAIN OFFSET(EQ)」で10dB程度絞っておく

これで聴感的にはほとんど劣化は感じ取れないように思いますが、精神的には依然として自信が持ちきれず微妙ではあります。(^^;

「DYNメニュー(ダイナミック編集)」を使う

これはやり方としてはかなり「邪道」です。
邪道ですが、結果としてはかなり面白いことになります。

まずは、理屈から始めます。

最近の録音現場では24ビットや32ビットで録音し、最終的にCD規格の16ビットに落とし込んで商品にするというのが一般化しています。

  1. 録音16ビット → 編集加工16ビット → 再生16ビット
  2. 録音24ビット or 32ビット → 編集加工24ビット or 32ビット→ 再生16ビット

どうせ最後は16ビットになるんだったら、録音や編集が(1)16ビットだろうが(2)32ビットだろうが結局は同じだろうと思うのですが、これは明らかに(2) の方が有利です。

何故ならば、16ビットならば96dBを超えて録音はできませんから、その手前で録音レベルを絞らざるを得ません。しかし、この状態で録音レベルを絞ってしまうと、木の葉がふれ合うような微かな音(20dB)はノイズの中に埋もれてしまいます。
これは困ったことなので、ここで録音技師の神技が登場することになります。
録音レベルが小さいときはフェーダーを少しあげておいて、音量が上がってくるにつれてこっそりと下げていきます。これを上手くやると、ほとんど聴感上の不自然さを感じさせることなく16ビットの器の中におさめることができます。
しかし、誰もがそのような神業を駆使できるわけではないので、一般的には「Comp/Limiter」なんてのを使います。
「Comp/Limiter」とは、音量がある一定のレベルを超えると圧縮をかけ始める機能のことです。例えば「上限いっぱいの-6dB程度までデータが入ってきたら自動的に圧縮をかけますよ!」というような機能です。逆に、あるレベルよりもデータが小さくなると自動的にブーストさせることも可能です。
つまりは、録音技師が音楽を聴いて手動でフェーダーを操作していたのを機械の側で自動的に行う機能だと言えます。

何とも言えずインチキくさいやり方ですが、しかし古い時代のデジタル録音はこのようなやり方で録音されているものが多いようです。
それと比べると、24ビット録音ならば、そのようなインチキくさいやり方を駆使しなくても、人間の耳が音として感知できる最大の音から最小の音まで、その全てをノイズに埋もれることなく録音することができます。
つまりは、24ビットで録音すれば録音段階で入るべき情報が全て入っているのですが、16ビット録音ならば何らかの操作が加わっているのが一般的なのです。
当然のことながら、入るべき情報が全て入っているデータから編集を行うのと、そうでない状態のデータを編集するのとでは、最終的に同じ16ビットに丸め込んだとしても音質面では大きな違いが出ることは容易に理解できるはずです。

ところが、ここからが面白いのですが、不思議なことに24ビットで録音されたデータからCD化された音楽は妙に軽く、そして薄く聞こえる傾向があります。
実は、今回「DEQ2496」を弄ってみて気づいたのですが、「Comp/Limiter」を使うと音質的には重厚感が増したように聞こえるのです。素人考えで言えば、本来は96dBというダイナミックレンジに入りきらない情報を無理矢理96dBに押し込んでいるので、その分中身がつまって聞こえるのかな、等と思ってしまいます。(^^;

つまりは、私のように古い時代の録音を中心に聞いているものにとっては、このインチキくさいやり方で録音された音こそが「聞き慣れた」音なのです。困った話ですが、この「聞き慣れた」という項目は個人レベルの趣味おいては結構大きな要素であって、変な操作は一切加えないでフラットな状態で余すことなくデータが記録されている音源の方が「軽くて薄い」と思わせる力を持つのです。

そこで、この「聞き慣れた」効果を最大限に発揮して「オーバーライド」を防ぐ方途として閃いたのが「DEQ2496」の「DYNメニュー(ダイナミック編集)」を使うやりかたです。
でも、繰り返しますが、このやり方はかなり「邪道」です。

「DYNメニュー(ダイナミック編集)」の1ページ目で「COMP(コンプレッサー機能)」を選び、圧縮をかけ始める閾値(THRESHOLD)設定します。RATIOとGAINに関してはよく分からない部分もあるのですが、圧縮の程度を決めるパラメーターのようです。

DYN_1

また、「COMP(コンプレッサー機能)」に関してはさらに細かく数値が設定できるようで、2ページの画面で「KNEE」の数値を操作することで全体のカーブを滑らかにすることができます。これは視覚的に確認できますし、聴感的にもカーブが滑らかな方が音質的に自然さがますようです。

DYN_2

その他、「ATTACK」や「RELEASE」の数値もあれこれ変えることで、コンプレッサー機能が働くまでの反応時間や解放するまでの時間を変更させることができます。一般的には、反応時間やリリース時間は短い方が音楽の勢いを削がないのですが、あまりにも短すぎると反応が遅れてオーバーライドしてしまいますので、そのあたりは頃合いを見計らって数値を探す必要があります。

さて、面白くて問題なのは、その結果です。
確かに、音の雰囲気はがらりと変わります。

しかしその変わり方は、「UTILITY」メニューの「GAIN OFFSET(EQ)」を使ってガバッとゲインを下げたときの変わり方とは全く違います。「GAIN OFFSET(EQ)」を極端に使ったときは明らかに「劣化」という言葉がピッタリだったのですが、「DYNメニュー(ダイナミック編集)」を使ったときは、なんだかスピーカーが変わったような雰囲気になります。
表現としては適当かどうかは分からないのですが、まるでヴィンテージのスピーカーに変わったような雰囲気で、厳密に言えばこれも「劣化」しているのでしょうが、聴感的には嫌いな音ではありません。

当然のことですが、この機能を使えば「GAIN OFFSET(EQ)」を0dBにしておいてもオーバーライドすることはまずありません。
手法としては「邪道」だとは思うのですが、聴感的には面白いのでメモリに記憶させて、この設定で音楽を聴くことが時々あります。
試してみてそんはない対処法だと思います。

DACでDSD変換してしまう

私が使っているDACはエソテリックの「D-07X」です。「D-07X」には2倍・4倍にアップサンプリングする機能があるのですが、さらにDSDに変換する機能もあります。
理由はよく分からないのですが、多少はビット落ちしたデータでもDSD変換すると勢いが戻るような気がします。

######################################################

「D-07X」では3種類のアップサンプリングが可能です。

  • 2Fs:32kHz/44.1kHz/48kHzのソースを、それぞれ2倍の64kHz/88.2kHz/96kHzにアップコンバートし、D/Aコンバータ部に伝送します。
  • 4Fs:32kHz/44.1kHz/48kHz/88.2kHz/96kHzのソースを、それぞれ4倍または2倍の128kHz/176.4kHz/ 192kHzにアップコンバートし、D/Aコンバータ部に伝送します。
  • DSD:DSDにデジタルフォーマット変換し、D/Aコンバータ部に伝送します。

一時はこのアップサンプリングに凝ったことがあるのですが、最近は懐疑的です。
その最大の理由は、「音がヘタれる」からです。

確かに、アップサンプリングすると天井が高くなったようなメリットは感じられるのですが、その対価として、ザラッとした生成りの手触りみたいな良さが失われるのが残念でした。ただし、今まではPC側でソフト的にアップサンプリングしていたので、今回のようにDAC側でハード的にアップサンプリングすると多少は傾向は変わるかなという期待がありました。

しかしながら、実際に試してみると、「2Fs」と「4Fs」に関しては、ソフト的にアップサンプリングしたときと同じような傾向の音で、私の好みではありませんでした。しかし、「DSD」に関しては、「うーん!」とうならされるほどの「化粧上手」です。
おそらく、これは充分に実用範囲ですし、特に古い録音に関しては積極的に使うメリットはあると思います。
おそらく、今後のアップサンプリングは単純に整数倍するようなやり方ではなくて、DSDフォーマットに変換してからアップサンプリングするやり方が主流になるだろうと思います。

ただし、個人的には、それでも素のままのザラッとした生成りの感触が後退するのが我慢できないので、SP盤時代の録音以外では使用していません。

######################################################

「SP盤時代の録音以外では使用していません。」と書いたのですが、デジタルイコライザで弄りたおした後にDSD変換してしまうというのは、聴感的にはかなり有効な感じがしています。
ただし、理由は分かりません。

とりあえずの結論

まずはこれが本筋かと思われます。DSD変換に関しては根拠薄弱ですが、聴感的にプラス面が感じられるので採用しています。気に入らなければ変換はオフでもいいかと思います。

  1. 16ビットの音源をMPDでソフト的に25ビットに変換してから送り出す。
  2. 「GAIN OFFSET(EQ)」で10dB程度絞っておく
  3. 「D-07X」でDSDに変換する

次にこれ。本筋から外れる「邪道」かとは思うのですが、意外と音の雰囲気が良くなるので捨てがたいです。この時は「GAIN OFFSET(EQ)」は使いません。

  1. 16ビットの音源をMPDでソフト的に25ビットに変換してから送り出す。
  2. 「DYNメニュー(ダイナミック編集)」を使う
  3. 「D-07X」でDSDに変換する

それにしても、たかだか2万円足らずの「DEQ2496」のおかげで、ホントにいろんな事を勉強させてもらっています。感謝、感謝です。


9 comments for “ビット落ちへの対処、あれこれ(^^;

  1. コージー
    2013年10月11日 at 6:32 PM

    デジタルイコライザーの話題、待ち望んでました。
    私がデジタルイコライザーに注目したのは、自作スピーカーをマルチアンプで鳴らすためにとても有効だと思ったからで、一連の記事でユングさんが紹介されているサイトの記事を読んで、自分なりに色々と考えを巡らせておりました。

    DEQ2496はその名の通り、安いけど24Bit/96kHzまでのデジタルデータを扱えるすぐれものです。
    DSP用のチップを調べてみると、デジタルプロセスは24Bit/96kHzまたは24Bit/48kHzというスペックが定番のようで、DEQ2496の内部プロセスも24Bit/96kHzまたは24Bit/48kHzで動作しているんじゃないかと推定しています。

    記事では、MPDの設定でデジタル出力を24Bit/44.1kHzへソフト的に変換する方法が提案されてますが、私の推定が正しければ、このデジタル信号は、DEQで更に24Bit/48kHzへと変換されている可能性があります。もしそうなら、最初から24Bit/48kHzへと変換したほうが、有利かもしれませんね。

    ネットで情報でも、DEQに入れる前に(品質の良い)サンプリングレートコンバーターで24Bit/96kHzへ変換した方がいいとおっしゃってる方がおられるので、私もDEQのために藤原さんのサンプリングレートコンバーター基板を作ってしまいました。

    ただ残念ながら、チャンデバとマルチアンプを組み立ててる最中で、サンプリングコンバーターの効果を確かめることができておりません。(汗)

  2. 2013年10月12日 at 12:15 PM

    >もしそうなら、最初から24Bit/48kHzへと変換したほうが、有利かもしれませんね。

    このあたりの内部動作の仕組みは詳しい仕様が不明なので確たる事は言えません。

    しかし、DEQ2496のワードクロックの外部入力はデジタルインの時には動作しません。

    つまりは、外部入力がデジタルの時は、そのデジタル信号を送り出す機器のクロックに同期するようになっています。

    ですから、クロックが44.1kHzに同期しながら、それを48kHzで処理するというのは考えにくいと思います。
    何故ならば、そう言うことをしようとすれば、44.1kHzというクロックの同期を解除してからもう一度新しい内部クロックで48kHzに同期させる必要があるからです。

    さらに言えば、44.1kHzのデータは44.1kHzのデータとして外部のDACに送り出されています。
    そうなると、44.1kHz→48kHz→44.1kHzという煩雑な変換を行っていることになります。

    それはちょっと考えにくいというのが私の感想です。

    それから、個人的にはPCサイドでアップサンプリングした音は好きになれません。もっとも、これは個人差があるので良い悪いのはなしではありません。

    • コージー
      2013年10月13日 at 9:19 PM

      >つまりは、外部入力がデジタルの時は、そのデジタル信号を送り出す機器のクロックに同期するようになっています。
      >さらに言えば、44.1kHzのデータは44.1kHzのデータとして外部のDACに送り出されています。

      入力=出力でしたか、、、これは、失礼しました。どうやら、私の予想は見当違いだったのようです。
      DEQのデジタルは入力の場合、ユングさんの仰るとおり、スレーブとして上流機器のクロックに同期して動作するんですね。勉強になりました。

      ちなみに、手元にあるDEQの蓋を開けて、DSPチップの銘柄を確認したところ、アナデバのADSP-2136Lとうチップが2枚入ってました。

      最新記事のNASの電源強化の効果について読んでいて、妄想したのですが、DEQの電源は(価格からして当然ですが)貧相なスイッチング電源です。アナログ電源化するといいかもしれませんね。

      調べてみると、デフォルトスイッチング電源の出力は、±15V, +9V, +5V, +3.3Vでした。アナログGNDとデジタルGNDは分離されてるようです。

      • 2013年10月13日 at 10:18 PM

        >最新記事のNASの電源強化の効果について読んでいて、妄想したのですが、DEQの電源は(価格からして当然ですが)貧相なスイッチング電源です。アナログ電源化するといいかもしれませんね。

        これに関しては120%同意しますね。DEQ2496は価格からは信じがたいほどのパフォーマンスを発揮するのですが、唯一気にくわないのが電源部の貧相さです。ただし、ここを強化したら価格は2倍以上になるかも知れませんね。(でも、2倍だったら絶対に買いますね。)

        そう言えば、DEQ2496を改造した報告がありました。

        http://www.audio-romanesque.com/DEQ2496.html

        どこかのショップで改造を引き受けてくれないかな・・・・(^^v

  3. tarosuke
    2014年9月14日 at 6:13 PM

    ヴィンテージな感じになるのは真空管の鈍り方に似ているからでしょうな。

  4. joecool
    2014年9月14日 at 8:49 PM

    既にご存じで検証済みかも知れませんが・・(^ー^;)ゞ
    DEQ2496はデジタルでも外部クロックを受け付けるという情報があります。

    http://ameblo.jp/44100x16bit-arts/entry-11266523658.html

    >説明書を読み違えて、DEQ2496は外部機器とワードシンクできないと勘違いしている方が多いが、ちゃんと外部クロックと同期可能である。
    >説明書には
    >「このワードクロック入力は、アナログ入力を使用する時のみアクティブになります」
    >とあるが、その前に同期についての説明があるのだから普通に考えれば、
    >「本機のクロックは、アナログ入力を使用する時のみアクティブになります」
    >の訳し間違いである事は明白である。

    私は外部クロックを持っていないので確認出来ませんが、真実ならDEQ2496の価値が2段くらい上がりますね。

  5. 2014年9月14日 at 9:04 PM

    >DEQ2496はデジタルでも外部クロックを受け付けるという情報があります。

    おおーっ!!
    本当ですか!!!

    知らなかったです。私はマニュアルの「アナログ入力を使用する時のみアクティブになります」という言葉を信じていました。
    一度確かめてから、検証報告したいと思います。

    • 2014年9月14日 at 9:35 PM

      Evo Clockのワードクロック出力端子からDEQ2496の入力端子に接続してみたのですが、残念ながら同期はしません。

      hiFace EvoからDEQ2496にXLR端子で接続しているのですが、CLOCKは依然として「XLRIN」のままです。やはり、デジタル入力ではすぐ上のクロックにしか同期しないようです。
      上記のサイトもよく読めば、実際に外部入力をして同期するのを確かめたわけではないようですね。

      少なくとも、Evo Clockのワードクロック出力端子からでは同期しません。
      残念。

  6. joecool
    2014年9月14日 at 10:23 PM

    最新の英文マニュアルを読んでみました。
    残念ながら、アナログオンリーでした。
    不確かな情報をお伝えして申し訳ありませんでした。

Comments are closed.