デジタルでイコライジングすることの限界

前回は「あれこれ弄っている中で、いかにデジタルといえどもイコライザの限界も理解できるようになってきました。世間で今も根強くあるイコライザへの不信感は、そう言う限界を超えたところで使われることによって生み出されたのではないかと思うようにもなってきました。」などと思わせぶりな事を書いてしまいました。
しかし、中味の方は、分かっておられる方には「今さらそんなことに気づいたのか!」とお叱りを受けそうなレベルの話です。お付き合いいただいてもがっかりされるかもしれませんので、それは最初にお断りしておきます。m(_ _)m

よく言われることですが、イコライザはとても便利な機器なのですが音質を劣化させると言われてきました。確かに、アナログ時代の安物イコライザなんかだと音が歪んだりSN比が大幅に低下したりしました。しかし、デジタルのイコライザをデジタル領域のど真ん中で使えば、たかだか2万円程度の「DEQ2496」であっても、音質の劣化はほぼ皆無の状態で周波数特性をほぼフラットにしてくれます。
この一ヶ月の試行錯誤の中で、その事に関しては確認できました。
しかし、あれこれ使っているうちに、非常に微妙な症状なのですが、時と場合によっては音の勢いが失せる傾向があることにも気づかされました。

もう少し具体的に報告しましょう。

私は基本的にクラシック音楽しか聞きません。しかし、何かの拍子で「J-POP」を聞くこともあって、上で述べた「時と場合」というのはこの「J-POP」を聞いたときのことでした。
クラシック音楽を聴いていたときはほとんど気にならなかったのですが、多くの「J-POP」においてはインジケーターのレッド表示がつきっぱなしになってしまいます。インジケーターがレッド表示になるのはオーバーライドの時です。

通常のCD規格は16ビットですから、音量の大小は2の16乗通りのレベルで記録が可能です。2の16乗を計算すると65,536ですから、全くの無音が「0」、記録可能な最大のブッチャキ大音量が「65,536」ということになります。正確さには欠けますが、図式的表現すると、細長い筒にボールを投げ込んでいく様子を思い浮かべてくれるといいのでしょうか。
こんな感じです。

16bit_1

ボールが一つも入っていない状態が無音で、そこにボールが入っていくごとに音量が上がっていきます。しかし、投げ込むことができるボールの数には限界があって、それが65,536個と言うことです。

ついでながら、ハイレゾ音源などで24ビットとか32ビットという事がよく言われます。あれは、この筒に投げ入れるボールが小さくなったと思えばいいようです。24ビットだとボールが小さくなったおかげで「16,777,216個」のボールを投げ込むことができます。32ビットだと「4,294,967,296個」です・・・ね(たぶん^^;)。
ですから、ビット数が上がったからと言って記録できるブッチャキ音量の上限が上がるのではなくて、無音とブッチャキ大音量の間がよりきめ細かく記録されていると理解しないといけません。

<追記>

「ボールに例えた図がとても分かり易くて、記事内容がすんなりと入ってきて素晴らしい記事です。」というお誉めをコメント欄でいただきました。
困った。(^^;
なぜなら、このあたり面倒くさいのでかなり端折って説明しているからです。ですから、もう少し説明を補足しておきます。

人間の可聴帯域が20Hzから20KHというのはよく知られています。しかし、意外と知られていないのが人間の耳のダイナミックレンジです。言葉をかえれば、どこまで「小さな音」を「音」として聞き分けられるのか、逆にどこまで「大きな音」に耐えられるのか、その幅を「人間の耳のダイナミックレンジ」と表現します。
このダイナミックレンジは一般的に120dBと言われています。
人によっては130dBに近い人もいるそうです。個人差があります。

つまり、人間が音を音として関知できる最小レベルが0dBで、鼓膜が破れる寸前の限界レベルのブッチャキ音量が120dBというわけです。ちなみに、0dBと120dBでは音の大きさの違いは「1:1000000」になります。(20dBで10倍になります。)

さて、ここから問題です。
デジタル情報はこの人間の耳が持つダイナミックレンジをフォローできているのでしょうか?
答えはイエスでもありノーでもあります。

ここからは少しばかり数式にお付き合いください。
デジタル情報の1ビットは概ね6dBのダイナミックレンジにあてはまります。
ですから、CD規格の16ビットだと「16×6」でダイナミックレンジは96dBです。つまりは人間の耳のダイナミックレンジである120dBはフォローできていません。
しかし、24ビットで記録すれば「24×6」でダイナミックレンジは144dBとなって、これは悠々と人間の耳のダイナミックレンジをフォローできることになります。
デジタル情報は器としては人間の耳のダイナミックレンジをフォローしきるクオリティを持っていますが、CD規格ではそのクオリティを十分に発揮できていないと言うことになります。それが、「イエスでもありノーでもある」という答えになるわけです。

ですから、CD規格の16ビットで限界いっぱいのブッチャキ音量を記録すると、「120-96」で24dBがノイズに埋もれてしまうことになります。一般的に「木の葉のふれあう音」が20dBとされていますので、そのレベルの幽かな音がノイズに埋もれてしまうわけです。つまりは、そう言う微かな音が音として記録できないのです。

これは一見すると困ったことになりそうな雰囲気です。
しかし、PA機器の故障でもなければ、実際の音楽シーンで人間の鼓膜を破るようなブッチャキ大音量が轟くことは考えられません。
クラシック音楽の世界ならば一番大きな音が鳴り響くオーケストラであってもせいぜいが80dB程度だと言われています。
つまりは、音楽というものは一般的に「人間の耳のダイナミックレンジ」の全てを使って鳴り響くことはないので、現実的には16ビットもあれば充分とも言えるのです。

しかし、音楽が24ビットで記録されていれば限界のブッチャキ音量から人間が音として関知できる最小レベルの音まできっちりと記録できるのですから、精神衛生的には非常によろしいことは明らかです。
その事を、「ビット数が上がったからと言って記録できるブッチャキ音量の上限が上がるのではなくて、無音とブッチャキ大音量の間がよりきめ細かく記録されている」と端折った形で表現したわけです。

なお、32ビットで記録されていればダイナミックレンジは「32×6」で192dBにもなります。
どう考えても、これは無駄なオーバークオリティのように見えます。しかし、これが決して無駄なオーバークオリティとは言えないことに気づくようになるのですが、それは次回の話となります。

<追記終わり>

話を16ビットに戻します。
当然のことですが、市販されているCDならば筒の中のボールの数が16ビット、つまり65,536個を超えることは絶対にありません。当然のことです。
ところが、このCDに記録されたデータをイコライザでイコライジングすると、減衰させられたりブースとされたりします。
まずは、話を分かりやすくするためにブーストされた場合のことを考えます。

通常、クラシック音楽のCDというのは音量的にはかなり控えめに記録されてます。それは、ブッチャキ大音量の部分と精妙なピアニシモの部分が両立しなければ音楽の魅力が伝わらないからです。ですから、オーケストラがトゥッティで鳴り響くようなところは限界近くまでデータを詰め込んでいても、それ以外の部分はかなり控えめに記録されています。と言うか、この間の経験から言うと、大部分のクラシック音楽の録音においてはトゥッティの部分であってもそれなりに余裕をもって録音をされている場合が少なくありません。
ですから、そう言う余裕を持って控えめに録音されたデータをブーストしても基本的にはあまり困ったことにはなりません。

こんな感じでです。

16bit_3

しかし、最近の「J-POP」はラウドネス競争に巻き込まれて、曲の始めから終わりまでほぼ限界近くまでボールが詰め込まれています。ラウドネス競争についての詳細はこのあたりをご覧いただければと思いますが、そのココロを簡単に言ってしまえば、「大きい音はいい音だ!!」です。そして、演奏する側もできる限り迫力のある音楽にしてユーザーの注意を引こうとする傾向があるようで、ミキシングが終わってみると全曲が上限いっぱいの数デシベルの範囲に収まっていた・・・なんてことは日常茶飯事です。

そういうCDのデータをイコライジングすると、こんな感じで困ったことになります。

16bit_2

つまり、ブースとされたデータが筒の中に入りきらずにあふれてしまうのです。これが「オーバーライド」とよばれる現象です。
「DEQ2496」はこの「オーバーライド」が起こるとアンプやスピーカーを保護するために自動的にリミッターが働きます。瞬間的にレッドゾーンに突入するくらいなら聴感上はほとんど問題は感じないのですが、ずっと赤いままだと明らかに寸詰まりの音になります。

ちなみに、「DEQ2496」のリミッター機能はどこをどう弄っても基本的に解除されないようになっています。当然と言えば、当然ですが、そうなるとこの「オーバーライド」の状態を改善するためには、全体的にゲインを下げる必要があります。
この全体的にゲインを下げるという機能は「DEQ2496」は「UTILITY」メニューの1ページ目にある「GAIN OFFSET(EQ)」で設定が可能です。

「GAIN OFFSET(EQ)」の落とし穴

初期設定は「0.0」ですが、ここから0.5dbステップで増減させることができます。
理屈から言うと、GEQ(グラフィック・イコライザ)とPEQ(パラメトリック・イコライザ)でブーストした和を少し上回る程度の量を減衰しておけばいいことになります。
当初はどうしても消せない大きな谷があったので、GEQ(グラフィック・イコライザ)は+9db、PEQ(パラメトリック・イコライザ)は+2dbが一番大きなブースト量でした。ですから、「GAIN OFFSET(EQ)」で12dbも絞ればオーバーライドは起こらなくなりました。

ところが、この状態で再生すると、なんだか音楽に元気がないのです。音質が劣化しているという感じはあまりしないのですが、なんだかこぢんまりと小さくまとまったような感じになるのです。
最初は気のせいかと思ったのですが、あれこれ聞いているうちに、やはり「気のせい」ではないと確信するようになってきました。何故ならば、レッドゾーンを覚悟で「GAIN OFFSET(EQ)」の減衰量を4db程度まで下げると、明らかに音楽に勢いが出てくるのです。

ここまでくると、さすがに鈍な私でも気がつきました。

ビット落ちです!!

アナログ信号でボリュームを下げるというのは一般的には抵抗を挟むことで電圧を下げることによって実現します。
しかし、デジタルの場合は音量は筒の中に入っているボールの数で表現されますから、音量を下げるときはボールの数を減らすしかありません。もっと有り体に言えば、情報を削ることによって音量を絞ります。
ちなみに、音量を半分にするためには6db絞る必要があるのですが、デジタルでこれを実現するためには1ビットを削る必要があります。私が最初に設定した12dbの減衰(ちなみに音量は4分の1になります)だと2ビットも情報を削っていたことになります。
つまりは16ビットのデータが14ビットになってしまっていたのです。これを世間では「ビット落ち」と言っています。

一見すると、16ビットが14ビットになるのだったら大した差はないように見えますが、筒に入るボールの数に置き換えてみると「たいしたこと」であることが容易に理解されます。

  • 16ビット→65,536個
  • 14ビット→65,536個÷2÷2=16,384

もしも、その筒にフルにボールが入っていた状態ならば、16ビットから14ビットへとビット落ちすると、「65536-13384=49152」で49152個のボールが捨てられることになるのです。つまりは、捨てられるボールの数は残っているボールの数の3倍になるのです。
もちろんビット落ちは周波数特性にはそれほど大きな影響を及ぼしませんので、その面での音質劣化はあまり感じません。しかし、ボールをこれだけも削ってしまえば音楽のダイナミズムが損なわれること、さらに言えば、無音とフルの間を65536通りで表現していたものが4分の1の16384通りになるのですからSN比は大きく低下して、その部分での音質の劣化が起こることは理論的にも容易に察しはつきます。
そして、その察しは理論だけではなく実際の聴感上においても否定しきれなかったわけです。

これは困ります。どう考えても放置はできません。
そこで、さらに測定と微調整を繰り返して、GEQ(グラフィック・イコライザ)によるブーストは最大で4.5dbまでに丸め込みました。
スピーカーのセッティングを少し見直し、さらにはスピーカーの後ろに籐製の衝立をおきました。この籐製の衝立は母の介護を在宅で行っていたときに使っていたもので、高さ2メートル、幅50㎝のパネルが5つ連結されているかなり大型でがっしりしたものです。
さらにはもう一息つぶしたい山や谷もあったのですが、目をつぶるところは思い切って目をつぶりました。
さらにPEQ(パラメトリック・イコライザ)によるブーストも2dbから1.5dbに切り詰めて、最終的に「GAIN OFFSET(EQ)」による減衰は4dbにとどめました。

それでもビット落ちは起こっているのですが、この程度の減衰であれば聴感上はほとんど気にならないレベルです。
しかし、精神衛生的には気分は良くありません。いや、気分だけでなく、たまにオーバーライド覚悟で全く減衰させない状態で聞くと音楽の元気が違うような気もします。例え4dbであってもビット落ちの影響は否定しきれないような気がします。
どこかのサイトに、CDの音質を担保するためには13~14ビットもあれば充分と書いていましたが、個人的には人間の聴覚はもう少し鋭敏ではないかと思います。

さらに言えば、ここまでは話がややこしくなるのであえてふれないできたのですが、GEQ(グラフィック・イコライザ)はブーストだけでなく減衰もしています。減衰している部分ではオーバーライドは絶対に起こらないので問題はないように見えるのですが、「GAIN OFFSET(EQ)」による減衰の影響をもろに受けることに気づかされました。

このあたり、理論的には正しいのかどうかは自信がないのですが、シンプルに考えれば、GEQ(グラフィック・イコライザ)で減衰している部分は「GAIN OFFSET(EQ)」による4dbの減衰がそのまま加算されるような気がします。もしも、この単純な推論が正しければ、たとえ「GAIN OFFSET(EQ)」による減衰を4dbに抑え込んでも、部分的にはそれよりも大きな減衰を強いられている部分があることになります。
私の場合はGEQ(グラフィック・イコライザで最大で5db減衰していますから、この部分に関しては合算で9dbも減衰していることになります。9dbの減衰と言えばかなり大きなビット落ちになってしまいますから、そうなると「たまにオーバーライド覚悟で全く減衰させない状態で聞くと音楽の元気が違うような気もします。」というのも気のせいとは言い切れなくなります。

これらのことから、結論として言えることは、例えデジタルであってもイコライザはできるかぎり控えめに使うことが重要なようです。何故ならば、極端な使い方をすると大きなビット落ちを招いてしまうからです。

ところが、ネット上を散見すると、「DEQ2496」を導入しても「AUTO EQ(自動補正)」しか使っていないという人が多いようです。そんな人は次のような悪の連鎖になってはいないでしょうか。

  1. 「DEQ2496」は初期設定では±15dbの範囲で補正しますのでかなり極端な補正がかかることになる。
  2. その状態で「J-POP」などをメインで聞くとレッドゾーンにふれっぱなしになってしまう。
  3. 仕方がないので「UTILITY」メニューの「GAIN OFFSET(EQ)」機能でドンと絞り込むことでそれを回避する。
  4. 表面的にはこれで目出度し目出度しとなるのですが、肝心の音楽の方は妙におとなしくこぢんまりとしてしまってつまらないものなってしまう。
  5. 結果として、イコライザを挟むと結局は音の勢いがなくなってしまうので「あんなものは駄目だよ」となってしまう。

最初に述べた「世間で今も根強くあるイコライザへの不信感」は、こういう文脈の中で生み出されているのではないかと思った次第です。
もう一度繰り返しますが、例えデジタルであってもイコライザは控えめに使うことが重要です。

しかし、ココロの中には、このビット落ちの問題をもう少し何とかできないものかという思いはあります。そして、思いだけでなく、いろいろと馬鹿げたチャレンジを繰り返している最中です。
前回の最後に「現時点で持ちネタは3つほど・・・^^v」と書いたうちの一つが、この馬鹿げた試行錯誤です。もう少しやってみてから報告したいと思います。


6 comments for “デジタルでイコライジングすることの限界

  1. nino
    2013年9月29日 at 12:38 AM

    ビット落ちの問題を解決するには、SRC2496のようなサンプリングレートコンバーターを導入して、16ビットの信号を24ビットにあらかじめ変換しておくという方法がありますね。ただし、音質を追求すると、イコライザーだけの場合に比べてクロックなどやっかいな問題も生じてきますが。もっともSRC2496は驚くほど安価なので、気軽に試すことができます。

    Frieve Audioの場合は24ビットで処理するようになっているので、16ビットの音源を再生する限り、ビット落ちの問題は回避されます。もしBug Headの音質にFrieve Audioのイコライジング機能を合わせたソフトウェアがあれば、PCオーディオのメリットをフルに活かせるシンプルなシステムが実現するのにと考えたりします。Windowsベースなのでアシンクロナス転送も使えますから。

  2. 2013年9月29日 at 4:33 PM

    ninoさん、いつもいつも貴重なアドバイスありがとうございます。

    現時点で考えている「馬鹿げた試行錯誤」は以下の3つです。いろいろやっています。

    1.MPDで送り出しのデータを24ビットに変換しておく。
    2.「DEQ2496」から受け取ったデータをDACでDSDに変換してしまう。
    3.「GAIN OFFSET(EQ)」でガバッと減衰するのではなく、DYNメニューで音量レベルによってダイナミックに編集する。

    「1」は理屈で言えば再生用のPCに若干ですが負荷がかかります。しかし、実際にやってみるとCPUの使用率が2~3%程度なのでまあ大丈夫かと思います。
    「2」はDSDへの変換でどんなメリットがあるのかいまいち良く理解できないのですが、聴感的にはかなり効果が高いような気がします。
    「3」は「GAIN OFFSET(EQ)」による減衰の代わりに使います。音の勢いは失せませんが、音の雰囲気が変わってしまいます。ただ、その雰囲気が結構悪くないので、個人的にはありかもしれないと考えています。

    もう少しあれこれトライしてから報告したいと思いますので、その時はまたアドバイスを願えればと思います。

  3. 2013年9月29日 at 9:53 PM

     デジタルイコライザの悪影響を軽減する方法としてbit拡張とオーバーサンプリングがあります。
    bit拡張の方が効果がありますがMPDなら両方出来ます。96k24bit出力にする設定を試してみてください。
     それとは別の方法としてマルチアンプ方式がbit落ち対策として有効です。
    帯域分割後にイコライジングすることにより低域(部屋の影響を受けやすい)を思い切って補正してもbit落ちによる悪影響が中高音に及びません。

  4. ねむねむ☆
    2013年10月2日 at 7:42 AM

    はじめましてこんにちは。「flac」を検索していたらこちらに辿り着きました。
    ボールに例えた図がとても分かり易くて、記事内容がすんなりと入ってきて素晴らしい記事です。
    ありがとうございました。

  5. 斎藤誠
    2013年10月13日 at 9:07 PM

    いつも嬉しく聞かせて頂いています。ありがとうございます。
    いかにビニール袋にニンジンを何本詰め込めるかとか言う話だったなんて面白いです。
    話題がずれていると思いますが、、、自分の焦点はどこに埋もれたデータがあるかにあります。
    自分はリサンプル後ダイナミクスでノイズごと埋もれた音を積極的に加算し音楽を楽しんでいます。レシオっていうんですかこれを1:1.4ぐらいにして、折れ曲がり肩はスレッショルドですか-60dbからで十分いけてます。あまりソフトを使いこなせないので説明できませんが、これでパコデルシアの蚊の泣いたようにしか聞こえない、アランフェス協奏曲のギターの音量が倍になってギターも生き生きします。ただ先にも申したように曲によってテープヒスや他のノイズも生き生きしてきます。写真で言うと魚眼レンズで撮った写真みたいで面白いですよ。

  6. yezoshima
    2013年10月19日 at 11:00 AM

    趣旨からちょっと外れますがCDの能力について考えます。

    まずDレンジです。N響の1960年代の70コンサートでの研究によると、オケの指揮者後方3m上空3mでのピーク値は110db、時間率1%の実行値は100dbだったそうです。また中央値は86db。対して暗騒音は50db。(楽器の能力としては、力任せに演奏すれば、30cmの距離でトランペット149db、ドラム140db、ピアノ135db、オペラ歌手130dbだそうです。)「ハイファイスピーカ」NHK技研より(カッコ内はソニーのオーディオしの記事から)

    仮に暗騒音以下20dbまでは有効として、音がどでかいことで高名なウィンフィルなら120dbもあるかもしれません。それでもDレンジは96dbあれば十分となります。ふつうは10-20dbのピーク値はカットするんですがね。

    さて微小音再生で問題となるのは、量子化ノイズでしょう。これは20kに集中的に発生しますが、生の形で再生すれば有害な情報となります。それを避けるためにランダムな雑音をくわえて目立たなくしています。(諧調不足の画像をそのまま再現すると諧調が連続する場面で段が出るので、ジャギー処理するのと同様の方法だそうです。初期のPCM録音では、デジタル録音をアナログテレコにコピーすることで雑音を付加していました)微小音は、そもそも暗騒音以下の音ですし、耳の感度から中音しか聞こえませんし、強音にマスクされるわけですし、強音と比べその品質はあまり問題にならないでしょう。

    次に超高域再生です。NHK技研でオーディオのプロ50人を集め、20k以上あり/なしの2種類のサンプルを与え、元の音とどちらが似ているかを選ぶテストを行いました。このとき、相当種類のサンプルを使いテスターの好きな方法ですきな音量で心行くまで何回でもためさせたのです。その結果、統計的にいって楽音20k以上が聞こえている証拠は全く見つからなかったそうです。

    以上の2点からいって、音の器としてはCDで必要十分だと判断します。SACDのほうが音がいいというのが世評ですが、そのほとんどは暗示と高額ゆえに丁寧なりマスタリングに由来するのでしょう。CDとSACDの間に有意味な音質差があるとしても、その差は聴力の限界近辺(たぶん外)にあるので、「誰にもはっきり分かる」「どんな装置でもわかる」はずはありません。たとえば、超高級ヘッドホンを使って大音量再生したときに、なんとかようやく聞こえるか聞こえないか程度の差でしょうね。(ラウドスピーカを部屋で鳴らしたら、撹乱が大きすぎてその差は判るはずはありません。耳鳴りがちょっとでもあったらもう駄目でしょう。)

    ということでSACDは流すことにしました。信号をいろいろ触ることもしません。

    当方はスピーカ自作派ですが。STAXの 見掛け上剛体で質量0の振動板をアンプのプッシュプル信号直結で全面駆動している・・・という能書きにやられっちゃいました。数理モデルみたいな理想スピーカってわけですね。おかげでヘッドホン派に移っています。仕事がモーレツに忙しくて家で鳴らせないのも大きいんですけどね。次はSR-009です。

Comments are closed.