デジタルの時代に入って、『「16bit 44.1kHz」という器の中に収録された音楽信号をできる限り正確に拾い出し、それをできる限り劣化させることなくスピーカーにまで送り届け現実の音楽に変換するすることこそが重要』なんだと言うことを書きました。
そして、『「16bit 44.1kHz」という器の中に収録された音楽信号をできる限り正確に拾い出すことはPCオーディオの急激な発展でかなりの部分まで実現できつつありますが、後段の、それをできる限り劣化させることなくスピーカーにまで送り届け現実の音楽に変換するという部分が実に難しいのです』、とも書きました。
しかし、「実現できつつある」という自負を深めている前段の部分において、本当は言及しなければいけないのに長きにわたって注意深く避け続けてきた項目があります。
それがクロックとジッターに関わる話題です。
この問題は巧妙に、且つ狡賢く避けてきましたね・・・(^^;
しかし、この問題を避けていて「16bit 44.1kHz」という器の中に収録された音楽信号をできる限り正確に拾い出す事などできるはずはないのですから、いつまでも避け続けるわけにはいかないでしょう。
クロックって何なのよ
デジタル再生においてクロックの問題が取り上げられるようになったのは古い話ではありません。CD規格が離陸した80年代の初頭には、こんなややこしい話題が存在していることを知っている人はほんの一握りだったはずです。
記憶に間違いなければ、クロックとかジッターという言葉が一般のオーディオマニアの中で表面化してきたのはこの10年ほどの間ではないでしょうか。
そして、この問題から長く、そして意図的に距離を置いてきたのですが、とりあえず「Evo Clock」あたりでお茶を濁しておこうか、と考えたのが2年ほど前のことです。
でも、よく分かんないです、このクロックとかジッターとか言う奴は。
でも、いつまでも逃げてばかりもいられないので、このあたりで腰を据えて、さらにはお勉強もかねてこの話題に触れてみたいと思います。ただし、どうにもよく分からない部分もありますし、大きな勘違いもあるかと思いますので、優しく間違いチェックと補足をしていただけると有り難いです。m(_ _)m
そこで、まず問題となるのは、そもそもクロックって何なのよ?と言うことです。
当たり前の話ですが、アナログの世界にはクロックなどと言う訳の分からないものは必要はありません。こいつが必要となるのはデジタルの世界だけです。
では、何故デジタルの世界ではクロックが必要となるのでしょう?
ところが、こういう根本的な問いかけに対して素人にでも分かるように書いてくれている人はほとんどないですね。
自分の馬鹿を棚に上げさせてもらえるのならば、本当の専門家というものは、どんな素人相手にでも自分の専門分野の内容を5分でわかりやすく伝えることができるものです。それを、専門用語で煙に巻いて納まりかえっているというのは、本当はそいつもよく分かっていないんじゃないかと疑ってしまいます。(実際分かっていないことが多いです。)
ですから、以下の内容は自分なりに分かったことだけを、できる限り自分の言葉で書いていこうかと考えています。
デジタルデータというのは、言うまでもなく「0」と「1」でできています。
「00110111100110111111000011100110」
みたいな感じです。
もちろん、ケーブルの中を「0」や「1」という数字が流れていくわけではありません。
デジタル機器はこの「0」と「1」を電圧の「ある→1」「なし→0」で表現しています。「ある→0」「なし→1」と言う逆の論理回路もあるようですが理屈は同じです。
ついでながら、CD自体は電気回路ではありませんので、表面に刻み込まれた穴ぼこ(ビット)に光を当てて、その光が反射するかしないで「0」と「1」を区分しています。そして、その光の反射を取り込んで最終的に電圧が「ある」か「ない」かに変換してDAコンバーターにデータを送り出しているのがCDトランスポートと呼ばれる部分です。
PCオーディオでは、この作業をあらかじめリッピングという作業で完了させているところが違いです。(本当はアドバンテージと書きたいのですが、いらぬ論議を引き起こしますので控えめに「違い」としておきます)
さて、問題はここからです。
CDプレーヤーを使った再生でも、PCオーディオによる再生でもいいのですが、そうやって読み取ったデジタルデータを送り込まれたDAコンバーターは、そのデジタルデータを正確に受け取る事ができるでしょうか。
答えは「No!」です。
理由は簡単で、量子化された「一かたまりのデータ」がどこから始まってどこで終わるのかが、このデータだけでは全く分からないからです。
「16bit 44.1kHz」というCD規格では話が複雑に過ぎますので、話をわかりやすくするために「4bit 8hz」という例で考えてみます。
「4bit」というのは、量子化された「一かたまりのデータ」は4bitですから「0011」みたいな4桁の数字が一つの固まりとなります。
「8Hz」というサンプリング周波数は、1秒間の音楽データを8回に区切って量子化すると言うことです。
ですから、最初に例としてあげた
「00110111100110111111000011100110」
というデータは、4桁を一かたまりと認識して
「0011 0111 1001 1011 1111 0000 1110 0110」
と解読すべきで、これでちょうど1秒間の音楽データと言うことになります。
ちなみに、CD規格の「16bit 44.1kHz」と言う規格は「0001101110011001」というような16bitのデータが44100個連なって1秒間の音楽データを表現しています。大変なものです。
さて、一見すると「00110111100110111111000011100110」というデータを「0011 0111 1001 1011 1111 0000 1110 0110」と解読するのは何の問題もないよう見えます。
しかし、DAコンバーターはこのデータだけを送りつけられても、どこから読み取りをはじめていいのが全く分かりません。こういう機械は人間のように融通が利きませんから、明示的に「ここから読み取りをはじめなさい」と示してあげないと動作しません。
もっとも、適当にその時の気分で読み取られるとえらいことになります。
なぜなら、読み取るポイントが一つずれるだけで全く別のデータに化けてしまうからです。
「0011 0111 1001 1011 1111 0000 1110 0110」
↓(左へ1つずれる)
「0110 1111 0011 0111 1110 0001 1100 110*」
こんな読み違いをされてDAコンバーターに送り込まれると、元データとはにてもにつかないアナログ波形になってしまいます。
ですから、デジタルデータにはもう一つ、サンプリングされた量子化データがどこから始まりどこで終わるのか、さらにはサンプリングされた時間の長さを明示的に示すデータが必要になるのです。
それが、クロックと呼ばれる信号なのです。
ですから、デジタルデータをスコア、DAコンバーターはスコアを現実の音に変換するオーケストラにたとえるならば、クロックは指揮者みたいなものだとも言えます。
そして、このクロックという指揮者に求められるのは、とにかく頭拍を揃えることです。もちろん、尾拍も揃えてくれればハッピーですし、各小節の長さを正確に保持してくれれば有り難い限りですが、とにかく頭を揃えてくれることが一番大事です。専門用語では「ピリオド(周期)・ジッター」とかいうそうです。
つまりは、
「00110111100110111111000011100110」
と言うデータのどこが頭拍かと言うことを示してくれるのが一番重要なのです。
「00110111100110111111000011100110」
こんな感じです・・・ね。
こうして、少なくとも頭拍を揃えてくれれば、「00110111100110111111000011100110」は「0011 0111 1001 1011 1111 0000 1110 0110」だと言うことをDAコンバーターは認識してくれるのです。
そして、データの送り出し側と受け取り側でこのクロックを共有すれば(この状態のことを「同期」していると言います)、送り出し側はこのクロック信号に従ってタイミング良くデータを送り出し、受け取る側もこのクロック信号に従ってタイミング良くデータを受け取ることで正確にDA変換が可能となるのです。
しかし、ここまで読んできて、「はてさて、理屈は何となく分かったが、おれのCDプレーヤーにはそんなクロックなどというものはついていないが、何の問題もなく音楽は再生されているぞ」と思われるかもしれません。
はい、その通りです。
普通は、そんなことは意識しなくても、デジタルの再生機器であるならばクロック信号を発生させる部品は必ず組み込まれています。何故ならば、それがなければ音楽は再生できないからです。
「えーっ、じゃぁ、あんた何を言っているの?訳分かんない!」と言われそうですね。(^^;
「何も考えなくても、クロック信号を発生させる部品が最初から組み込まれているならば、そんなことを取り上げて考える必要なんかないじゃないの!」と言われそうですね。
ですから、ここからもう一歩、話を前に進める必要があるのです。
問題はそのクロック信号の「精度」と「ゆらぎ」なのです。
ジッターノイズって何なの?
上の例に挙げたようなサンプリング周波数が「8Hz」ならば精度も糞もありません。1秒間を正確に8分割してその頭拍を示せばいいのですから簡単なものです。
しかし、非圧縮のデジタル音源の最低レベルであるCD規格でもサンプリング周波数は「44.1kHz」です。つまりは、1秒間を44100回も分割して、その頭拍を正確に明示しなければいけないのです。
そして、通常のデジタル機器に内蔵されている部品だと、そこまでの高い精度を望むのは無理なのです。
問題は二つあって、積み込まれている部品がチープで、そこまで正確に時間を刻むほどの「精度」がないと言うこと、二つめは、そこそこの精度があっても時間の流れの中で「揺らいで」しまうという問題です。ですから、CD規格の「16bit 44.1kHz」であっても、その頭拍を正確に明示し(精度)、さらにはその精度を維持し続けること(揺らぎ)は難しいのです。
そして、音源がハイレゾ化するにつれて、その難しさは幾何級数的に上がっていきます。
音源がハイレゾになればさらに大変なことになります。サンプリング周波数が192kHzのデータならば1秒間を192000回も分割してその頭拍を明示しなければいけないのです。サンプリング周波数が上がれば、それに同期させるためのクロックの精度はより高いものが求められるのです。
さらには、サンプリング周波数が同じでもビット数が上がると、これまた同じように精度の向上が必要になります。
そう考えると、ハイレゾ音源を正確に使いこなすのは大変なのです。
わたしが、ハイレゾの前にとにかくは「16bit 44.1kHz」というCD規格を汲み尽くすべきだというのは、そのハードルを越えられずしてハイレゾどころの話じゃないでしょう、という思いがあるからです。
現実のクロック周期は理想のクロック周期に対して必ずずれが生じます。
そして、その理想的なクロック周期と現実のクロック周期との間で発生するずれのことを「ジッター」と呼んでいるのです。
では、クロックが頭拍を明示する精度が落ちてくると、つまりはジッターが発生するとどんなことがおこるのでしょうか?
一番わかりやすかった説明は「Digital Audioの小部屋」さんのサイトです。日付を見てみると2001年の記事ですし、その中で「MJ誌 1999/4 P11」について触れておられますから、私が10年ほど前にこの話題に気づく前から分かる人の間では問題になっていたのです。この事実には少し驚かされました。
クロックの精度が落ちてくると、以下の図のような感じでデータを読み出すタイミングがずれてきます。
もちろん、筆者も注釈されているようにこの図はあくまでもイメージですし、サンプル間は直線で結ばれるわけではありません。しかし、時間軸に沿って読み取るタイミングがずれることによって最終的なアナログ波形が変形される様子はイメージしやすいと思いました。
そして、こうした時間軸のずれによって引き起こされる歪みを総称して「ジッターノイズ」と呼んでいるのです。
この「ジッターノイズ」が引き起こす問題点を一言で言ってしまえば、このような環境下ではサンプリング定理が成立しないと言うことに尽きます。サンプリング定理によれば、CD規格の「44.1kHz」というサンプリング周波数があれば20kHzまでの周波数領域の音は正確に再現できます。しかし、それは理想的なクロックが供給されていてジッターノイズが発生していないという条件設定が必要なのです。
ジッターノイズの発生によってS/N比が落ちるとかダイナミックレンジがどうちゃらとか書いている人も多いのですが、それは些末なことであって、問題の本質はこれに尽きます。
ただし、どんなに高精度のクロックを導入してもジッターを0にすることはできません。これは100万円を超えるようなルビジウムクロックを導入しても、理論的には0にはなりません。
マスタークロックジェネレーター「G-01」・・・買えませんが(^^;
49 comments for “クロックとジッターについて考える(1)”
はじめまして。
vine mpdでシステムを組むのに際して参考にさせていただきました。
以降、常々勉強させていただいています。本当にありがとうございます。m(_ _)m
ここ数年間、ハイレゾの再生環境について、疑問を感じていました。
しかし、僕の疑問はyungさまとは若干認識を異にします。
一般的にはハイレゾの良好な再生には高度なオーディオ環境が必要と言われています。
しかし僕はそのようには考えません。
実態は逆で、むしろコンシューマー向けの安価なオーディオ装置でも気持ちいい音が聞けるのがハイレゾのメリットではないか。CDを良好に再生できない環境でもハイレゾならいい音で鳴るのでは。ハイレゾ音源を再生するほうが、簡単に正確なDA変換に近づくことができるのではないだろうか。
ハイレゾはジッターの影響を受けにくいのではないか、と考えています。
ジッターの影響を排除した高級機だとCDとハイレゾの差異は小さくなる。
ジッターの影響は受けるが、音質にある程度配慮した機種だと差異が大きくなる。
ジッター以前に音質に問題があるレベルの低級機だと差異が聞き取れない。
こうしたことが起きているのではないかという事です。
まず、ハイレゾのほうがDA変換に際してのサンプルが多いぶんジッターの影響を小さくできるのではないか、と考えています。
サンプルが少ないと、ジッターによるズレがDA変換に大きく影響し理想から乖離する。サンプルが多くなるほど、ジッターによるズレは平均化され、理想のDA変換に近づく。
10kHzの音を考えた時、1波長の間のサンプル数は44.1/16だと4、5個にしかなりません。96/24だと9、10個です。
2倍のサンプルからアナログ波形を再現するほうが、個々のサンプルの誤差の影響を受けにくい気がします。
16bitと24bitだとサンプルの正確さは2の8乗=256倍違います。
これはどうなのか。
クロックのゆらぎは±240psが限度とのこと、つまり約500psのゆらぎ。
その僅かな時間の間に、音はどれだけ変わるのか。
音の振幅を16bitの情報で分割した場合、その階調は65536。
ここで20kHzの音を考える。
振幅の底から頂上までは1÷40000=0.000025s。
それを16bitの階調65536で割ると、0.00000000038147s=381.47ps
500psもゆらぎがあると、65536の階調の1つ分、ズレてしまう。
僕なりに考える±240psの根拠はこんな感じじゃないかと思っています。
16bitが24bitになると、クロックに求められる誤差は256倍厳しくなるのか。
階調を正確に得ようとしたら、±240ps÷256=±0.9ps、ということなのでしょうが、ことはそんなに単純でしょうか。
そもそも、得られるサンプルは最初からジッターによる誤差を内包した曖昧な近似値です。
同じ機器で16bitと24bitの音源を再生しようとした場合、同じ機器なので生じるクロックの誤差、それ以外の原因で生じるジッターが同じと考えられる場合。
そうした場合、得られるサンプルの正確さは、もとのデジタルデータの正確さが高いほうが有利だと思います。
24bitはもともと16bitより256倍正確なのですから、少々クロックが弱くて階調のサンプリングにズレが生じたとしても、粗い16bitのデータと比較した場合、ズレが帳消しになる可能性はあるのではないでしょうか。
こうしたことは、DA変換を行なっている電子回路の実装がどうなっているかによって変わってくると思います。
誤差を含んだサンプルデータにサンプリング定理を当てはめるにあたって、どのような処理が行われているのか。
僕は技術者ではないし、勉強する時間も頭もないので、わからない事だらけですが。
CD規格の音楽データをしっかりと再生できる環境を作ることは、僕自身にとって大事な課題です。
僕が所有している音源のほとんどがCDDAであり、これらを可能な限り良好に再生したいと思っています。そのためには、DA変換で何が起きているのかをより正確に知りたいと思っています。
乱文、失礼いたしました。
flyingnote様
ご意見、興味深く拝見しました。
あなた様の意図する文脈とは違うかもしれませんが、
私は元のデータをパソコン等でリサンプリングするだけで音質が
よくなることに疑問と理由を探していたのですが、データ量を
擬似的に膨らませることでジッターの影響を少なくできるのかなと
理解し、納得ができました。
勉強になりました。
>元のデータをパソコン等でリサンプリングするだけで
>音質がよくなることに疑問と理由を探していた
僕の場合も発端は近いようなことです。
パソコンからのデジタル出力を長い光ケーブルでつないだのですが、そのままでは聴けたものではありませんでした。パソコンでアップサンプリングして出力したほうが好結果が得られました。
そこからジッター対策としてのアップサンプリング転送、つまりハイレゾの利用という着想が出てきています。
>データ量を擬似的に膨らませることでジッターの影響を少なくできるのか
それが正しいのかどうかわかりません。
デジタル信号の挙動については、何年も通奏低音のような疑問が続いています。
こちらではサンプルレートコンバーターでデジタル信号をリサンプリングすることでジッターの低減を目指していますが、非常に効果があります。
いろいろ、何とかしたいところです。
flyingnote 様
リプライありがとうございます。
いろいろと比較をしているのですが
同じ環境とはいかないにしても
①MOTU828mk3のクロックをクロックをインターナル(16bit 44.1kHz)
②MOTU828mk3のクロックを外部S/PDIFにしRAL-24192UT1(トランスポート)よりクロックを同期(16bit 44.1kHz)
③nano idsd(16bit 44.1kHz)
④nano idsd(32bit 352.8kHz)
⑤アナログLP
⑤については今回置いておくとしても、④nano idsd(32bitフロート 352.8kHz)がそれ以外では断然良かったとおもいます。
②は①よりは音のフォーカスがあい、良くなったと思いますが・・・
高価なクロックを導入すればもっとよくなるのかもしれませんが、何で判断すればいいのでしょうか?スペックor価格でしょうか?
②にしてデータをアップサンプリングしてテストしたいところですが、どうもうまくクロックが同期しなくて再生できません又はひどいノイズがのります。。MOTU828mk3の調子が悪いのか、相性みたいなものもあるのかもしれません。
おそらく、アップサンプリングして、かつクロックを導入すればもっといい効果がでるともおもいますが・・・・
I2Sはいま、Raspberry Piを調達中です。
bit拡張をするとやはり、音の階調が増えて、空間が広がるような感じがしますね。
シンフォニーなどには最適だと思います。16bitでは平面的な感じです。
ただし、表現できるにはスピーカーを選びますね。
試聴はTimedomain lightです。
まわしものか、ばかにされるかもしれませんが。
クロックとジッターについてではないのでここに書き込むのは適切ではないかとも思うのですが、「CD規格が不充分」かいう流れの中だと思うのでここにしました。
CD規格で充分だと私も思います。今年の5月の連休ごろBeagleBone BlackをI2S接続で使い始めましたが、それまでデジタル音源(CDリッピング)ではだめかと思っていたのが完全に無くなりました。私は今でもLPレコードを常用しています。LPレコードを普通に買うことができた時代のソフトはLPレコードですし、買うことができなくなってからはCDを買っています。LPレコードで持っているソフトについてはCDを買っていないので、聴きたいものによってアナログだったりデジタルだったりするということです。
今年の5月までは、CDではだめなのかな?とかもっと高級なDACが必要なのかな?と思っていました。I2S接続というのはspdif周りの3つのプロセスを省略してPCとDACを直接接続するようで、具体的にはDDCと多くの場合DACに内蔵されているDAIと呼ばれる部分を省略します。あるとないというのがこれほど違うとは思ってもいませんでした。
まさかと思い、Raspberry Piと亀の子式に上に乗せるタイプのDACも使ってみましたが、これはBeagleBone Blackと比べるのは少し酷ですが、これを先に聴いていたらこれでCD規格で充分だと結論付けていたと思います。BeagleBone Blackの場合、別にクロックを用意する必要があることと、接続用の配線が必要なことなど少しスキルが必要ですがRaspberry Piの場合、基板を重ねて差し込みねじを締めるだけで使用可能な基板を販売しています。ハイレゾ対応の普通のDDC1個以下の値段でPCとDACのセットがそろいます。煙草の箱ぐらいの大きさの小さな箱から、かなり高級なDACでも出せないような音が出てきます。アナログが衰退していくのは仕方ないとつくづく思ってしまいますし、こんな箱からこんな音が出てくるのが信じられません。
BeagleBone Blackの場合、内部クロックでも作動しますが、外部クロックを使用したほうが圧倒的に高音質になります。私の場合そこそこの精度のクロックしか使用してないので次のステップはクロックとジッター対策かな、と書いてつじつまを合わせておきます。
moctさん、
>具体的にはDDCと多くの場合DACに内蔵されているDAIと呼ばれる部分を省略します。あるとないというのがこれほど違うとは思ってもいませんでした。
最近自作派の間で流行っているRaspberry PiからのI2SによるDAC直結ですが、これがUSB接続よりも音がいいということは、デジタル・オーディオにおいては「デジタル信号も劣化する」と考えなければならないという事実の証明になっていますね。
これは、デジタル信号の物理的な実体が単なる電気信号であり電流であることと、ジッターが関係するデジタル・オーディオの特性を考えれば納得が行きます。
そもそも電気信号(電流)自体にデジタルやアナログの別があるわけではなく、「流」が付くくらいですからアナログな存在なわけですが、当然のこととして回路を通せば確実に劣化します。ただ、デジタルの場合電気信号というのは単にしきい値より上を1、下を0と判別するためだけのものですから、劣化してもこのしきい値判別が可能な範囲の劣化であればデータは完璧に維持されます。たとえ劣化しても、USB非同期転送モードのDACのように、後から精度の高いクロックを注入してやれば復活させることもできます。これがアナログ伝送に対するデジタル伝送の優位性であり、一般的なデジタルの世界の常識なのですが、デジタル・オーディオの場合、これで解決されるのは振幅だけであって、時間軸(ジッター)の問題はやはり完全には解決されないようです。
電流の立ち上がりエッジや立ち下がりエッジが崩れてしまうと、それが0と1の反転タイミングのずれとなり、ジッターの増加となって音質の低下につながることが知られていますから、やはりデジタルであっても音質には「最短直結がベスト」という結論にならざるを得ませんね。
NASからの再生を前提にするなら、従来のUSB接続によるPCオーディオはセパレート型ネットワーク・プレーヤーと考えることができますが、今自作オーディオマニアのやっていることはPCオーディオというよりもむしろ一体型ネットワーク・プレーヤーの自作そのものであって、図らずもPCオーディオはネットワーク・プレーヤーに勝てないことを証明してしまいました。巷に溢れているUSB接続機器も存在意義を失ってしまいました。。。いささか性急にすぎる結論かもしれませんが、それだけ変化のスピードが早いということですね。
>I2S接続
実は興味がありながら手をつけていません。ジッターを排除するという意味で大きな効果があるのだと思いますが、、、
しかし使えるDACが限られるという事があります。好みのDACがあってもあきらめざるを得ない。
それが僕にはハードルが高く感じられるんだろうと思います。
自由度の高い条件の中で、なんとかする方法がないのだろうかと考えるほうに、むしろ関心があります。
>CD規格で充分
僕自身は、CDで十分なのかどうか、まだ結論が出ていません。
通常のデジタル伝送ではCD音源を鳴らし切ることは難しい。
実のところ、その解はI2S接続でもハイレゾでも構わないので、とにかくこのジッターという謎を何とかして欲しいと思っているのだと思います。
とりあえず、クロックの精度だけでジッターを何とかしようとするのは限界があるのではないかと思っています。リサンプリング、アシンクロナス接続など、クロックをどう使うかによって成果が出るのではないかと思います。
moct 様
こんにちは
わたしも、
>Raspberry Piと亀の子式に上に乗せるタイプのDAC
にてI2Sを試してみました。
Raspberry Pi+volumioはapu1c+lightmpdに比べてスペックに劣るので、たまに音切れするように感じますが、
I2Sのためでしょうか?ローレベルの再現性が若干高いようと思います。
比較したのはnano idsdですが。(Raspberry Piに接続して試聴)
”若干”というのは個人差があるでしょうが、オーディオ好きには大きな差となるかもしれません。
Raspberry Piはmpdを0.19.1にして、soxリサンプラーを追加インストールして、若干パラメーター
もいじって聞いていますので、素の音とはいえないかもしれませんが。
88.1khz,32bit floatぐらいまでリサンプリングすると(それ以上は音がとび、調整できませんでした。)
かなりいいと思います。
>CD規格で充分だと私も思います。
44.1khz 16bitのままでいい。
LPよりいい。
というふうには思えませんでしたが。
でも、やっぱりスペック不足でしょうか?
曲によって結構でき、不出来の差が大きいですね。
apu1c+lightmpdの方が安心して聞けます。
遅まきながら返信です。
Raspberry Piと亀の子式に上に乗せるタイプのDAC、導入してみました。
これは、DACを変える、ということに、どういう意味があるのかと、考えさせられる音です。
参りましたw。
Raspberry Pi+hifiberry(亀の子式に上に乗せるタイプのDAC)+runeaudio
のほうが圧倒的にいいです。
ローレベルの再現性がやはり違います。
上記の組み合わせはかなり安定していると思います。
apu1c+lightmpdを使わなくなりました。
現在runeaudioではなく、そのままarch linuxをいれていい音がでないか苦闘中ですが
音はでましたが、へっぽこな音です。かなりいじらないとruneaudioのレベルにはいけないですね。
私には荷が重そうです。
I2SとUSBは比較できないと思いますよ。だって、場所が違いますもん。USBでもI2Sが使いたければ、I2S出力があるUB-DDCを使えばいいのです。
ただ、サウンドデバイスのインターフェースは興味ある話題です。この場合、USB vs Raspberry Pi GPU のバス、ということになるのかな。
ここで気になるのが、普通のUSB-DACの中です。
USB -> S/PDIF -> I2S -> DAC、となっているのでしょうか?
USB -> I2S -> DAC、だと嬉しいんですけどね。
大きな勘違いをしていますね。
解かりやすい組合せでいえば、
APU1C→USB→hiFace Evo→I2S→Evo DACこの組み合わせでは、USBオーディオです。
APU1C→I2S→Evo DACの組み合わせでI2Sオーディオです。
ただしAPU1Cは今の所I2S出力には対応していませんし、仮に対応したとしてもDAC側の規格に合わせたI2S出力基板を作成取付後、ケースに収める必要もあります。
はっきり言ってかなりのスキルがいります。
こちらのサイトでは、I2Sオーディオはまだ先の世界です。
Raspberryのときは、volumioとruneaudioを利き比べ、結局runeの方になりました。
そのRaspberry+I2s Dacも嫁入りして今は手元にありません。
今はBeagleBone BlackのI2S(外部クロック)に戻っています。Raspberry+I2S Dacの2,3歩先にある音だと思います。
前回、CD規格で充分と書きました。
これはLPとの比較がどうのこうのということではなく、そのままの意味です。音楽を聴くのに充分と思ったということです。
私の望みが低いのかもしれませんが、Raspberry+I2S Dacで、邪心(もっと良いDacが欲しいとか、ハイレゾでなければとか……)を持たないで音楽に没頭できるレベルになったと思いました。
moct様
こんにちは
BeagleBone BlackのI2S非常に興味のあるところですが、電子工作をしたことがない私ではかなりハードルが高いですね。
また
>Raspberry+I2S Dacの2,3歩先にある音だと思います。
と考えられているのはわかるのですが、BeagleBone Blackだけで鳴るとは思えないので、接続されているDAC、およびソフトなどの再生環境がわからないこともあり一概に比較ができないと思うのですが。
その
>2,3歩先にある音
とは具体的にどのような音なのかを示していただけるとありがたいのですが。
わたしがRaspberry+I2s Dacで感じたのはローレベルの再現性が高いので、演奏の空気感、ニュアンスがかなりでると思いましたが、VolumioとRuneAudioではまたかなり違い、RuneAudioの組み込みのカーネルパラメーターを変えることでもかなり異なる、非常にセンシティブなシステムだと思います。
チャーリー 様
言葉が少なくあいまいな表現をしてしまい申し訳ありません。
使っている機材は、RasPiの方が、new_western_elecさんのIrBerryDAC、BBBの方がMi-TakeさんのDSD対応キット(PCM1792)と、Amanero社の COMBO384基板です。以前は、BBBのUSBからDDCとしてCOMBO384基板を使い、ソフトはRTカーネルのArchにMPDか、LightMPDでした。ArchにNASをsshfdでマウントしたのとLightMPDの優劣がつけれなくて聴き比べていた時期に、そのままの機材でI2S接続が出来ることが分かり、あまりの違いにすぐに切り替えました。
BBBのUSBからCOMBO384基板を使いIrBerryDACに接続して比較してみたこともあります。PCM1792DACの方が少し音楽のスケールが大きくなると思いました。音色の違いは当然ありますが、絶対的にクオリティーが異なるといったレベルの違いはないと思いました。そしてどちらも、いわゆるハイレゾ対応の普及品から出る普通の音です。
私が音楽を再生する際一番重視している点は(非常に誤解を受けやすい表現になりそうなのであまりしたくありませんが)、より視覚に訴える音、見えるとまではいかなくてもスピーカーの側面に行って覗きたくなるような音がする、ということです。強い、強靭な音といってもいいかも知れません。実はデジタルオーディオがだめだと思っていた一番はこれでした。BBBとRasPIのI2Sでやっとこのハードル(といっても私が勝手に作ったのですが)を超えたと思います。
確かにVolumioとRuneAudioでは音に違いがありますが(RuneのOCXを常用していました)、音の強さみたいな部分の差は無いと思います。そしてこの音の強さ、強靭さの正体はどうも音の立ち上がりのようなのです。(これはあくまでも聴観上の経験からなので勘違いかもしれません。)
RasPi+IrBerryDACを使いはじめて間もないころ、フルニエ、グルダのBeethoven Cello Sonata No.2を聴いたときのことです。最初に和音のフォルテで始まり、チェロが小さくちょっと鳴ってからもう一回ピアノが和音でガーンときますが、このとき「ピアノこの音量で大丈夫なのか?」とか「ピアノってポテンシャルの大きな楽器だな」といったことを感じました。いままでも何度か同じファイルを再生し聴いていますが、この感じはその時初めてでした。BBBの場合更にピアノの音が鳴りきる感じが強くなります。
BBB-I2Sは今のところ bbb.ieero.com で公開されているboticv3
がほとんど唯一です。(古いバージョンも含めればもう少しありますが)MPDとカーネルのバージョンをいじれば音は少し変化します。
このboticv3を使い始めてからなれるまでしばらく戸惑ったことがありました。例えばMercury Living Presence シリーズのドラティ指揮・ドヴォルザーク:スラブ舞曲を聴くとします。録音が古いのでヒスノイズが少しあるのでその音量を確かめながらボリュームの調整をしますが、
曲の途中のフォルテ部分やフィナーレでボリューム絞ることが良くありました。フォルテの音(打楽器の音)がしっかり立ち上がるため大きく聴こえるようなったこと、音量変化の度合いが激しくなったため更にそれがより大きく感じるようになったようです。ボリュームを絞ると次の曲では明らかに絞りすぎで、アンプを離れたところにあるため椅子との間をウロウロしていました。
冷静になって聴くと確かに音量は大きくなっているが感じた程は大きくなっていません。
音の見え具合というか強靭さは、BBBの方がはるかに強く感じます。張り詰めた感じ、或いは音が空気を伝って皮膚に加える圧力が強いといった感じです。
隣で新聞を畳まれたり、10円玉がテーブルで倒れたりした時、音は小さいのですが本当に強い実体感のある(実際に起こっているわけですから)音がします。
目を瞑って音楽聴いているとき、スピーカーから新聞を畳む音とすっかり同じ音がしたら、間違いなく飛び上がって驚くと思います。
moct様
かなりの長文のご返信ありがとうございます。
いろいろな実験をされているつわものでいらっしゃるのがわかりました。
グーグルで基盤の名前や使い方を調べながら読ませていただきました。COMBO384とBBBをI2Sでどのように接続するのかはよくわかりませんでしたが・・・(勘違いしてたらごめんなさい。)
わたしがRasPiといっしょに使っているのはhifiberryなのでIrBerryDACとは違うので正確なところなんともいえませんが、これほど感想が違うものなのかと、妙な感慨をもって読ませていただきました。
>音の強さ
というのはあまり考えたことがなかったですね。どちらかというとバランスよく音の表情がでて、演奏の特徴を自ずから明らかにするような機械が理想かなと思っているので。
しかし、音の捉え方は個々に違うのかもしれませんね。
>演奏の空気感、ニュアンスがかなりでる
というのが音の強さ、存在感と思う人がいても不思議ではないかもしれません。
スピーカーが違うこともおそらく大きな要因でしょう。
現在わたしのつかっているのはTimeDomain lightですが、moct様は何を使っていらっしゃるんでしょうか?興味のあるところです。
チャーリー 様
私の使っているスピーカーは自作(自作といえるほど作っていませんが)です。基本的な構造は、スピーカーの吸音材にする素毛フェルトを何枚か重ね音の出る穴を開けたバッフルを天井から釣り、その後ろにそこそこの小口径フルレンジを置いただけのものです。スピーカーユニットの振動が出来る限り床などに伝わらないような工夫などはしてあります。
出てくる音はTimeDomain lightと同傾向だと思います。バッフルはかなり大きいですが、面での反射がないので、空中に裸のユニットを浮かせたのと等価に近い状態ですから、音像が肥大せず非常にシャープに立体的に定位します。低音が不足しそうだと想像していましたが、木製のバッフルより豊かに聴こえます。トーンコントロールで少し低域を持ち上げてやると全く低域の不足を感じません。オーケストラのコントラバスの動きなどは良く分かります。ペトリのリコーダーを聴いているとき、部屋に入ってきた娘が「女の人が演奏しているでしょう。」といわれたことがあります。ブレスで分かったそうです。これを書く前に思い出し確かめてみましたが、はっきりと分かりましたから、分解能もかなり高いんじゃないかと思っています。設置するスペースのある方にはお勧め出来るとものだと思います。
moct様
ご返信、ありがとうございます。
そうですか、やはり自作でしたか。
やっぱり、いろいろ試してみることの究極は自作ですよね。
私も工作には程遠い人ですが、TimeDomain lightの左右アンバランスがどうしても気になってアンプ部を分離させてしまいました。なんだかその方が良くなった気がします。自己満足かもしれませんが。
まあ、お金がある人には日本経済のためにも、高額のスピーカーでもなんでも購入していただければいいと思いますがね。
>I2SとUSBは比較できないと思いますよ。だって、場所が違いますもん。USBでもI2Sが使いたければ、I2S出力があるUB-DDCを使えばいいのです。
I2SとUSBの比較の問題ではなくて、I2Sで動作するDACに対して、途中にUSB(インターフェイスとしてのDAIも含む)を余計に介在させるのと、PCからI2Sのまま直接転送するのとどちらが有利なのかという問題です。
これは「PCで音楽」さんのサイトなどでも、その結果が出ています。PCオーディオというものを、「PCからUSBを介して単体DACに接続する」ものと定義すると、I2Sだけで完結するネットワーク・プレーヤーと比べると不利になるのは間違いないと思います。
I2S入力に対応している単体DACはほとんど市販されていませんから、実際にはWindowsからはUSBによる非同期転送、LinuxからはDACがUSB非同期転送に対応していないためDDCを経由したS/PDIF転送となるのが通常です。
一般には音が良いとされるLinuxですが、S/PDIFは送信側のクロック(この場合はDDCのクロック)に受信側が同期する同期転送で、さらにその転送の仕組み上ジッターを発生させやすいということで、少なくともハイエンドの世界では使われなくなっています。これを使わざるを得ないところに、通常のLinuxオーディオの弱点があります。
PCとDACの接続方式による違いを動作クロックも含めてまとめると、
(1)I2S直結の場合
I2S -> DAC(DACの高精度クロックで動作)
(2)USB直結による非同期転送の場合(Windowsなど)
USB -> I2S(DAI) -> DAC(DACの高精度クロックで動作)
(3)DDC経由によるS/PDIF転送の場合(VoyageMPDなど)
USB -> S/PDIF (DDC)-> I2S(DAI) -> DAC(DDCのクロックに同期)
なお、
(4)Linux(非同期転送非対応)から直接USBでDACに接続する場合
USB -> I2S -> DAC(PCのUSBコントローラのクロックに同期)
*なお、XMOSからはLinux対応のドライバーも出ていますが、メーカー製のDACでLinuxに対応しているものはほとんどないため、自作しない限りUSBで直結すると(4)になります。
(2)以下は、I2Sだけで完結する場合に比べて余計な変換が必要となります。この転送方式の違いだけで、クロックも含めた音質の優劣をつけるなら、
(1)>(2)>(3)>(4)
と考えていいのではないでしょうか。
(3)>(4)では、(4)のほうがシンプルなのですが、DACが同期するクロックの違いで、優秀なDDCを使用すればこのようになるようです。いずれにしても(1)や(2)に比べれば不利です。Linuxの優位性を本当に活かすのであればI2S転送は必須であると思います。(1)の場合は、メーカー製のネットワーク・プレーヤーと何ら変わるところはありません。
PCオーディオと一口に言ってもその形態はさまざまなものが考えられ、人によって選択する内容はそれぞれだと思います。これが一番いいとか無理に決めつける必要はないし、そのつもりもありませんが、何と言っても動きの早い世界ですので、ボーナス時期を控えて投資を考えておられる方は、何に投資するか慎重に検討されたほうがいいかと思います(私自身ボーナスとは縁がありませんが、まさにその状況です)。
こんばんは。
I2SでDACチップが接続されている図だと思いますが、I2Sのクロック(LRCLK,BCLK)の精度・ジッターが問題になるのですよね。<一般に、DACと言う名称がDACユニット(USB-DACなど)とDACチップ(PCM5102Aなど)を指しているのかわかりにくいですね>
(1)I2S直結の場合
I2S -> DAC(DACの高精度クロックで動作)
この場合、I2Sのクロックを創るのは、ホストのPCですから
I2S -> DAC(PCのクロックで動作)
になるのではないでしょうか?
>I2S -> DAC(PCのクロックで動作)
になるのではないでしょうか?
I2Sの場合はいろいろなバリエーションがあり、DACのチップによっても異なりますが、一般的にはご指摘の通り I2S -> DAC(PCのクロックで動作)とすべきですね。これをマスター・モードと呼びますが、DAC側がクロックを持つスレーブ・モードというのも可能です。
ご回答ありがとうございます。
I2S -> DAC(PCのクロックで動作)
と書いたのですが、CPU用のクロックやその他のクロックと混同しそうなので、正しくは、
I2S -> DAC(PCのオーディオ用クロックで動作)
とするべきかもしれないですね。
>(4)Linux(非同期転送非対応)から直接USBでDACに接続する場合
USB -> I2S -> DAC(PCのUSBコントローラのクロックに同期)
これ、本当かな?
USBってパケット通信し。クロック同期していないし・・・。
>これ、本当かな?
USBってパケット通信し。クロック同期していないし・・・。
PCから送られるパケットデータに合わせてDAC側のPLLが同期しているというのが正しいですね。
一体型/セパレート型、各種転送方式とクロックの問題については
こちらの記事で詳しく解説されており、参考になります。
私も何年ぶりかで読みなおしてみたのですが、ご指摘のとおり単純に「PCのUSBコントローラのクロックに同期」と考えるのは正確ではないようです。
それにしても、LANも非同期転送の一種であると考えることができますから、上流から下流までのクロックの精度と一貫性という意味で、すべてを内部的に完結できる一体型ネットワーク・プレーヤーの構造上の優位性は動かしがたいものがあるように思います。やはりLINNの先見性は素晴らしいということでしょう。今後は利便性と柔軟性の高いUSBオーディオとの住み分けになっていくような気がします。
話は変わりますが、たまたまオークションで一昔前のエソテリックの超弩級トランスポートがほぼ50万円で落札されたのを偶然見つけました。
Esoteric P-0s VUK-P0 CDトランスポート銘機☆美品☆
電源部との合計重量も約47Kgとすさまじい物量の投入ぶりですが、S/PDIFで転送する時点ですでに過去の製品です。未だにあのようなものをありがたがるマニアが多いことに驚きました。
あまりに省略しすぎた書き方だったので修正させてください。
—
>(4)Linux(非同期転送非対応)から直接USBでDACに接続する場合
USB -> I2S -> DAC(PCのUSBコントローラのクロックに同期)
これ、本当かな?
USBってパケット通信し。クロック同期していないし・・・。
—
クロックに同期していない、と言う意味ではなく、クロックに同期させる必要は必ずしもない。と言う意味で書きました。
というのは、昔に買ったオンキョーの24bit/96kHz対応USBオーディオインターフェイス が、内部水晶クロックを使用しています。パソコンクロック同期だとオーディオ機器にくらべて30倍ぐらいジッターが増えていたのを大幅に低減したというモデルでした。(当時は音源があまりなく、24bit/96kHzではあまり使いませんでしたが)
2004年ごろの製品で2万円代の製品です。
10年前のエントリー機で対策していた(完ぺきではないでしょうが)問題が、現在ではそのまま放置されているというのは、不思議だと感じるのです。
コメントをよく読んでいなかったので前後しますが、このオンキョーのオーディオ・インターフェイスは、USB経由の同期転送でデータを受け取った後で24bit/96kHzに強制的に変換する仕様なのではないでしょうか。その場合は最終的に内部クロックでD/A変換されることになります。正しいかどうかはわかりませんが。
自分も調べました(調べてから投稿しろよ>自分)
「アシンクロナス(非同期)伝送」機能を開発して世界で初採用したのが、オンキョーのSE-U55GX、SE-U33GX (’04年発売)、だそうです。
Windows XP の時代ですね。Windowsのオーディオドライバに問題が多くあった時代かな、MMEドライバ、DirectSoundドライバなどを使用してて。
時代を先取りしすぎていたのかも。
SE-U55GXは、Windows Vistaに対応するのにファームウェアのアップグレードが必要で、それも有償 7350円 だったとか。
なにか、かなり無理をしていたのかもしれません。
今気がついたのですが、この話題の出発点となったRaspberry PiはI2Sの出力端子を持っていますから、そこから直接DACにI2Sで接続できます。USBは使いません。juubeeさんはそこのところを勘違いされているのかもしれませんね。
私がオーディオ関係でジッターの話を初めて聞いたのは、CD-Rが普及し始めたころCD-Rのブランドによって記録された”音”が違う(か否か?)と言う巷の話に纏わる議論でした。結果は、ジッターの影響が音の良し悪しに関係が有るとも無いとも・・はっきりした結論は出なかったように思いますが(CDーRの精度維持の耐久性にはハッキリした優劣があったと思いますが・・・)、そこでも取り扱うデータのタイミングの話として”時間”の問題が絡んでいて、「こりゃー、大変だ」・・と思った記憶ありました。と言うのも、私もナノ秒(ns)・ピコ秒(ps)単位あたりまでのデータを扱う仕事をしたことがあって、その扱いの微妙さを感じていたからでした。私は、そう言った装置開発ではなく、もっぱらそれを使ってデータを採る仕事だったので、そう言った機器の設計上の実態については全くの無知ですが、使う際の装置の調整には細心の注意を必要としたのは今も覚えています。
ns、ps の世界と言うのは、光の速度と比較するとかなり実感できるのですが、1nsと言うのは、秒速30万Kmの光が300mm、1psでは0.3mm、進むのに要する時間です。電気回路中の電子は当然この光速よりは遅いので、こう言った時間単位を扱う計測装置には相当な注意が必要なことが判ります。単一の装置内では、電気のON/OFFに伴う過渡現象、更には回路の”長さ”への考慮も必要でしょうし、複数の装置を接続するする場合はその接続についても注意が必要になる場合があるでしょう(たしか、最近でも話題になった”超光速”粒子の測定で誤りがあったのは、この手の話だったように記憶しています)。
オーディオにそこまでの精度が必要か否かについては、肯定する根拠も否定する根拠も私自身は持ち合わせていないので、ここでの議論を楽しく聞かせていただきたいと思っています(恐らく、音楽を聴く道具としては”CDで良いじゃないか”派の私には余り関係ないとは思いますが・・・)。
ここで、こんなに沢山のレスをいただいたのは初めてです。有難うございます。
すみませんが、まとめて (^^;;
nino さん
I2S直結とおっしゃっていますね。
確かに、Raspberry Pi からI2Sが出るようですが、これはオンボードのサウンドデバイスから取り出しているんじゃないんですか? 実際には独立したチップではなくてGPU内部にあるような感じがしますが。
なので、一見、USBをバイパスしているように見えて、実際には、(USBじゃないけど同様に)オンボードでサウンドデバイスに繋がるバスがあって、USBと比較するんだったらこっちでしょ、ということを言っているんです。
なるほど、そういう意味でしたか。
Raspberry Pi からのI2Sは、SoCのBCM2835というチップからシリアル通信で出力されるもので、GPUチップは別にあります。USBも同じBCM2835から出力されてさらにLAN9512のUSBハブを経由します。出処は同じです。
ただ、ここで問題にしているのはUSB転送とI2S転送の優劣ではなくて、そもそもUSBはDACに直結できない(必ず単体DAC内のDAIでI2Sに変換される)という問題です。だから最初からI2Sで転送したほうが、余計な変換回路を経由しないため、音質上も有利なのではないかということです。I2Sの場合はRaspberry PiとDAC基板を同一筐体内に収めることになりますが。
nino さん
なるほど。
大ざっぱには、
経路こそ違えども、Raspberry Pi 内のDDCでI2Sに変換されて、それが外だしされるだけですから、USB-DACと比べて、バイパスされる機構はない、ことになると思うんですが、
同じチップでI2SとUSBの両方を出力するとなると、私の頭ではどう考えたらいいかわからなくなってきます。やはりバイパスなのかなぁw 一歩踏み込んだ話になると難しいですねぇ (^^;;
juubee さん
Raspberry PiにDDCが内蔵されているわけではなくて、外部ストレージから受け取ったPCMデータをBCM2835からI2Sの形式で出力するか、USBの形式で出力するかだけの違いです。それを司るのがI2SドライバとUSBドライバで、その指示をBCM2835が実行して出力します。Raspberry PiはI2Sドライバが開発されているのでI2Sを出力できます。最初からI2Sを出力するチップや端子があるわけではありません。
ちなみに、サウンドデバイスには同じBCM2835からPWM信号(当然PWMドライバがあります)が出力されて、LPFでアナログに変換されます。出力形式が異なるだけです。
PCオーディオでのPCの役割は、データを受け取ってそれを受信側のデバイス(DAC)が処理可能な形式にして送り出すことです(再生の制御もありますが)。DAC側の形式はI2Sと決まっていますから、PCからUSBの形式で出力されると、当然DAC側で変換しなければならなくなります。
ただし、I2Sというのは本来機器内接続の規格であり、長距離伝送に不向きでUSBのように規格が統一されているわけではないため、簡単に使えるものではありません。そのため、PCオーディオでは一度USBの形式で外に出すことで汎用性と利便性を高めているわけです。したがって、I2S直結なら必然的にPCとDACを同一筐体に収めることになり、事実上ネットワーク・プレーヤーと変わらなくなります。
ある意味、これはPCオーディオにとっては「不都合な真実」かもしれません。
nino さん
>最初からI2Sを出力するチップや端子があるわけではありません。
普通のDDCとは違うってことですね。
>ある意味、これはPCオーディオにとっては「不都合な真実」かもしれません。
いやいや、ALIXやCuBOXを選び、voyageMPDやlightMPDを選ぶことが、既に、オーディオ機器を志向しているんだと思いますよ。
>普通のDDCとは違うってことですね
いや、DDCではないということです。これをDDCと呼ぶなら、PCはすべてDDCということになります。
「不都合な真実」とは、インターフェイスを必要とする外付け(USB)DACは音質面で不利であるということです(つまりは通常のPCオーディオのことですが)。DACと一体化することによって生じる干渉などの問題は設計で対処できます。しかし、外付けのインターフェイス部分の変換によって確実に生じる音質の劣化は対処のしようがありません。
こんばんは。
>外付けのインターフェイス部分の変換によって確実に生じる音質の劣化は対処のしようがありません。
PCMデータは、USBインタフェースを通しても変わりません。(クロックをUSB経由で供給しない場合)
DACチップにI2Sインタフェースを通じて出すデータは、Raspberry PiのBCM2835から出そうと、USB-DAC内のハードウェア(Socあるいはシングルチップマイコンなど)から出そうと、全く同じデータが出力されます。
ですから、インタフェースを介することによって音質が劣化するとは言えません。
使用するDACチップが同じとすれば、使用するクロック・電源・回路の引き回し・ノイズなどによって音が変わるのです。
インタフェースを通じてクロックも伝送する場合(それも不完全な状態で場合)は違ってきます。
ninoさんが上げられていた、
(3)DDC経由によるS/PDIF転送の場合(VoyageMPDなど)
USB -> S/PDIF (DDC)-> I2S(DAI) -> DAC(DDCのクロックに同期)
なお、
(4)Linux(非同期転送非対応)から直接USBでDACに接続する場合
USB -> I2S -> DAC(PCのUSBコントローラのクロックに同期)
の場合ですね。Linux が非同期転送に対応していないのが不思議ですが。
ぶっちゃけて言えば、LinuxベースPCをホストにするUSB-DACを使用したPCオーディオは、高音質再生に向いていない、と言うことだと思います。(なので、コネクタ接続・ケーブル引き回しのI2S接続でも、高音質化するのでしょう。)
>PCMデータは、USBインタフェースを通しても変わりません。
こういう人は必ず出てくると思っていました。デジタルであっても余計な回路を通したり変換を行うと、データは変わりませんが、音質は必ず劣化します。これはデジタル・オーディオの常識です。この件に関してはこれまでにもここで散々議論になったことなので、繰り返すつもりはないのですが。。。
データが変わらない=音が変わらない
ではありません。
ここで言っているデータとは信号波形から復元されるバイナリデータのことで、これは常に一致します。しかし、バイナリ変換前のデバイスからの出力波形は一致しません。出力波形はジッターにも影響します。
デジタル・データの物理的実体はアナログ電流です。0や1はあくまでも概念であって物理的実体はありません。機器は電流で動いているのであって、0や1で動いているのではありません。ここのところから理解しないと、デジタル・オーディオは理解できません。
実は上のほうでも違う表現でまったく同じことを説明しているのですが。やっぱりなかなか理解してもらえませんね。。。
結果としてデータをコピーしただけでも音は変わります。納得しない人は絶対納得しないでしょうが。これがデジタル・オーディオの現実です。
>Linux が非同期転送に対応していないのが不思議ですが。
これは単にDACのメーカーがLinux対応のドライバーを開発する気がないだけですね。VoyageMPD なんてのは所詮一部のマニアのお遊びですから、メーカーとしては相手してもしょうがないということでしょう。
こんにちは。
>しかし、バイナリ変換前のデバイスからの出力波形は一致しません。出力波形はジッターにも影響します。
これは何でしょう?USBの信号ラインでしょうか?
USB非同期転送ではクロックは伝送しませんので、信号ラインの波形はジッターに「本質的」に影響しません。
まず、これを抑えましょう。
>0や1はあくまでも概念であって物理的実体はありません。
あります。TTLレベルやCMOSレベルの信号としてインプリメントします(その他さまざまなですが)。こういった規約を守る限りデジタルは変換を行っても回路を追加しても「本質的」に変化しません。ここのところを理解できないと、デジタルオーディオの入り口にも入れません。
>外付けのインターフェイス部分の変換によって確実に生じる音質の劣化は対処のしようがありません。
このような劣化は「本質的」にありません(非同期転送)。これが基本です。
では、何故、音が変わるという経験をすることがあるのでしょうか。
一つには、USBの信号ラインが、I2Sのクロック信号を汚染しているのかもしれません。これは回路設計の問題ですね。電源の違いの影響もあるでしょう。
で、汚染の原因になるのはUSBの信号ラインに限りません。LAN、表示系、ユーザーインタフェースなどすべてが関係します。数多いだけI2Sのクロック信号等の汚染源がふえるので音質劣化が多く対策も困難と言うことになります。
つまり、USB-DACは、シリアル通信1入力のみというシンプルな信号回路ですので、有利なのです。
ソフトウェア的にもLinuxのような巨大で鈍重なOSを動作させるために必要なハードウェアリソースは、ノイズ等で音質に悪影響を与えます。
USB-DACでは、OS不要でも作成できるほどシンプルです。音質に悪影響を与えるハードウェア・ソフトウェアリソースを最小限に抑えることができるのです。
また、DA後のアナログ信号も非常に微小な信号レベルを扱います。ノイズ等の少ない環境が望ましいですね。
いずれにせよ、デジタル・オーディオにおいては、「DA変換する環境」にクリーンで正確なクロック・低ノイズ・十分な電源等を提供することが肝になります。
アナログ信号は、信号経路上の影響で一度音質が劣化・変化すれば復旧しません。
デジタル信号は、信号経路上の影響で(アナログレベルの)劣化・変化があっても、DAする環境を適切なものにすれば、元の音質が得ることができるのです。
おかげで、Blue Sky Labelで提供される貴重な音源が、様々な劣悪な信号経路をたどり外部インタフェースで変換されているにもかかわらず音質劣化することなく私たちも楽しめるのです。
Hippo さんの説明はデジタル・オーディオの基本的な理論の説明としては正しいし、一般ユーザー向けの説明としてはこれで十分でしょう。ただ、ここではどこまで掘り下げて考えるかの問題で、一歩踏み込むと、ではなぜリッピングの方法によって音が変わるのか、非同期転送でアイソレーターも備えている最新のDACを使ってもやっぱり音が変わってしまうとか、インターネットを経由でダウンロードするとなぜ音が変わるのか、などという一般に知られている事実(知られていない?)については説明がつかなくなります。
実をいうとHippoさんの
>一つには、USBの信号ラインが、I2Sのクロック信号を汚染しているのかもしれません。これは回路設計の問題ですね。電源の違いの影響もあるでしょう。
という部分が答えといえば答になっているのですが、
では、私の書き込みですが、
>しかし、バイナリ変換前のデバイスからの出力波形は一致しません。出力波形はジッターにも影響します。
これではあまりにも説明不足で意味不明なのは当然ですね。「出力波形」とは、デジタル信号の信号波のことです。0や1というは概念ですから、必ずこれを物理的な実体として表す必要があります。例として、
「0」を0V、「1」を2V、しきい値を1Vとすると、デバイスでは信号電圧が1Vを超えた瞬間に電源がオンになります。逆に1Vを下回った瞬間にオンだった電源がオフになります。そして実際のデバイスの電源ラインでは、当然のこととしてこのオン/オフ時にノイズが発生します。これはデジタル機器が動作すれば必然的に発生するノイズであり、これを回避する方法はりません。
そしてこの反転タイミングは電圧の立ち上がりエッジと立ち下がりエッジの状態によって前後に揺れます。0Vから2Vへの立ち上がりエッジが急峻であればしきい値の1Vに達するタイミングが早くなるし、なだらかであれば遅くなります。これにつれてノイズの発生タイミングも不規則に揺れ動き、信号の劣化によりこの立ち上がりエッジや立ち下がりエッジが崩れてくるとノイズの発生パターンの揺らぎも大きくなります。
もちろん、これが直接DACクロックのジッターとなるわけでありません。DACのクロック信号は別に与えられますから、理論上は関係ないはずです。しかし、実際の機器では電源ラインやグラウンドを通じて相互のノイズが影響し合うのは避けられません。ノイズの発生パターンが違ったり変動が大きくなると、機器内でそれがクロック信号にも影響が及ぶということは十分考えられます。いわば自家中毒ですね。
>これは回路設計の問題ですね。
はい、そのとおりですね。この影響を可能な限り排除した設計を考えるのが設計者の仕事ですね。非同期転送モードで動作するDACというのはよくできていて、デジタル信号であっても、伝送の過程で信号波形が崩れてジッターを誘発するという意味では「劣化」するのですが、この場合の「劣化」は後で高精度のクロックで叩き直してやれば「回復」します。一種の「リセット」機能といってもいいでしょう。しかも最近ではアイソレーターでPCからのノイズが直接入り込まないようになっています。
しかしどんなによくできたDACであっても、やはり上流からのデータを完全にリセットしてその影響を排除することは不可能です。完全にリセットされるなら上流で何を使っても音は同じになるはずですから。これは設計者がヘタレであるとうことよりも、現状の電子機器の限界と考えるべきでしょう。
ということは、DACに送り込むデータもできるだけ「きれいな」状態(いい加減な言葉使いですが)であるほうが、音質上も有利ということにはならないでしょうか。
この推測がまったくの見当外れでないことは、実際に上流で余計な回路を通したり変換を行ったりすると、微妙にではあっても音質が損なわれることで確認できます。リッピングによる音の違いも同じですね(違いを認めない人もいますが)。
デジタル・オーディオのデータの部分については、デジタルの理論で説明がつきますから議論するまでもありません。しかし、ジッターというのはアナログ要素ですから「劣化」とか「回復」とかデジタルとはおよそ相容れない表現になってしまいます。
こんにちは。
>デジタル機器が動作すれば必然的に発生するノイズであり、これを回避する方法はりません。
・・・
>機器内でそれがクロック信号にも影響が及ぶということは十分考えられます。いわば自家中毒ですね。
そうですね。基板設計や半導体設計では(デジタル処理のみの場合でも)常識ですね。クロック信号に対する影響だけでなく。
前にも指摘しましたが、このことが、USB-DACの有利な点です。ノイズ発生源が非常に多いRaspberry PiなどからI2S出力するより圧倒的に有利な点です。
>デジタル信号であっても、伝送の過程で信号波形が崩れてジッターを誘発するという意味では「劣化」するのですが、この場合の「劣化」は後で高精度のクロックで叩き直してやれば「回復」します。
これ、完全に間違っています。デジタル信号(USBでのPCM伝送)の伝送で波形は伝送しません。伝送しないものは「劣化」しません。
基本の基本的なことかつ本質なので間違わないでください。
(デジタルももとははアナログだという点に注目するのはいいのですが、単純にデジタルにアナログの挙動を適用するのは危険で間違いのもとです)
>ジッターというのはアナログ要素ですから「劣化」とか「回復」とかデジタルとはおよそ相容れない表現になってしまいます。
そうですね。相容れないのは理解されているようですね。それを無理にこじつけて一緒にしてしまうのでおかしな話になるのです。
前後しますが、
>リッピングによる音の違いも同じですね(違いを認めない人もいますが)
音は変わりません。これが事実で現実です。違うという場合は、観測装置・観測方法になんらかの問題がある証拠となります。
上の補足ですが、この問題は信号波形(音声波形のことではありません)が完全な矩形波であれば起こりません。矩形波から崩れることによって、受信側のデバイスで発生する読み取り時のノイズパターンが変化して、それがマスタークロックのジッターパターンに影響を及ぼし、結果的に音の違いに反映されるという問題です。
完全な矩形波が出力されるには、電圧が0Vから遷移時間0で所定の電圧まで変化しなければなりません。現実のデバイスはそのような動作はできないし、電流電圧もそのような変化は不可能です。つまり、デジタル機器と呼ばれるものの実体は、スイッチング動作に特化してはいてもあくまでアナログ機器であって、電流はもちろんアナログ電流です。したがって、教科書に出てくるような完全な矩形波の出力は実現不可能で、この問題は設計で根本的に解決できるものではありません。
この問題は、ケーブルを経由して送信側からクロック信号が伝送されていたS/PDIFでは大きな問題でした。DACの動作クロックが事実上信号波形に依存していますから、ケーブルを変えただけでも大きく音が変わりました。これは非同期転送のDACによって大きく改善されました。
しかし、LANでもやはり音は変わります。NASを変えたら音が変わったというのは誰でも経験することですが、LANも現在のDACと似ていて非同期のパケット転送であり、受信側の新たなクロックでデータが再構築され、パルストランス受けで受信側とは絶縁されています。ですからNASを変えたからといって音が変わるはずはないのですが、実際にはかなり変わります。信号波形が最終的に音質に及ぼす影響は無視できないと思います。
デジタル一般の世界ではしきい値判別が可能であるかどうかだけが問題であり、信号波形がいくら崩れてもしきい値判別が可能な限りデータは一致しますから、波形の形状までが問題になることは通常ありません。デジタルでありながら信号波形の形状が問題になるというところにデジタル・オーディオの特殊性があります。
しかし、デバイスの実際の動作まできちんと理解すれば、その結果として当たり前の音質の変化が起こっているだけのことであって、オカルトでも何でもありません。ただ、音の変化を認めない人にとってはあり得ないことかもしれません。
こんばんは。
途中の信号波形は関係ありません。(完全な矩形波を前提にしているシステムもありませんが。
何故なら、信号波形(それは電流信号でも光でも磁気反転でも音波でも何でもよい)を使って振幅データを伝送しているだけだからです。
伝送しているのは、信号波形そのものではないのです。電気的に伝送する場合に信号波形を利用しているだけです。
繰り返しますが、伝送されるのは振幅データだけです。信号波形ではありません。
これが、現実であり事実なのです。単なる理論上の話ではありません。そう設計され、そう実現されているのです。デバイスの実際の動作がわかれば理解できることですね。
(なぜ、ninoさんのように知識も豊富な方が、現実から目を背けようとするのか不思議です)
もし、音質の変化を感じられた場合は、原因は別のところにあります。それを追及するのが、正しいアプローチです。
nino さん
Raspberry PiのI2S出力動作は、それが事実であろうことは、有難く拝聴致しました。
ですが、考え方の違いはよくあることなので、押し売りは無用に願います。
スレタイと関係ない話題を続けるのもなんなので、これで失礼します。
ユング君さん
はじめまして。いつも大変興味深い記事をありがとうございます。
さて、
> ジッタ < ± πf(2N-1-1))-1 /2 [秒] (f:周波数 N:ビット)
についてですが、先頭に“(”が抜けている気がします(引用元さんに無いですね)。
導出経緯が不明なので間違ってるかも知れませんが、
“Π×f×((2のN-1乗)-1)×2”の逆数 ※Π(パイ)は円周率
ではないかと(-1する意味がよく解らないのですけれど(笑))。
また、どうもこの“f”には「信号周波数」の2倍を入れるみたいです(「サンプリング周波数」?)。
とすると計算結果は半分になり、±120psくらいでしょうか。
ちなみに、以下のBB社製DAC「PCM1702」の評価ボード「EVM-1702」資料P.5では「16bit、信号周波数20kHzで119.4[ps]」となっています(16bit精度を0.0015%として計算している模様)。
http://www.tij.co.jp/jp/lit/an/jaja001/jaja001.pdf
本記事の主旨でないとは思いますが、ご参考まで。
では
う~ん。。。私の言ってることがまるで理解されていないのかな。。。
>伝送しているのは、信号波形そのものではないのです。電気的に伝送する場合に信号波形を利用しているだけです。
>繰り返しますが、伝送されるのは振幅データだけです。信号波形ではありません。
こんな当たり前のことを繰り返されてもポイントが全然違うんですけど。
ケーブルの中を0と1を流せるわけはないので、振幅データを伝送するには信号波形を使わざるを得ないのですが、その波形が完全な矩形波でないことによるノイズパターンの揺れが最終的にDNAのクロックを揺らす可能性のことを言っているのですが。
アナログと混同しているとか。。何か話が噛み合いませんね。
こんばんは。
>>繰り返しますが、伝送されるのは振幅データだけです。信号波形ではありません。
>こんな当たり前のことを繰り返されても
よかった、これが本当に理解できていれば、インターネットの経由でダウンロードで音が変わる・リッピングの方法で音が変わる・コピーしたら音が変わるなどと言うことがでたらめだということが理解できるでしょう。
(繰り返しになりますが、もし音が変わるなら他に原因を ー観測装置・観測方法を含めー 求めるべきです)
>その波形が完全な矩形波でないことによるノイズパターンの揺れ
矩形波でも時間的揺れがあればノイズパターンは変わります。1:4程度の台形波形でも時間的揺れが無ければノイズパターンは変わりません。波形は関係ないのです。
ノイズの影響と言う点で、
DACのクロック(I2Sの各クロック)に関して言えば、繰り返しになりますが、ノイズ発生源の少ないUSB-DAC内のI2S信号の方が、多数のノイズ発生源のある(強度の他、共振もかも)PCからのI2S信号の方が、圧倒的に不利になります。
(念のため書いておきますと、I2Sクロックの精度が重要になるのは、デジタル・アナログ変換を行うデバイス、かつ、高度な再現性を必要とする音声信号への変換を行う唯一のデバイスの入力と言う点です)
なお、ninoさんも書いておられますが、DNAのクロックを揺らす「可能性」、ですから、実際に起きているのかどうかの検証も必要ですね。ここからかもしれませんよ。
誤記訂正。
誤
DACのクロック(I2Sの各クロック)に関して言えば、繰り返しになりますが、ノイズ発生源の少ないUSB-DAC内のI2S信号の方が、多数のノイズ発生源のある(強度の他、共振もかも)PCからのI2S信号の方が、圧倒的に不利になります。
正
DACのクロック(I2Sの各クロック)に関して言えば、繰り返しになりますが、ノイズ発生源の少ないUSB-DAC内のI2S信号「にくらべて」、多数のノイズ発生源のある(強度の他、共振もかも)PCからのI2S信号の方が、圧倒的に不利になります。
失礼しました。
「オーディオの科学」には、CDプレイヤーはいったんバッファにデータをためて、水晶発振で同期の上で出力するので、ジッタの影響は実用上は存在しないとありました。
実際に東京情報大の研究結果では、ハイエンド機からローエンド機まで実測ジッタは最も鋭敏な耳の検知限界を2桁下回る値(普通の人にとってハッキリ悪影響がわかる量の4けた下)だったそうです。(問題は基準周波数44100hzからのずれの方で、安物は1時間で1秒狂う位のずれがあったそうです。)
私はジッタ計測機を持っていないので、自ら検証してはいないのですが。これもケーブル問題と同じで「イメージ暗示戦術」じゃないでしょうか。
こんにちは。
色々な研究結果があります。
1μsという研究結果から80ps以下という研究結果まで、約10000倍の違いがあります。
東京情報大の研究結果や「オーディオの科学」の理論から、「イメージ暗示戦術」だという結論を出すのは、早計ですね。
信号経路(同期型と非同期型を区別する必要あり)におけるジッタの影響、DACに実際に出すクロックのジッタの影響、信号経路のジッタがDAC以外におよぼす影響 ー たとえば電源やアース ー などが必要でしょう。