著者:スタンフォード・ブロックチェーン・クラブ出典:W-SOURCE翻訳:Good Oba、Golden Finance
はじめに
ブロックチェーンと暗号通貨は、その誕生以来、より幅広いアクセスを提供し、仲介者を排除することで、金融の状況を変革するために取り組んできた。時を経て、ウェブ3の発展はその応用シナリオを拡大し、クリエイターが繁栄し、ユーザーがデータをコントロールするインターネットを創造する上でのブロックチェーン技術の可能性を強調しています。
分散化を確保しながらエンドユーザーに力を与えるインフラの重要な部分は、データが弾力性があり、検閲に強いデータベースに保存されるようにすることです。中央集権型データベースは便利で使い慣れたものであるにもかかわらず、必要なセキュリティを提供できず、データベース所有者の許可を必要とするため、世界的な普及が制限されています。
分散データストレージシステムは、データを保存、管理、共有するノードのネットワークを構築することで、フォールトトレラントで回復力の高いストレージの必要性に対処します。中央集権化の必要性を排除し、P2P方式でデータを分散させることで、セキュリティと透明性が強化されます。分散ストレージシステムは多くの場合、冗長性と可用性によってデータを複製する傾向があるブロックチェーンや同様の技術に基づいています。
分散ストレージシステムは、未使用のストレージ容量に依存することで、セキュリティ、データの回復力、潜在的なコストメリットを提供する一方で、規制や相互運用性の課題に直面しています。
分散ストレージは、真にオープンでアクセス可能なネットワークに不可欠です。どのようなストレージシステムにおいても重要な点は、データの保存と維持の方法をどのように正当化するかということです。ユーザーにとってより重要な問題は、データはどのように保存され、維持されることが証明されているのかということです。これはデータプルーフィングによって対処される。
全体として、私たちは2種類の証明を区別しています:
Deterministic Proofs:データ保持者が特定のデータについて証明を作成し、データのハッシュを作成して一致させることを証明できるようにします。このタイプの証明は、データを入力として生成されたハッシュのみを公開する。
確率的証明:基礎となるデータが利用可能である可能性が高いことを示すために、確率に依存します。これは、特定の仮説の確実性の程度を合理的に示す証明であり、発表済みで必要に応じて検索可能なデータに適用される。
本論文の残りの部分では、3つの異なるシステムにおけるデータの保存と完全性を証明するための設計の選択について議論します。まず、大容量でスケーラブルなデータに焦点を当てたTagionについて、次に分散型ストレージネットワークであるFilecoinが、どのようにしてデータを大規模に保存することを保証するかについて議論します。
Tagion
アーキテクチャ
Tagionは大容量トランザクションに特化した分散型ネットワークで、テクノロジーと民主的ガバナンスに基づいた独自の暗号通貨システムを構築することを目標としています。このプロジェクトは、大規模なスケールを可能にする革新的なデータベース・アーキテクチャと暗号技術に依存している。ブロックチェーンではなく、DARTデータベースに最適化されたストレージを使用した分散型台帳です。Tagionの証明メカニズムは決定論的証明の一例です。
DARTデータベースの中核機能は、ハッシュキーに基づいてデータを保存する分散ハッシュテーブルとして機能することです。情報が格納されるにつれて、構造は自然に多くのブランチを生成し、それぞれが最大256のアーカイブとサブブランチを組み合わせてサポートする。

SMTは、無関係なデータ要素にアクセスしたり、特定のデータ断片をダウンロードしたりすることなく、証明者が要素の存在を検証できるようにすることで、効率を大幅に向上させます。さらに、ツリー内の値の独立性により、ツリーの最終構造を変更することなく、任意の順序で更新することができます。

Tagionのシステムは、すべてのサブブランチのハッシュを含むルートハッシュを利用して、最小限の計算でデータの状態を迅速に検証します。処理をさらに強化するため、システムはシャード化されたブロックチェーンと同様に、特定のエコシステム用にサブDARTを作成することができる。これらの指定されたノードはデータのサブセットを管理し、スループットを向上させ、アプリケーションチェーンと同様に、異なるアプリケーション用にネットワークをカスタマイズできるようにします。
DARTを使用してステートレスシステムを構築することで、システム遷移の完全な履歴を維持する必要がなくなります。これはデータを削除できることを意味し、全体的なストレージ要件を削減し、軽量化を通じてシステムの分散化を高める可能性があります。
Tagionは、HiBON(Hash Invariant Binary Representation Objects)によりストレージプロセスをさらに容易にします。これは、データがハッシュ不変のまま保存されることを保証し、連想ハッシュに基づくデータ検索を簡素化します。ハッシュ不変とは、データが異なる順序で処理されても、常に同じハッシュを生成することを意味する。これは、データベースのデータ検索と書き込みを高速化するための実証済みのテクニックです。
これらのメカニズムにより、Tagionはデータを安全に保存するだけでなく、ネットワークにおけるデータの包含と完全性を効率的に検証します。
データの完全性
Tagionのすべてのサブシステムは、ランダム化されたワンダリングとして知られているものを実行し、データが保存され、オンデマンドで利用可能であることをチェックします。保持検証チャレンジに失敗したノードは、ネットワークから除外されます。
すべてのアーカイブにはタイムスタンプが含まれており、保存期間を延長するには料金が必要です。徘徊の間、システムは支払いを受け取ったかどうかをチェックし、受け取っていない場合はデータを削除してスペースを解放する。
Filecoin
Filecoinは分散型ストレージネットワークで、ネイティブトークンであるFilecoinを通じて、マイナーがストレージ容量を提供するインセンティブを与えます。これらの報酬を得るために、マイナーはストレージ容量を検証するための証明を生成する必要があります。
セクタと呼ばれるFilecoinのストレージの基本単位は、標準的なサイズとプロバイダーが拡張可能なライフサイクルを持っています。Filecoinに保存されたユーザーデータはすべて暗号化され、複数のコピーがネットワーク上に分散されるため、マイナーはファイルの内容にアクセスできません。
Filecoinネットワークにおけるマイナーの影響力は、彼らが提供するストレージの量に比例し、ネットワークのコンセンサスメカニズムに参加することもできます。
Filecoinのアーキテクチャはモジュール式で、ノードは必要に応じてシステムの特定の部分を操作できる。例えば、ノードはストレージノードとしてのみ機能し、市場運営には参加しません。
データの完全性と可用性を保証するために、ファイルコインは2つのアルゴリズムに依存しています。
ストレージの証明
ファイルコインのマイナーは、任意の時点でデータのコピーを保持していることを検証するために証明を生成します。この証明はチャレンジによって達成されます。システムはマイナーに、彼らがデータを所有している場合にのみ正しく答えられる質問をします。
チャレンジが出されたときに採掘者がただデータをコピーするだけでないことを確実にするため、チャレンジは予測不可能な時間間隔でランダムにデータの異なる部分をターゲットにするように設計されている。ランダム性と時間間隔の不確実性を組み合わせることで、採掘者がチャレンジが提示されたときだけデータを取得することは不可能であり、不経済で非合理的です。
プルーフ・オブ・タイム・アンド・スペース(PoSt)
Filecoinは、継続的なストレージとデータの可用性を保証するために、プルーフ・オブ・タイム・アンド・スペース(PoSt)を導入しました。プルーフ・イン・タイムは、マイナーに暗号チャレンジを提示することで、時間間隔にわたってストレージを検証します。マイナーは、ファイルが指定された時間枠内に保存されている場合にのみ、チャレンジをパスすることができます。
PoStは2種類のチャレンジで構成されています。
Winning PoSt:マイナーは、特定の時間(通常はアルゴリズムが次のブロックを採掘するマイナーを選択したとき)にデータのコピーを保存したことを検証します。次のブロックを採掘するマイナーをアルゴリズムが選択する時である。短期的な期限は、彼らがデータを所有していることを保証します。
WindowPoSt:繰り返し行われるチャレンジで、マイナーは要求された通りにデータを維持した証明を提出する。提出されたときだけデータを封印することは、採掘者にとってより高価になる。
隔離はProof-of-Repplicationアルゴリズムの一部であり、計算集約的であるため、合理的な採掘者は隔離の必要性を最小限にしたいと考えます。
複製証明
隔離は複製証明アルゴリズムの一部であり、計算集約的であるため、採掘者に隔離の頻度を減らすよう促します。レプリケーションの証明は、ユーザーである採掘者が物理的ハードウェア上に一意のコピーを作成し、保存していることを保証します。この証明には以下が含まれます:
データそのもの
データを封印した採掘者
封印の日時
データ封印時のブロックの高さ

マイナーに2種類の証明を生成させることで、ユーザーにファイルの安全なストレージを提供し、実際にストレージを提供したマイナーのみが報酬を得ることができます。証明はチェーン上に載せるには大きすぎるため、マイナーはゼロ知識簡潔非対話的知識引数(zkSNARK)を生成してチェーンに提出し、Filecoinを最大のzkSNARKユーザーにして、1日あたり600万から700万の証明を生成しています。
全体として、Filecoinはハイブリッドなアプローチで決定論的証明(PoRep)と確率論的証明(PoSt)を組み合わせています。
Celestia
この記事の3つ目の例はCelestiaで、いわゆるデータアベイラビリティブロックチェーンです。
イーサロールアップの台頭により、Celestiaのようなデータアベイラビリティソリューションは、ロールアップトランザクションデータを保存するためのイーサアーカイブノードの安価な代替手段を提供することで人気を博しています。
データ可用性の実証
ファイルコインとは異なり、Celestiaはエンドユーザーにストレージソリューションを提供するのではなく、データ可用性の問題を解決することに焦点を当てています。データの可用性は、ブロックチェーンのデータが正しく公開されていることを保証します。通常、ブロックチェーンノードは可用性を検証するためにブロック全体をダウンロードする必要があり、これは検証の妨げとなるリソース集約的なプロセスです。
このプロセスを簡素化するために、Celestiaはデータ可用性サンプリング(DAS)を使用しています。この方法は、あらかじめ決められた信頼レベルに達するまで、ライトノードがデータの一部のみをダウンロードすることを含みます。サンプルのデータがすべて利用可能であれば、データの可用性を確率的に証明するものとして、データがリリースされたとみなされます。
提案者はデータのブロックを作成します。
ブロックデータをk×k個のブロックに分割し、行列を形成する。
パリティデータを追加してこの行列を拡張すると、リードソロモン符号化を使って2k×2kの行列が作成される。このタイプのエンコーディングでは、データのサブセットからデータセット全体を復元することができます。
展開された行列の各行と各列について、独立したメルケル根を計算し、結合します。
最後に、これらすべての結合根のメルケル根をブロックヘッダのブロックデータコミットメントに追加し、データの利用可能性を確認します。

可用性を確認するために、ライトノードは展開行列で一意の座標をランダムに引き、その座標に対応するメルクル証明データのブロックをフルノードに問い合わせます。応答が正しければ、データのブロック全体が利用可能である可能性が高い。
その後、ノードは受信したデータブロックを正しいMerkle証明とともにネットワークの残りの部分にブロードキャストします。十分なサンプリングがあれば、ノードはブロック全体を再構築することができるため、Celestiaは検証のためにリソースが限られたノードにより依存することができ、分散化に貢献します。
本稿執筆時点では、Celestiaはまだ非常に新しいものです。しかし、データ可用性サンプリングはCelestia以外でも採用される可能性のある技術であり、EtherCoreの開発者はスケールを助けるためにプロトコルに追加することを議論している。
結論
要約すると、分散ネットワークにおけるデータの保存と可用性の検証のためのさまざまな方法が機能しており、活発に使用されています。
TagionはDARTデータベースを使用しており、スループットを向上させ、疎なMerkleツリーで保護された特殊なサブエコシステムの開発をサポートするためにシャーディングされています。
Filecoinのアーキテクチャは、2つの異なるアルゴリズム、プルーフ・イン・タイムとプルーフ・オブ・レプリケーションを利用し、採掘者がデータを確実に保存していることを検証・証明できるようにしています。これらの証明は、ゼロ知識証明という形でチェーン上に記録されます。
Celestiaはデータの可用性レイヤーとして機能し、リードソロモン符号化を利用してデータのブロックを行列に展開します。この構造により、ライトクライアントがデータの可用性を確認するためにランダムサンプリングを実行し、データセット全体をダウンロードする必要性を回避することができます。
分散ストレージシステムの状況が進化し続ける中、Tagion、Filecoin、Celestiaはそれぞれ、データの完全性、可用性、アクセス性を確保するための独自の戦略を打ち出しています。これらのプラットフォームはともに、分散型ネットワークをサポートするレジリエントなデータ配信およびストレージシステムの構築に大きく貢献しています。