2.1 並列Proof-of-Work (PPoW) の基礎
先行研究で導入されたPPoWは、次のメインブロックを追加する前に、設定可能な数 $k$ のPoW「投票」(またはブロック)をマイニングすることを要求する。これにより並列化されたブロック構造が生まれる。各投票はトランザクションを含む。この設計は、ブロックの確定に複数の支持証明を必要とするため、Bitcoinの直鎖状チェーンよりも本質的に強力な一貫性保証を提供する。
本論文は、Bitcoinおよびその最近の亜種であるTailstormの主要な限界に対処する、新規のProof-of-Work (PoW) 暗号通貨プロトコルを提案する。中核となる革新は、並列Proof-of-Work (PPoW) コンセンサスとDAG型投票、そしてターゲット報酬割引スキームを組み合わせた点にある。本プロトコルは、優れた一貫性保証、高いトランザクションスループット、低い確定レイテンシ、およびセルフィッシュマイニングのようなインセンティブベースの攻撃に対する強化された耐性を提供することを目的としている。
本研究は、PoWシステムにおけるコンセンサスアルゴリズムとインセンティブスキームの間の循環依存関係に動機づけられている。Bitcoinの特性はよく理解されているが、多くの新しいプロトコルは一貫性とインセンティブの両方に関する徹底的な分析を欠いている。TailstormはBitcoinを改善したが、欠点があった:そのツリー構造の投票では一部の投票が未確定のまま残り、均一な報酬割引は加害者とともに無実のマイナーも罰していた。
先行研究で導入されたPPoWは、次のメインブロックを追加する前に、設定可能な数 $k$ のPoW「投票」(またはブロック)をマイニングすることを要求する。これにより並列化されたブロック構造が生まれる。各投票はトランザクションを含む。この設計は、ブロックの確定に複数の支持証明を必要とするため、Bitcoinの直鎖状チェーンよりも本質的に強力な一貫性保証を提供する。
Tailstormはこれらの $k$ 個の投票をツリーとして構造化し、各新しい投票は単一の親を参照していた。これによりジレンマが生じる:マイナーはどのブランチを延長するかを選択しなければならず、一部のブランチとそのトランザクションは次のブロックまで未確定のまま残される。
提案プロトコルは投票を有向非巡回グラフ (DAG) として構造化する。新しい投票は複数の過去の投票を親として参照できる。これにより接続性が増し、特定のブロックに対してより多くの投票をコンセンサスセットに含めることが可能になり、トランザクション確定率が向上し、レイテンシが低減される。
Tailstormは投票ツリーの深さに比例して報酬を割り引き、深い(非線形な)ツリー内のすべてのマイナーを均等に罰していた。新プロトコルはターゲット割引スキームを実装する。マイナーの投票に対する報酬は、DAG内でのその特定の役割に基づいて計算される:
$Reward_v = BaseReward \times (1 - \alpha \cdot C_v)$
ここで、$C_v$ は投票 $v$ が非線形性やフォーク生成に与えた貢献度の尺度である(例:互いに接続されていない競合する投票をどれだけ参照しているか)。パラメータ $\alpha$ は割引の強度を制御する。これにより、コンセンサスの直線性を直接損なう行動をとったマイナーのみが罰せられることが保証される。
本論文は、現実的なネットワーク仮定の下で、10分の確定ウィンドウ後における二重支払い攻撃の成功確率が、Bitcoinと比較して約50倍低いと主張している。これは、PPoWにおける $k$ 投票要件に起因し、攻撃者が確定済みブロックを覆すことを統計的に困難にしている。
重要な方法論的貢献は、プロトコルに対する最適な攻撃戦略を体系的に探索するために強化学習 (RL) を使用した点である。RLエージェントは、利益を最大化するために投票の公開タイミングと親選択を操作することを学習する。このアプローチはアドホックな攻撃分析よりも厳密であり、割引なしのバニラPPoWが脆弱であることを明らかにした。
DAG投票とターゲット割引の組み合わせは、セルフィッシュマイニングに対する強力な抑止力を生み出す。ブロックの保留やフォークの作成を含む攻撃は、攻撃者の報酬が直接割り引かれるため、収益性が低くなる。RLベースの分析は、提案プロトコルがBitcoinおよびTailstormの両方と比較して優れた耐性を持つことを確認している。
ブロックあたりの $k$ 個の各投票にトランザクションを詰め込むことで、本プロトコルはBitcoinのインターバルあたり単一ブロックモデルよりも高いスループットを達成する。DAG構造は、より多くの投票(したがってそれらのトランザクション)を現在のブロックで確定させ、先送りにされることを防ぐことで、レイテンシをさらに低減する。
本論文はTailstormの2つの欠点に直接対応している:1) 未確定投票: DAGは複数の親参照を可能にすることでこれを緩和する。2) 集団罰則: ターゲット割引が均一なツリー深さによる罰則に取って代わる。結果として、Tailstormの利点を保持しつつその弱点を克服するプロトコルが得られる。
報酬割引関数が中心である。ブロックに対する投票のDAGを $G$ とする。投票 $v \in G$ に対して、その「競合スコア」 $C_v$ を定義する。提案される一つの尺度は以下の通り:
$C_v = \frac{|\text{未接続親}(v)|}{|\text{全親}(v)| + \epsilon}$
ここで「未接続親」とは、それ自体が祖先リンクで結ばれていない親投票である。高い $C_v$ は、$v$ が競合するブランチを参照しており、非線形性を増加させていることを示す。最終報酬はこのスコアによって割り引かれる。RLエージェントの目的は、累積割引報酬 $\sum \gamma^t R_t$ を最大化する方策 $\pi$ を学習することであり、ここで $R_t$ は特定の親選択を行って時刻 $t$ に投票を公開することによる(潜在的には割引された)報酬である。
本論文には、Bitcoin、Tailstorm、基本的なPPoW、および提案するターゲット割引付きDAG-PPoWにおける攻撃成功率と収益性を比較するシミュレーションが含まれていると考えられる。図表で示される予想される主要な結果は以下の通り:
重要な発見: 実験はおそらく、本論文の衝撃的な主張、すなわち「報酬割引なしの並列proof-of-workは、一部の現実的なネットワークシナリオにおいて、Bitcoinよりもインセンティブ攻撃に対する耐性が低い」という主張を裏付けていると考えられる。これは、新しいコンセンサスメカニズムを注意深く設計されたインセンティブスキームと組み合わせることの絶対的必要性を強調している。
シナリオ: ネットワークハッシュレートの25%を支配するマイナー (M) が、セルフィッシュマイニング攻撃を実行したいと考えている。
Bitcoin/Tailstormの場合: Mは見つけたブロックを保留し、プライベートフォークを作成する。成功すれば、Mは正直なブロックをオーファンにし、不均衡な報酬を請求できる。RLエージェントはこの戦略を学習する。
ターゲット割引付きDAG-PPoWの場合:
この事例は、プロトコルのメカニズムがどのように攻撃者の利益計算を直接変化させるかを示している。
本論文は、単なるProof-of-Workに対する漸進的な改良ではない。それは、ブロックチェーン設計を悩ませる根本的なインセンティブ-コンセンサスループに対する外科的ストライクである。著者らは、ほとんどの「改良された」プロトコルが、それらの変更がマイナーの経済をどのように歪めるかを無視して、活性やスループットだけを真空状態で最適化するために失敗することを正しく特定している。彼らの重要な洞察は、セキュリティがコンセンサスアルゴリズム単独の特性ではなく、責任を正確に帰属させることができる罰則システムとの緊密な結合の特性であるということだ。TailstormのツリーからDAGへの移行は、効率性に関するものではない——それは、ターゲットを絞った罰則に必要な法医学的細分性を作り出すことに関するものだ。
議論は完璧に構築されている:1) Bitcoinの限界はよく知られている、2) Tailstormは進歩を遂げたが新たな問題(鈍い罰則、確定の遅延)を導入した、3) したがって、マイナーの行動に関するより細かいデータを提供する構造(DAG)が必要であり、4) そのデータを使用して外科的な抑止措置を実施しなければならない。提案をストレステストするために強化学習を使用することは特に優れている。それは、現実世界の攻撃者がどのように動作するか——静的なスクリプトに従うのではなく、適応的に利益を探し求める——を反映しており、従来の確率モデルよりも現実的なセキュリティ評価を提供する。バニラPPoWがBitcoinよりも安全性が低い可能性があるという衝撃的な発見は、この方法の価値を証明するものであり、隠れた攻撃面を暴露する。
強み: 概念的フレームワークは堅牢である。DAG+ターゲット割引メカニズムは優雅であり、先行技術の明確な欠点に対処している。方法論的厳密性(RLベースの攻撃探索)は、暗号経済学を評価するための新たな標準を設定する。また、本論文は、より投機的なDAGベースのプロジェクトとは異なり、PoWコンテキスト内で特定の測定可能な目的にそれを適用することで、しばしば過大評価されがちな「DAG」という用語を有益に解明している。
欠点と未解決の問題: 部屋の中の象は複雑さである。本プロトコルは、マイナーとノードがDAGを維持・分析し、競合スコアを計算し、カスタム割引を適用することを要求する。これは、Bitcoinの美しいシンプルさと比較して、計算および実装のオーバーヘッドを増加させる。また、割引パラメータ($\alpha$)がガバナンス対立の源となるリスクもある。さらに、多くの学術的提案と同様に、分析はおそらく、ある程度合理的で利益最大化を図るマイナーを想定している。利益ではなく破壊を目的とするビザンチンアクター——CastroとLiskov (1999) のような従来のBFT文献で考慮される脅威モデル——に完全に対処していない。
プロトコル設計者にとって:インセンティブ分析は必須である。 あらゆるコンセンサスの変更は、RLのようなツールでモデル化され、逆説的なインセンティブを明らかにしなければならない。「PPoWはBitcoinよりも安全性が低い」という発見は警鐘となるべきだ。開発者にとって:責任帰属のためのDAGパターンは、シャーディングアーキテクチャやレイヤー2ネットワークなど、他のコンセンサスコンテキストでも探求する価値のある強力なツールである。研究コミュニティにとって:この研究は、AIコミュニティがベンチマークデータセットを持っているのと同様に、暗号経済学を攻撃するための標準化されたオープンソースRLフレームワークの緊急の必要性を強調している。最後に、最大の要点は、ブロックチェーンセキュリティが純粋な暗号学から、暗号学、ゲーム理論、機械学習のハイブリッド分野へと移行していることだ。将来の安全なシステムは、これら3つすべての専門知識を必要とするだろう。