Параллельный Proof-of-Work с DAG-голосованием и целевым дисконтированием вознаграждений: Анализ и дизайн протокола

1. Введение и обзор

В данной статье представлен новый протокол криптовалюты на основе Proof-of-Work (PoW), который решает ключевые ограничения Bitcoin и его недавнего варианта, Tailstorm. Основная инновация заключается в сочетании консенсуса Параллельного Proof-of-Work (PPoW) с голосованием в стиле DAG и схемой целевого дисконтирования вознаграждений. Протокол призван обеспечить превосходные гарантии согласованности, более высокую пропускную способность транзакций, меньшую задержку подтверждения и повышенную устойчивость к атакам на основе стимулов, таким как эгоистичный майнинг.

Работа мотивирована циклической зависимостью в PoW-системах между алгоритмами консенсуса и схемами стимулирования. Хотя свойства Bitcoin хорошо изучены, многие новые протоколы не имеют тщательного анализа как согласованности, так и стимулов. Tailstorm улучшил Bitcoin, но имел недостатки: его древовидное голосование оставляло некоторые голоса неподтверждёнными, а равномерное дисконтирование вознаграждений наказывало невинных майнеров наряду с нарушителями.

Ключевые идеи

DAG вместо дерева: Структурирование голосов в виде направленного ациклического графа (DAG) вместо дерева позволяет подтверждать больше голосов на блок и обеспечивает точное, целевое наказание.
Целевое дисконтирование: Вознаграждения дисконтируются на основе вклада отдельного голоса в нелинейность (например, создание форков), а не равномерно для всего блока.
Устойчивость к атакам: Поиск атак на основе обучения с подкреплением показывает, что предлагаемый протокол более устойчив к атакам на стимулы, чем как Bitcoin, так и базовый PPoW.
Ключевой вывод: PPoW без дисконтирования вознаграждений может быть менее безопасным, чем Bitcoin, при определённых условиях сети.

2. Основы дизайна протокола

2.1 Основы параллельного Proof-of-Work (PPoW)

PPoW, как было представлено в предыдущих работах, требует, чтобы конфигурируемое число $k$ PoW-«голосов» (или блоков) было добыто, прежде чем можно будет добавить следующий основной блок. Это создаёт параллелизованную структуру блоков. Каждый голос содержит транзакции. Такой дизайн по своей сути обеспечивает более сильные гарантии согласованности, чем линейная цепочка Bitcoin, поскольку финализация блока требует нескольких подтверждающих доказательств.

2.2 От дерева к DAG: структурирование голосов

Tailstorm структурировал эти $k$ голосов как дерево, где каждый новый голос ссылается на одного родителя. Это создаёт дилемму: майнеры должны выбирать, какую ветвь расширять, оставляя некоторые ветви — и их транзакции — неподтверждёнными до следующего блока.

Предлагаемый протокол структурирует голоса как направленный ациклический граф (DAG). Новый голос может ссылаться на несколько предыдущих голосов как на родителей. Это увеличивает связность и позволяет включать больше голосов в набор консенсуса для данного блока, повышая скорость подтверждения транзакций и снижая задержку.

2.3 Механизм целевого дисконтирования вознаграждений

Tailstorm дисконтировал вознаграждения пропорционально глубине дерева голосов, одинаково наказывая всех майнеров в глубоком (нелинейном) дереве. Новый протокол реализует схему целевого дисконтирования. Вознаграждение за голос майнера рассчитывается на основе его конкретной роли в DAG:

$Reward_v = BaseReward \times (1 - \alpha \cdot C_v)$

Где $C_v$ — это мера вклада голоса $v$ в нелинейность или создание форков (например, на сколько конкурирующих голосов он ссылается, которые сами не связаны). Параметр $\alpha$ контролирует силу дисконтирования. Это гарантирует, что наказываются только майнеры, чьи действия напрямую вредят линейности консенсуса.

3. Анализ безопасности и стимулов

3.1 Гарантии согласованности по сравнению с Bitcoin

В статье утверждается, что после 10-минутного окна подтверждения вероятность успешной атаки двойной траты примерно в 50 раз ниже, чем в Bitcoin, при реалистичных предположениях о сети. Это вытекает из требования $k$ голосов в PPoW, что статистически затрудняет атакующему отмену подтверждённого блока.

3.2 Поиск атак с помощью обучения с подкреплением

Значительным методологическим вкладом является использование обучения с подкреплением (RL) для систематического поиска оптимальных стратегий атак против протокола. RL-агент учится манипулировать временем публикации голосов и выбором родителей для максимизации прибыли. Этот подход более строгий, чем анализ ad-hoc атак, и показал, что ванильный PPoW (без дисконтирования) уязвим.

3.3 Устойчивость к атакам на основе стимулов

Комбинация DAG-голосования и целевого дисконтирования создаёт мощный сдерживающий фактор для эгоистичного майнинга. Атаки, связанные с удержанием блоков или созданием форков, становятся менее прибыльными, потому что вознаграждения атакующего напрямую дисконтируются. Анализ на основе RL подтверждает превосходную устойчивость предлагаемого протокола по сравнению с Bitcoin и Tailstorm.

4. Оценка производительности

4.1 Пропускная способность и задержка транзакций

Упаковывая транзакции в каждый из $k$ голосов на блок, протокол достигает более высокой пропускной способности, чем модель Bitcoin с одним блоком на интервал. Структура DAG дополнительно снижает задержку, позволяя подтверждать больше голосов (и, следовательно, их транзакций) в текущем блоке, а не откладывать их.

4.2 Сравнение с Tailstorm

Статья напрямую затрагивает два недостатка Tailstorm: 1) Неподтверждённые голоса: DAG смягчает это, позволяя ссылаться на нескольких родителей. 2) Коллективное наказание: Целевое дисконтирование заменяет равномерное наказание по глубине дерева. В результате получается протокол, сохраняющий преимущества Tailstorm, но преодолевающий его слабости.

5. Технические детали и математическая формулировка

Функция дисконтирования вознаграждений является центральной. Пусть $G$ — это DAG голосов для блока. Для голоса $v \in G$ определим его «оценку конфликта» $C_v$. Одна из предлагаемых мер:

$C_v = \frac{|\text{Несвязанные родители}(v)|}{|\text{Все родители}(v)| + \epsilon}$

Где «Несвязанные родители» — это родительские голоса, которые сами не связаны по предкам. Высокий $C_v$ указывает, что $v$ ссылается на конфликтующие ветви, увеличивая нелинейность. Итоговое вознаграждение дисконтируется на эту оценку. Цель RL-агента — изучить политику $\pi$, которая максимизирует совокупное дисконтированное вознаграждение $\sum \gamma^t R_t$, где $R_t$ — это (потенциально дисконтированное) вознаграждение от публикации голоса в момент времени $t$ с определённым выбором родителей.

6. Результаты экспериментов и выводы

Вероятно, статья включает симуляции, сравнивающие вероятность успеха атак и прибыльность для Bitcoin, Tailstorm, базового PPoW и предлагаемого DAG-PPoW с целевым дисконтированием. Ключевые ожидаемые результаты, представленные в графиках или таблицах, показали бы:

График 1: Вероятность двойной траты в зависимости от времени подтверждения: График, показывающий, что кривая предлагаемого протокола падает гораздо быстрее, чем у Bitcoin.
График 2: Относительный доход атакующего: Гистограмма, сравнивающая доход атакующего с оптимизацией RL при разных протоколах. Столбец DAG-PPoW должен быть самым низким, возможно, даже ниже 1.0 (честный майнинг).
График 3: Скорость подтверждения транзакций: Показывает процент транзакций, подтверждённых в первом блоке, подчёркивая преимущество DAG перед древовидной структурой.

Ключевой вывод: Эксперименты, предположительно, подтверждают поразительное заявление статьи: «Параллельный proof-of-work без дисконтирования вознаграждений менее устойчив к атакам на стимулы, чем Bitcoin, в некоторых реалистичных сценариях сети». Это подчёркивает абсолютную необходимость сочетания новых механизмов консенсуса с тщательно разработанными схемами стимулирования.

7. Фреймворк анализа: пример

Сценарий: Майнер (M) контролирует 25% хешрейта сети и хочет выполнить атаку эгоистичного майнинга.

В Bitcoin/Tailstorm: M удерживает найденный блок, чтобы создать приватный форк. В случае успеха M может сделать честные блоки сиротами и получить непропорционально большое вознаграждение. RL-агент изучил бы эту стратегию.

В DAG-PPoW с целевым дисконтированием:

M находит голос $V_m$. Чтобы начать атаку, M удерживает $V_m$ и позже публикует его, ссылаясь на несколько старых, конфликтующих голосов, чтобы попытаться создать доминирующий форк.
Протокол анализирует DAG. $V_m$ имеет высокий $C_v$, потому что ссылается на несвязанные голоса, намеренно увеличивая нелинейность.
Вознаграждение $V_m$ сильно дисконтируется: $Reward_{V_m} = BaseReward \times (1 - \alpha \cdot 0.8)$.
Даже если форк M победит, дисконтированное вознаграждение делает атаку менее прибыльной, чем честный майнинг. RL-агент учится избегать этой стратегии.

Этот пример показывает, как механика протокола напрямую изменяет расчёт прибыли атакующего.

8. Будущие применения и направления исследований

Гибридные модели консенсуса: Концепция DAG-PPoW может быть интегрирована с другими механизмами консенсуса, такими как Proof-of-Stake (PoS) или делегированные системы, для создания многоуровневых моделей безопасности.
Динамическая корректировка параметров: Будущая работа может исследовать возможность сделать $k$ (количество голосов) и $\alpha$ (сила дисконтирования) динамическими, корректируя их на основе состояния сети и наблюдаемых паттернов атак.
Применение в других областях: Основная идея использования структуры графа для атрибуции и наказания «плохого поведения» может быть применена за пределами блокчейна — в консенсусе распределённых баз данных и системах совместного обнаружения сбоев.
Формальная верификация: Критическим следующим шагом является формальная верификация свойств безопасности и живости протокола с использованием таких инструментов, как TLA+ или Coq, следуя прецеденту, установленному строгими анализами протоколов вроде Tendermint.
Проблемы развёртывания в реальном мире: Необходимы исследования по начальной загрузке, поддержке лёгких клиентов и поведению протокола при экстремальном разделении сети (сценарии «split-brain»).

9. Ссылки

Nakamoto, S. (2008). Bitcoin: A Peer-to-Peer Electronic Cash System.
Garay, J., Kiayias, A., & Leonardos, N. (2015). The Bitcoin Backbone Protocol: Analysis and Applications. EUROCRYPT.
Sompolinsky, Y., & Zohar, A. (2016). Bitcoin’s Security Model Revisited. arXiv:1605.09193.
Eyal, I., & Sirer, E. G. (2014). Majority is not Enough: Bitcoin Mining is Vulnerable. Financial Cryptography.
[Tailstorm Reference] — Конкретная ссылка на Tailstorm из PDF.
[Parallel Proof-of-Work Reference] — Конкретная ссылка на PPoW из PDF.
Sutton, R. S., & Barto, A. G. (2018). Reinforcement Learning: An Introduction. MIT Press. (Для методологии RL).
Buchman, E., Kwon, J., & Milosevic, Z. (2018). The Latest Gossip on BFT Consensus. arXiv:1807.04938. (Для сравнения с BFT-протоколами).

10. Экспертный анализ и критический обзор

Основная идея

Эта статья — не просто очередное постепенное улучшение Proof-of-Work; это точечный удар по фундаментальной петле «стимулы-консенсус», которая мучает дизайн блокчейна. Авторы правильно определяют, что большинство «улучшенных» протоколов терпят неудачу, потому что они оптимизируют живость или пропускную способность в вакууме, игнорируя, как эти изменения искажают экономику майнеров. Их ключевая идея заключается в том, что безопасность — это не свойство одного лишь алгоритма консенсуса, а его тесная связь с системой наказаний, которая может точно определить вину. Переход от дерева Tailstorm к DAG — это не вопрос эффективности, а создание той детализации, которая необходима для целевого наказания.

Логика изложения

Аргументация выстроена безупречно: 1) Ограничения Bitcoin хорошо известны, 2) Tailstorm добился прогресса, но создал новые проблемы (грубое наказание, отложенные подтверждения), 3) Следовательно, нам нужна структура (DAG), которая предоставляет более детальные данные о поведении майнеров, и 4) Мы должны использовать эти данные для введения точечных сдерживающих мер. Использование обучения с подкреплением для стресс-тестирования предложения особенно элегантно. Это отражает то, как действуют реальные атакующие — не следуя статичным сценариям, а адаптивно ища прибыль — и, таким образом, обеспечивает более реалистичную оценку безопасности, чем традиционные вероятностные модели. Шокирующий вывод о том, что ванильный PPoW может быть менее безопасным, чем Bitcoin, свидетельствует о ценности этого метода; он выявляет скрытые векторы атак.

Сильные стороны и недостатки

Сильные стороны: Концептуальная основа прочна. Механизм DAG+целевое дисконтирование элегантен и решает явные недостатки предыдущих работ. Методологическая строгость (поиск атак на основе RL) задаёт новый стандарт для оценки криптоэкономики. Статья также полезно демистифицирует часто переоцениваемый термин «DAG», применяя его к конкретной, измеримой цели в контексте PoW, в отличие от более спекулятивных проектов на основе DAG.

Недостатки и открытые вопросы: Слон в комнате — это сложность. Протокол требует от майнеров и узлов поддерживать и анализировать DAG, вычислять оценки конфликтов и применять индивидуальные дисконты. Это увеличивает вычислительные и имплементационные накладные расходы по сравнению с прекрасной простотой Bitcoin. Также существует риск того, что параметры дисконтирования ($\alpha$) станут источником конфликтов управления. Кроме того, как и во многих академических предложениях, анализ, вероятно, предполагает несколько рационального, максимизирующего прибыль майнера. Он не полностью рассматривает византийских акторов, чья цель — нарушение работы, а не прибыль — модель угроз, рассматриваемая в традиционной BFT-литературе, например, у Кастро и Лискова (1999).

Практические выводы

Для дизайнеров протоколов: Анализ стимулов не подлежит обсуждению. Любое изменение консенсуса должно моделироваться с помощью таких инструментов, как RL, чтобы выявить извращённые стимулы. Вывод о том, что «PPoW менее безопасен, чем Bitcoin», должен стать тревожным звонком. Для разработчиков: Паттерн «DAG для подотчётности» — мощный инструмент, который стоит исследовать в других контекстах консенсуса, возможно, даже в шардированных архитектурах или сетях второго уровня. Для исследовательского сообщества: Эта работа подчёркивает острую необходимость в стандартизированных, открытых RL-фреймворках для атак на криптоэкономику, аналогичных бенчмарк-наборам данных в сообществе ИИ. Наконец, главный вывод заключается в том, что безопасность блокчейна переходит от чистой криптографии к гибридной дисциплине, объединяющей криптографию, теорию игр и машинное обучение. Будущие безопасные системы потребуют экспертизы во всех трёх областях.