Shoal框架大幅降低Aptos鏈上Bullshark延遲 提升40-80%

Shoal框架:如何降低Aptos上的Bullshark延遲?

概述

  1. Aptos labs解決了DAG BFT中兩個重要的開放問題,顯著減少了延遲,並首次消除了確定性實際協議中對超時的需求。總體上,在無故障情況下將Bullshark的延遲改進了40%,在故障情況下改進了80%。

  2. Shoal是一個框架,通過流水線和領導者聲譽來增強任何基於Narwhal的共識協議(如DAG-Rider、Tusk、Bullshark)。流水線通過每輪引入一個錨點來減少DAG排序延遲,領導者聲譽通過確保錨點與最快的驗證節點關聯來進一步改善延遲問題。此外,領導者聲譽使Shoal可以利用異步DAG構造來消除所有場景中的超時。這使Shoal能提供普遍響應的屬性,包含了通常需要的樂觀響應。

  3. 這項技術非常簡單,涉及按順序依次運行底層協議的多個實例。因此,當用Bullshark實例化時,我們得到一羣正在進行接力賽的"鯊魚"。

萬字詳解Shoal框架:如何減少Aptos上的Bullshark延遲?

動機

在追求區塊鏈網路高性能時,一直關注降低通信復雜性。然而,這種方法並未導致吞吐量顯著提高。例如,早期版本Diem中實現的Hotstuff僅實現了3500 TPS,遠低於100k+ TPS的目標。

近期突破源於認識到數據傳播是基於領導者協議的主要瓶頸,可從並行化中受益。Narwhal系統將數據傳播與核心共識邏輯分離,提出一種架構,所有驗證者同時傳播數據,而共識組件僅訂購少量元數據。Narwhal論文報告了160,000 TPS的吞吐量。

之前介紹了Quorum Store,將數據傳播與共識分離,以及如何使用它來擴展當前共識協議Jolteon。Jolteon是基於領導者的協議,結合Tendermint的線性快速路徑和PBFT風格的視圖更改,可將Hotstuff延遲降低33%。然而,基於領導者的共識協議無法充分利用Narwhal的吞吐量潛力。盡管將數據傳播與共識分開,隨着吞吐量增加,Hotstuff/Jolteon的領導者仍受限制。

因此,決定在Narwhal DAG之上部署Bullshark,一種零通信開銷的共識協議。不幸的是,與Jolteon相比,支持Bullshark高吞吐量的DAG結構帶來了50%的延遲代價。

本文介紹Shoal如何大幅減少Bullshark延遲。

萬字詳解Shoal框架:如何減少Aptos上的Bullshark延遲?

DAG-BFT背景

Narwhal DAG中每個頂點都與輪數相關聯。爲進入第r輪,驗證者必須先獲得屬於第r-1輪的n-f個頂點。每個驗證者每輪可廣播一個頂點,每個頂點至少引用前一輪的n-f個頂點。由於網路異步性,不同驗證者可能在任何時間點觀察到DAG的不同本地視圖。

DAG的一個關鍵屬性是無歧義性:如果兩個驗證節點在DAG本地視圖中具有相同頂點v,則它們具有完全相同的v因果歷史。

萬字詳解Shoal框架:如何減少Aptos上的Bullshark延遲?

總順序

可在無額外通信開銷的情況下就DAG中所有頂點的總順序達成一致。爲此,DAG-Rider、Tusk和Bullshark中的驗證者將DAG結構解釋爲一種共識協議,頂點代表提案,邊代表投票。

雖然DAG結構上的羣體交集邏輯不同,但所有現有基於Narwhal的共識協議都具有以下結構:

  1. 預定錨點:每隔幾輪(如Bullshark中的兩輪)就有預先確定的領導者,其頂點稱爲錨點。

  2. 排序錨點:驗證者獨立但確定性地決定訂購哪些錨點以及跳過哪些。

  3. 排序因果歷史:驗證者逐個處理有序錨點列表,對每個錨點,通過確定性規則對其因果歷史中所有先前無序頂點進行排序。

滿足安全性的關鍵是確保在步驟(2)中,所有誠實驗證節點創建有序錨點列表,使所有列表共享相同前綴。在Shoal中,對上述所有協議做出以下觀察:

所有驗證者都同意第一個有序錨點。

Bullshark延遲

Bullshark的延遲取決於DAG中有序錨點之間的輪數。雖然Bullshark最實用的部分同步版本比異步版本延遲更好,但遠非最佳。

問題1:平均塊延遲。在Bullshark中,每個偶數輪都有錨點,每個奇數輪的頂點被解釋爲投票。常見情況下,需要兩輪DAG才能訂購錨點,然而,錨點因果歷史中的頂點需要更多輪次等待錨點被排序。常見情況下,奇數輪中頂點需要三輪,偶數輪中非錨點頂點需要四輪。

問題2:故障案例延遲,上述延遲分析適用於無故障情況,另一方面,如果一輪領導者未能足夠快廣播錨點,則無法對錨點排序(因此被跳過),前幾輪所有未排序頂點必須等待下一個錨點被排序。這顯著降低了地理復制網路的性能,特別是因爲Bullshark使用超時等待領導者。

萬字詳解Shoal框架:如何減少Aptos上的Bullshark延遲?

Shoal框架

Shoal解決了這兩個延遲問題,它通過流水線增強了Bullshark(或任何其他基於Narwhal的BFT協議),允許每輪都有錨點,並將DAG中所有非錨點頂點的延遲減少到三輪。Shoal還在DAG中引入了零開銷領導者聲譽機制,這使得選擇偏向於快速領導者。

挑戰

DAG協議背景下,流水線和領導者聲譽被認爲是困難問題,原因如下:

  1. 以前的流水線試圖修改核心Bullshark邏輯,但這從本質上講似乎是不可能的。

  2. 領導者聲譽在DiemBFT中引入並在Carousel中正式化,是根據驗證者過去表現動態選擇未來領導者(Bullshark中的錨)的想法。雖然在領導者身分上存在分歧不違反這些協議安全性,但在Bullshark中可能導致完全不同的排序,這引出問題核心,即動態和確定性地選擇輪錨是解決共識所必需的,而驗證者需要就有序歷史達成一致以選擇未來錨。

作爲問題難度的證據,Bullshark的實現,包括目前生產環境中的實現,都不支持這些特性。

協議

盡管存在上述挑戰,但解決方案隱藏在簡單背後。

在Shoal中,我們依靠在DAG上執行本地計算的能力,並實現了保存和重新解釋前幾輪信息的能力。憑藉所有驗證者都同意第一個有序錨點的核心洞察力,Shoal按順序組合多個Bullshark實例對它們進行流水線處理,使得(1)第一個有序錨點是實例的切換點,以及(2)錨點的因果歷史用於計算領導者的聲譽。

萬字詳解Shoal框架:如何減少Aptos上的Bullshark延遲?

流水線

與Bullshark類似,驗證者先驗地就潛在錨點達成一致,即有一個已知映射F:R -> V將輪次映射到領導者。Shoal一個接一個地運行Bullshark的實例,這樣對於每個實例,錨由映射F預先確定。每個實例都訂購一個錨,這會觸發切換到下一個實例。

最初,Shoal在DAG第一輪啓動Bullshark第一個實例並運行它直到確定第一個有序錨點,比如在第r輪。所有驗證者都同意這個錨點。因此,所有驗證者都可以確定地同意從第r+1輪開始重新解釋DAG。Shoal只是在第r+1輪啓動了新的Bullshark實例。

在最好情況下,這允許Shoal在每輪都訂購一個錨。第一輪的錨點按第一個實例排序。然後,Shoal在第二輪開始新實例,它本身有錨點,該錨由該實例排序,然後,另一個新實例在第三輪中訂購錨點,然後該過程繼續。

萬字詳解Shoal框架:如何減少Aptos上的Bullshark延遲?

領導者聲譽

在Bullshark排序期間跳過錨點時,延遲會增加。在這種情況下,流水線技術無能爲力,因爲在前一個實例訂購錨點之前無法啓動新實例。Shoal通過使用聲譽機制根據每個驗證節點最近活動歷史爲每個驗證節點分配分數來確保將來不太可能選擇相應領導者來處理丟失的錨點。響應並參與協議的驗證者將獲得高分,否則,驗證節點將被分配低分,因爲它可能崩潰、緩慢或作惡。

其理念是在每次分數更新時,確定性地重新計算從回合到領導者的預定義映射F,偏向於得分較高的領導者。爲讓驗證者在新映射上達成一致,他們應該在分數上達成一致,從而在用於派生分數的歷史上達成一致。

在Shoal中,流水線和領導聲譽可以自然結合,因爲它們都使用相同的核心技術,即在就第一個有序錨點達成一致後重新解釋DAG。

事實上,唯一區別是,在第r輪中對錨點排序後,驗證者只需根據第r輪中有序錨點的因果歷史,從第r+1輪開始計算新的映射F'。然後,驗證節點從第r+1輪開始使用更新的錨點選擇函數F'執行Bullshark的新實例。

萬字詳解Shoal框架:如何減少Aptos上的Bullshark延遲?

沒有更多超時

超時在所有基於領導者的確定性部分同步BFT實現中起着至關重要的作用。然而,它們引入的復雜性增加了需要管理和觀察的內部狀態數量,這增加了調試過程的復雜性,並且需要更多的可觀察性技術。

超時也會顯著增加延遲,因爲適當地配置它們非常重要,並且通常需要動態調整,因爲它高度依賴於環境(網路)。在轉移到下一個領導者之前,該協議會爲有故障的領導者支付完整的超時延遲懲罰。因此,超時設置不能過於保守,但如果超時時間太短,協議可能會跳過好的領導者。例如,我們觀察到,在高負載情況下,Jolteon/Hotstuff中的領導者不堪重負,並且在他們推動進展之前超時就已到期。

不幸的是,基於領導者的協議(如Hotstuff和Jolteon)本質上需要超時,以確保每次領導者出現故障時協議都能取得進展。如果沒有超時,即使是崩潰的領導者也可能永遠停止協議。由於在異步期間無法區分有故

APT3.21%
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 6
  • 分享
留言
0/400
虚拟土豪梦vip
· 07-25 11:15
延迟降这么多 aptos要起飞了
回復0
CoffeeNFTsvip
· 07-22 19:02
这延迟降低有点香啊
回復0
RugDocDetectivevip
· 07-22 19:01
太牛了 等了好久Aptos方案终于出来啦
回復0
RuntimeErrorvip
· 07-22 19:00
aptos这新花样到底行不行
回復0
倒霉蛋验证者vip
· 07-22 18:58
延迟高的日子总算到头了 麻了大半年
回復0
快照自动机vip
· 07-22 18:56
速度提高就是牛批啊
回復0
交易,隨時隨地
qrCode
掃碼下載 Gate APP
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)