监控

Conduit 发布 Degen Chain 宕机事件报告:已改进对 Orbit 链的警报与监控

ChainCatcher 消息,Conduit 发布有关 Degen Chain 此前宕机事件的事后分析报告,5 月 10 日,Conduit 将 Degen 和 Proof of Play Apex 的 batch 大小增加到 10MB,以降低成本,这延迟了数据从这些网络批量发布到其母链的时间。 5 月 12 日,这个配置被恢复为修复批量发布。这导致了两个网络上的重组,因为在 24 小时强制包含窗口之后发布了 batch。Arbitrum Nitro 将在批处理中的任何交易之前插入任何 inbox 消息,并使用新的时间戳重播这些交易。 重组后,由于其深度没有被 geth 很好地处理,节点会带着损坏的数据库回来。这就需要从 genesis 重新同步数据目录。每个网络的同步时间超过 40 小时,重放率约为 100M gas/s。 一旦节点被重新同步,Conduit 就会尝试各种交易重放方案,尽管并非所有交易都能够恢复,因为有些交易依赖于精确的时间戳。 在与每个 rollup 团队协商后,Conduit 讨论并并行尝试各种策略,以使网络在线并恢复重组前的状态。 Degen Chain 网络瘫痪 54 小时后恢复上线。Proof of Play 的 Apex 链大约在同一时间被恢复,但在之后实施了另一种恢复方案后,才可供公众使用。 Conduit 称,已改进了对 Orbit 链的警报和监控,以覆盖这种情况,并致力于与 Offchain Labs 合作,提高所有 Orbit 链运营商的可观察性。团队将继续投资和研究机制,以便在测试环境中更好地模拟主网条件和交易有效负载。 Degen Chain Explorer 已正常显示 Degen Chain 最新状态。
ChainCatcher 与创新者共建Web3世界