Hai năm rưỡi trước, trong "Endgame" bài viết, tôi đã đề cập rằng các con đường phát triển khác nhau trong tương lai của blockchain có vẻ rất giống nhau từ quan điểm kỹ thuật. Trong cả hai trường hợp, có một số lượng lớn giao dịch trên chuỗi và việc xử lý các giao dịch này đòi hỏi: (1) tính toán nhiều; (2) rất nhiều băng thông dữ liệu.
Một nút Ethereum thông thường (chẳng hạn như nút lưu trữ reth 2 TB đang chạy trên máy tính của tôi hiện nay) không thể xác minh trực tiếp lượng dữ liệu và tính toán khổng lồ được yêu cầu, ngay cả với khả năng kỹ thuật phần mềm mạnh mẽ và cây Verkle. Thay vào đó, ở cả "phân đoạn L1" và các giải pháp tập trung vào tổng hợp, ZK-SNARK được sử dụng để xác minh tính toán và DAS được sử dụng để xác minh tính khả dụng của dữ liệu. Cho dù đó là phân đoạn L2 hay Rollups, DAS đều giống nhau và công nghệ của ZK-SNARK cũng giống hệt nhau. Chúng vừa là mã hợp đồng thông minh vừa là một tính năng giao thức. Từ góc độ kỹ thuật thực sự, Ethereum là sharding và Rollups là shard.
Điều này tự nhiên đặt ra một câu hỏi: sự khác biệt giữa hai điều này là gì? Một điểm khác biệt là hậu quả của lỗi mã: trong Rollups, mã thông báo bị đánh cắp; trong sharding, sự đồng thuận bị phá vỡ. Tuy nhiên, tôi dự đoán rằng khi giao thức ổn định và công nghệ xác minh chính thức được cải thiện, tác động của lỗi mã sẽ ngày càng nhỏ hơn. Vì vậy, những khác biệt nào khác có thể tồn tại giữa hai giải pháp này và có thể tồn tại lâu dài?
Sự đa dạng của môi trường thực thi
Năm 2019, chúng tôi đã thảo luận về ý tưởng về môi trường thực thi trong Ethereum. Về cơ bản, Ethereum sẽ có các "khu vực" khác nhau. có thể đặt các quy tắc khác nhau cho các tài khoản (bao gồm các phương thức hoàn toàn khác nhau như UTXO), cách hoạt động của máy ảo và các chức năng khác. Điều này sẽ cho phép sự đa dạng về phương pháp trên các phần khác nhau của ngăn xếp, nhưng sẽ khó đạt được nếu Ethereum cố gắng tích hợp nhiều chức năng thành một.
Cuối cùng, chúng tôi đã từ bỏ một số kế hoạch đầy tham vọng hơn và chỉ giữ lại EVM. Tuy nhiên, Ethereum L2 (bao gồm cả bản tổng hợp, xác thực và Plasma) cuối cùng có thể được coi là môi trường thực thi. Hiện tại, chúng tôi thường tập trung vào các L2 tương đương EVM, nhưng điều này bỏ qua sự đa dạng do nhiều phương pháp khác mang lại:
- Arbitrum Stylus, bổ sung một oracle dựa trên WASM thứ hai bên ngoài EVM;
- Nhiên liệu, sử dụng kiến trúc dựa trên UTXO tương tự như Bitcoin (nhưng có nhiều chức năng hơn);
- Aztec, giới thiệu một ngôn ngữ mới và chính thức hóa chương trình tập trung vào các hợp đồng thông minh bảo vệ quyền riêng tư dựa trên ZK-SNARK.
Chúng tôi có thể cố gắng biến EVM thành một siêu máy ảo bao gồm tất cả các hình thức hóa có thể có, nhưng điều này sẽ làm giảm đáng kể hiệu quả của từng chức năng. Sẽ tốt hơn nếu để những nền tảng này làm những gì họ chuyên môn.
Đánh đổi bảo mật: Khả năng mở rộng và tốc độ giao dịch
Ethereum L1 cung cấp sự đảm bảo an ninh rất mạnh mẽ. Nếu dữ liệu trong khối cuối cùng trên L1 được cam kết, toàn bộ sự đồng thuận (bao gồm cả sự đồng thuận xã hội trong các trường hợp cực đoan) sẽ đảm bảo rằng dữ liệu không thể bị thay đổi và mọi hoạt động thực thi được kích hoạt bởi dữ liệu này sẽ không bị hoàn nguyên và dữ liệu vẫn có thể truy cập được. Để đạt được sự đảm bảo an ninh này, Ethereum L1 sẵn sàng chấp nhận chi phí cao.
Tại thời điểm viết bài, phí giao dịch tương đối thấp: Phí lớp 2 chưa đến 1 xu cho mỗi giao dịch và ngay cả trên L1, chuyển khoản ETH cơ bản cũng chưa đến một đô la. Nếu tiến bộ công nghệ đủ nhanh và sự tăng trưởng trong không gian khối sẵn có có thể theo kịp nhu cầu thì những khoản phí này có thể vẫn tương đối thấp trong tương lai, nhưng cũng có thể không. Đối với nhiều ứng dụng phi tài chính (chẳng hạn như mạng xã hội hoặc trò chơi), thậm chí phí giao dịch 0,01 USD cũng là quá cao.
Tuy nhiên, mạng xã hội và trò chơi không cần mô hình bảo mật giống như L1. Nếu ai đó có thể chi một triệu đô la để hủy bỏ kỷ lục thua trận hoặc đăng một dòng tweet muộn hơn ba ngày so với thực tế thì điều đó không thành vấn đề. Do đó, các ứng dụng này sẽ không phải chịu chi phí bảo mật như nhau. Các giải pháp L2 đạt được điều này bằng cách hỗ trợ một loạt các phương pháp sẵn có dữ liệu từ bản tổng hợp, plasma đến tính hợp lệ.
Một sự đánh đổi khác là vấn đề chuyển tài sản từ L2 sang L2. Tôi dự đoán rằng trong 5 đến 10 năm tới, tất cả các Bản tổng hợp sẽ là Bản tổng hợp ZK và các hệ thống chứng minh cực kỳ hiệu quả như Binius và Circle STARK với tính năng tra cứu, kết hợp với các lớp tổng hợp bằng chứng, sẽ giúp L2 có thể cung cấp các gốc trạng thái cuối cùng trong mỗi khe.
Nhưng hiện tại, chúng tôi chỉ có thể kết hợp phức tạp các Bản tổng hợp lạc quan và Bản tổng hợp ZK và sử dụng các khoảng thời gian chứng minh khác nhau. Nếu chúng tôi triển khai phân đoạn thực thi vào năm 2021, thì mô hình bảo mật để giữ cho các phân đoạn luôn trung thực sẽ là Optimistic Rollups chứ không phải ZK, vì vậy L1 sẽ phải quản lý logic chống gian lận trên chuỗi phức tạp và thời gian rút tiền sẽ kéo dài tới một tuần để chuyển tài sản giữa các phân đoạn. Nhưng giống như lỗi mã, tôi nghĩ vấn đề này cuối cùng sẽ chỉ là tạm thời.
Tốc độ giao dịch là khía cạnh thứ ba của sự đánh đổi bảo mật và là khía cạnh lâu dài hơn. Ethereum tạo ra các khối cứ sau 12 giây và sẽ không nhanh hơn để tránh sự tập trung quá mức. Tuy nhiên, nhiều L2 đang khám phá việc nén thời gian khối xuống vài trăm mili giây. Mười hai giây không quá tệ: người dùng thường đợi trung bình khoảng 6-7 giây để giao dịch của họ được đưa vào một khối (không chỉ 6 giây vì khối tiếp theo có thể không bao gồm chúng). Điều này có thể so sánh với thời gian tôi chờ đợi khi thanh toán bằng thẻ tín dụng. Nhưng nhiều ứng dụng cần tốc độ nhanh hơn và L2 có thể cung cấp điều đó.
Để tăng tốc, L2 có cơ chế xác nhận trước: Bản thân người xác thực L2 hứa sẽ bao gồm một giao dịch tại một thời điểm cụ thể bằng chữ ký số và nếu giao dịch không được đưa vào, họ sẽ bị phạt. Cơ chế StakeSure tiếp tục mở rộng cơ chế này.
Bây giờ, chúng ta có thể thử triển khai tất cả các tính năng này trên L1. L1 có thể bao gồm "xác nhận trước nhanh" và "xác nhận cuối cùng chậm" hệ thống. Nó có thể bao gồm các phân đoạn khác nhau với các mức độ bảo mật khác nhau. Tuy nhiên, điều này sẽ làm tăng độ phức tạp của giao thức. Ngoài ra, thực hiện mọi thứ trên L1 có nguy cơ làm quá tải sự đồng thuận, vì nhiều phương pháp quy mô lớn hơn hoặc thông lượng cao hơn gây ra rủi ro tập trung cao hơn hoặc yêu cầu các hình thức "quản trị"mạnh mẽ hơn. điều này, nếu được thực hiện trên L1, sẽ ảnh hưởng đến các phần khác của giao thức. Bằng cách cung cấp sự đánh đổi thông qua L2, Ethereum phần lớn có thể tránh được những rủi ro này.
Lợi ích của Lớp 2 đối với Tổ chức và Văn hóa
Hãy tưởng tượng một đất nước bị chia làm hai, một nửa trở thành nhà nước tư bản chủ nghĩa và nửa còn lại là nhà nước do chính phủ lãnh đạo (khác với các kịch bản trong thế giới thực, giả sử đây không phải là kết quả của bất kỳ cuộc chiến tranh đau thương nào mà chỉ là một biên giới tự nhiên xuất hiện vào một ngày nào đó).
Ở phần tư bản, các nhà hàng bao gồm quyền sở hữu phi tập trung, chuỗi khối và quyền biểu quyết khác nhau. Ở nhà nước do chính phủ lãnh đạo, họ đều là các cơ quan chính phủ, giống như đồn cảnh sát. Vào ngày đầu tiên, sẽ không có nhiều thay đổi. Nhìn chung, mọi người sẽ làm theo những thói quen hiện có, điều gì hiệu quả và điều gì không, dựa trên thực tế kỹ thuật như kỹ năng lao động và cơ sở hạ tầng. Tuy nhiên, một năm sau, bạn sẽ thấy những thay đổi lớn khi các cơ cấu khuyến khích và kiểm soát khác nhau dẫn đến những thay đổi đáng kể trong hành vi, ảnh hưởng đến ai đến và đi, cái gì được xây dựng, cái gì được duy trì và cái gì bị bỏ đi.
Lý thuyết tổ chức ngành nói rất nhiều về những khác biệt như vậy: nó không chỉ thảo luận về sự khác biệt giữa nền kinh tế do chính phủ quản lý và nền kinh tế tư bản mà còn thảo luận về sự khác biệt giữa nền kinh tế do các tập đoàn nhượng quyền lớn thống trị và nền kinh tế nơi mỗi siêu thị được điều hành bởi một doanh nhân độc lập. Tôi nghĩ sự khác biệt giữa hệ sinh thái lấy L1 làm trung tâm và hệ sinh thái lấy L2 làm trung tâm là tương tự nhau.
Là một hệ sinh thái lấy L2 làm trung tâm, tôi nghĩ những ưu điểm chính của Ethereum như sau:
- Vì Ethereum là hệ sinh thái lấy L2 làm trung tâm nên bạn có thể độc lập xây dựng một hệ sinh thái phụ với các tính năng độc đáo trong khi vẫn là một phần của hệ sinh thái Ethereum lớn hơn.
- Nếu bạn chỉ đang xây dựng một ứng dụng khách Ethereum, thì bạn là một phần của Ethereum lớn hơn và mặc dù bạn có một số chỗ để đổi mới nhưng nó vẫn ít hơn nhiều so với L2. Tuy nhiên, nếu bạn đang xây dựng một chuỗi hoàn toàn độc lập, không gian sáng tạo của bạn rất rộng lớn nhưng bạn cũng mất đi lợi ích của hiệu ứng mạng và bảo mật chung. L2 là một sự cân bằng tốt.
- Nó không chỉ mang đến cơ hội thử các môi trường thực thi mới và đánh đổi bảo mật có thể đạt được khả năng mở rộng, tính linh hoạt và tốc độ mà còn cung cấp cơ chế khuyến khích khuyến khích các nhà phát triển xây dựng và duy trì cũng như cộng đồng hỗ trợ.
Trên thực tế, mỗi L2 đều bị cô lập, điều này cũng có nghĩa là việc triển khai các phương pháp mới không cần có sự cho phép: bạn không cần phải thuyết phục tất cả các nhà phát triển cốt lõi rằng phương pháp mới của bạn là "an toàn" cho toàn bộ chuỗi. Nếu L2 của bạn không thành công thì đó là trách nhiệm của bạn. Bất kỳ ai cũng có thể đề xuất những ý tưởng táo bạo (ví dụ: phương pháp Plasma của Intmax) và ngay cả khi các nhà phát triển cốt lõi của Ethereum hoàn toàn phớt lờ nó, họ vẫn có thể tiếp tục xây dựng và cuối cùng là triển khai.
Các tính năng và tiền biên dịch L1 không như thế này. Ngay cả trong Ethereum, sự thành công hay thất bại của quá trình phát triển L1 cuối cùng thường phụ thuộc vào chính trị nhiều hơn chúng ta mong muốn. Về mặt lý thuyết, bất cứ thứ gì có thể được xây dựng, các cơ chế khuyến khích khác nhau được tạo ra bởi hệ sinh thái lấy L1 làm trung tâm và lấy L2 làm trung tâm cuối cùng sẽ ảnh hưởng nghiêm trọng đến những gì được xây dựng thực sự, mức chất lượng và trình tự xây dựng nó.
Hệ sinh thái lấy L2 làm trung tâm của Ethereum phải đối mặt với những thách thức gì?
Cách tiếp cận lấy L2 làm trung tâm này phải đối mặt với một thách thức chính mà hệ sinh thái lấy L1 làm trung tâm gần như không phải đối mặt ở mức độ tương tự: sự phối hợp. Nói cách khác, mặc dù Ethereum có nhiều L2 nhưng thách thức là làm thế nào để nó vẫn có cảm giác giống như "Ethereum" và giữ lại các hiệu ứng mạng của Ethereum thay vì trở thành N chuỗi độc lập. Ngày nay, tình trạng này không đạt yêu cầu về nhiều mặt:
- Chuỗi chéo thường yêu cầu các cầu nối tập trung, rất phức tạp đối với người dùng thông thường. Nếu bạn có mã thông báo trên Optimism, bạn không thể dán địa chỉ Arbitrum của người khác vào ví của mình để chuyển tiền.
- Hỗ trợ hợp đồng chuỗi chéo không tốt cho ví hợp đồng thông minh cá nhân và ví tổ chức (bao gồm cả DAO). Nếu bạn thay đổi một phím trên một L2, bạn cần thay đổi nó trên mọi L2 khác.
- Cơ sở hạ tầng xác minh phi tập trung thường thiếu. Ethereum cuối cùng đã bắt đầu có những khách hàng nhẹ như Helios. Tuy nhiên, nếu tất cả các hoạt động diễn ra trên L2 thì mỗi hoạt động đều cần RPC tập trung của riêng mình, điều này là vô nghĩa. Về nguyên tắc, một khi bạn có tiêu đề khối Ethereum, việc xây dựng ứng dụng khách nhẹ cho L2 không khó; nhưng trên thực tế, điểm này ít được nhấn mạnh.
Cộng đồng đang nỗ lực cải thiện ba lĩnh vực này. Đối với trao đổi mã thông báo chuỗi chéo, tiêu chuẩn ERC-7683 là một đề xuất mới, không giống như "cầu nối tập trung" hiện có, không có nút tập trung, mã thông báo hoặc quản trị cố định. Đối với các tài khoản chuỗi chéo, hầu hết các ví đều áp dụng phương pháp sử dụng các thông báo có thể phát lại trên chuỗi chéo để cập nhật khóa trong thời gian ngắn và tổng hợp kho khóa trong dài hạn. Các client nhẹ dành cho L2 đang bắt đầu xuất hiện, chẳng hạn như Beerus dành cho Starknet. Ngoài ra, những cải tiến gần đây về trải nghiệm người dùng với ví thế hệ tiếp theo đã giải quyết được nhiều vấn đề cơ bản hơn, như cho phép người dùng truy cập DApp mà không cần chuyển đổi mạng theo cách thủ công.
Tuy nhiên, phải thừa nhận rằng hệ sinh thái lấy L2 làm trung tâm phải đối mặt với những thách thức thực sự trong việc phối hợp. Bởi vì một L2 đơn lẻ không có động lực kinh tế tự nhiên để xây dựng cơ sở hạ tầng để phối hợp: các L2 quy mô nhỏ sẽ không làm được điều đó vì họ chỉ thu được một phần lợi ích nhỏ; L2 quy mô lớn cũng sẽ không vì chúng có thể thu được nhiều hoặc nhiều hơn bằng cách nâng cao hiệu ứng mạng cục bộ của chính chúng. Nếu mọi L2 chỉ xem xét đến chính nó và không ai xem xét cách phù hợp với hệ thống Ethereum rộng lớn hơn, thì chúng ta sẽ thất bại, giống như điều không tưởng về đô thị được mô tả trong các phần trước.
Thật khó để nói có một giải pháp hoàn hảo cho vấn đề này. Tôi chỉ có thể nói rằng hệ sinh thái cần nhận thức đầy đủ hơn rằng cơ sở hạ tầng xuyên L2 cũng là một loại cơ sở hạ tầng Ethereum giống như máy khách L1, công cụ phát triển và ngôn ngữ lập trình và cần được đánh giá cao và tài trợ. Chúng tôi có Hiệp hội Giao thức; có lẽ chúng ta cần một Hiệp hội cơ sở hạ tầng cơ bản.
Phần kết luận
Trong nhiều cuộc thảo luận công khai khác nhau, "L2" và "phân mảnh" thường được coi là hai chiến lược đối lập nhau để mở rộng quy mô blockchain. Nhưng khi bạn nghiên cứu công nghệ cơ bản, bạn sẽ thấy một vấn đề nan giải: các phương pháp mở rộng quy mô cơ bản thực tế là hoàn toàn giống nhau. Cho dù đó là phân chia dữ liệu, trình xác minh gian lận hay trình xác minh ZK-SNARK hay các giải pháp cho "Cuộn lên, phân đoạn" giao tiếp, điểm khác biệt chính là: ai chịu trách nhiệm xây dựng và cập nhật các thành phần này và họ có bao nhiêu quyền tự chủ?
Hệ sinh thái lấy L2 làm trung tâm về cơ bản là phân mảnh từ góc độ kỹ thuật thực sự, nhưng trong phân mảnh, bạn có thể xây dựng phân đoạn của riêng mình bằng các quy tắc của riêng bạn. Điều này rất mạnh mẽ, với khả năng sáng tạo vô hạn và rất nhiều sự đổi mới mang tính tự chủ. Nhưng nó cũng có một số thách thức chính, đặc biệt là về mặt phối hợp. Để một hệ sinh thái lấy L2 làm trung tâm như Ethereum thành công, nó phải hiểu những thách thức này và giải quyết chúng trực tiếp để đạt được nhiều lợi ích nhất có thể từ hệ sinh thái lấy L1 làm trung tâm và tiến gần nhất có thể đến mức tốt nhất của cả hai thế giới.