Tác giả: Câu lạc bộ Blockchain Stanford Nguồn: W-SOURCE Dịch: Shan Oba, Golden Finance
Giới thiệu
Kể từ khi ra đời, chuỗi blockchain và tiền điện tử đang nỗ lực thay đổi bối cảnh tài chính bằng cách cung cấp quyền truy cập rộng hơn và loại bỏ các trung gian. Theo thời gian, sự phát triển của web3 đã mở rộng các kịch bản ứng dụng, nêu bật tiềm năng của công nghệ chuỗi khối trong việc tạo ra một Internet nơi người sáng tạo phát triển mạnh và người dùng kiểm soát dữ liệu của họ.
Một phần quan trọng của cơ sở hạ tầng trao quyền cho người dùng cuối, đồng thời đảm bảo tính phân cấp, là đảm bảo dữ liệu được lưu trữ trong cơ sở dữ liệu linh hoạt, chống kiểm duyệt. Mặc dù cơ sở dữ liệu tập trung thuận tiện và quen thuộc nhưng chúng không cung cấp được mức độ bảo mật cần thiết và yêu cầu sự cho phép của chủ sở hữu cơ sở dữ liệu, hạn chế việc áp dụng trên toàn cầu.
Hệ thống lưu trữ dữ liệu phân tán đáp ứng nhu cầu lưu trữ có khả năng chịu lỗi và có khả năng phục hồi cao bằng cách xây dựng mạng lưới các nút lưu trữ, quản lý và chia sẻ dữ liệu. Việc loại bỏ nhu cầu về cơ quan trung ương và phân phối dữ liệu theo phương thức P2P giúp tăng cường tính bảo mật và minh bạch. Các hệ thống lưu trữ phân tán, thường dựa trên blockchain hoặc các công nghệ tương tự, có xu hướng sao chép dữ liệu thông qua tính dự phòng và tính khả dụng.
Mặc dù hệ thống lưu trữ phân tán cung cấp khả năng bảo mật, khả năng phục hồi dữ liệu và lợi ích chi phí tiềm ẩn nhờ dựa vào dung lượng lưu trữ không được sử dụng nhưng chúng vẫn phải đối mặt với những thách thức về quy định và khả năng tương tác.
Để có một mạng thực sự mở và dễ tiếp cận, lưu trữ phân tán là điều cần thiết. Một khía cạnh quan trọng của bất kỳ hệ thống lưu trữ nào là cách chứng minh cách lưu trữ và duy trì dữ liệu. Câu hỏi quan trọng hơn đối với người dùng làDữ liệu được chứng minh là được lưu trữ và duy trì như thế nào? Điều này được giải quyết thông qua bằng chứng dữ liệu.
Nói chung, chúng tôi phân biệt hai loại bằng chứng:
Bằng chứng xác định
mạnh >: Cho phép chủ sở hữu dữ liệu tạo bằng chứng cho dữ liệu cụ thể chứng minh việc tạo của họ và khớp với hàm băm của dữ liệu. Loại bằng chứng này chỉ hiển thị hàm băm được tạo bằng cách sử dụng dữ liệu làm đầu vào. Bằng chứng xác suất: Dựa vào xác suất để cho thấy rằng dữ liệu cơ bản rất có thể có sẵn. Đó là sự biện minh thể hiện một cách hợp lý mức độ chắc chắn của một giả thuyết cụ thể, áp dụng cho dữ liệu đã được công bố và, nếu cần, có thể truy xuất được.
Phần còn lại của bài viết này thảo luận về các lựa chọn thiết kế để chứng minh tính toàn vẹn và lưu trữ dữ liệu trong ba hệ thống khác nhau. Đầu tiên là Tagion, tập trung vào dữ liệu dung lượng cao và có thể mở rộng, sau đó thảo luận về cách mạng lưu trữ phi tập trung Filecoin đảm bảo lưu trữ dữ liệu quy mô lớn. Cuối cùng, bài viết này sẽ khám phá Celestia, tập trung vào việc lưu trữ và phục vụ dữ liệu blockchain.
Tagion
Kiến trúc
Tagion là mạng phi tập trung dành riêng cho các giao dịch khối lượng lớn với mục tiêu xây dựng một hệ thống tiền tệ độc đáo dựa trên công nghệ và quản trị dân chủ. Dự án dựa trên kiến trúc cơ sở dữ liệu tiên tiến và công nghệ mã hóa để đạt được quy mô lớn. Nó không phải là một blockchain mà là một sổ cái phân tán sử dụng cơ sở dữ liệu DART để tối ưu hóa việc lưu trữ. Cơ chế chứng minh của Tagion là một ví dụ về chứng minh tất định.
Chức năng cốt lõi của cơ sở dữ liệu DART là bảng băm phân tán lưu trữ dữ liệu theo khóa băm. Khi lưu trữ thông tin tăng lên, cấu trúc sẽ tự nhiên tạo ra nhiều nhánh hơn, mỗi nhánh hỗ trợ tới 256 kho lưu trữ và nhánh phụ kết hợp.
Ngoại trừ tương tự như phân phối Bảng băm công thức, hạ tầng của Tagion cũng có thể hiểu là cây Merkle thưa thớt (SMT). SMT là cấu trúc dữ liệu được xác thực dựa trên các cặp khóa-giá trị hỗ trợ các hoạt động cơ sở dữ liệu tiêu chuẩn như tra cứu, chèn, cập nhật và xóa. Mỗi cặp khóa-giá trị đại diện cho một lá và hàm băm của nhánh cha được lấy bằng cách băm đệ quy các nút con vào gốc Merkle.
SMT cải thiện đáng kể hiệu quả bằng cách cho phép người chứng minh xác minh sự hiện diện của các phần tử mà không cần phải truy cập vào các phần tử dữ liệu không liên quan hoặc tải xuống các đoạn dữ liệu cụ thể. Hơn nữa, tính độc lập của các giá trị trong cây cho phép cập nhật theo bất kỳ thứ tự nào mà không làm thay đổi cấu trúc cuối cùng của cây.
Việc sử dụng hệ thống Root của Tagion hàm băm chứa tất cả các hàm băm nhánh phụ, nhanh chóng xác minh trạng thái dữ liệu với mức tính toán tối thiểu. Để nâng cao hơn nữa sức mạnh xử lý, hệ thống có thể tạo các DART phụ cho các hệ sinh thái cụ thể, tương tự như các chuỗi khối được phân chia. Các nút được chỉ định này quản lý các tập hợp con dữ liệu, tăng thông lượng và cho phép tùy chỉnh mạng cho các ứng dụng khác nhau, tương tự như chuỗi ứng dụng.
Sử dụng DART để tạo hệ thống không trạng thái mà không cần lưu giữ toàn bộ lịch sử chuyển đổi hệ thống. Điều này có nghĩa là dữ liệu có thể bị xóa, giảm yêu cầu lưu trữ tổng thể và có khả năng tăng tính phân cấp của hệ thống thông qua việc giảm nhẹ.
Tagion sử dụng HiBON (Đối tượng biểu diễn nhị phân hàm băm bất biến) để tạo điều kiện thuận lợi hơn nữa cho quá trình lưu trữ, đảm bảo rằng dữ liệu vẫn giữ nguyên tính bất biến hàm băm khi xuất hiện, đơn giản hóa việc truy xuất dữ liệu dựa trên hàm băm kết hợp. Tính bất biến của hàm băm có nghĩa là dữ liệu sẽ luôn tạo ra cùng một hàm băm bất kể thứ tự được xử lý. Đây là một công nghệ đã được chứng minh giúp tăng tốc độ truy xuất và ghi dữ liệu vào cơ sở dữ liệu.
Thông qua các cơ chế này, Tagion không chỉ lưu trữ dữ liệu một cách an toàn mà còn xác minh một cách hiệu quả tính bao gồm và tính toàn vẹn của dữ liệu trong mạng.
Tính toàn vẹn của dữ liệu
Tất cả các hệ thống con của Tagion đều thực hiện cái gọi là bước đi ngẫu nhiên để kiểm tra xem dữ liệu có được lưu trữ và cung cấp khi cần hay không. Các nút không vượt qua thử thách xác minh lưu giữ sẽ bị loại khỏi mạng.
Tất cả các bản lưu trữ đều có dấu thời gian và yêu cầu thanh toán cho bộ nhớ mở rộng. Trong quá trình di chuyển, hệ thống sẽ kiểm tra xem đã nhận được thanh toán hay chưa, nếu không dữ liệu sẽ bị xóa để giải phóng dung lượng.
Filecoin
Filecoin là mạng lưu trữ phi tập trung khuyến khích người khai thác cung cấp dung lượng lưu trữ thông qua mã thông báo gốc Filecoin. Để kiếm được những phần thưởng này, người khai thác phải tạo bằng chứng xác minh khả năng lưu trữ của họ.
Đơn vị lưu trữ cơ bản của Filecoin được gọi là một khu vực, có kích thước tiêu chuẩn và thời gian tồn tại mà nhà cung cấp có thể mở rộng. Thiết kế cân bằng cẩn thận tính bảo mật và khả năng sử dụng. Tất cả dữ liệu người dùng được lưu trữ trên Filecoin đều được mã hóa và nhiều bản sao được phân phối trên mạng, đảm bảo rằng người khai thác không thể truy cập nội dung tệp.
Tầm ảnh hưởng của những người khai thác trong mạng Filecoin tỷ lệ thuận với dung lượng lưu trữ mà họ cung cấp, điều này cũng cho phép họ tham gia vào cơ chế đồng thuận của mạng. Máy ảo Filecoin chịu trách nhiệm thực hiện các hợp đồng thông minh và tạo điều kiện thuận lợi cho các hoạt động của thị trường như ghép nối các nhà cung cấp dịch vụ lưu trữ với người dùng.
Cấu trúc của Filecoin là mô-đun, cho phép các nút điều chỉnh các phần cụ thể của hệ điều hành khi cần thiết. Ví dụ: một nút chỉ có thể đóng vai trò là nút lưu trữ và không tham gia vào các hoạt động thị trường.
Để đảm bảo tính toàn vẹn và sẵn có của dữ liệu, Filecoin dựa vào hai thuật toán: bằng chứng lưu trữ và bằng chứng sao chép.
Bằng chứng lưu trữ
Người khai thác trong Filecoin tạo ra bằng chứng để xác minh rằng họ giữ bản sao dữ liệu tại bất kỳ thời điểm nào. Bằng chứng này đạt được thông qua một thử thách: hệ thống đặt ra những câu hỏi cho người khai thác mà chỉ có thể trả lời chính xác nếu họ có dữ liệu.
Để đảm bảo rằng người khai thác không chỉ sao chép dữ liệu khi có thách thức, các thử thách được thiết kế để nhắm mục tiêu ngẫu nhiên các phần khác nhau của dữ liệu trong những khoảng thời gian không thể đoán trước. Sự kết hợp giữa tính ngẫu nhiên và sự không chắc chắn trong các khoảng thời gian khiến cho người khai thác không thể, không kinh tế và không hợp lý, chỉ lấy được dữ liệu khi có thách thức được đưa ra.
Bằng chứng về không gian và thời gian (PoSt)
Filecoin giới thiệu Bằng chứng về không gian và thời gian (PoSt) để đảm bảo tính sẵn có của dữ liệu và lưu trữ liên tục. Bằng chứng về Không thời gian xác minh việc lưu trữ theo các khoảng thời gian bằng cách đặt ra thách thức về mật mã cho những người khai thác. Người khai thác chỉ có thể vượt qua thử thách nếu các tệp được lưu trữ trong khung thời gian đã chỉ định.
PoSt bao gồm hai loại thử thách:
Chiến thắng PoSt: Người khai thác xác minh rằng họ lưu trữ một bản sao của dữ liệu tại một thời điểm cụ thể, thường là khi thuật toán chọn công cụ khai thác để khai thác khối tiếp theo. Thời hạn ngắn đảm bảo họ có dữ liệu.
Bằng chứng về không thời gian của cửa sổ (WindowPoSt): Một thách thức định kỳ trong đó những người khai thác gửi bằng chứng rằng họ đã duy trì dữ liệu theo yêu cầu. Chỉ niêm phong dữ liệu khi nó được gửi sẽ tốn kém hơn đối với người khai thác.
Niêm phong là một phần của thuật toán chứng minh sự sao chép và có tính toán chuyên sâu, khiến những người khai thác hợp lý muốn giảm nhu cầu niêm phong càng nhiều càng tốt.
Bằng chứng sao chép
Niêm phong là một phần của thuật toán chứng minh bản sao, thuật toán này đòi hỏi nhiều tính toán và khuyến khích thợ mỏ giảm tần suất niêm phong. Bằng chứng sao chép đảm bảo rằng người dùng, thợ mỏ tạo và lưu trữ các bản sao duy nhất trên phần cứng vật lý của họ. Bằng chứng này bao gồm:
Yêu cầu người khai thác tạo hai loại bằng chứng để cung cấp cho người dùng khả năng lưu trữ tệp an toàn được đảm bảo và chỉ những người khai thác cung cấp bộ nhớ thực tế mới có thể nhận được phần thưởng. Bởi vì bằng chứng quá lớn để đưa vào chuỗi, các thợ mỏ tạo ra các đối số kiến thức không tương tác, ngắn gọn, không chứa kiến thức (zkSNARK) và gửi chúng đến chuỗi, biến Filecoin trở thành người dùng zkSNARK lớn nhất, tạo ra 6 triệu đến 7 triệu bằng chứng mỗi ngày .
Nói chung,Filecoin kết hợp các phương pháp chứng minh xác định (PoRep) và chứng minh xác suất (PoSt), sử dụng phương pháp kết hợp.
Celestia
Ví dụ thứ ba trong bài viết này là Celestia, một blockchain được gọi là tính khả dụng của dữ liệu, cung cấp khả năng thực thi và lưu trữ dữ liệu cho các chuỗi khối mô-đun, cho phép họ thuê ngoài các chức năng cốt lõi .
Với sự nổi lên của Ethereum Rollup, các giải pháp sẵn có của dữ liệu như Celestia đã trở nên phổ biến vì chúng cung cấp giải pháp thay thế rẻ hơn cho việc lưu trữ dữ liệu giao dịch Rollup so với các nút lưu trữ Ethereum.
Chứng minh tính khả dụng của dữ liệu
Không giống như Filecoin, Celestia không cung cấp giải pháp lưu trữ cho người dùng cuối mà tập trung vào giải quyết các vấn đề về tính khả dụng của dữ liệu. Tính sẵn có của dữ liệu đảm bảo rằng dữ liệu blockchain đã được xuất bản chính xác. Thông thường, các nút blockchain phải tải xuống toàn bộ khối để xác minh tính khả dụng, một quy trình sử dụng nhiều tài nguyên có thể cản trở việc xác minh.
Để đơn giản hóa quy trình này, Celestia sử dụng Lấy mẫu sẵn có dữ liệu (DAS). Phương pháp này bao gồm các nút nhẹ chỉ tải xuống một phần nhỏ dữ liệu cho đến khi đạt được mức độ tin cậy được xác định trước. Dữ liệu được coi là được công bố nếu tất cả dữ liệu trong mẫu đều có sẵn dưới dạng bằng chứng xác suất về tính sẵn có của dữ liệu.
Nó hoạt động như sau:
Người đề xuất tạo một khối dữ liệu.
Chia dữ liệu khối thành các khối k×k để tạo thành ma trận.
Mở rộng ma trận bằng cách thêm dữ liệu chẵn lẻ, sử dụng mã hóa Reed-Solomon để tạo ma trận 2k×2k. Kiểu mã hóa này cho phép khôi phục toàn bộ tập dữ liệu từ một tập hợp con của dữ liệu.
Tính toán và kết hợp các nghiệm Merkle độc lập cho từng hàng và cột của ma trận mở rộng.
Cuối cùng, gốc Merkle của tất cả các gốc kết hợp này được thêm vào cam kết dữ liệu khối trong tiêu đề khối, xác nhận tính khả dụng của dữ liệu.
Để xác minh tính khả dụng, các nút ánh sáng trích xuất ngẫu nhiên các tọa độ duy nhất từ ma trận mở rộng, sau đó truy vấn các nút đầy đủ để tìm các khối dữ liệu tương ứng với bằng chứng Merkle của các tọa độ này. Nếu phản hồi đúng, điều đó có nghĩa là có khả năng cao là toàn bộ khối dữ liệu đều có sẵn.
Sau đó, nút này sẽ phát khối đã nhận có bằng chứng Merkle chính xác tới phần còn lại của mạng. Miễn là lấy mẫu đủ, các nút có thể xây dựng lại toàn bộ khối, cho phép Celestia dựa nhiều hơn vào các nút có nguồn lực hạn chế để xác minh, do đó góp phần phân cấp.
Tính đến thời điểm viết bài này, Celestia vẫn còn rất mới. Tuy nhiên,lấy mẫu tính khả dụng của dữ liệu là một công nghệ có thể được áp dụng bên ngoài Celestia và các nhà phát triển cốt lõi của Ethereum đang thảo luận về việc thêm nó vào giao thức để giúp mở rộng quy mô.
Kết luận
Tóm lại, nhiều phương pháp lưu trữ và xác minh tính khả dụng của dữ liệu trong mạng phân tán đang hoạt động và được sử dụng tích cực.
Tagion sử dụng cơ sở dữ liệu DART, sử dụng sharding để tăng thông lượng và hỗ trợ phát triển các hệ sinh thái phụ chuyên biệt được bảo vệ bởi các cây Merkle thưa thớt.
Cấu trúc của Filecoin sử dụng hai thuật toán khác nhau, Proof of Spacetime và Proof of Replication, để cho phép các nhà khai thác xác minh và chứng minh rằng họ có dữ liệu được lưu trữ đáng tin cậy. Những bằng chứng này sau đó được ghi lại trên chuỗi dưới dạng bằng chứng không có kiến thức.
Celestia, với tư cách là lớp sẵn có của dữ liệu, sử dụng mã hóa Reed-Solomon để mở rộng các khối dữ liệu thành ma trận. Cấu trúc này cho phép các máy khách hạng nhẹ thực hiện lấy mẫu ngẫu nhiên để xác nhận tính khả dụng của dữ liệu, bỏ qua nhu cầu tải xuống toàn bộ tập dữ liệu.
Khi bối cảnh hệ thống lưu trữ phân tán tiếp tục phát triển, Tagion, Filecoin và Celestia đều đề xuất các chiến lược riêng để đảm bảo tính toàn vẹn, tính khả dụng và khả năng truy cập của dữ liệu. Cùng với nhau, các nền tảng này đóng góp quan trọng vào việc xây dựng hệ thống lưu trữ và xuất bản dữ liệu linh hoạt hỗ trợ các mạng phi tập trung.