Tác giả: Haseeb Qureshi, Đối tác của Dragonfly Capital Nguồn: Medium Dịch: Shan Ouba, Golden Finance< /p>
Giả sử bạn muốn chạy một mô hình ngôn ngữ lớn như Llama2–70B. Một model lớn như vậy cần bộ nhớ trên 140GB, điều đó có nghĩa là bạn không thể chạy model gốc trên máy tính ở nhà. Lựa chọn của bạn là gì? Bạn có thể chuyển sang một nhà cung cấp đám mây, nhưng bạn có thể không quan tâm đến việc tin tưởng vào một công ty tập trung duy nhất để xử lý khối lượng công việc này cho bạn và thu thập tất cả dữ liệu sử dụng. Sau đó, thứ bạn cần là suy luận phi tập trung, cho phép bạn chạy các mô hình học máy mà không cần dựa vào bất kỳ nhà cung cấp nào.
Vấn đề về độ tin cậy
Trong một mạng phi tập trung, chỉ cần chạy mô hình và tin tưởng vào đầu ra là không đủ. Giả sử tôi yêu cầu mạng phân tích các tình huống khó xử trong quản trị bằng cách sử dụng Llama2-70B. Làm sao tôi biết nó không thực sự sử dụng Llama2–13B, mang lại cho tôi kết quả phân tích tệ hơn và bỏ túi sự khác biệt?
Trong một thế giới tập trung, bạn có thể tin tưởng một công ty như OpenAI sẽ làm điều đó một cách trung thực vì danh tiếng của họ đang bị đe dọa (ở một mức độ nào đó, chất lượng của LLM tự nó bị đe dọa). -hiển nhiên). Nhưng trong một thế giới phi tập trung, sự trung thực không được coi trọng mà nó đã được xác minh.
Đây là lúc những suy luận có thể kiểm chứng được phát huy tác dụng. Ngoài việc cung cấp phản hồi cho truy vấn, bạn cũng có thể chứng minh rằng nó chạy đúng trên mô hình bạn yêu cầu. Nhưng bằng cách nào?
Cách đơn giản nhất là chạy mô hình dưới dạng hợp đồng thông minh trên chuỗi. Điều này chắc chắn sẽ đảm bảo rằng đầu ra được xác minh, nhưng nó rất không thực tế. GPT-3 đại diện cho các từ có kích thước nhúng là 12.288. Nếu bạn thực hiện phép nhân ma trận quy mô này trên chuỗi, thì sẽ tốn khoảng 10 tỷ USD theo giá gas hiện tại—các phép tính sẽ lấp đầy mỗi khối trong khoảng một tháng.
Vậy là không. Chúng ta cần một cách tiếp cận khác.
Sau khi quan sát toàn bộ tình huống, tôi thấy rõ rằng ba cách tiếp cận chính đã xuất hiện để giải quyết những suy luận có thể kiểm chứng: bằng chứng không có kiến thức, bằng chứng lạc quan về gian lận và mật mã Kinh tế học. Mỗi cái đều có ý nghĩa bảo mật và chi phí riêng.
p> p>
1. Bằng chứng không có kiến thức (ZK ML)
Hãy tưởng tượng bạn có thể chứng minh điều đó bạn đã chạy một Mô hình lớn, nhưng cho dù mô hình có lớn đến đâu thì bằng chứng thực sự có kích thước cố định. Đây là những gì ZK ML hứa hẹn thông qua sự kỳ diệu của ZK-SNARK.
Mặc dù về nguyên tắc nghe có vẻ tao nhã nhưng việc biên dịch các mạng lưới thần kinh sâu thành các mạch không có kiến thức và chứng minh chúng là vô cùng khó khăn. Nó cũng rất tốn kém - ít nhất, bạn có thể đang xem xét chi phí suy luận gấp 1000 lần và độ trễ gấp 1000 lần (thời gian cần thiết để tạo ra bằng chứng), chưa kể việc biên dịch mô hình thành một mạch trước khi tất cả điều này xảy ra. Cuối cùng, chi phí đó phải được chuyển cho người dùng, vì vậy nó sẽ rất tốn kém đối với người dùng cuối.
Mặt khác, đây là cách duy nhất để đảm bảo tính đúng đắn thông qua mật mã. Với ZK, các nhà cung cấp mô hình không thể gian lận dù họ có cố gắng thế nào đi chăng nữa. Nhưng chi phí để làm như vậy là rất lớn, khiến nó không thực tế đối với các mô hình lớn trong tương lai gần.
Ví dụ: EZKL, Modulus Labs, Giza
2. Bằng chứng gian lận lạc quan (Optimistic ML )
Cách tiếp cận lạc quan là tin tưởng nhưng phải xác minh. Chúng ta giả định rằng các suy luận là đúng trừ khi được chứng minh ngược lại. Nếu một nút cố gắng gian lận, "người quan sát" trong mạng có thể chỉ ra kẻ gian lận và thách thức họ bằng cách sử dụng bằng chứng gian lận. Những người quan sát này phải luôn quan sát chuỗi và chạy lại suy luận trên mô hình của chính họ để đảm bảo đầu ra là chính xác.
Những bằng chứng gian lận này là các trò chơi phản ứng-thử thách tương tác kiểu Truebit trong đó bạn chia đôi quỹ đạo thực thi mô hình liên tục trên chuỗi cho đến khi tìm thấy lỗi.
p> p>
Nếu điều này xảy ra, sẽ rất tốn kém vì các chương trình này rất lớn và có trạng thái nội bộ rất lớn - một suy luận GPT-3 có chi phí khoảng 1 petaflop ( 10^5 phép tính dấu phẩy động). Nhưng lý thuyết trò chơi cho thấy điều này gần như sẽ không bao giờ xảy ra (bằng chứng gian lận nổi tiếng là khó viết mã chính xác vì mã gần như sẽ không bao giờ bị tấn công trong quá trình sản xuất).
Lợi ích của sự lạc quan là học máy sẽ an toàn miễn là người quan sát trung thực chú ý. Rẻ hơn ZK ML, nhưng hãy nhớ rằng mọi người quan sát trong mạng sẽ tự chạy lại mọi truy vấn. Ở trạng thái cân bằng, điều này có nghĩa là nếu có 10 người quan sát thì chi phí bảo mật phải được chuyển cho người dùng, do đó họ sẽ phải trả gấp hơn 10 lần chi phí suy luận (hoặc bất kể có bao nhiêu người quan sát).
Như với phương pháp tổng hợp lạc quan, nhược điểm là bạn phải đợi giai đoạn thử thách trôi qua trước khi có thể chắc chắn rằng phản hồi đã được xác minh. Tuy nhiên, tùy thuộc vào cách tham số hóa mạng, bạn có thể phải đợi vài phút thay vì vài ngày.
Ví dụ: Ora, Gensyn (mặc dù hiện tại chưa được chỉ định)
3. Kinh tế học tiền điện tử (Kinh tế học tiền điện tử ML)
Ở đây, chúng tôi loại bỏ tất cả công nghệ ưa thích và làm một việc đơn giản: bỏ phiếu theo tỷ lệ vốn chủ sở hữu. Người dùng quyết định số lượng nút sẽ chạy truy vấn của họ, mỗi nút sẽ hiển thị phản hồi của họ và nếu có sự khác biệt giữa các phản hồi thì nút lẻ sẽ bị loại bỏ. Công cụ oracle tiêu chuẩn - Đây là một cách tiếp cận đơn giản hơn cho phép người dùng đặt mức độ bảo mật mà họ muốn, cân bằng chi phí và độ tin cậy. Nếu Chainlink đang thực hiện học máy thì đây là điều họ sẽ làm.
Độ trễ ở đây rất nhanh - bạn chỉ cần hiển thị cam kết của từng nút. Nếu điều này được ghi vào blockchain, về mặt kỹ thuật điều này có thể xảy ra trong hai khối.
Tuy nhiên, tính bảo mật là yếu nhất. Nếu đủ khôn ngoan, phần lớn các nút có thể hợp lý lựa chọn thông đồng. Với tư cách là người dùng, bạn phải suy ra mức độ rủi ro của các nút này và chi phí để gian lận là bao nhiêu. Điều đó nói lên rằng, bằng cách sử dụng những thứ như tái thế chấp Eigenlayer và bảo mật có thể quy cho, mạng có thể cung cấp bảo hiểm một cách hiệu quả trong trường hợp xảy ra lỗi bảo mật.
Nhưng cái hay của hệ thống này là người dùng có thể chỉ định mức độ an toàn mà họ muốn. Họ có thể chọn bao gồm 3 nút trong số đại biểu hoặc 5 nút hoặc mọi nút trong mạng - hoặc, nếu họ muốn YOLO, họ thậm chí có thể chọn n=1. Hàm chi phí ở đây rất đơn giản: người dùng trả tiền cho số nút họ muốn. Nếu chọn 3 thì bạn cần trả gấp 3 lần chi phí suy luận.
Đây là một câu hỏi khó: bạn có thể đảm bảo n=1 an toàn không? Trong một cách triển khai đơn giản, một nút sẽ luôn gian lận nếu không có ai kiểm tra. Nhưng tôi nghi ngờ rằng nếu bạn mã hóa truy vấn và thực hiện thanh toán theo ý định, bạn có thể nhầm lẫn giữa các nút rằng chúng thực sự là những nút duy nhất phản hồi nhiệm vụ này. Trong trường hợp này, bạn có thể tính phí ít hơn gấp 2 lần chi phí suy luận đối với người dùng thông thường.
Cuối cùng, cách tiếp cận kinh tế tiền điện tử là đơn giản nhất, dễ dàng nhất và có thể rẻ nhất, nhưng lại kém hấp dẫn nhất và về nguyên tắc là kém an toàn nhất. Nhưng như mọi khi, ma quỷ nằm trong các chi tiết.
Ví dụ: Nghi thức (mặc dù chưa được chỉ định), Atoma Network
Tại sao có thể kiểm chứng Machine learning thật khó
Bạn có thể thắc mắc tại sao chúng tôi chưa có tất cả? Xét cho cùng, cốt lõi của các mô hình học máy chỉ là những chương trình máy tính rất lớn. Chứng minh rằng một chương trình được thực thi chính xác từ lâu đã là nền tảng của blockchain.
Đây là lý do tại sao ba phương pháp xác minh này phản ánh cách một chuỗi khối bảo vệ không gian khối của nó - các bản tổng hợp ZK sử dụng bằng chứng ZK, các bản tổng hợp lạc quan sử dụng bằng chứng gian lận, trong khi hầu hết các chuỗi khối L1 sử dụng kinh tế học mật mã. Không có gì ngạc nhiên khi về cơ bản chúng tôi đã đi đến cùng một giải pháp. Vậy điều gì khiến điều này trở nên khó khăn khi áp dụng vào học máy?
ML độc đáo ở chỗ các tính toán ML thường được biểu diễn dưới dạng biểu đồ tính toán dày đặc được thiết kế để chạy hiệu quả trên GPU. Chúng không được thiết kế để được chứng minh. Vì vậy, nếu bạn muốn chứng minh tính toán ML trong ZK hoặc một môi trường lạc quan, bạn phải biên dịch lại nó theo định dạng có thể thực hiện được - điều này rất phức tạp và tốn kém.
p> p>
Khó khăn cơ bản thứ hai trong học máy là sự không chắc chắn. Việc xác minh chương trình giả định rằng đầu ra của chương trình là xác định. Nhưng nếu bạn chạy cùng một mô hình trên kiến trúc GPU hoặc phiên bản CUDA khác, bạn sẽ nhận được các kết quả đầu ra khác nhau. Ngay cả khi bạn phải buộc mọi nút sử dụng cùng một kiến trúc, bạn vẫn sẽ gặp phải vấn đề về tính ngẫu nhiên được sử dụng trong thuật toán (nhiễu trong mô hình khuếch tán hoặc lấy mẫu mã thông báo trong LLM). Bạn có thể khắc phục tính ngẫu nhiên bằng cách kiểm soát hạt giống RNG. Nhưng ngay cả như vậy, bạn vẫn phải đối mặt với một vấn đề đe dọa cuối cùng: tính không chắc chắn cố hữu của số học dấu phẩy động.
Gần như mọi thao tác trong GPU đều được thực hiện trên các số dấu phẩy động. Dấu phẩy động rất khó tính vì chúng không liên kết - nghĩa là, dấu phẩy động (a + b) + c không phải lúc nào cũng giống với a + (b + c). Vì GPU có tính song song cao nên thứ tự cộng hoặc nhân có thể khác nhau mỗi lần chúng được thực thi, điều này có thể dẫn đến những khác biệt nhỏ ở đầu ra. Do tính chất riêng biệt của các từ, điều này khó có thể ảnh hưởng đến đầu ra của LLM, nhưng đối với các mẫu hình ảnh, nó có thể dẫn đến các giá trị pixel hơi khác nhau, dẫn đến hai hình ảnh không khớp hoàn hảo.
Điều này có nghĩa là bạn cần tránh sử dụng dấu phẩy động, điều này có nghĩa là ảnh hưởng lớn đến hiệu suất hoặc bạn cần cho phép một chút lỏng lẻo khi so sánh kết quả đầu ra. Dù bằng cách nào, các chi tiết đều phức tạp và bạn không thể trừu tượng hóa chúng được. (Hóa ra, đây là lý do tại sao EVM không hỗ trợ số dấu phẩy động, mặc dù một số chuỗi khối như NEAR có hỗ trợ.)
Tóm lại, phân cấp Lý do về mạng rất khó vì tất cả các chi tiết đều quan trọng và số lượng chi tiết trong thực tế là đáng kinh ngạc.
Kết luận
Hiện tại, blockchain và máy học rõ ràng có nhiều điểm chung. Một là công nghệ tạo ra niềm tin, hai là công nghệ rất cần sự tin tưởng. Mặc dù mỗi phương pháp suy luận phi tập trung đều có những ưu điểm riêng nhưng tôi rất muốn tìm hiểu cách các doanh nhân có thể sử dụng những công cụ này để xây dựng mạng lưới tốt nhất có thể.