Tác giả gốc: Advait (Leo) Jayant
A muốn đề xuất được cá nhân hóa cao trên Netflix và Amazon. B không muốn Netflix hoặc Amazon biết sở thích của họ.
Trong thời đại kỹ thuật số ngày nay, chúng ta tận hưởng sự tiện lợi của các đề xuất được cá nhân hóa từ các dịch vụ như Amazon và Netflix phục vụ chính xác thị hiếu của chúng ta. Tuy nhiên, sự xâm nhập của những nền tảng này vào cuộc sống riêng tư của chúng ta đang khiến chúng ta ngày càng khó chịu. Chúng tôi mong muốn được tùy chỉnh mà không phải hy sinh quyền riêng tư. Trước đây, điều này dường như là một nghịch lý: làm thế nào để đạt được sự cá nhân hóa mà không cần chia sẻ lượng lớn dữ liệu cá nhân với các hệ thống AI dựa trên đám mây. Mã hóa hoàn toàn đồng hình (FHE) cung cấp giải pháp cho phép chúng tôi tận dụng tối đa cả hai thế giới.
Trí tuệ nhân tạo dưới dạng dịch vụ (AIaaS)
Trí tuệ nhân tạo (AI) hiện đang xử lý thị giác máy tính, xử lý ngôn ngữ tự nhiên (NLP) và hệ thống đề xuất đóng một vai trò quan trọng trong những thách thức phức tạp trong nhiều lĩnh vực. Tuy nhiên, sự phát triển của các mô hình AI này đã mang lại những thách thức đáng kể cho người dùng thông thường:
1. Khối lượng dữ liệu: Việc xây dựng các mô hình chính xác thường yêu cầu các tập dữ liệu khổng lồ, đôi khi thậm chí đạt tới quy mô petabyte.
2. Sức mạnh tính toán: Các mô hình phức tạp như bộ chuyển đổi đòi hỏi sức mạnh tính toán mạnh mẽ của hàng chục GPU, thường chạy liên tục trong nhiều tuần.
3. Chuyên môn về miền: Việc tinh chỉnh các mô hình này đòi hỏi chuyên môn sâu.
Những trở ngại này khiến hầu hết người dùng gặp khó khăn trong việc phát triển độc lập các mô hình học máy mạnh mẽ.
Quy trình AI dưới dạng dịch vụ trong các ứng dụng thực tế
Bước vào kỷ nguyên AI dưới dạng dịch vụ (AIaaS), mô hình này cung cấp cho người dùng quyền truy cập bằng cách cung cấp các dịch vụ đám mây được quản lý bởi công nghệ những người khổng lồ (bao gồm cả các thành viên FAANG) sang các mô hình mạng lưới thần kinh tiên tiến nhất, từ đó khắc phục được những trở ngại trên. Người dùng chỉ cần tải dữ liệu thô lên các nền tảng này, nơi dữ liệu được xử lý để tạo ra những suy luận sâu sắc. AIaaS dân chủ hóa một cách hiệu quả khả năng tiếp cận các mô hình học máy chất lượng cao, mở ra các công cụ AI tiên tiến cho nhiều nhóm người hơn. Tuy nhiên, thật không may, AIaaS ngày nay mang lại những tiện ích này nhưng lại làm tổn hại đến quyền riêng tư của chúng ta.
Quyền riêng tư dữ liệu trong trí tuệ nhân tạo dưới dạng dịch vụ
Hiện tại, dữ liệu chỉ được mã hóa trong quá trình truyền từ máy khách đến máy chủ. Máy chủ có quyền truy cập vào dữ liệu đầu vào và dự đoán dựa trên dữ liệu đó.
Trong quy trình AI dưới dạng dịch vụ, máy chủ có quyền truy cập vào dữ liệu đầu vào và đầu ra. Tình huống này làm phức tạp thêm việc chia sẻ thông tin nhạy cảm, chẳng hạn như dữ liệu y tế và tài chính, của người dùng thông thường. Các quy định như GDPR và CCPA làm trầm trọng thêm những lo ngại này vì chúng yêu cầu sự đồng ý rõ ràng từ người dùng trước khi dữ liệu của họ có thể được chia sẻ và đảm bảo cho người dùng quyền biết dữ liệu của họ được sử dụng như thế nào. GDPR còn cung cấp thêm tính năng mã hóa và bảo vệ dữ liệu trong quá trình truyền. Các quy định này đặt ra các tiêu chuẩn nghiêm ngặt để đảm bảo quyền riêng tư và quyền của người dùng, ủng hộ sự minh bạch rõ ràng và kiểm soát thông tin cá nhân. Với những yêu cầu này, chúng tôi phải phát triển các cơ chế bảo mật mạnh mẽ trong các quy trình AI dưới dạng Dịch vụ (AIaaS) để duy trì sự tin cậy và tuân thủ.
FHE giải quyết vấn đề
Bằng cách thực hiện a và b Với mã hóa, chúng tôi có thể đảm bảo rằng dữ liệu đầu vào vẫn ở chế độ riêng tư.
Mã hóa đồng hình hoàn toàn (FHE) cung cấp giải pháp cho các vấn đề về quyền riêng tư dữ liệu liên quan đến điện toán đám mây. Lược đồ FHE hỗ trợ các hoạt động như cộng và nhân bản mã. Khái niệm này rất đơn giản và rõ ràng: tổng của hai giá trị được mã hóa bằng kết quả được mã hóa của tổng của hai giá trị đó và điều này cũng đúng đối với phép nhân.
Trong hoạt động thực tế, nó hoạt động như sau: người dùng thực hiện cục bộ các thao tác bổ sung trên các giá trị văn bản gốc ? và ?. Sau đó, người dùng mã hóa ? và ? và gửi bản mã đến máy chủ đám mây. Máy chủ có thể thực hiện các thao tác cộng (đồng hình) trên các giá trị được mã hóa và trả về kết quả. Kết quả được giải mã từ máy chủ sẽ nhất quán với việc bổ sung văn bản gốc cục bộ của ? và ?. Quá trình này vừa đảm bảo quyền riêng tư dữ liệu vừa cho phép thực hiện tính toán trên đám mây.
Mạng thần kinh sâu (DNN) dựa trên mã hóa đồng hình hoàn toàn
Ngoài các phép tính cộng và nhân cơ bản, đã đạt được tiến bộ đáng kể trong việc sử dụng mã hóa đồng hình hoàn toàn (FHE) để xử lý mạng thần kinh trong quy trình AI dưới dạng dịch vụ. Trong bối cảnh này, người dùng có thể mã hóa dữ liệu đầu vào thô thành văn bản mã hóa và chỉ truyền những dữ liệu được mã hóa này đến máy chủ đám mây. Sau đó, máy chủ thực hiện các phép tính đồng cấu trên các bản mã này, tạo ra đầu ra được mã hóa và trả về cho người dùng. Điều quan trọng là chỉ người dùng mới giữ khóa riêng, cho phép họ giải mã và truy cập kết quả. Điều này xây dựng luồng dữ liệu được mã hóa FHE từ đầu đến cuối, đảm bảo dữ liệu người dùng luôn ở chế độ riêng tư trong suốt quá trình.
Mạng thần kinh dựa trên mã hóa hoàn toàn đồng hình cung cấp cho người dùng sự linh hoạt đáng kể về AI như một dịch vụ. Sau khi bản mã được gửi đến máy chủ, người dùng có thể ngoại tuyến vì không cần phải liên lạc thường xuyên giữa máy khách và máy chủ. Tính năng này đặc biệt có lợi cho các thiết bị IoT, thường hoạt động trong những điều kiện hạn chế mà việc liên lạc thường xuyên thường không thực tế.
Tuy nhiên, cần lưu ý những hạn chế của mã hóa đồng cấu hoàn toàn (FHE). Chi phí tính toán của nó rất lớn; các chương trình FHE vốn đã tốn thời gian, phức tạp và tốn nhiều tài nguyên. Ngoài ra, FHE hiện đang gặp khó khăn trong việc hỗ trợ hiệu quả các hoạt động phi tuyến, điều này đặt ra thách thức đối với việc triển khai mạng lưới thần kinh. Hạn chế này có thể ảnh hưởng đến độ chính xác của mạng nơ-ron được xây dựng trên FHE, vì các hoạt động phi tuyến rất quan trọng đối với hiệu suất của các mô hình đó.
K.-Y. Lam, X. Lu, L. Zhang, X. Wang, H. Wang, và S. Q. Goh, "Ứng dụng mạng thần kinh tăng cường quyền riêng tư dựa trên mã hóa hoàn toàn đồng nhất hiệu quả trong AI dưới dạng dịch vụ," được trình bày tại Đại học Công nghệ Nanyang ( Singapore) và Viện Hàn lâm Khoa học Trung Quốc (Trung Quốc).
(Lam và cộng sự, 2024) mô tả giao thức mạng thần kinh nâng cao quyền riêng tư cho dịch vụ AI. Giao thức trước tiên xác định các tham số của lớp đầu vào bằng cách sử dụng kỹ thuật học lỗi (LWE). LWE là một mật mã nguyên thủy được sử dụng để bảo vệ dữ liệu thông qua mã hóa để có thể thực hiện tính toán trên dữ liệu được mã hóa mà không cần giải mã trước. Đối với lớp đầu ra ẩn, các tham số được xác định bởi vòng LWE (RLWE) và vòng GSW (RGSW). Hai công nghệ mã hóa tiên tiến này mở rộng LWE để đạt được các hoạt động mã hóa hiệu quả hơn.
Các tham số công khai bao gồm các cơ sở phân rã ? và ? ??Cho một vectơ đầu vào < mi>? Độ dài là ?, một nhóm < mrow >? LWE ciphertext(? mi>?,??)Đối với mỗi phần tử ?[ mo >?]Đã tạo khóa riêng LWE ?< /mrow>, khóa đánh giá cho ? được tạo cho chỉ mục ? /mi>[?]> 0 và ?[?< mo Stretchy="false">]<0Ngoài ra, đối với ? Đặt một bộ khóa chuyển đổi LWE. Các khóa này cho phép chuyển đổi hiệu quả giữa các sơ đồ mã hóa khác nhau.
Lớp đầu vào được chỉ định là lớp 0 và lớp đầu ra là lớp ? cho mỗi lớp ?Số lượng nơ-ron từ 1 đến ? là < ngữ nghĩa >??Được xác định ở cấp 0. Ma trận trọng số??Vectơ độ lệch ?? Bắt đầu từ lớp 0 Lớp phủ được xác định trên lớp 0. Đối với mỗi nơ-ron ℎ từ 0 đến ? ?−1 từ ?< /mi>−Văn bản mã hóa LWE của lớp 1 được đánh giá theo mã hóa đồng cấu. Điều này có nghĩa là các phép tính được thực hiện trên dữ liệu được mã hóa để tính các hàm tuyến tính trong ℎ. Tế bào thần kinh thứ - trong lớp ?, kết hợp với ma trận trọng số và vectơ thiên vị. Sau đó, bảng tra cứu (LUT) được đánh giá theo ℎ. - nơ-ron thứ , và từ ?′ chuyển sang ?Sau khi thực hiện thao tác, kết quả sẽ được làm tròn và định lại tỷ lệ. Kết quả được đưa vào bộ sưu tập văn bản mã hóa LWE của lớp ?.
Cuối cùng, giao thức trả về bản mã LWE cho người dùng. Sau đó, người dùng có thể sử dụng khóa riêng ? để giải mã tất cả văn bản mã hóa. Tìm kết quả suy luận.
Giao thức này triển khai một cách hiệu quả khả năng suy luận mạng thần kinh bảo đảm quyền riêng tư bằng cách sử dụng công nghệ mã hóa đồng hình hoàn toàn (FHE). FHE cho phép thực hiện các phép tính trên dữ liệu được mã hóa mà không làm rò rỉ dữ liệu đến máy chủ xử lý, đảm bảo quyền riêng tư của dữ liệu đồng thời cung cấp các lợi thế của AI như một dịch vụ.
Việc áp dụng mã hóa đồng cấu hoàn toàn trong AI
FHE (mã hóa hoàn toàn đồng cấu) giúp thực hiện các phép tính an toàn trên dữ liệu được mã hóa chứ không chỉ mở Nhiều kịch bản ứng dụng mới đảm bảo quyền riêng tư và bảo mật dữ liệu.
Quyền riêng tư của người tiêu dùng trong quảng cáo: (Armknecht và cộng sự, 2013) đã đề xuất một hệ thống đề xuất đổi mới sử dụng mã hóa đồng hình hoàn toàn (FHE). Hệ thống này có thể cung cấp các đề xuất được cá nhân hóa cho người dùng đồng thời đảm bảo rằng nội dung của các đề xuất này hoàn toàn được bảo mật đối với chính hệ thống. Điều này đảm bảo tính riêng tư của thông tin ưu tiên của người dùng và giải quyết hiệu quả các vấn đề lớn về quyền riêng tư trong quảng cáo được nhắm mục tiêu.
Ứng dụng y tế: (Naehrig và cộng sự, 2011) đưa ra một kịch bản hấp dẫn cho ngành chăm sóc sức khỏe. Họ đề xuất sử dụng mã hóa đồng hình hoàn toàn (FHE) để liên tục tải dữ liệu y tế của bệnh nhân lên nhà cung cấp dịch vụ ở dạng mã hóa. Cách tiếp cận này đảm bảo rằng thông tin y tế nhạy cảm được giữ bí mật trong suốt vòng đời của nó, vừa nâng cao quyền riêng tư của bệnh nhân vừa cho phép các tổ chức chăm sóc sức khỏe xử lý và phân tích dữ liệu liền mạch.
Khai thác dữ liệu: Khai thác các tập dữ liệu lớn có thể mang lại những hiểu biết sâu sắc đáng kể nhưng thường gây tổn hại đến quyền riêng tư của người dùng. (Yang, Zhong và Wright, 2006) đã giải quyết vấn đề này bằng cách áp dụng mã hóa chức năng trong bối cảnh mã hóa đồng cấu hoàn toàn (FHE). Cách tiếp cận này giúp có thể trích xuất thông tin có giá trị từ các tập dữ liệu khổng lồ mà không ảnh hưởng đến tính bảo mật về quyền riêng tư của các cá nhân được khai thác.
Quyền riêng tư về tài chính: Hãy xem xét tình huống trong đó một công ty có dữ liệu nhạy cảm và thuật toán độc quyền phải được giữ bí mật. (Naehrig và cộng sự, 2011) đã đề xuất mã hóa đồng cấu để giải quyết vấn đề này. Bằng cách áp dụng mã hóa đồng hình hoàn toàn (FHE), các công ty có thể thực hiện các tính toán cần thiết trên dữ liệu được mã hóa mà không làm lộ dữ liệu hoặc thuật toán, đảm bảo quyền riêng tư tài chính và bảo vệ sở hữu trí tuệ.
Nhận dạng hình ảnh pháp y: (Bosch và cộng sự, 2014) mô tả một phương pháp gia công nhận dạng hình ảnh pháp y bằng cách sử dụng mã hóa đồng hình hoàn toàn (FHE). Công nghệ này đặc biệt có lợi cho các cơ quan thực thi pháp luật. Bằng cách áp dụng FHE, cảnh sát và các cơ quan khác có thể phát hiện các hình ảnh bất hợp pháp trên ổ cứng mà không làm lộ nội dung của chúng, do đó bảo vệ tính toàn vẹn và bảo mật của dữ liệu đang được điều tra.
Mã hóa hoàn toàn đồng hình hứa hẹn sẽ cách mạng hóa cách chúng ta xử lý thông tin nhạy cảm trong nhiều lĩnh vực, từ quảng cáo và chăm sóc sức khỏe đến khai thác dữ liệu, an ninh tài chính và thực thi pháp luật. Khi chúng tôi tiếp tục phát triển và cải tiến những công nghệ này, tầm quan trọng của việc bảo vệ quyền riêng tư và bảo mật trong một thế giới ngày càng dựa trên dữ liệu là không thể phủ nhận.
Hạn chế của Mã hóa hoàn toàn đồng hình (FHE)
Bất chấp tiềm năng của nó, chúng tôi vẫn cần giải quyết một số hạn chế chính
Hỗ trợ nhiều người dùng: Mã hóa đồng hình hoàn toàn (FHE) cho phép thực hiện tính toán trên dữ liệu được mã hóa, nhưng độ phức tạp tăng theo cấp số nhân trong các tình huống liên quan đến nhiều người dùng. Thông thường, dữ liệu của mỗi người dùng được mã hóa bằng khóa chung duy nhất. Việc quản lý các bộ dữ liệu khác nhau này, đặc biệt là trong môi trường quy mô lớn do nhu cầu tính toán của FHE, trở nên không thực tế. Để đạt được mục tiêu này, các nhà nghiên cứu như Lopez-Alt và cộng sự đã đề xuất một khung FHE đa khóa vào năm 2013 cho phép hoạt động đồng thời trên các tập dữ liệu được mã hóa bằng các khóa khác nhau. Cách tiếp cận này, mặc dù đầy hứa hẹn, nhưng lại tạo ra các lớp phức tạp bổ sung và yêu cầu sự phối hợp tốt trong quản lý khóa và kiến trúc hệ thống để đảm bảo quyền riêng tư và hiệu quả.
Chi phí tính toán quy mô lớn: Cốt lõi của mã hóa đồng cấu hoàn toàn (FHE) nằm ở khả năng thực hiện các phép tính trên dữ liệu được mã hóa. Tuy nhiên, khả năng này đi kèm với một mức giá rất lớn. Chi phí tính toán của các hoạt động FHE tăng đáng kể so với các tính toán không được mã hóa truyền thống. Chi phí này thường biểu hiện ở dạng đa thức, nhưng liên quan đến đa thức bậc cao, làm trầm trọng thêm thời gian chạy và khiến nó không phù hợp với các ứng dụng thời gian thực. Tăng tốc phần cứng cho FHE thể hiện một cơ hội thị trường to lớn, nhằm giảm độ phức tạp tính toán và tăng tốc độ thực thi.
Hoạt động hạn chế: Những tiến bộ gần đây thực sự đã mở rộng phạm vi ứng dụng của mã hóa đồng cấu hoàn toàn, cho phép nó hỗ trợ nhiều hoạt động khác nhau. Tuy nhiên, nó vẫn chủ yếu phù hợp cho các phép tính tuyến tính và đa thức, đây là một hạn chế đáng kể đối với các ứng dụng trí tuệ nhân tạo liên quan đến các mô hình phi tuyến phức tạp như mạng lưới thần kinh sâu. Các hoạt động mà các mô hình AI này yêu cầu đang gặp khó khăn trong việc thực thi hiệu quả trong các khung mã hóa đồng hình hoàn toàn hiện tại. Mặc dù chúng tôi đang đạt được tiến bộ, nhưng khoảng cách giữa khả năng hoạt động của mã hóa đồng hình hoàn toàn và nhu cầu về các thuật toán AI tiên tiến vẫn là một trở ngại quan trọng cần phải vượt qua.
Mã hóa đồng cấu hoàn toàn trong bối cảnh mã hóa và trí tuệ nhân tạo
Sau đây là một số dự án dành riêng cho việc sử dụng mã hóa đồng cấu hoàn toàn mã hóa trong lĩnh vực mã hóa Các công ty sử dụng Mã hóa đồng hình (FHE) cho các ứng dụng AI:
Zama cung cấp Concrete ML, một bộ mã nguồn mở. các công cụ được thiết kế để đơn giản hóa dữ liệu Các nhà khoa học sử dụng quy trình mã hóa đồng hình hoàn toàn (FHE). Concrete ML chuyển đổi các mô hình học máy thành các mô hình tương đương đồng hình của chúng, cho phép tính toán bí mật trên dữ liệu được mã hóa. Cách tiếp cận của Zama cho phép các nhà khoa học dữ liệu tận dụng FHE mà không cần kiến thức chuyên sâu về mật mã, điều này đặc biệt hữu ích trong các lĩnh vực mà quyền riêng tư dữ liệu là rất quan trọng, chẳng hạn như chăm sóc sức khỏe và tài chính. Các công cụ của Zama hỗ trợ phân tích dữ liệu an toàn và học máy trong khi vẫn mã hóa thông tin nhạy cảm.
Privasee tập trung vào việc xây dựng mạng điện toán AI an toàn. Nền tảng của họ sử dụng công nghệ Mã hóa hoàn toàn đồng hình (FHE) để cho phép nhiều bên cộng tác mà không làm rò rỉ thông tin nhạy cảm. Bằng cách sử dụng FHE, Privasee đảm bảo rằng dữ liệu người dùng vẫn được mã hóa trong toàn bộ quá trình tính toán AI, do đó bảo vệ quyền riêng tư và tuân thủ các quy định bảo vệ dữ liệu nghiêm ngặt như GDPR. Hệ thống của họ hỗ trợ nhiều mô hình AI, cung cấp giải pháp linh hoạt để xử lý dữ liệu an toàn.
Octra kết hợp tiền điện tử với trí tuệ nhân tạo để cải thiện hiệu quả quản lý dữ liệu và bảo mật giao dịch kỹ thuật số. Bằng cách tích hợp mã hóa hoàn toàn đồng hình (FHE) và công nghệ máy học, Octra cam kết tăng cường bảo mật và bảo vệ quyền riêng tư của bộ lưu trữ đám mây phi tập trung. Nền tảng của nó sử dụng công nghệ blockchain, mật mã và trí tuệ nhân tạo để đảm bảo dữ liệu người dùng luôn được mã hóa và bảo mật. Chiến lược này xây dựng một khuôn khổ vững chắc cho bảo mật giao dịch kỹ thuật số và quyền riêng tư dữ liệu trong nền kinh tế phi tập trung.
Mind Network kết hợp mã hóa đồng hình hoàn toàn (FHE) với trí tuệ nhân tạo để đạt được các phép tính được mã hóa an toàn trong quá trình xử lý trí tuệ nhân tạo mà không cần giải mã. Điều này thúc đẩy một môi trường AI phi tập trung, bảo vệ quyền riêng tư, kết hợp liền mạch giữa bảo mật mật mã với các khả năng AI. Cách tiếp cận này không chỉ bảo vệ tính bảo mật của dữ liệu mà còn tạo ra một môi trường phi tập trung, không tin cậy, nơi các hoạt động AI có thể được thực hiện mà không cần dựa vào cơ quan trung ương hoặc tiết lộ thông tin nhạy cảm, kết hợp hiệu quả sức mạnh mã hóa của FHE với các yêu cầu Vận hành cho hệ thống trí tuệ nhân tạo.
Số lượng các công ty đi đầu trong lĩnh vực mã hóa đồng hình hoàn toàn (FHE), trí tuệ nhân tạo (AI) và tiền điện tử vẫn còn hạn chế. Điều này chủ yếu là do việc triển khai FHE hiệu quả đòi hỏi chi phí tính toán rất lớn, đòi hỏi sức mạnh xử lý mạnh để thực hiện các phép tính mật mã một cách hiệu quả.
Kết luận
Mã hóa đồng hình hoàn toàn (FHE) giúp nâng cao quyền riêng tư trong AI bằng cách cho phép tính toán trên dữ liệu được mã hóa mà không cần giải mã, một phương pháp đầy hứa hẹn. Khả năng này đặc biệt có giá trị trong các lĩnh vực nhạy cảm như chăm sóc sức khỏe và tài chính, nơi quyền riêng tư dữ liệu rất quan trọng. Tuy nhiên, FHE phải đối mặt với những thách thức đáng kể, bao gồm chi phí tính toán cao và những hạn chế trong việc xử lý các hoạt động phi tuyến cần thiết cho học sâu. Bất chấp những trở ngại này, những tiến bộ trong thuật toán FHE và khả năng tăng tốc phần cứng đang mở đường cho các ứng dụng thực tế hơn trong AI. Sự phát triển liên tục trong lĩnh vực này hứa hẹn sẽ cải thiện đáng kể các dịch vụ AI bảo mật, bảo mật quyền riêng tư, cân bằng hiệu quả tính toán với khả năng bảo vệ dữ liệu mạnh mẽ.