원래 게시자: Advait (Leo) Jayant
A는 넷플릭스와 아마존에서 고도로 개인화된 추천을 원하지만, B는 넷플릭스나 아마존이 자신의 선호도를 알기를 원하지 않습니다.
오늘날의 디지털 시대에 우리는 아마존이나 넷플릭스와 같은 서비스에서 자신의 관심사에 정확하게 맞춰진 개인화된 추천의 편리함을 누리고 있습니다. 하지만 이러한 플랫폼이 우리의 사생활까지 파고들면서 불안감이 커지고 있습니다. 우리는 프라이버시를 희생하지 않으면서도 맞춤화된 서비스를 원합니다. 과거에는 대량의 개인 데이터를 클라우드 기반 AI 시스템에 공유하지 않고 개인화를 달성하는 방법이 역설처럼 보였습니다. 완전 동형 암호화(FHE)는 이 두 가지를 모두 달성할 수 있는 솔루션을 제공합니다.
인공지능 서비스(AIaaS)
인공지능(AI)은 오늘날 컴퓨터 비전, 자연어 처리(NLP), 추천 시스템 등 여러 영역에서 복잡한 문제를 해결하는 데 핵심적인 역할을 하고 있습니다. 그러나 이러한 AI 모델의 개발은 일반 사용자에게 다음과 같은 중대한 과제를 안겨줍니다.
1. 데이터 양: 정확한 모델을 구축하려면 수조 바이트에 달하는 방대한 데이터 세트가 필요한 경우가 많습니다.
2. 연산 능력: 변환기와 같은 복잡한 모델에는 수십 개의 GPU가 필요하며, 종종 몇 주 동안 연속적으로 실행되는 경우가 많습니다.
3. 도메인 전문성: 이러한 모델을 미세 조정하려면 고도의 전문성이 필요합니다.
이러한 장벽 때문에 대부분의 사용자는 스스로 강력한 머신 러닝 모델을 개발하기 어렵습니다.
실제 애플리케이션에서의 서비스형 AI 파이프라인
사용자가 최첨단 신경망 모델에 액세스할 수 있도록 FAANG 회원사를 비롯한 거대 기술 기업이 관리하는 클라우드 서비스를 제공함으로써 앞서 언급한 장애물을 극복하는 모델인 서비스형 AI(AIaaS)의 시대가 열리고 있습니다. 사용자는 이러한 플랫폼에 원시 데이터를 업로드하기만 하면 데이터가 처리되어 통찰력 있는 추론을 생성합니다.AIaaS는 고품질 머신러닝 모델에 대한 액세스를 효과적으로 대중화하여 더 많은 커뮤니티에 고급 AI 도구를 개방했습니다. 하지만 안타깝게도 오늘날의 AIaaS는 이러한 편리함을 제공하는 대가로 개인 정보를 희생하고 있습니다.
서비스형 AI의 데이터 프라이버시
현재 데이터는 클라이언트에서 서버로 전송되는 동안에만 암호화됩니다. 서버는 입력 데이터와 해당 데이터를 기반으로 한 예측에 액세스할 수 있습니다.
서비스형 AI에서는 서버가 입력 데이터와 출력 데이터 모두에 액세스할 수 있습니다. 이러한 상황은 일반 사용자가 의료 및 금융 데이터와 같은 민감한 정보를 공유하는 것을 복잡하게 만듭니다. GDPR 및 CCPA와 같은 규정은 사용자가 데이터를 공유하기 전에 명시적으로 동의하도록 요구하고 자신의 데이터가 어떻게 사용되는지 알 권리를 보장함으로써 이러한 문제를 더욱 악화시키며, GDPR은 전송 중인 데이터의 암호화 및 보호를 의무화함으로써 한 걸음 더 나아갑니다. 이러한 규정은 사용자의 개인정보 보호와 권리를 보장하기 위해 엄격한 기준을 설정하여 개인 정보에 대한 명확한 투명성과 통제를 옹호합니다. 이러한 요건을 고려할 때, 신뢰와 규정 준수를 유지하기 위해 서비스형 AI(AIaaS) 프로세스 내에 강력한 개인정보 보호 메커니즘을 개발하는 것이 필수적입니다.
FHE가 문제를 해결합니다
A와 B를 암호화하면 입력 데이터를 비공개로 유지할 수 있습니다.
완전 동형 암호화(FHE)는 클라우드 컴퓨팅과 관련된 데이터 프라이버시 문제에 대한 솔루션을 제공합니다.FHE 체계는 암호문 덧셈 및 곱셈과 같은 연산을 지원합니다. 개념은 간단합니다. 암호화된 두 값의 합은 두 값의 합에 대한 암호화 결과와 같으며 곱셈도 마찬가지입니다.
실제로는 다음과 같이 작동합니다. 사용자가 로컬에서 일반 텍스트 값 ? 와 ? 는 더하기 연산을 수행합니다. 그런 다음 사용자가 ? 와 ? 를 암호화하고 암호 텍스트를 클라우드 서버로 보냅니다. 서버는 암호화된 값에 대해 (동형적으로) 더하기 연산을 수행하고 결과를 반환할 수 있습니다. 서버에서 복호화된 결과는 ? 및 ? 의 로컬 일반 텍스트 더하기 결과와 동일합니다. 이 프로세스는 데이터 프라이버시를 보호하는 동시에 클라우드에서 계산을 수행할 수 있도록 합니다.
완전한 동형 암호화를 기반으로 하는 심층 신경망(DNN)
기본 덧셈과 곱셈 연산 외에도, 서비스로서의 AI에서 프로세스에서는 신경망 처리를 위한 완전 동형 암호화(FHE)를 사용하는 데 상당한 진전이 있었습니다. 이러한 맥락에서 사용자는 원시 입력 데이터를 암호 텍스트로 암호화하고 이렇게 암호화된 데이터만 클라우드 서버로 전송할 수 있습니다. 그러면 서버는 이러한 암호 텍스트에 대해 동형 연산을 수행하여 암호화된 출력을 생성한 후 사용자에게 반환합니다. 결정적으로, 사용자만 개인 키를 보유하므로 암호를 해독하고 결과에 액세스할 수 있습니다. 이를 통해 엔드투엔드 FHE 암호화 데이터 스트림이 구축되어 프로세스 전반에 걸쳐 사용자 데이터의 프라이버시와 보안을 보장합니다.
완전한 동형 암호화를 기반으로 하는 신경망은 서비스형 AI에서 사용자에게 상당한 유연성을 제공합니다. 암호 텍스트가 서버로 전송되면 클라이언트와 서버 간에 자주 통신할 필요가 없으므로 사용자는 오프라인 상태로 전환할 수 있습니다. 이 기능은 일반적으로 빈번한 통신이 비현실적인 제한된 조건에서 작동하는 IoT 장치에 특히 유용합니다.
그러나 완전 동형 암호화(FHE)의 한계에 주목할 필요가 있습니다. FHE 방식은 본질적으로 시간이 많이 걸리고 복잡하며 리소스 집약적인 방식이기 때문에 계산 오버헤드가 매우 큽니다. 또한 FHE는 현재 비선형 연산을 효과적으로 지원하지 못하기 때문에 신경망 구현에 어려움을 겪고 있습니다. 비선형 연산은 이러한 모델의 성능에 매우 중요하기 때문에 이러한 한계는 FHE를 기반으로 구축된 신경망의 정확도에 영향을 미칠 수 있습니다.
K.-Y. Lam, X. Lu, L. Zhang, X. Wang, H. Wang, S. Q. Goh, "효율적인 완전 동형 암호화를 기반으로 한 프라이버시 강화 신경망(AI-as-a-service 애플리케이션에서 효율적인 완전 동형 암호화를 기반으로 한 프라이버시 강화 신경망", 싱가포르 난양공과대학교와 중국과학원(중국)에서 발표.
(Lam et al., 2024)에서는 서비스형 AI를 위한 프라이버시 강화 신경망 프로토콜에 대해 설명합니다. 이 프로토콜은 암호화를 통해 데이터를 보호하는 데 사용되는 암호화 기본 요소인 오류에 의한 학습(LWE)을 사용하여 입력 계층의 매개변수를 정의하는 것으로 시작하여 암호화된 데이터를 먼저 해독하지 않고도 계산할 수 있도록 합니다. 숨겨진 출력 계층의 경우, 매개변수는 보다 효율적인 암호화 작업을 위해 LWE를 확장하는 두 가지 고급 암호화 기술인 링 LWE(RLWE) 및 링 GSW(RGSW)로 정의됩니다.
공개 매개변수에는 분해 기준 ? 및 ? ? ? 입력 벡터가 주어졌을 때 ? 의 길이 ? , ? LWE 암호(? ? ,? ? ) 각 요소에 대한 ? [? ]는 LWE 개인키를 사용하여 생성됩니다 ? 에서 ? 평가 키가 인덱싱되어 ? [? ]>0 및 ? [? ]<0 또한, 의 경우? 는 LWE 전환 키 세트를 설정합니다. 이러한 키는 서로 다른 암호화 체계 간의 효율적인 전환을 지원합니다.
입력 레이어는 레이어 0으로 지정되고 출력 레이어는 레이어 ? 각 레이어에 대해 ? 에서 1까지 ? 뉴런의 수는 ? ? 가 레이어 0에서 결정되었습니다. 가중치 행렬 ? ? 바이어스 벡터 ? ? 레이어 0에서 시작하여 레이어 0에 대한 중첩이 정의됩니다. 각 뉴런에 대해 0에서 ℎ까지 ? ? -1에서 첫 번째 ? -1 레이어는 동형 암호화로 평가됩니다. 즉, 암호화된 데이터에 대한 계산이 수행되어 ℎ에서 선형 함수를 계산합니다. 첫 번째 ? 레이어를 -번째 뉴런에 가중치 행렬과 바이어스 벡터를 결합합니다. 그 후, 룩업 테이블(LUT)이 ℎ에서 평가됩니다. -번째 뉴런, 그리고 <세맨틱스>에서? ′에서 더 작은 로 전환하는 경우? 실행 연산을 수행한 후 결과를 반올림하고 재조정합니다. 결과는 첫 번째 ? 레이어에 통합됩니다.
마지막으로 프로토콜은 LWE 암호를 사용자에게 반환합니다. 그러면 사용자는 개인 키 ? 를 사용하여 모든 암호 텍스트를 해독할 수 있습니다. 추론의 결과를 찾습니다.
이 프로토콜은 완전 동형 암호화(FHE) 기술을 활용하여 프라이버시를 보호하는 신경망 추론을 효율적으로 구현하며, FHE는 데이터 자체를 처리 서버에 공개하지 않고 암호화된 데이터에 대해 계산을 수행할 수 있게 하여 데이터 프라이버시를 보장하는 동시에 서비스형 AI의 이점을 제공합니다.
AI에서 완전 동형 암호화의 적용
FHE(완전 동형 암호화)는 암호화된 데이터에서 안전한 연산을 가능하게 하여 수많은 새로운 애플리케이션 시나리오를 열어줄 뿐만 아니라 데이터 개인정보 보호 및 보안을 보장합니다.
광고에서의 소비자 개인정보 보호: (Armknecht et al., 2013)는 완전 동형 암호화(FHE)를 활용하는 혁신적인 추천 시스템을 제시합니다. 이 시스템은 사용자에게 개인화된 추천을 제공하는 동시에 이러한 추천의 콘텐츠가 시스템 자체에 완전히 비공개로 유지되도록 보장할 수 있습니다. 이를 통해 사용자의 선호 정보에 대한 프라이버시를 보장하고 타겟 광고의 중요한 개인정보 보호 문제를 효과적으로 해결할 수 있습니다.
의료 애플리케이션: (Naehrig et al., 2011)은 의료 산업을 위한 매력적인 솔루션을 제안합니다. 이들은 환자의 의료 데이터를 암호화된 형태로 서비스 제공업체에 지속적으로 업로드하기 위해 완전동형암호화(FHE)를 사용할 것을 제안합니다. 이 접근 방식은 민감한 의료 정보가 수명 주기 내내 기밀로 유지되도록 보장하여 환자의 개인정보 보호를 강화하고 의료 기관이 데이터를 원활하게 처리하고 분석할 수 있도록 합니다.
데이터 마이닝: 대규모 데이터 세트를 마이닝하면 중요한 인사이트를 얻을 수 있지만, 사용자 개인정보가 희생되는 경우가 많습니다. (양, 종, 라이트, 2006)는 완전 동형 암호화(FHE)의 맥락에서 함수형 암호화를 적용하여 이 문제를 해결했습니다. 이 접근 방식을 사용하면 채굴된 데이터의 개인 정보 보안을 손상시키지 않고 대규모 데이터 세트에서 가치 있는 정보를 추출할 수 있습니다.
금융 개인정보 보호: 기업이 비밀로 유지해야 하는 민감한 데이터와 독점 알고리즘을 보유하고 있는 시나리오를 상상해 보세요. 이 문제를 해결하기 위해 동형 암호화를 제안한 연구(Naehrig et al., 2011)는 동형 암호화를 제안합니다. 완전 동형 암호화(FHE)를 적용하면 데이터나 알고리즘을 노출하지 않고 암호화된 데이터에 필요한 연산을 수행할 수 있어 금융 개인정보 보호와 지적 재산 보호를 보장할 수 있습니다.
포렌식 이미지 인식:(Bosch et al., 2014)에서는 완전 동형 암호화(FHE)를 사용하여 포렌식 이미지 인식을 아웃소싱하는 방법을 설명합니다. 이 기술은 법 집행 기관에 특히 유용합니다. 경찰 및 기타 기관은 FHE를 적용하여 이미지의 내용을 공개하지 않고도 하드 드라이브에서 불법 이미지를 탐지할 수 있으므로 수사 시 데이터의 무결성과 기밀성을 보호할 수 있습니다.
완전 동형 암호화는 광고, 의료, 데이터 마이닝, 금융 보안, 법 집행 등 다양한 분야에서 민감한 정보를 처리하는 방식에 혁신을 가져올 것입니다. 이러한 기술을 지속적으로 개발하고 개선함에 따라 데이터 중심의 세상에서 개인 정보 보호와 보안의 중요성은 아무리 강조해도 지나치지 않습니다.
전체 동형 암호화(FHE)의 한계
잠재력에도 불구하고 여전히 해결해야 할 몇 가지 주요 한계가 있습니다
다중 사용자 지원: 전체 동형 암호화(FHE)를 사용하면 암호화된 데이터가 계산할 수 있지만, 여러 사용자가 포함된 시나리오에서는 복잡성이 기하급수적으로 증가합니다. 일반적으로 각 사용자의 데이터는 고유한 공개 키를 사용하여 암호화됩니다. 특히 FHE의 계산 수요를 고려한 대규모 환경에서는 이러한 이질적인 데이터 세트를 관리하는 것이 비현실적입니다. 이러한 이유로 Lopez-Alt 등의 연구자들은 2013년에 서로 다른 키로 암호화된 데이터 세트에 대한 동시 작업을 허용하는 다중 키 FHE 프레임워크를 제안했습니다. 이 접근 방식은 유망하지만, 추가적인 복잡성 계층을 도입하고 개인정보 보호와 효율성을 보장하기 위해 키 관리 및 시스템 아키텍처 측면에서 세밀한 조율이 필요합니다.
대규모 연산 오버헤드: 완전 동형 암호화(FHE)의 핵심은 암호화된 데이터에 대한 연산 수행 능력입니다. 하지만 이 기능에는 막대한 비용이 발생합니다. FHE 연산의 계산 오버헤드는 기존의 비암호화 연산에 비해 상당히 높습니다. 이 오버헤드는 일반적으로 다항식 형태로 표현되지만, 고차 다항식을 포함하기 때문에 런타임을 악화시켜 실시간 애플리케이션에는 적합하지 않습니다. FHE용 하드웨어 가속은 계산 복잡성을 줄이고 실행 속도를 높이기 위해 설계된 상당한 시장 기회를 나타냅니다.
유한 연산: 최근의 발전으로 완전 동형 암호화의 적용 범위가 실제로 넓어져 더 다양한 연산을 지원할 수 있게 되었습니다. 하지만 여전히 선형 및 다항식 연산에 주로 적용되며, 이는 심층 신경망과 같은 복잡한 비선형 모델을 포함하는 AI 애플리케이션에는 큰 제약이 됩니다. 이러한 AI 모델에 필요한 연산은 현재의 완전 동형 암호화 프레임워크에서 효율적으로 실행하기 어렵습니다. 진전이 이루어지고 있지만, 완전 동형 암호화의 운영 능력과 고급 AI 알고리즘의 요구 사항 사이의 격차는 여전히 극복해야 할 주요 장벽으로 남아 있습니다.
암호화 및 AI 맥락에서의 완전동형암호
다음은 완전동형암호(FHE)를 활용하여 암호화 영역에서 AI 애플리케이션을 연구하는 몇 가지 기업들입니다:
< li>Zama는 데이터 과학자를 위해 완전 동형 암호화(FHE) 사용 프로세스를 간소화하도록 설계된 오픈 소스 도구 모음인 Concrete ML을 제공합니다.Concrete ML은 머신러닝 모델을 동형 동등한 형태로 변환하여 암호화된 데이터의 기밀 계산을 가능하게 합니다.Zama의 접근 방식을 통해 데이터 과학자는 심층적인 암호화 지식 없이도 FHE를 활용할 수 있습니다. FHE는 의료 및 금융과 같이 데이터 프라이버시가 중요한 분야에서 특히 유용하며, Zama의 도구는 민감한 정보를 암호화하면서 안전한 데이터 분석과 머신 러닝을 가능하게 합니다.
Privasee는 안전한 AI 컴퓨팅 네트워크 구축을 전문으로 합니다. 이 회사의 플랫폼은 완전 동형 암호화(FHE) 기술을 활용하여 여러 당사자가 민감한 정보를 노출하지 않고 협업할 수 있도록 지원합니다. 프리바시는 FHE를 사용하여 AI 연산 프로세스 전반에 걸쳐 사용자 데이터를 암호화하여 개인정보를 보호하고 GDPR과 같은 엄격한 데이터 보호 규정을 준수합니다. 이 시스템은 여러 AI 모델을 지원하여 안전한 데이터 처리를 위한 다목적 솔루션을 제공합니다.
옥트라는 암호화폐와 AI를 결합하여 디지털 거래 보안과 데이터 관리 효율성을 향상시킵니다. 옥트라는 완전동형암호화(FHE)와 머신러닝 기술을 융합하여 탈중앙화 클라우드 스토리지의 보안과 개인정보 보호를 강화하는 데 전념하고 있습니다. 이 플랫폼은 블록체인, 암호화, 인공 지능 기술을 사용하여 사용자 데이터를 항상 암호화하고 안전하게 보호합니다. 이 전략은 탈중앙화 경제에서 디지털 거래의 보안과 데이터 프라이버시를 위한 견고한 프레임워크를 구축합니다.
마인드 네트워크는 완전동형암호화(FHE)와 인공지능을 결합하여 인공지능 처리 과정에서 복호화 없이도 안전한 암호화된 연산을 가능하게 합니다. 이를 통해 암호화 보안과 AI 기능을 원활하게 결합하는 프라이버시 보호 탈중앙화 AI 환경을 촉진합니다. 이 접근 방식은 데이터의 기밀성을 보호할 뿐만 아니라 중앙 기관에 의존하거나 민감한 정보를 노출하지 않고도 AI 작업을 수행할 수 있는 신뢰 없는 분산 환경을 구현하여 FHE의 암호화 강도와 AI 시스템의 운영 요구 사항을 효과적으로 결합합니다.
완전동형암호화(FHE), 인공지능(AI), 암호화폐의 최전선에서 활동하는 기업의 수는 아직 제한적입니다. 이는 FHE를 효과적으로 구현하는 데 필요한 막대한 계산 오버헤드 때문에 암호화 연산을 효율적으로 수행할 수 있는 강력한 처리 능력이 필요하기 때문입니다.
결론
완전 동형 암호화(FHE)는 암호화된 데이터에 대해 복호화 없이 연산을 수행할 수 있게 함으로써 AI의 개인정보 보호를 강화하는 유망한 접근 방식을 제공합니다. 이 기능은 의료 및 금융과 같이 데이터 프라이버시가 중요한 민감한 영역에서 특히 유용합니다. 그러나 FHE는 높은 계산 오버헤드와 딥러닝에 필요한 비선형 연산 처리의 한계 등 상당한 과제에 직면해 있습니다. 이러한 장애물에도 불구하고 FHE 알고리즘과 하드웨어 가속화의 발전은 AI에 보다 실용적으로 적용될 수 있는 길을 열어주고 있습니다. 이 분야의 지속적인 개발은 계산 효율성과 강력한 데이터 보호의 균형을 맞추는 안전하고 개인 정보를 보호하는 AI 서비스를 크게 향상시킬 것입니다.