소개
디지털화 시대에 인공지능(AI)은 기술 혁신과 사회 발전을 이끄는 핵심 동력이 되었습니다.AI의 발전은 기술적 진보일 뿐만 아니라 지난 몇 년간 벤처캐피탈 업계와 자본 시장에서 가장 뜨거운 화두가 되어 왔습니다.
블록체인 기술의 발전과 함께 탈중앙화 AI(Decentralized AI)가 등장했습니다. 이 글에서는 탈중앙화 AI의 정의와 아키텍처에 대해 설명하고 AI 산업과 시너지를 낼 수 있는 방법에 대해 설명합니다.
탈중앙화 AI의 정의와 아키텍처
![](https://img.jinse.cn/7331810_ image3.png)
탈중앙화 AI는 분산형 컴퓨팅 리소스와 데이터 스토리지를 활용하여 개인정보 보호와 보안이 강화된 분산된 방식으로 AI 모델을 학습하고 사용합니다. 다음과 같은 네 가지 주요 아키텍처 계층이 있습니다.
- 모델 계층:탈중앙화된 AI 모델 개발, 공유 및 거래를 지원하여 글로벌 규모의 협업과 혁신을 촉진. strong>. 이 단계는 블록체인 기술을 사용하여 AI 모델 공유 및 협업을 위한 글로벌 플랫폼을 구축하는 Bittensor와 같은 프로젝트가 대표적입니다.
- 트레이닝 레이어:스마트 계약과 탈중앙화 기술을 활용하여 비용을 낮추고 AI 모델 훈련 과정을 간소화하여 훈련 효율성을 개선합니다. 이 단계의 과제는 효율적인 모델 학습을 위해 분산 컴퓨팅 리소스를 효과적으로 활용하는 방법입니다.
- 데이터 레이어: 블록체인 기술을 사용하여 데이터를 저장하고 관리함으로써 데이터 보안과 변조를 방지하는 동시에 사용자에게 데이터에 대한 완전한 제어권을 부여합니다. 이 단계의 애플리케이션으로는 블록체인 기술을 통해 데이터의 투명한 거래와 소유권 확인을 가능하게 하는 탈중앙화된 데이터 마켓플레이스 등이 있습니다.
- 산술 계층: 분산형 GPU 연산 플랫폼과 대역폭 지원을 통해 분산 컴퓨팅 자원이 제공되어 효율적인 AI 모델의 훈련과 추론을 지원합니다. 엣지 컴퓨팅 및 분산 GPU 네트워크와 같은 기술 발전은 AI 모델 학습 및 추론을 위한 새로운 솔루션을 제공합니다.
분산형 AI 대표 프로젝트
![](https://img.jinse.cn/7332354_ image3.png)
탈중앙화 AI 산업 개요: 모델 레이어
모델 레이어: 빅 모델 참여 매개변수의 수는 기하급수적으로 증가하고 모델 성능은 크게 향상되고 있지만, 모델의 추가 확장을 통한 이득은 감소하고 있습니다. 이러한 추세는 AI 모델의 방향과 성능을 유지하면서 비용과 리소스 소비를 줄이는 방법에 대해 다시 생각하게 합니다.
![](https://img.jinse.cn/7332355_image3.png)
대규모 AI 모델의 개발은 다음과 같은 "모델 성능과 매개변수 크기, 데이터 세트 크기, 계산 간에 관계가 있다는 '규모의 법칙'을 따릅니다.
![](https://img.jinse.cn/7332356_image3.png)
모델이 특정 크기로 확장되면 특정 작업의 성능이 갑자기 크게 향상됩니다. 큰 모델 파라미터의 수가 증가하면 모델 성능의 개선은 점차 감소하며, 파라미터 규모와 모델 성능의 균형을 어떻게 맞추는지가 향후 개발의 관건이 될 것입니다.
![](https://img.jinse.cn/7332357_image3.png)
AI 빅 모델용 API는 가격 경쟁이 심화되면서 여러 공급업체가 시장 점유율을 높이기 위해 가격을 인하했습니다. 그러나 빅 모델 성능이 동질화되면서 API 수익의 지속 가능성에 의문이 제기되고 있습니다. 어떻게 하면 높은 사용자 고착도를 유지하고 수익을 늘릴 수 있을지가 앞으로의 주요 과제가 될 것입니다.
![](https://img.jinse.cn/7332358_image3.png)
![](https:/. /img.jinse.co.uk/7332359_image3.png)
엔드 사이드 모델링의 적용은 데이터 정밀도를 낮추고 혼합 전문 모델(MoE) 아키텍처를 채택함으로써 달성할 수 있습니다. 모델 양자화 기술은 32비트 부동소수점 데이터를 8비트로 압축하여 모델 크기와 메모리 소비를 크게 줄일 수 있습니다. 이러한 방식으로 모델이 최종 디바이스에서 효율적으로 실행될 수 있어 AI 기술 도입을 촉진할 수 있습니다.
![](https://img.jinse.cn/7332360_image3.png)
요약: 블록체인은 모델 계층을 강화하여 AI 모델의 투명성, 협업 및 사용자 참여를 개선합니다.
![](https://img.jinse.cn/7331805_image3.png)
중앙 집중식 AI 산업 그루밍: 훈련 계층
훈련 계층: 대규모 모델 훈련에는 높은 대역폭과 저지연 통신이 필요하며 대규모 모델 시도를 위해 분산된 산술 네트워크의 가능성이 존재합니다. 이 단계의 과제는 보다 효율적인 모델 학습을 위해 통신 및 연산 리소스의 할당을 최적화하는 것입니다.
![](https://img.jinse.cn/7332361_image3.png)
분산형 산술 네트워크는 다음과 같은 잠재력을 가지고 있습니다. 대규모 모델 훈련에는 어느 정도 잠재력이 있습니다. 과도한 통신 오버헤드라는 문제에도 불구하고 스케줄링 알고리즘을 최적화하고 전송되는 데이터의 양을 압축함으로써 훈련 효율을 크게 향상시킬 수 있습니다. 하지만 실제 환경에서 네트워크 지연과 데이터 전송 병목 현상을 극복하는 방법은 여전히 분산형 훈련의 주요 과제로 남아 있습니다.
![](https://img.jinse.cn/7332362_image3.png)
빅 모델 훈련 병목 현상을 해결하기 위해 훈련 병목 현상을 해결하기 위해 데이터 압축, 스케줄링 최적화, 로컬 업데이트 및 동기화 등의 기법을 사용할 수 있습니다. 이러한 방법은 통신 오버헤드를 줄이고 훈련 효율성을 개선하여 분산형 산술 네트워크를 대규모 모델 훈련에 적합한 옵션으로 만들 수 있습니다.
![](https://img.jinse.cn/7332363_image3.png)
영지식 머신 러닝( zkML)은 영지식 증명과 머신러닝 기술을 결합하여 학습 데이터와 모델 세부 정보를 노출하지 않고도 모델 검증과 추론을 가능하게 합니다. 이 기술은 특히 의료 및 금융과 같이 높은 수준의 데이터 기밀성이 요구되는 산업에 적합하며, 데이터 프라이버시를 보장하는 동시에 AI 모델의 정확성과 신뢰성을 검증할 수 있습니다.
![](https://img.jinse.cn/7331805_image3.png)
탈중앙화된 AI 산업 그루밍: 데이터 계층
데이터의 프라이버시 및 보안은 AI 개발의 핵심 이슈가 되었습니다. 탈중앙화된 데이터 저장 및 처리 기술은 이러한 문제를 해결할 수 있는 새로운 아이디어를 제공합니다.
데이터 저장, 데이터 인덱싱, 데이터 적용은 모두 분산형 AI 시스템의 적절한 기능을 보장하기 위한 핵심 요소입니다. 파일코인이나 Arweave와 같은 탈중앙화 스토리지 플랫폼은 데이터 보안과 개인정보 보호는 물론 스토리지 비용 절감이라는 측면에서 새로운 솔루션을 제공합니다.
![](https://img.jinse.cn/7332364_image3.png)
![](https://img.jinse.cn/7332365_image3.png)
분산형 스토리지 예시:
![](https. //img.jinse.cn/7332366_image3.png)
![](https://img.jinse.cn/7332367_image3.png)
2020년 이후 Arweave는 주로 NFT 시장과 Web3 애플리케이션의 수요에 힘입어 데이터 스토리지 규모가 빠르게 성장하고 있습니다. Arweave를 통해 사용자는 탈중앙화된 영구 데이터 저장소를 구축하여 장기적인 데이터 저장 문제를 해결할 수 있습니다.
반면, AO 프로젝트는 Arweave 생태계를 더욱 강화하여 사용자에게 더욱 강력한 컴퓨팅 기능과 광범위한 애플리케이션 시나리오를 제공합니다.
![](https://img.jinse.cn/7332368_image3.png)
이 페이지에서는 일회성 결제를 통해 영구 저장을 가능하게 하는 두 가지 탈중앙화 스토리지 프로젝트인 Arweave와 월별 결제 모델을 사용하여 유연한 스토리지 서비스를 제공하는 데 중점을 둔 Filecoin을 비교합니다. 두 프로젝트 모두 기술 아키텍처, 비즈니스 규모, 시장 포지셔닝 측면에서 각기 다른 장점을 가지고 있으며, 사용자는 자신의 필요에 따라 적절한 솔루션을 선택할 수 있습니다.
탈중앙화 AI 산업 개요: 산술 계층
산술 계층: AI 모델의 복잡성이 증가하면서 컴퓨팅 자원의 필요성도 커지고 있습니다. 컴퓨팅 리소스에 대한 수요도 증가합니다. 탈중앙화된 연산 네트워크의 등장은 AI 모델 훈련과 추론에 리소스를 할당하는 새로운 방법을 제공합니다.
![](https://img.jinse.cn/7332369_image3.png)
![](https://img.jinse.cn/7332370_image3.png)
분산형 계산 네트워크(및 훈련과 추론을 위한 전용 계산 네트워크)는 현재 DeAI 회로에서 가장 활발하고 빠르게 성장하고 있는 영역입니다. 지금까지 관찰된 DeAI 회로에서 가장 활발하고 가장 빠르게 성장하는 영역입니다. 이는 실제 인프라 제공업체들이 AI 체인의 과실을 가져가는 것과 일치합니다. GPU와 같은 컴퓨팅 파워 자원의 부족이 지속됨에 따라 컴퓨팅 파워 하드웨어 장치를 갖춘 공급업체들이 이 분야에 뛰어들고 있습니다.
![](https://img.jinse.cn/7332371_image3.png)
Aethir 사례:
![](https://img.jinse.cn/7332372_image3.png)
비즈니스 모델: 산술 임대를 위한 양방향 마켓플레이스
탈중앙화된 산술 마켓플레이스 본질적으로 Web3 기술을 활용하여 그리드 컴퓨팅의 개념을 경제적으로 실행 가능한 시장으로 확장하는 방식입니다. 본질적으로 Web3 기술을 사용하여 그리드 컴퓨팅의 개념을 경제적으로 인센티브가 주어지고 신뢰가 필요 없는 환경으로 확장하는 것입니다. 탈중앙화 산술 서비스 시장은 CPU와 GPU와 같은 자원 공급자에게 유휴 산술을 탈중앙화 네트워크에 기여하도록 인센티브를 제공하고, 산술 자원의 수요 측(예: 모델 공급자)을 연결하여 더 낮은 비용으로 더 유연한 방식으로 산술 서비스 자원을 제공함으로써 형성됩니다. 탈중앙화된 연산 시장은 중앙화된 독점 클라우드 서비스 제공자에게도 도전이 될 수 있습니다.
탈중앙화 연산 시장은 제공하는 서비스 유형에 따라 범용과 전용으로 더 세분화할 수 있습니다. 범용 컴퓨팅 네트워크는 탈중앙화된 클라우드처럼 운영되며 다양한 애플리케이션에 컴퓨팅 리소스를 제공합니다. 전용 컴퓨팅 네트워크는 주로 특정 사용 사례에 맞게 제작된 특수 목적의 컴퓨팅 네트워크입니다. 예를 들어, 렌더 네트워크는 렌더링 워크로드에 초점을 맞춘 전용 컴퓨팅 네트워크이고, 젠슨은 머신러닝 모델 훈련에 초점을 맞춘 전용 컴퓨팅 네트워크이며, io.net은 범용 컴퓨팅 네트워크의 예입니다.
분산형 인프라에서 모델을 훈련할 때 발생하는 주요 과제 중 하나는 대규모 연산, 대역폭 제약, 전 세계 여러 공급업체의 이기종 하드웨어 사용으로 인한 높은 지연 시간입니다. 따라서 범용 컴퓨팅 네트워크보다 전용 AI 컴퓨팅 네트워크가 AI에 더 적합합니다. ML 모델의 중앙 집중식 학습은 여전히 가장 효율적이고 안정적인 프로젝트이지만, 프로젝트의 자본력에 대한 요구가 매우 높습니다.
결론
분산형AI. 은 떠오르는 기술 트렌드로서 데이터 프라이버시, 보안, 비용 효율성 측면에서 점차 그 장점이 입증되고 있습니다. 다음 게시물에서는 분산형 AI가 직면한 위험과 과제, 그리고 앞으로 나아갈 방향에 대해 살펴보겠습니다.