레이첼, 골든 파이낸스
자오창펑은 11월 27일 X에 올린 글에서 AI 데이터 태깅과 같은 작업은 블록체인을 통해 수행하기에 이상적이며, 글로벌 저비용 인력의 도움과 암호화폐를 통한 즉각적인 지불로 지리적 제약을 해소할 수 있다고 말했습니다.
데이터 태깅이란 텍스트, 이미지, 오디오 등의 원시 데이터에 특정 구조화된 정보를 제공하기 위해 수동 또는 자동화된 라벨을 붙이는 것을 말합니다. 라벨링된 데이터는 머신러닝 또는 AI 모델을 학습시키는 데 사용되며, 예를 들어 텍스트에 감정 범주(긍정, 부정, 중립)를 지정하는 것도 데이터 라벨링의 일종입니다. AI 데이터 라벨링에 블록체인을 사용하는 것은 높은 투명성, 신뢰성, 분산 협업을 필요로 하는 데이터 라벨링 시나리오에 특히 적합합니다. 이는 데이터 라벨링의 효율성과 품질을 향상시킬 뿐만 아니라 글로벌 협업과 데이터 거래의 새로운 가능성을 창출합니다.
현재 이 트랙에서 진행 중인 양질의 프로젝트는 무엇인가요? 이 트랙의 발전 전망은 어떻게 되나요?
AI 데이터 태깅에서 블록체인의 역할
블록체인은 탈중앙화된 분산 원장 기술로서
투명성,
불변성,
추적성을 갖춘 분산형 원장 기술입니다. 데이터 태깅의 이러한 기능은 기존 방식에서 발생하는 다음과 같은 문제를 해결할 수 있습니다.
데이터 신뢰성 및 위변조 방지: 태그된 기록은 블록체인에 기록될 때마다 임의로 변경할 수 없으며 태깅의 신뢰성을 보장합니다.
업무 배분의 투명성: 블록체인은 업무의 분배, 실행, 검토 과정을 기록하여 부당한 업무 배분이나 결과의 조작을 방지할 수 있습니다.
인센티브: 데이터 주석자는 블록체인의 스마트 계약 기술을 사용하여 작업 완료 시 암호화폐 또는 기타 보상을 자동으로 받을 수 있습니다.
데이터 추적성: 각 태그의 출처, 주석 작성자, 검토자를 추적할 수 있습니다.
적용 시나리오
분산된 마크업: 블록체인을 사용하여 을 사용하여 데이터 주석 작업을 전 세계의 주석가들에게 분산시켜 보다 효율적으로 데이터를 처리할 수 있습니다.
품질 감사: 여러 사람의 주석 작업 결과를 블록체인 기술을 통해 비교 및 감사하여 주석의 정확성을 보장합니다.
라벨링된 데이터의 거래:라벨링된 데이터는 블록체인에서 거래할 수 있으며, 구매자와 판매자는 데이터의 무결성이나 진위 여부에 대해 걱정할 필요가 없습니다.
개인정보 보호: 블록체인을 사용한 라벨링된 데이터의 암호화 저장으로 개인 데이터의 보안을 보장합니다.
관련 프로젝트
프로젝트 토큰의 경제 모델은 다음과 같습니다:
커뮤니티 보상: 사용자는 데이터 라벨링 및 분석에 참여하면 $OORT 토큰으로 보상을 받을 수 있습니다. 또한, 연 수익률(APY) 보상 증가, 기기 할인, DAO 투표권 등 추가 혜택을 제공하는 기여와 연계된 고유한 NFT를 획득할 수 있습니다.
미션 담보: 참가자는 미션에 대한 헌신을 증명하기 위해 최소 210달러의 OORT 토큰을 약정해야 하며, 이는 완료 시 반환 및 보상을 받게 됩니다.
판매 수익 분배: 일부 NFT 보유자는 향후 데이터 판매 수익의 일부를 분배받을 수 있어 장기적인 수익이 더욱 향상됩니다.
프로젝트 토큰의 경제 모델은 다음과 같습니다 :
커뮤니티 보상 :공용 토큰의 10%는 사용자의 사전 상호작용에 대한 에어드랍 보상으로 사용되며, 구체적으로 다음과 같습니다. 에어드랍을 받을 수 있는 방법은 세 가지가 있습니다.AI 빌더 되기: 고품질 인터넷 콘텐츠 수집,AI 검증자 되기: 수집된 콘텐츠 검증,AI 개발자 되기: 검증된 데이터세트로 AI 에이전트 훈련.
토큰 배포:이 프로젝트는 2024년 1월에 IOBC Capital, Foresight. 벤처스, 솔라나 재단, 에버스테이트 캐피털, 다수의 저명한 AI 학자 및 교수 등의 투자자로부터 200만 달러의 시드 펀딩을 완료했습니다. PublicAI 토큰 분배에 대한 자세한 내용은 아직 명확하지 않습니다.
도전 과제
현재 이 트랙의 개발을 제약하는 몇 가지 요소는 첫째, AI 데이터 태깅에는 높은 컴퓨팅 및 스토리지 자원이 필요하고 둘째, 블록체인의 확장성에 의해 프로젝트의 성능이 제약되며 셋째, 기술의 표준화 및 규정이 아직 완벽하지 않다는 점입니다. 불완전합니다.
두 번째 사항은 아마도 오늘날 우리가 직면한 가장 큰 과제일 것입니다. AI 데이터 태깅과 모델 훈련에는 일반적으로 많은 컴퓨팅 리소스가 필요하고 블록체인 네트워크의 노드는 컴퓨팅 성능이 제한되어 있기 때문입니다. 블록체인의 탈중앙화 특성을 보장한다는 전제하에 분산 컴퓨팅 자원을 효과적으로 통합하고 사용하여 AI 데이터 태깅 프로젝트의 계산 요구를 충족하는 방법은 해결해야 할 문제입니다. 코인의 자회사인 그린필드가 이 트랙에 대한 스토리지 지원을 제공하고 있으며, 이 분야에서 더 많은 스토리지 및 컴퓨팅 자원이 실용화될 것으로 기대한다고 합니다.