저자: 폴 베라디타킷, Pantera Capital 파트너, 번역: 골든 파이낸스 샤오저우
요약:
VLA혁신과 규모의 경제 효과로 인해 저렴하고 효율적이며 다재다능한 휴머노이드 로봇이 탄생하고 있습니다.
창고 로봇이 소비자 로봇 시장으로 확대됨에 따라 로봇 안전, 자금 조달 및 평가 메커니즘을 심도 있게 검토할 필요가 있습니다.
암호화는 로봇 보안에 대한 경제적 보장을 제공하고 도킹 인프라, 지연 시간 및 데이터 수집 프로세스를 최적화함으로써 로봇 산업을 주도할 것입니다.
ChatGPT는 AI에 대한 인간의 인식을 완전히 바꿔놓았습니다. 빅 언어 모델이 외부 소프트웨어 세계와 상호 작용하기 시작했을 때 많은 사람들은 AI 지능이 궁극적인 형태라고 생각했습니다. 하지만 스타워즈, 블레이드 러너, 로보캅과 같은 고전 공상과학 영화를 돌아보면 인간이 진정으로 꿈꾸었던 것은 로봇의 형태를 취하여 물리적 세계에서 상호작용할 수 있는 AI였다는 것을 알 수 있습니다.
판테라 캐피탈이 보기에 로봇 공학에서 "ChatGPT의 순간"이 다가오고 있습니다. 지난 몇 년간 인공지능의 획기적인 발전이 업계의 지형을 어떻게 변화시켰는지 분석한 다음 배터리 기술, 지연 시간 최적화, 데이터 수집의 개선이 미래를 어떻게 변화시킬지, 그리고 여기서 암호화폐의 역할은 무엇인지 살펴볼 것입니다. 마지막으로 로봇 안전, 금융, 평가 및 교육이 집중해야 할 핵심 분야라고 생각하는 이유를 설명합니다.
1, 변화의 요소
(1) 인공 지능 혁신
멀티 모달 빅 언어 모델링의 발전은 로봇에게 복잡한 작업을 수행하는 데 필요한 '두뇌'를 제공하고 있습니다. 로봇은 주로 시각과 청각이라는 두 가지 감각을 통해 주변 환경을 인식합니다.
컨볼루션 신경망과 같은 전통적인 컴퓨터 비전 모델은 물체 감지나 분류 작업에는 능숙하지만 시각 정보를 목적에 맞는 작업 지침으로 변환하는 데는 어려움을 겪습니다. 대규모 언어 모델은 텍스트 이해와 생성에는 탁월하지만 물리적 세계를 인식하는 능력에는 한계가 있습니다. 
로봇은 시각-언어-행동(VLA) 모델을 통해 시각 인식, 언어 이해, 신체 동작을 통합된 컴퓨팅 프레임워크에 통합할 수 있습니다.2025년 2월 Figure AI는 제로 샘플 일반화 기능과 이중 시스템 1/시스템 2 아키텍처로 업계에 새로운 기준을 제시하는 범용 휴머노이드 로봇 제어 모델인 Helix를 출시했습니다. 제로 샘플 일반화 기능을 사용하면 로봇이 각 작업에 대해 반복적으로 학습할 필요 없이 새로운 시나리오, 물체 및 명령에 즉시 적응할 수 있습니다. 시스템 1/시스템 2 아키텍처는 높은 수준의 추론과 가벼운 추론을 분리하여 인간과 같은 사고와 실시간 정확성을 결합한 상용 휴머노이드 로봇을 구현할 수 있습니다.
(2) 경제적인 로봇 공학, 현실이 되다
세상을 변화시킨 기술들은 보편성이라는 공통점을 가지고 있습니다. 스마트폰, 개인용 컴퓨터, 3D 프린팅 기술은 모두 중산층을 위한 저렴한 가격을 통해 보편성을 달성했습니다. 유니트리 G1과 같은 로봇의 가격이 혼다 어코드 세단이나 미국의 최저 연소득 3만 4천 달러보다 저렴하다면, 수작업과 일상 업무가 대부분 로봇에 의해 수행되는 세상을 상상하는 것은 놀라운 일이 아닙니다.
< /p>
(3)웨어하우징에서 소비자 시장으로
로보틱스는 웨어하우징 솔루션에서 소비자 공간으로 확장되고 있습니다. 인간은 전문 로봇이 할 수 있는 모든 일을 할 수 있지만, 전문 로봇은 인간이 할 수 있는 모든 일을 할 수 없는 세상은 인간을 위해 설계되었습니다. 로봇 회사들은 더 이상 공장에 특화된 로봇을 만드는 데 국한되지 않고 보다 다재다능한 휴머노이드 로봇을 개발하고 있습니다. 따라서 로봇 공학의 영역은 창고에만 존재하는 것이 아니라 일상 생활에 스며들게 될 것입니다.
비용은 확장성의 주요 걸림돌 중 하나입니다. 우리가 가장 관심을 두는 지표는 시간당 통합 비용으로, 교육 및 재충전 시간, 작업 수행 비용, 로봇 구입 비용의 합을 로봇이 작동하는 총 시간으로 나눈 값으로 계산됩니다. 경쟁력을 갖추려면 이 비용이 관련 산업의 평균 임금보다 낮아야 합니다.
이미지 src="https://img.jinse.cn/7379925_watermarknone.png" title="7379925" alt="rQCyavIaHdxhfr10i808m9Rj3UhR0JpqVvv1s4kq.png">< /p>
창고 공간에 완전히 침투하려면 로봇의 총 비용이 시간당 $31.39 미만이어야 합니다. 그리고 가장 큰 소비자급 시장인 사교육 및 의료 서비스에서는 그 비용을 35.18달러 미만으로 유지해야 합니다. 로봇은 현재 더 저렴하고, 더 효율적이며, 더 다재다능한 로봇을 향해 나아가고 있습니다.
2로봇공학의 다음 혁신
(1) 배터리 최적화
배터리 기술은 항상 사용자 친화적인 로봇의 걸림돌이었습니다. BMW i3와 같은 초기 전기 자동차는 짧은 주행거리, 높은 비용, 낮은 활용도라는 배터리 기술의 한계로 인해 대중적인 인기를 얻지 못했으며, 로봇도 같은 딜레마에 직면해 있습니다. 보스턴 다이내믹스의 스팟 로봇은 한 번 충전으로 90분만 사용할 수 있고, 유니트리 G1의 배터리 수명은 약 2시간입니다. 사용자들은 2시간마다 수동으로 배터리를 충전하고 싶지 않을 것이 분명하기 때문에 자율 충전 및 도킹 인프라가 개발의 핵심 초점이 되었습니다. 현재 로봇 충전에는 배터리 교체 또는 직접 충전의 두 가지 주요 모드가 있습니다.
배터리 교체 모드는 방전된 배터리 팩을 신속하게 교체하여 가동 중단 시간을 최소화하고 연속 작동을 보장하며 현장 또는 공장 시나리오에 적합합니다. 이 프로세스는 수동 또는 자동화할 수 있습니다.
유도 충전은 무선 전원을 사용하므로 완전 충전에 시간이 오래 걸리지만 프로세스를 쉽게 완전 자동화할 수 있습니다.
(2) 지연 시간 최적화
저지연 작업은 환경 감지 및 원격 조작의 두 가지 범주로 나눌 수 있습니다. 환경 인식은 로봇이 환경을 공간적으로 인식하는 것을 말하며, 원격 조작은 특히 인간 작업자가 실시간으로 제어하는 것을 말합니다.
신트리니의 연구에 따르면 로봇 인식 시스템은 저렴한 센서에서 시작하지만 기술적 해자는 융합 소프트웨어, 저전력 컴퓨팅 및 밀리초 단위의 정밀 제어 루프에 있습니다. 로봇이 공간 측위를 완료하면 경량 신경망이 장애물, 팔레트 또는 사람과 같은 요소에 태그를 지정합니다. 장면 레이블은 계획 시스템에 입력되어 발, 휠셋 또는 로봇 팔로 전송되는 모터 명령을 즉시 생성합니다. 50밀리초 미만의 감각 지연 시간은 사람의 반사 속도와 동일합니다 - 이 임계값을 초과하는 지연 시간은 로봇의 움직임이 서툴게 됩니다. 따라서 90%의 의사 결정은 단일 시각-언어-행동 네트워크를 통해 로컬에서 이루어져야 합니다.
완전 자율 로봇은 고성능 VLA 모델의 지연 시간이 50밀리초 미만이어야 하며, 원격 조작 로봇은 작업자와 로봇 간의 신호 지연이 50밀리초를 넘지 않아야 합니다. 시각 및 텍스트 입력이 별도의 모델에 의해 처리되어 대규모 언어 모델에 공급되는 경우 전체 지연 시간은 50밀리초 임계값을 훨씬 초과할 수 있으므로 VLA 모델이 특히 중요합니다.
(3)데이터 수집 최적화
데이터 수집 방법에는 실세계 비디오 데이터, 합성 데이터, 텔레프레즌스 데이터의 세 가지 주요 방법이 있습니다. 실제 데이터와 합성 데이터 사이의 핵심 병목 현상은 로봇의 물리적 동작과 비디오 시뮬레이션 모델 사이의 간극을 메우는 것입니다. 실제 비디오 데이터에는 힘 피드백, 관절 동작 오류 및 재료 변형과 같은 물리적 세부 사항이 부족하고 시뮬레이션 데이터에는 센서 고장 및 마찰 계수와 같은 예측할 수 없는 변수가 부족합니다.
가장 유망한 데이터 수집 방법은 사람이 로봇을 원격으로 제어하여 작업을 수행하는 원격 조작입니다. 그러나 인건비는 원격 조작 데이터 수집의 주요 제약 조건입니다.
메카는 주류 방식과 맞춤형 하드웨어를 결합하여 다차원적인 인간 동작 데이터를 캡처하고, 이를 로봇 신경망 훈련에 적합한 데이터 세트로 처리한 후 빠른 반복 주기와 결합하여 AI 로봇 훈련을 위한 방대한 양의 고품질 데이터를 제공하는 등 맞춤형 하드웨어 개발도 고품질 데이터 수집을 위한 새로운 접근 방식을 제공하고 있습니다. 이러한 기술 파이프라인은 원시 데이터에서 배포 가능한 로봇으로의 변환 경로를 단축합니다.
3, 주요 탐구 분야
(1) 암호화와 로보틱스 융합
암호학은 로봇 네트워크의 효율성을 개선하기 위해 신뢰하지 않는 당사자에게 인센티브를 제공할 수 있습니다. 이전 섹션에서 설명한 주요 영역을 기반으로, 저희는 도킹 인프라, 지연 시간 최적화, 데이터 수집의 세 가지 영역에서 암호화가 효율성을 개선할 수 있다고 생각합니다.
탈중앙화된 물리적 인프라 네트워크(DePIN)는 충전 인프라의 혁신을 약속합니다. 휴머노이드 로봇이 자동차처럼 전 세계에서 운행됨에 따라 충전소도 주유소처럼 접근성이 높아야 합니다. 중앙 집중식 네트워크는 막대한 초기 투자가 필요하지만, DePIN은 노드 운영자에게 비용을 분산시켜 충전 시설을 더 많은 지역으로 빠르게 확장할 수 있습니다.
DePIN은 또한 분산형 인프라를 활용하여 원격 처리 지연 시간을 최적화합니다. 지리적으로 분산된 엣지 노드의 컴퓨팅 자원을 통합하여 원격 제어 명령을 로컬 또는 최근에 사용 가능한 노드에서 처리함으로써 데이터 전송 거리를 최소화하고 통신 지연 시간을 크게 줄일 수 있습니다. 스트리밍 미디어나 사물 인터넷(IoT)에서 엣지 컴퓨팅의 이점을 입증하는 프로젝트가 있지만, 현재 DePIN 프로젝트는 분산형 스토리지, 콘텐츠 배포, 대역폭 공유에 중점을 두고 있으며 아직 로봇 공학이나 원격 제어로 확장되지는 않았습니다.
원격 조작은 가장 유망한 데이터 수집 형태이지만, 중앙화된 기관의 경우 데이터 수집을 위한 전문가 고용 비용이 엄청나게 높습니다. dePIN은 암호화폐 토큰을 통해 제3자가 원격 조작 데이터를 제공하도록 장려함으로써 이 문제를 해결합니다. Reborn 프로젝트는 원격 조작자의 글로벌 네트워크를 구축하고 그들의 기여를 통과 디지털 자산으로 전환하여 다음과 같은 탈중앙화된 허가 없는 시스템을 만듭니다. -참여자는 거버넌스에 참여하고 AGI 로봇 교육에 기여하면서 수익을 얻습니다.
(2) 안전은 항상 핵심 관심사가 될 것입니다
로봇공학의 궁극적인 목표는 완전한 자율성을 달성하는 것이지만, 터미네이터 시리즈에서 경고했듯이 인간이 마지막으로 원하는 것은 자율성이 로봇을 공격 무기로 바꾸는 것입니다. 공격 무기로 만드는 것입니다. 이미 대형 언어 모델의 안전성에 대한 우려가 제기되고 있으며, 이러한 모델이 물리적 행동을 할 수 있게 되면 로봇의 안전은 사회적 수용을 위한 핵심 전제 조건이 됩니다.
경제적 안전은 번성하는 로봇 생태계의 기둥 중 하나입니다. 이 분야의 기업인 OpenMind는 암호화 증명을 통해 기기 인증, 물리적 존재 확인, 리소스 액세스를 가능하게 하는 탈중앙화된 기계 조정 계층인 FABRIC을 구축하고 있습니다. 단순한 작업 시장 관리와 달리 FABRIC은 로봇이 중앙화된 중개자에 의존하지 않고도 신원 정보, 지리적 위치, 행동 기록을 자율적으로 증명할 수 있도록 지원합니다.
행동 제약과 인증은 온체인 메커니즘을 통해 시행되어 누구에게나 감사 가능한 규정 준수를 보장합니다. 안전 표준, 품질 요구 사항 및 지역 규범을 충족하는 로봇은 보상을 받고, 위반자는 처벌 또는 자격 박탈을 당하므로 자율 머신 네트워크에 책임과 신뢰가 형성됩니다.
심비오틱과 같은 제3자 재서약 네트워크도 마찬가지로 상호 보안 보장을 제공할 수 있습니다. 페널티 파라미터 시스템은 아직 개선이 필요하지만, 관련 기술은 이미 실용화 단계에 있습니다. 곧 업계 보안 가이드라인이 만들어질 것이며, 이 가이드라인을 참고하여 페널티 파라미터를 모델링할 수 있을 것으로 예상합니다.
구현 예시:
로보틱스가 공생 네트워크에 가입합니다.
검증 가능한 몰수 매개변수를 설정합니다(예: "2,500명 이상의 인간 접촉력 적용 ");
플레고어는 다음을 보장하기 위해 본드를 제공합니다. 로봇이 매개변수를 준수하도록 보장하는 보증을 제공합니다.
위반이 발생하면 이 보증은 피해자에 대한 보상으로 사용됩니다.
이 모델은 기업이 안전을 우선시하도록 장려하고, 서약 풀의 보험 메커니즘을 통해 소비자의 수용을 촉진합니다.
로봇 공학 분야에 대한 심비오틱 팀의 인사이트는 다음과 같습니다:
심비오틱유니버설 서약 프레임워크는 공유 또는 독립형 모델을 통해 경제적 안전의 뒷받침이 필요한 모든 영역으로 서약의 개념을 확장할 수 있도록 설계되었습니다. 보험에서 로봇 공학에 이르기까지 적용 시나리오는 사례별로 설계되어야 합니다. 예를 들어, 로봇 공학 네트워크는 전적으로 공생 프레임워크에 구축되어 이해관계자들이 네트워크의 무결성에 대한 경제적 보장을 제공할 수 있습니다.
4, 로보틱스 기술 스택의 격차 해소
OpenAI가 AI의 대중화를 이끌었지만 ChatGPT의 초석은 이미 오래 전에 마련되었습니다. 클라우드 서비스는 로컬 연산에 대한 모델의 종속성을 깨뜨렸고, 허깅페이스는 모델의 오픈 소싱을 가능하게 했으며, 캐글은 AI 엔지니어를 위한 실험 플랫폼을 제공했습니다. 이러한 점진적인 혁신이 모여 AI의 대중적 채택으로 이어졌습니다.
AI와 달리 로봇 공학 분야는 자금이 제한되어 있어 시작하기가 어렵습니다. 로보틱스가 보편화되려면 개발 장벽을 애플리케이션 개발처럼 쉽게 AI 개발할 수 있는 수준으로 낮춰야 합니다. 자금 조달, 평가, 교육 등 세 가지 수준에서 개선의 여지가 있다고 생각합니다.
자금 조달은 로봇공학의 고질적인 문제입니다. 컴퓨터 프로그램을 개발하려면 컴퓨터와 클라우드 컴퓨팅 리소스만 있으면 되지만, 완전한 기능을 갖춘 로봇을 만들려면 모터, 센서, 배터리 등의 하드웨어를 구매해야 하고 그 비용이 10만 달러를 쉽게 넘습니다. 이러한 하드웨어 특성으로 인해 로봇 개발은 AI에 비해 유연성이 떨어지고 비용이 많이 듭니다.
실제 시나리오를 위한 로봇 평가 인프라는 아직 초기 단계입니다. AI 분야는 손실 함수 시스템이 잘 정의되어 있고 테스트를 완전히 가상화할 수 있습니다. <강조>그러나 좋은 가상 전략이 곧바로 효과적인 실제 시나리오로 전환될 수는 없습니다. 로봇은 반복적인 최적화를 위해 다양한 실제 환경에서 자율 전략을 테스트할 수 있는 평가 시설이 필요합니다.
이러한 인프라가 성숙해지면 인재가 유입되고 휴머노이드 봇이 웹2.0의 폭발적인 성장 곡선을 반복하게 될 것입니다. 오픈소스 프로젝트인 OM1("안드로이드의 로봇 버전")은 원시 하드웨어를 경제적으로 인식하고 확장 가능한 지능으로 변환하는 암호화 로봇 회사인 OpenMind가 이러한 방향으로 나아가고 있습니다. 비전, 언어 및 동작 계획 모듈은 휴대폰 앱처럼 플러그 앤 플레이 방식으로 작동하며, 모든 추론 단계가 일반 영어로 제공되므로 운영자는 펌웨어를 건드리지 않고도 동작을 감사하거나 조정할 수 있습니다. 이러한 자연어 추론 기능을 통해 새로운 세대의 인재들이 로봇 공학 분야에 원활하게 진입할 수 있으며, 오픈 소스 운동이 AI를 가속화한 것처럼 로봇 공학 혁명을 촉발할 오픈 플랫폼을 향한 중요한 발걸음을 내디딜 수 있습니다.
이미지 src="https://img.jinse.cn/7379926_watermarknone.png" title="7379926" alt="9w4FeDFrQpSzIOVnqjQL1iz3LrIaGlrRUCz29CRB.png">< /p>
인재 밀도가 산업의 궤도를 결정합니다. 체계적이고 포괄적인 교육 시스템은 로봇 분야의 인재를 양성하는 데 매우 중요합니다. OpenMind의 나스닥 상장은 금융 혁신과 오프라인 교육에 모두 관여하는 지능형 기계의 새로운 시대가 열렸음을 의미합니다. <오픈마인드와 로보스토어가 공동으로 미국 내 K-12 공립학교의 출범을 발표합니다. 휴머노이드 로봇에 기반한 최초의 일반 교육 커리큘럼을 유니트리 G1에 도입한다고 발표했습니다. 이 커리큘럼은 플랫폼에 구애받지 않고 다양한 로봇 형태에 적응할 수 있으며 학생들에게 실습 기회를 제공하도록 설계되었습니다. 이러한 긍정적인 신호는 향후 몇 년 안에 로봇 교육 자원의 풍부함이 인공지능 분야에 필적할 것이라는 우리의 판단에 힘을 실어줍니다. AI 분야에 대한 우리의 판단을 뒷받침합니다.
5미래 전망
비전-언어-행동(VLA) 모델링 혁신과 규모의 경제는 저렴하고 효율적이며 다양한 기능을 갖춘 휴머노이드 로봇을 탄생시켰습니다. 창고 로봇이 소비자 등급 시장으로 확장됨에 따라 안전, 자금 조달 모델 및 평가 시스템이 주요 탐구 방향이 되었습니다. 우리는 암호화폐가 보안을 위한 경제적 보장 제공, 충전 인프라 최적화, 지연 성능 및 데이터 수집 파이프라인 개선이라는 세 가지 경로를 통해 로봇 공학을 발전시킬 것이라고 굳게 믿고 있습니다.