저자: 케르만 콜리 출처: 서브스택 번역: 굿오바, 골든파이낸스
2024년, 이더스캔, 듄, 난센을 사용하면 언제든 원하는 데이터를 볼 수 있으니 암호화된 데이터에 쉽게 접근할 수 있을 것이라고 생각할 수 있겠죠. 겉으로 보기에는 그렇게 보입니다.
규모
일반적인 웹2.0 공간에서 직원 10명과 고객 10만 명을 보유한 회사의 경우, 100GB 이상의 데이터는 생성되지 않습니다(상위 계층에서). 이 데이터 크기는 iPhone이 모든 질문을 처리하고 모든 것을 저장할 수 있을 만큼 충분히 작습니다. 하지만 직원이 1,000명이고 고객이 100,000,000명이라면 처리해야 하는 데이터의 양은 페타바이트는 아니더라도 수백 테라바이트에 달할 것입니다.
처리하려는 규모가 훨씬 더 많은 생각을 필요로 하기 때문에 이것은 근본적으로 완전히 다른 문제입니다. 수백 테라바이트의 데이터를 처리하려면 작업을 전송할 분산 컴퓨터 클러스터가 필요합니다. 이러한 작업을 전송할 때 고려해야 할 사항은 다음과 같습니다.
작업자가 임무를 수행하지 못하면 어떻게 되는가
한 작업자가 다른 작업자보다 훨씬 오래 걸리면 어떻게 되는가
어떤 작업을 어떤 작업자에게 할당할지 어떻게 결정할 것인가
모든 결과를 결합하고 계산이 정확한지 어떻게 확인할 것인가
이것들은 모두 여러 머신에서 빅 데이터 계산을 처리할 때 고려해야 할 사항들입니다. 스케일은 사용하지 않는 사람에게는 보이지 않는 문제를 일으킵니다. 데이터는 규모가 커질수록 제대로 관리하기 위해 더 많은 인프라가 필요한 영역 중 하나입니다. 대부분의 사람들에게 이러한 문제는 눈에 보이지 않습니다. 이러한 규모를 처리하려면 다음과 같은 다른 문제에 직면하게 됩니다.
웹2에서는 모든 사람이 데이터를 공개하기를 원했다는 점이 흥미롭습니다. 웹3에서는 마침내 데이터가 공개되었지만 이를 이해하는 데 필요한 작업을 수행하는 방법을 아는 사람은 거의 없습니다. 기만적인 사실은 약간의 도움을 받으면 글로벌 데이터 집합에서 데이터 집합을 상당히 쉽게 얻을 수 있다는 것인데, 이는 '로컬' 데이터는 쉽지만 '글로벌' 데이터(모든 사람과 모든 것에 관련된 것)는 구하기 어렵다는 것을 의미합니다.
파편화
처리해야 하는 규모 때문에 더 이상 어려운 일이 아닌 것처럼 보입니다. 현재 암호화된 데이터를 어렵게 만드는 새로운 차원이 있는데, 바로 시장의 경제적 인센티브로 인해 암호화된 데이터가 계속 파편화될 것이라는 사실입니다. 예를 들면 다음과 같습니다:
새로운 블록체인의 부상. 현재 50개에 가까운 L2가 운영 중이며, 곧 출시될 것으로 알려진 50개와 수백 개의 L2가 준비 중입니다. 각 L2는 사실상 색인화 및 구성이 필요한 새로운 데이터베이스 소스입니다. 표준화되기를 바라지만 항상 확신할 수는 없습니다!
새로운 유형의 VM의 등장 EVM은 하나의 영역에 불과합니다. SVM, Move VM 등 무수히 많은 VM이 시장에 진입하고 있습니다. 새로운 유형의 가상 머신은 각각 완전히 새로운 데이터 시나리오를 의미하며, 기본 사항과 심층적인 이해 측면에서 고려해야 합니다. 가상 머신은 몇 개나 있을까요? 투자자들은 수십억 달러의 투자로 새로운 것에 인센티브를 줄 것입니다!
새로운 계정 프리미티브의 부상. 스마트 콘트랙트 지갑, 호스트형 지갑, 계정 추상화는 데이터를 실제로 해석하는 방식에 새로운 복잡성을 가져옵니다. 발신자 주소는 릴레이에 의해 제출되었기 때문에 실제 사용자가 아닐 수 있으며, 자세히 살펴보면 실제 사용자가 혼합된 어딘가에 있을 수도 있습니다.
모르는 것을 정량화할 수 없기 때문에 조각화는 특히 어려울 수 있습니다. 세상에 존재하는 모든 L2와 총 등장할 가상 머신을 알 수는 없습니다. 일단 충분한 규모에 도달하면 따라잡을 수 있겠지만 그건 또 다른 이야기입니다.
개방되어 있지만 상호 운용되지 않음
많은 사람들이 놀랐던 마지막 문제는 데이터가 개방되어 있지만 쉽게 상호 운용되지 않는다는 점이라고 생각합니다. 팀이 함께 만든 모든 스마트 컨트랙트는 큰 데이터베이스 안에 있는 작은 데이터베이스와 같습니다. 저는 이를 스키마라고 생각하고 싶습니다. 모든 데이터는 거기에 있지만, 스마트 컨트랙트를 개발하는 팀은 일반적으로 데이터를 조합하는 방법을 알고 있습니다. 원한다면 시간을 들여 직접 이해할 수도 있지만, 모든 잠재적 패턴에 대해 수백 번을 반복해야 하며, 거래 상대방인 구매자 없이 큰 비용을 들이지 않고 어떻게 그렇게 할 수 있을까요?
이 말이 너무 추상적으로 느껴진다면 예를 들어보겠습니다. "이 사용자가 브릿지를 얼마나 자주 사용하나요?"라고 가정해 보겠습니다. . 이 질문은 하나의 질문처럼 보이지만 그 안에는 많은 질문이 중첩되어 있습니다. 이를 세분화해 보겠습니다.
먼저, 존재하는 모든 브릿지를 알아야 합니다. 그리고 관심 있는 체인을 알아야 합니다. 만약 모두 체인이라면, 이것이 왜 어려운지 위에서 언급했습니다.
그런 다음 각 브릿지에 대해 스마트 컨트랙트의 작동 방식을 이해해야 합니다
모든 정렬을 이해했다면, 이제 이러한 모든 개별 패턴을 통합할 수 있는 모델을 추론해야 합니다
상기의 각 문제는 해결하기가 어렵고 상당한 리소스가 필요합니다.
결과
이 모든 것이 어디로 이어질까요? 현재 우리 생태계의 상태는 ......
생태계에서 실제로 무슨 일이 일어나고 있는지 아는 사람은 아무도 없습니다. 제대로 정량화하기 어려운 활동의 개념만 존재할 뿐입니다.
사용자 수가 부풀려지고 마녀 공격을 탐지하기 어렵습니다. 지표는 무의미해지고 신뢰할 수 없게 됩니다! 지표가 모두 똑같이 보이기 때문에 시장 참여자에게는 참인지 거짓인지조차 중요하지 않습니다.
온체인 신원 확인의 주요 문제. 강력한 신원 확인을 원한다면 정확한 데이터가 필수적이며, 그렇지 않으면 신원이 왜곡될 수 있습니다!
이 글이 암호화폐 데이터 공간의 현실을 이해하는 데 도움이 되었기를 바랍니다.