Rachel, Golden Finance
Vào ngày 27 tháng 11, Changpeng Zhao đã đăng bài về Chi phí lao động và thanh toán ngay lập tức thông qua tiền điện tử, phá vỡ các giới hạn về địa lý.
Gắn thẻ dữ liệu đề cập đến việc chú thích thủ công hoặc tự động dữ liệu gốc (chẳng hạn như văn bản, hình ảnh, âm thanh, v.v.) để nó có thông tin có cấu trúc cụ thể. Dữ liệu được gắn nhãn được sử dụng để huấn luyện các mô hình học máy hoặc trí tuệ nhân tạo. Ví dụ: gắn nhãn văn bản với các danh mục cảm xúc (tích cực, tiêu cực, trung tính) là một loại nhãn dữ liệu. Việc sử dụng blockchain để chú thích dữ liệu trí tuệ nhân tạo đặc biệt phù hợp với các kịch bản chú thích dữ liệu đòi hỏi tính minh bạch, độ tin cậy cao và khả năng cộng tác phân tán. Điều này không chỉ cải thiện hiệu quả và chất lượng của chú thích dữ liệu mà còn tạo ra những khả năng mới cho giao dịch dữ liệu và cộng tác toàn cầu.
Hiện tại có những dự án chất lượng cao nào trên con đường này? Triển vọng phát triển đường đua là gì?
Vai trò của blockchain trong ghi nhãn dữ liệu AI
h3>
Blockchain là công nghệ sổ cái phân tán phi tập trung với tính minh bạch, không giả mạo và khả năng truy xuất nguồn gốc mạnh mẽ> cùng các tính năng khác. Những tính năng này trong việc gắn thẻ dữ liệu có thể giải quyết các vấn đề sau trong các phương pháp truyền thống:
Tính xác thực của dữ liệu và khả năng chống giả mạo: Mỗi tính năng bản ghi được đánh dấu được ghi vào blockchain và không thể thay đổi theo ý muốn, đảm bảo độ tin cậy của việc đánh dấu.
Tính minh bạch trong phân bổ nhiệm vụ: Blockchain có thể ghi lại quá trình phân phối, thực hiện và xem xét các nhiệm vụ để ngăn chặn việc phân bổ nhiệm vụ không công bằng hoặc giả mạo kết quả.
Cơ chế khuyến khích: Sử dụng công nghệ hợp đồng thông minh của blockchain, người chú thích dữ liệu có thể tự động nhận tiền điện tử hoặc các phần thưởng khác bằng cách hoàn thành nhiệm vụ.
Khả năng truy xuất nguồn gốc dữ liệu: Có thể truy nguyên thông tin nguồn, người chú thích và người đánh giá của mỗi thẻ.
Kịch bản ứng dụng
Chú thích phân tán: Sử dụng chuỗi khối, các tác vụ chú thích dữ liệu được phân phối tới những người chú thích trên toàn thế giới, giúp việc xử lý dữ liệu hiệu quả hơn.
Kiểm tra chất lượng: Kết quả chú thích của nhiều người được so sánh và xem xét thông qua công nghệ blockchain để đảm bảo tính chính xác của chú thích.
Giao dịch dữ liệu có chú thích: Dữ liệu có chú thích có thể được giao dịch trên blockchain và người mua và người bán không cần phải lo lắng về tính toàn vẹn hoặc tính xác thực của dữ liệu dữ liệu.
Bảo vệ quyền riêng tư: Sử dụng blockchain để mã hóa và lưu trữ dữ liệu có chú thích nhằm đảm bảo tính bảo mật của dữ liệu riêng tư.
Dự án liên quan
OORT DataHub: Cung cấp dịch vụ chú thích dữ liệu phi tập trung dựa trên blockchain, sử dụng thuật toán Bằng chứng trung thực để kiểm soát chất lượng. Nền tảng của nó phân phối nhiệm vụ, kiểm tra chất lượng dữ liệu và trả phần thưởng thông qua hợp đồng thông minh, thu hút những người chú thích toàn cầu tham gia và đảm bảo tính minh bạch và bảo vệ quyền riêng tư của dữ liệu được chú thích.
Mô hình kinh tế của mã thông báo dự án như sau:
Phần thưởng cộng đồng: Bằng cách tham gia chú thích và phân tích dữ liệu, người dùng có thể nhận được phần thưởng mã thông báo $OORT. Ngoài ra, có thể nhận được các NFT duy nhất gắn liền với các khoản đóng góp mang lại các lợi ích bổ sung như phần thưởng khi tăng năng suất hàng năm (APY), chiết khấu thiết bị và quyền biểu quyết DAO.
Thế chấp nhiệm vụ: Người tham gia cần thế chấp ít nhất 210 mã thông báo OORT để thể hiện cam kết của họ với nhiệm vụ sau đó. hoàn thành nhiệm vụ, mã thông báo sẽ được trả lại và phần thưởng sẽ được phân phối.
Chia sẻ doanh thu bán hàng: Một số chủ sở hữu NFT cũng có thể chia sẻ cổ tức từ doanh thu bán dữ liệu trong tương lai, giúp tăng thêm lợi nhuận lâu dài .
PublicAI: Dự án sinh thái AI trên chuỗi Solana nhằm mục đích kết nối những người có nhu cầu dữ liệu và thế giới Người chú thích thưởng cho người tham gia thông qua cơ chế khuyến khích mã thông báo được mã hóa, đồng thời sử dụng công nghệ chuỗi khối để ghi lại chi tiết của quy trình chú thích nhằm đảm bảo bảo mật và quyền riêng tư dữ liệu.
Mô hình kinh tế của mã thông báo dự án như sau:
Phần thưởng của cộng đồng: 10% mã thông báo công khai sẽ được sử dụng làm phần thưởng airdrop cho những tương tác sớm của người dùng. Cụ thể, có ba cách. để nhận được airdrop , trở thành AI Builder: Thu thập nội dung internet chất lượng cao;trở thành Người xác thực AI: Xác thực nội dung đã thu thập; Trở thành Nhà phát triển AI: Đào tạo các tác nhân AI bằng cách sử dụng các bộ dữ liệu đã được xác thực.
Phân bổ mã thông báo: Dự án vào năm 2024 Vào tháng 1 , nó đã hoàn thành vòng tài trợ ban đầu trị giá 2 triệu đô la Mỹ. Các nhà đầu tư bao gồm IOBC Capital, Foresight Ventures, Solana Foundation, Everstate Capital và nhiều học giả và giáo sư nổi tiếng trong lĩnh vực trí tuệ nhân tạo. Chưa có thông tin chi tiết cụ thể về việc phân bổ mã thông báo PublicAI. vẫn được làm rõ.
Thách thức
Hiện tại, một số yếu tố chính cản trở sự phát triển của tuyến đường này: Thứ nhất , Ghi nhãn dữ liệu AI yêu cầu tài nguyên tính toán và lưu trữ cao thứ hai, hiệu suất dự án bị hạn chế bởi khả năng mở rộng của blockchain thứ ba, tiêu chuẩn hóa và giám sát kỹ thuật vẫn chưa hoàn thiện;
Trong số đó, điểm thứ hai có lẽ là thách thức lớn nhất hiện nay. Do việc ghi nhãn dữ liệu AI và đào tạo mô hình thường đòi hỏi một lượng lớn tài nguyên tính toán nên các nút trong mạng blockchain có khả năng tính toán hạn chế. Làm thế nào để tích hợp và sử dụng hiệu quả các tài nguyên điện toán phân tán để đáp ứng nhu cầu điện toán của các dự án ghi nhãn dữ liệu AI đồng thời đảm bảo tính chất phi tập trung của blockchain là một vấn đề cấp bách cần được giải quyết. Được biết, Greenfield, một công ty con của Binance, đang cung cấp hỗ trợ lưu trữ cho đường đua này và mong muốn có thêm tài nguyên lưu trữ và điện toán để thực hành trong lĩnh vực này.