Rachel,金色财经
11月27日,赵长鹏在X上发文称,AI 数据标注等任务非常适合通过区块链完成,可借助全球低成本劳动力,并通过加密货币即时支付,打破地域限制。
数据标记是指对原始数据(如文本、图像、音频等)进行人工或自动化的标注,使其具有特定的结构化信息。标记的数据用于训练机器学习或人工智能模型,例如为文本标注情感类别(正面、负面、中立)就是一种数据标记。而将区块链用于人工智能数据标注,特别适用于需要高透明度、可信性和分布式协作的数据标注场景。这不仅可以提升数据标注的效率和质量,还为全球协作和数据交易创造了新的可能性。
目前,这一赛道有哪些优质的项目?赛道发展前景如何?
区块链在AI数据标记中的作用
区块链是一种去中心化的分布式账本技术,具有透明性、不可篡改性和可追溯性等特点。这些特点在数据标记中可以解决传统方法中的以下问题:
数据真实性和防篡改: 每次标记的记录都被写入区块链,无法被随意更改,保证了标注的可信度。
任务分配透明性: 区块链可以记录任务的分发、执行和审核过程,防止任务分配不公平或结果篡改。
激励机制: 使用区块链的智能合约技术,数据标注员可以通过完成任务自动获得加密货币或其他奖励。
数据溯源: 每个标记的来源、标注员以及审核者的信息都可以被追踪。
应用场景
分布式标注: 利用区块链,将数据标注任务分配给全球的标注员,数据处理效率更高。
质量审核: 多人标注结果通过区块链技术进行对比与审核,确保标注准确性。
标注数据交易: 标注好的数据可以在区块链上交易,买卖双方无需担心数据的完整性或真实性。
隐私保护: 使用区块链对标注数据进行加密存储,保证隐私数据安全。
相关项目
项目代币的经济模型如下:
社区奖励:通过参与数据标注和分析,用户可获得 $OORT 代币奖励。此外,还可能获得与贡献挂钩的独特 NFT,这些 NFT 提供额外权益,如提高年收益率 (APY) 的奖励、设备折扣和 DAO 投票权。
任务抵押:参与者需抵押至少 210 个 $OORT 代币,以表明对任务的承诺,完成任务后会返还代币并发放奖励。
销售收益分成:部分 NFT 持有者还可从未来的数据销售收入中分红,进一步提升长期收益。
项目代币的经济模型如下:
社区奖励:10%的Public代币将用于用户前期交互的空投奖励,具体来说获取空投的方法有三种,成为 AI Builder:收集高质量互联网内容;成为 AI Validator:验证收集的内容;成为 AI Developer:使用已验证数据集训练 AI 代理。
代币分配:项目在 2024 年 1 月完成了 200 万美元的种子轮融资,投资方包括 IOBC Capital、Foresight Ventures、Solana Foundation、Everstate Capital 及多位人工智能学界知名院士教授等,目前具体的 PublicAI 代币分配细节尚未明确。
面临的挑战
目前,几大因素束缚该赛道的发展:一是是AI数据标记需要较高的计算和存储资源;二是项目性能受制于区块链的扩展性;三是技术标准化和监管尚不完善。
其中,第二点是或许是目前所面临的最大的挑战。因为AI 数据标记和模型训练通常需要大量的计算资源,而区块链网络中的节点计算能力有限。如何在保证区块链去中心化特性的前提下,有效地整合和利用分布式计算资源来满足 AI 数据标记项目的计算需求,是一个亟待解决的问题。据悉,币安旗下的Greenfield 正在为这一赛道提供存储支持,期待能有更多的存储和计算资源在这一领域进行实践。