引言
在数字化时代,人工智能(AI)已成为推动技术革新和社会进步的关键力量。AI的发展不仅仅是技术的进步,更是人类智慧的延伸。AI在过去一段时间风险投资行业和资本市场最为热门的话题。
随着区块链技术的发展,去中心化AI(Decentralized AI)应运而生,本文将为您解读去中心化AI的定义、架构以及它如何与人工智能行业协同作用。
去中心化AI的定义与架构
去中心化AI利用去中心化的计算资源和数据存储,以分布式方式训练和使用AI模型,增强隐私性和安全性。其四层主要架构包括:
• 模型层:支持去中心化的AI模型开发、共享和交易,促进全球范围内的协作和创新。这一层面的代表项目如Bittensor,它利用区块链技术创建了一个全球范围内的AI模型共享与协作平台。
• 训练层:利用智能合约和去中心化技术,降低AI模型训练的成本并简化流程,提高训练效率。这一层面的挑战在于如何有效利用分布式计算资源进行高效的模型训练。
• 数据层:利用区块链技术存储和管理数据,确保数据的安全性和不可篡改性,同时赋予用户对数据的完全控制权。这一层面的应用如去中心化的数据市场,它们通过区块链技术实现了数据的透明交易和所有权确认。
• 算力层:通过去中心化GPU算力平台和带宽支持,提供分布式计算资源,支持AI模型的高效训练和推理。这一层面的技术进步,如边缘计算和分布式GPU网络,为AI模型的训练和推理提供了新的解决方案。
去中心化AI代表项目
去中心化AI行业梳理:模型层
模型层:大模型参数量指数级增长,模型性能显著提升,但进一步扩展模型规模带来的收益正在逐渐减小。这一趋势要求我们重新思考AI模型的发展方向,如何在保持性能的同时降低成本和资源消耗。
AI大模型的发展遵循“规模定律”,即模型性能与参数规模、数据集大小和计算量之间存在一定的关系。
当模型扩展到一定规模时,其在特定任务中的性能会突然显著提升。随着大模型参数量的增加,模型性能的提升幅度逐渐减小,如何平衡参数规模和模型性能将是未来发展的关键。
我们看到,AI大模型的API价格竞争加剧,多家厂商纷纷降价,以提高市场占有率。然而,随着大模型性能的同质化,API收入的持续性也面临质疑。如何保持高用户粘性并提高收入将是未来的一大挑战。
端侧模型的应用将通过减少数据精度和采用混合专家模型(MoE)架构来实现。模型量化技术可以将32位浮点数据压缩为8位,从而显著减少模型大小和内存消耗。通过这种方式,模型可以在端侧设备上高效运行,推动AI技术的进一步普及。
总结:区块链助力模型层提升AI模型的透明度、协作性和用户参与度。
中心化AI行业梳理:训练层
训练层:大模型训练要求高带宽与低延迟的通信,去中心化算力网络进行大模型尝试存在可能性。这一层面的挑战在于如何优化通信和计算资源的分配,以实现更高效的模型训练。
去中心化算力网络在大模型训练中具有一定的潜力。尽管存在通信开销过大的挑战,但通过优化调度算法和压缩传输数据量,可以显著提高训练效率。然而,如何在实际环境中克服网络延迟和数据传输瓶颈,仍是去中心化训练面临的主要难题。
为了解决去中心化算力网络中大模型训练的瓶颈,我们可以采用数据压缩、调度优化和局部更新与同步等技术。这些方法能够减少通信开销,提高训练效率,使去中心化算力网络在大模型训练中成为一种可行的选择。
零知识机器学习(zkML)结合了零知识证明和机器学习技术,允许在不暴露训练数据和模型细节的情况下进行模型验证和推理。这一技术特别适用于对数据保密性要求高的行业,如医疗和金融,能够确保数据隐私的同时验证AI模型的准确性和可靠性。
去中心化AI行业梳理:数据层
数据的隐私性和安全性成为AI发展的关键问题。去中心化数据存储和处理技术为解决这些问题提供了新的思路。
数据存储、数据索引和数据应用都是确保去中心化AI系统正常运作的关键环节。去中心化存储平台如Filecoin和Arweave在数据安全和隐私保护方面提供了新的解决方案,并降低了存储成本。
去中心化存储案例:
在这页中,我们对比了Arweave和Filecoin两个去中心化存储项目。Arweave通过一次性支付实现永久存储,而Filecoin则采用按月支付的模式,侧重于提供灵活的存储服务。两者在技术架构、业务规模和市场定位上各有优势,用户可以根据具体需求选择适合的方案。
去中心化AI行业梳理:算力层
算力层:随着AI模型的复杂度增加,对计算资源的需求也在不断增长。去中心化算力网络的出现,为AI模型的训练和推理提供了新的资源配置方式。
去中心化的计算网络(以及用于训练和推理的专项计算网络)是目前观察下来 DeAI 赛道上最活跃和发展最快的领域。这与现实世界的基础设施供应商截取了 AI 产业链的丰盛果实相一致。伴随着 GPU 等算力资源短缺的状态持续,有着算力资源硬件设备的厂商纷纷入局这个领域。
Aethir案例:
商业模式:算力租赁的双边市场
去中心化算力市场,本质上是利用 Web3 技术将网格计算的理念扩展到了一个具有经济激励、无需信任的环境之中。通过激励 CPU 和 GPU 等资源提供方将闲置的算力贡献到去中心化网络中,从而形成有一定规模的去中心化算力服务市场;并连接算力资源的需求方(如模型提供商),以更低的成本、更灵活的方式,为其提供算力服务资源。去中心化算力市场,也是对中心化垄断的云服务供应商的一个挑战。
去中心化算力市场根据其服务的类型可进一步分为:通用型和专用型。通用计算网络像分散的云一样运行,为各种应用程序提供计算资源。专用型计算网络主要为特定用途的计算网络,针对特定用例量身定制。例如,Render Network 是一个专注于渲染工作负载的专用计算网络;Gensyn 是一个专注于 ML 模型训练的专用计算网络;而 io.net 是通用计算网络的一个示例。
对于 DeAI 而言,在去中心化基础设施上训练模型面临的一个重要挑战是大规模算力、带宽限制和使用来自全球不同供应商的异构硬件导致的高延迟性。因此,一个专用型的 AI 计算网络比通用型的计算网络能提供更适配 AI 的功能。目前集中式训练 ML 模型依然是最为高效和稳定的项目,但是这对项目方的资本实力提出了一个非常高的要求。
结语
去中心化AI作为一种新兴的技术趋势,正逐步展现出其在数据隐私、安全性和成本效益方面的优势。在下一篇文章中,我们将探讨去中心化AI面临的风险与挑战,以及未来的发展方向。