数据决定人类:去中心化云存储的探索
摘要: 数据决定人性:我们必须非常关心我们的数据如何存储、管理和拥有。
文章作者:Hunter Lampson
文章编译:Block unicorn
文章经过作者允许转载,作者Hunter Lampson是高盛的分析师,对资本部署和数字资产感兴趣,周末会在创作者社区出现,可以在推特找到他。
数据决定了人类。社会对技术创新和人类生活的数字化追求,创造了对数据存储和检索的爆炸性需求。从农业革命、医疗保健发现和政治档案,到自动驾驶汽车、蛋白质折叠和神经网络,数据是帮助我们发现实现目标的新解决方案的主要助推器。它是基本的工具,限制和强迫我们的行动能力与代理不可减少的投入,允许访问和赋予我们的数字和物理生活的意义。数据决定人性:我们必须非常关心我们的数据如何存储、管理和拥有。
全球数据市场
今天,超过63%的全球人口,即50多亿人(谷歌数据显示有77亿人口),使用互联网,这一数字将继续以每年10%以上的速度增长。但云存储市场的增长速度更快,从2015年到2025年,全球数据领域(全球范围内创建、捕获、复制和消费的数据量)预计将以58%的复合年增长率增长,到2025年,创建、存储和复制的数据量将超过180ZB(1 zb等于1024tb,1tb等于1024GB)。如果你在2025年之前堆叠足够的10tb硬盘来满足全世界的数据需求,那么这堆硬盘可以到达月球。
图 1. 按年份划分的全球数据圈规模。资料来源:Uygun 和 Döngül,2021 年
从经济角度来看,云存储市场在2021年的估值约为760亿美元;到2028年,它将达到3900亿美元(年复合增长率为26.2%)。尽管有如此爆炸性的经济增长,云存储供应商的市场份额仍在继续巩固。截至第22季度,三大云提供商——亚马逊网络服务(AWS)、微软Azure和谷歌云平台(我亲切地称之为云服务三巨头)——占据了云计算市场65%的份额。中心化云存储提供商所拥有的力量综合了它们的网络效应、声誉、技术基础设施和资产负债表,以至于新的竞争对手根本无法与之竞争。
存储解决方案的类型
1. 本地
2. 集中式(中心化)云存储 (CCS)
3. 分散式(去中心化)云存储 (DCS)
本地存储和CCS提供商——三大巨头(Amazon、Azure、谷歌)以及阿里巴巴云、Box、iCloud等——他们的特点都是以中心化存储的方式。这意味着信息存储和维护在单个位置(或少数位置),管理在单个数据库中,并由单个实体操作,就地部署和CCS解决方案都存在单点故障风险。
CCS解决方案的普及需要对现场数据存储的经济性进行历史回顾。起初,用户在自己的硬件上存储数据。这意味着数据存储和维护都希望存储在相同的实体物理位置(例如公司的现有数据服务器),我称之为第一阶段。
图 2. 数据存储采用的三个阶段。资料来源:Hunter Lampson
随着云存储的网络效应实现了更便宜(通常也更安全)的存储能力,消费者和公司转移到集中式云(第二阶段),CCS解决方案开发了云计算、API和其他SaaS产品,客户也随之增长。尽管集中式解决方案是市场上最简单、最便宜和最有效的选择,但它们的基本限制仍然是相同的:一个容器负责实体的100%数据。CCS解决方案是对室内解决方案的改进,但曾经的经济最佳方案已经变得昂贵和令人望而却步。今天,DCS提供商是市场上最便宜和最安全的存储解决方案。
CCS 解决方案的主要弱点
1. 缺乏数据所有权
当用户向CCS提供商上传数据时,他们不再拥有自己的数据。苹果扫描iCloud用户照片的颇具争议的决定(后来被撤销)就是一个很好的例子。当数据存储在给定的硬件产品(iPhone、Mac等)上时,苹果有严格的隐私保护政策。但重要的是,一旦用户向iCloud上传了一个字节的数据,苹果就会认为这些数据属于他们的领域——而不再属于用户的领域。这个先例意味着,存储在本地的数据属于用户,而存储在云中的数据属于存储提供商。
2. 容易出现数据泄露和中断
在CCS供应商中,大量的数据泄露并不需要花费太多的时间。Amazon、Azure和谷歌由于其单点故障结构,都遭受过这种问题。
这些提供者的集中式结构允许它们构建大型围墙花园,并提供相对于内部解决方案更高级别的安全性。与此同时,数据库变得越大、越集中,攻击者就越觊觎它。数据中断在CCS解决方案中也很常见,例子可以在这里看到:Amazon, Azure,谷歌。
3. 倾向于审查制度
CCS提供商不仅会不受控制地丢失数据,而且还会故意删除数据。就在几周前,YouTube热门频道Bankless在没有任何警告、通知或理由的情况下被终止。谷歌在其云服务上拥有并存储YouTube内容,谢天谢地,它恢复了频道,但谷歌和其他CCS提供商不得不删除某些数据的存在,这是对社会有害的。
4. 高成本
也许CCS解决方案最关键的缺点是费用太高。尽管在过去的50年里,存储数据的成本平均每年下降30.5%,但CCS的价格在过去的7年里一直保持不变。这是由于CCS提供商累积的网络效应。由于这些网络效应,三巨头已经开始主导云计算领域。随着它们共同的市场份额继续增长,三大巨头就像一个寡头垄断企业一样,有能力操纵价格,并将新进入者拒之门外。
图 3. 一段时间内的数据存储成本,资料来源:Arweave 黄皮书
图 4. AWS、Azure、Google 上一段时间内的数据存储成本。资料来源:AWS、Azure、谷歌、Hunter Lampson。
存储价格和存储成本之间存在差距的主要原因是CCS提供商目前保持的市场主导地位,DCS解决方案走了一条不同的道路。
DCS的解决方案
在CCS的弱点之上,去中心化存储(DCS)已被证明是数据存储领域的范式转变(第三阶段)。DCS解决方案通过匹配存储空间的供应和需求,实现跨地理分布的节点集利用空闲硬盘空间。这创造了一个更有效的市场,降低了成本,消除了本地和CCS解决方案中存在的单点故障风险,DCS解决方案还将数据所有权返回给用户。
图 5. 按平台每年存储 1 GB 的累积成本。资料来源:AWS、Azure、谷歌、Storj、SiaStats、Arweave Fees、File.app、Hunter Lampson。
虽然数据中心和存储节点的地理分布不是决定网络集中度的唯一因素,但它是一个有用的试金石。跨空间的节点分布也是决定复制、检索和保护数据的级别的一个重要因素。一般来说,网络中的节点越多,检索的速度就越快,对自然灾害的保护也就越强(我们什么时候把存储节点放到月球上?!)因此,理解节点去中心化是有效云存储的先决条件是很重要的。
与CCS解决方案相比,DCS解决方案具有革命性的地方在于其去中心化程度。在Sia、Storj、Filecoin和Arweave上运行的活动节点比AWS、Azure和谷歌Cloud管理的数据中心总和多114倍以上。
图 6. 按服务划分的活动节点总数。资料来源:Filscan、Viewblock、Storj、SiaStats、Peterson 2015、Baxtel、谷歌、Sam Williams、Hunter Lampson。
Arweave的节点数很难量化,因为Viewblock提供的统计数据将每个存储池视为单个存储节点。在一次离线对话中,Arweave的创始人Sam Williams告诉我,59个当前的存储池(根据Viewblock)可以有数百甚至数千个节点支持它们。因此,Viewblock低估了实际的节点数约10-100倍。出于这个原因,为了保守起见,我使用“500+”作为节点数。还需要注意的是,活动节点计数是去中心化的不完美度量方法,绝对的节点数量并不能告诉我们谁在运行节点(以及每个实体操作多少节点)。
借用Spencer Applebaum和Tushar Jain的说法,DCS服务之间的一个重要区别是基于合同的存储解决方案和永久存储解决方案之间的区别。简单地说:目前市场上所有的DCS服务都是基于合同的模型,只有Arweave例外。
基于合约的存储模型vs永久存储模型
Filecoin、Sia和Storj使用的是基于合约的定价模型——与目前CCS公司采用的模型相同。基于合约的定价意味着用户持续支付存储数据的费用,类似于付费订阅的方式(每个月/每年都要付费)。尽管存在细微差别,但Filecoin、Sia和Storj与现有的CCS提供商直接竞争。
另一方面,Arweave提供了永久存储模型,这意味着用户只需支付一笔费用,作为回报,他们的数据将被永久存储。与其他DCS和CCS提供商相比,Arweave常常显得懒散和不精确,Arweave区别于竞争对手的基本特征是数据持久性。
图 7. CCS 和 DCS 解决方案的概念图,资料来源:Hunter Lampson
仔细研究Filecoin、Sia和Storj,有助于我们更好理解它们与CCS提供商和Arweave的不同之处。
图 8. DCS 解决方案的主要特征。资料来源:Filecoin、Storj、Sia、Arweave、CoinMarketCap、Crunchbase。
Filecoin
Filecoin于2020年10月推出主网,是目前市场上采用最广泛、资金最充足的DCS项目。截至2022年7月12日,Filecoin的完全稀释市值约为11.9亿美元,历史最高纪录为123亿美元。Juan Benet是协议实验室(Protocol Labs)的创始人兼首席执行官,该公司开发了Filecoin及其底层技术——星际文件系统(IPFS)。到目前为止,Filecoin已经筹集了2.582亿美元的资金,其中大部分来自2017年底的首次代币发行(ICO)。
要理解Filecoin,我们必须理解IPFS,这是一种用于存储和检索数据的点对点(P2P)分布式系统。IPFS是为解决基于http的internet的缺点而构建的,它使用内容寻址来对数据进行分类,这意味着信息是根据其内容而不是其位置来请求和传递的。这是通过为每个数据区块发行一个内容标识符(CID)来实现的,CID是通过对每个文件的内容进行散列生成的,使其不可变。为了定位所请求的信息(由唯一CID表示),IPFS使用分布式哈希表(dht), dht包含存储了与CID相关的内容的节点的网络位置。当用户从IPFS节点请求信息时,该节点将检查自己的哈希表,看看是否可以定位(然后检索)所请求的文件。如果节点不包含请求的信息,它可以从对等节点下载内容并将其交付给用户。在这个模型中,信息是跨多个节点复制的,而不是HTTP模型中存在单一的、集中的位置。这消除了单点故障风险,同时提高了检索速度,因为数据是同时从多个对等点检索的。
IPFS是用来存储和传输数据的通信网络,而Filecoin是建立在其之上的经济系统。IPFS本身并不能激励用户存储其他人的数据:Filecoin可以。这是通过两个独特的证明机制完成的:复制证明(PoRep)和时空证明(PoSt)。PoRep只运行一次,以验证存储矿机是否具有它们所说的内容。对于每个链上PoRep,都包含10个SNARKs(简洁的非交互式知识论证),这证明了合同的完成。另一方面,PoSt是连续运行的,以证明存储矿工在一段时间内将存储空间奉献给相同的数据。验证该过程所需的链上交互是数据密集型的,因此Filecoin使用zk-SNARKs(零知识简洁非交互式知识论证)来生成这些证明,并将其数据压缩至10倍。
Sia
在讨论的四种DCS协议中,Sia是第一个发布的,并于2015年6月发布。2013年,David Vorick和Luke Champine在HackMIT创立了Sia,该公司拥有强大的用户吸引力,完全稀释后的市值达到1.9亿美元,历史最高的29.7亿美元。
Sia是由成立于2014年的nebula Labs推出的。Sia以类似于Filecoin的方式将上传的数据划分为复合部分(在本例中为片段),并将它们分散到全球各地的分布式主机上。与Filecoin不同的是,Sia通过不同的存储证明(PoS)机制实现了这一点。这个证明要求主机随着时间的推移共享一小部分随机选择的数据。该证明被验证并存储在Sia区块链上,主机获得Siacoin奖励。
Storj
与Filecoin和Sia一样,Storj自2018年10月推出以来获得了巨大的吸引力。Storj与Filecoin和Sia的区别在于它不依赖区块链共识来存储数据。相反,Storj完全依赖擦除编码和卫星节点来存储数据,以增加数据冗余和减少带宽使用。Storj对擦除编码的独家使用意味着数据持久性(数据在遇到故障时仍然可用的概率)与扩展因子(可靠存储数据所需的额外成本)不是线性相关的。因此,在Storj上,更高的持久性不需要按比例增加带宽。给定节点切换(节点脱机(或离开网络)的速率),从长远来看,擦除编码可能是有价值的,因为它需要更少的磁盘空间和存储和修复的带宽,尽管它增加了CPU运行时。
Storj在网络架构和定价机制上也与Filecoin和Sia有所不同。在Storj上,定价由中间存储用户(包括应用程序)和存储节点的卫星节点决定。卫星节点负责协商价格和带宽利用率。因此,Storj的定价模式并非完全依赖自由市场活动,而是受制于集中力量,因为卫星运营商代表着节点和终端用户之间潜在的集中中介。
Storj还与Amazon S3进行了本地集成,这意味着现有的Amazon S3用户可以迁移到Storj并使用基本特性,而不需要改变他们的代码库,这可能会减少与离开Amazon S3生态系统相关的摩擦。
Arweave
与Filecoin、Sia和Storj不同,Arweave提供永久数据存储。Arweave由首席执行官Sam Williams和William Jones于2018年6月成立,截至2022年7月12日,Arweave的完全稀释市值达到8.9亿美元,达到41.8亿美元的历史最高市值。
Arweave寻求以去中心化的方式提供永久数据存储,只需一次性付费,这是通过 Arweave 捐赠机制完成的。考虑到数据存储的成本在过去50年里以每年30.5%的速度下降,Arweave认为今天每GB/1美元的存储购买力比未来每GB/1美元的存储成本更高。这个三角洲使Arweave的捐赠池成为可能,“本金”是用户支付的前期费用,“利息”是购买力随着时间推移代币价格的上涨。Arweave的保守假设是存储价格每年下降0.5%,这使得捐赠池能够长期生存。
Arweave 目前约 3.85 美元/GB 的成本反映了数据存储的终端价值。在短期内,Sia 和 Filecoin(甚至是Big3三巨头)更便宜。但从长远来看,Arweave 成为更明智的选择。即使在短期内,用户也会为其他人无法提供的东西支付溢价:数据持久性。对于某些人来说,永久存储的成本相对缺乏弹性,因为某些文件(例如 NFT)需要永久存储。
Arweave由区块编织提供支持,这是一种类似于区块链的数据结构,其中每个块都链接到前一个块区和召回区块。召回区块是除最近挖掘的块之外以前已挖掘的任何块。因此,Arweave的结构不仅仅是将连续区块链接在一起的链——它是将当前区块链接到先前挖出的区块和另一个随机块(Recall块)的编织在一起。
为了开采新区块并获得采矿奖励,矿工必须证明他们可以访问召回区块,Arweave的访问证明(PoA)机制保证,对于每个新挖掘的区块,召回区块的数据也包括在内。这意味着要存储新数据,矿工必须同时存储现有数据。PoA还鼓励矿工在节点间平等地复制所有数据。当选择复制程度较低的区块作为召回区块时,能够使用该区块的矿工会在更少的矿工池中竞争相同的奖励。在其他条件相同的情况下,随着时间的推移,存储复制程度较低的区块的矿工将获得更大的奖励。
建立在区块编织之上的是永久网——类似于今天的万维网,但是永久性的。Arweave的Bockweave是为Permaweb提供动力的基础层;Permaweb是用户与之交互的层。鉴于Arweave是建立在HTTP之上的,传统浏览器可以访问网络上存储的所有数据,从而实现无缝的互操作性。
吸引力
虽然DCS解决方案在理论上可能优于CCS解决方案,但应该根据它们在实践中的有用性来评价它们,我们可以通过检查以下内容来衡量每个项目的吸引力:
1. 存储的数据
2. 节点分布
3. 感兴趣的搜索
4. 生态系统的力量
5. 需求方面的收入
1. 存储的数据
需求是通过检查数据存储量随时间变化而直接衡量的,被视为DCS提供商的主要KPI。仅从这一指标来看,Filecoin占优势;截至撰写本文时,Filecoin存储了超过90%的DCS数据圈,而90天前这一数据圈仅为82.8%。
图 9. 存储的 DCS 数据市场的比例。资料来源:Storj Stats、SiaStats、Viewblock、File.app、Hunter Lampson。
Filecoin不仅存储了最多的数据,而且增长速度也最快。在过去的90天里,Filecoin平台上存储的数据增长了112%。
图 10. 数据存储增长(过去 90 天)。资料来源:Storj Stats、SiaStats、Viewblock、File.app、Hunter Lampson。
根据这些都是存储协议,存储的数据量是一个重要的指标,尽管它有严重的限制。数据存储量没有告诉我们协议收益或数据本身(它的价值如何,它的功能是什么,它将存储多长时间,等等)。在DCS和CCS供应商之间,关于如何描述存储数据的特征存在着持续的争论,因为不是所有的数据都被平等地重视(和对待)。有些数据比其他数据更重要。用户可能会根据这个指标来划分他们的存储提供者,因此存储的数据量只能描绘出部分情况。
数据存储量也缺乏数据将如何为协议的需求端收入做出贡献的背景,这在考虑Filecoin时,尤其成问题,Filecoin是唯一一个实质上免费提供存储的DCS服务。出于这个原因,用户可能会使用Filecoin存储数据,因为它目前的定价(后面会详细介绍……)。虽然我很难找到这方面的公开资源(原因很明显),但有趣的是,这个领域的无数建设者和研究人员-他们都是我非常尊敬的人-告诉我,Filecoin倾向于与大型机构合作,提供免费存储,以操纵他们的存储量指标。从理论上讲,Filecoin可以比任何其他DCS协议存储无限多的数据,但仍然产生零需求端收入。
2. 节点分布
虽然数据存储量是存储需求的直接度量,但我们也可以看看间接度量。节点分布对理解很重要,因为它突出了需求端和供应端参与者的地理组成部分。我们可以通过观察1)存储节点和 2)搜索兴趣的地理分布来评估这一点。
存储节点在空间上的分布越分散越好,更高的分散性(通常)形成更大的去中心化,并缩短从节点到最终用户的检索时间。较高的分散性还降低了无法恢复的数据丢失的风险(通常是由于环境因素,如自然灾害)。理想情况下,节点不会任意分散在空间中,而是与空间中的存储需求相关(可能相当于技术饱和乘以人口密度)。鉴于美国、中国和欧洲的存储需求最集中,我们预计它们将拥有最集中的存储节点。因此,CCS和DCS解决方案中的节点分布都集中在美国、欧洲和中国是有道理的。DCS节点分布与CCS存储中心分布相似,是DCS解决方案达到重要市场成熟水平的积极信号。
图 11. DCS 节点的地理分布。资料来源:Filscan、Viewblock、Storj、SiaStats、Sam Williams。
图 12. CCS 节点(数据中心)的地理分布。资料来源:Peterson 2015,Baxtel,谷歌。
3. 感兴趣的搜索
如果我们把节点分布看作DCS供应中的分布,那么我们可以(至少部分地)把搜索兴趣分布看作DCS需求中的分布。(这一假设基于这样一个事实:对于DCS解决方案的每次搜索,搜索者更有可能是存储空间的用户,而不是供应商。)
根据这个指标,Filecoin显然目前在全球范围内拥有最高的搜索兴趣主导地位,相对于Storj、Sia和Arweave。因此,人们可能会认为Filecoin的相对需求最高。
图 13. 按国家/地区划分的相对搜索兴趣优势。资料来源:谷歌趋势。注意:我使用术语“Sia”而不是“Siacoin”
这些假设都是基于当前的供需指标,但回顾过去,也可以得出类似的结论。自2021年年中以来,Filecoin一直是搜索次数最多的DCS解决方案。值得注意的是,2021年8月的Arweave和2021年11月和2021年12月的Storj几乎超过了Filecoin的搜索兴趣。
图 14. 一段时间内的相对搜索兴趣。资料来源:谷歌趋势
虽然兴趣搜索可以是一个有用的指标,但它有严重的局限性。这个指标向我们展示了单个用户如何使用谷歌来获取关于每个项目的信息,搜索兴趣并没有告诉我们实际的协议需求。
可以很容易地得出结论,因为Filecoin筹集了迄今为止最多的资金,他们可能有最多的钱花在营销上。那么,也许营销预算可以单独解释每个项目中搜索兴趣的变化。也许兴趣搜索主导比协议需求更能预测获得的资金——谁又能说的准呢?此外,Filecoin拥有易于理解的、关键字较多的域,如Web3。存储和非功能性测试。存储时,也可能引起数据的偏差。用户在搜索“Web3 Storage”时可能会遇到Filecoin的服务,这完全是基于搜索引擎优化和他们拥有的域。
兴趣搜索可变性的另一个局限性是它可能与存储需求高度不相关。例如,如果用户打算将数百tb的数据移动到DCS提供者,那么他们的搜索活动(一次搜索)将不能反映他们的实际存储需求。也有可能是外部变量,比如像Coinbase这样的cex(中心化交易所)营销这些单个代币的程度,在这里发挥了重要作用。
4. 生态系统
因为DCS解决方案存在于基础设施层,所以它们的生态系统通常代表用户需求,因为它们的用户(消费者、公司、开发人员)可以选择使用或构建哪个生态系统。生态系统的力量来源于1)建立在协议之上的项目和2)与之合作的现有项目。考虑到他们的合作关系的成熟度和新项目的添加速度,Filecoin拥有最强大的生态系统。在过去的18个月里,Filecoin的生态系统已经从40个项目发展到300多个项目。Filecoin拥有一批令人印象深刻的合作伙伴,其中包括:Chainlink、Polygon和Polygon Studios、The Graph、Near、ConsenSys、Brave、ENS、Flow、Hedera、ChainSafe、Ceramic、Livepeer、Audius、decrypt、MoNA和Skiff。
图 15. Filecoin 生态系统。资料来源:Messari
为了帮助发展他们的生态系统,Filecoin基金会在其生态系统和拨款项目上投入了大量资金。Protocol Labs是Filecoin背后的团队,到目前为止已经进行了46次直接投资,向包括decrypt、Syndicate、ConsenSys和Spruce在内的生态系统项目部署了超过4.8亿美元。
图 16. 随着时间的推移,Protocol Labs的投资。资料来源:Crunchbase
仅次于Filecoin的是Arweave的生态系统,Filecoin有近300个合作伙伴,而Arweave大约有60个。尽管许多合作伙伴可以同时从两个平台中受益——例如,Mirror和Skiff可以同时为用户提供Filecoin和Arweave的服务——但其他项目,如Solana,不太可能同时使用两个平台。这意味着许多最关键的web3基础设施项目——协议、dApp、NFT平台——将找到产品与市场的契合的存储协议,并在意识形态上与Filecoin或Arweave保持一致,这取决于具体的用例。每个生态系统的实力将在每个平台的长期生存能力中发挥至关重要的作用,因此赢得新老建设者的心和思想的能力是最重要的。
值得注意的是,相对于Filecoin, Arweave的生态系统在平台上建立了更多的新项目——因为它们依赖于技术来生存——而不是选择性利用现有技术的项目。这也解释了为什么Filecoin会与更成熟的项目合作,这并不是因为Filecoin的合作关系发展得更快、更成功,而是因为Filecoin的合作伙伴(如Cloudflare和Opera)存在的时间更长。相比之下,Arweave的合作伙伴一般都是在网络基础上白手起家的早期公司。Arweave的一些著名合作伙伴包括Solana、Polkadot、The Graph、Mirror、Bundlr、Glass、KYVE、Decent Land、ArDrive。
图 17. Arweave 生态系统。资料来源:@axo_pas(在 Twitter 上)
自2020年以来,Arweave已经向15个生态系统项目投入了近5500万美元,包括Mask、Fluence和Pianity。通过他们的Open Web Foundry加速项目,Arweave帮助开发者创建永久Web应用,并通过他们的社区运营生态系统基金ARCA DAO进行了投资。
Sia 和 Storj的生态系统较小,分别有大约30个和13个项目。尽管Sia和Storj的生态系统规模较小,但它们拥有出色的合作关系。Storj的一些合作伙伴包括CoinMarketCap、Crypto.com、Kraken、Filebase、Render、Akash和Quant,而Storj的合作伙伴包括Microsoft Azure、Fastly、Couchbase和Pokt。重要的是,Storj的战略是围绕捕获现有Amazon S3用户建立的,包括大型现有公司。因此,Storj的许多合作伙伴可能会拒绝公开上市。Storj的合伙人可能看不到被列为此类公司的任何好处。相比之下,在Arweave上构建的新的web3原生项目可能确实会从被列为合作伙伴中受益,以表明他们在生态系统中的沉浸感。不同的宣传动机使生态系统比较具有挑战性,因为我们缺乏完整的数据集。
今天,Sia主要由Filebase(第一个与Amazon s3兼容的dApp)和Arzen(一个面向消费者的去中心化存储应用程序)使用。
5. 需求方面的收入
数据存储量可能是用户吸引力最直接的衡量标准,但需求端收入衡量的是用户吸引力的价值——或项目将用户吸引力货币化的能力。正如Sami和Mihai(两人都是MessariCrypto分析师)在他们关于Filecoin收入模型的文章中所解释的那样,需求端收入是基础设施项目的一个有用指标,因为它衡量的是人们使用网络所支付的费用(在这种情况下:存储数据所支付的费用)。重要的是,需求方的收入不包括支付给矿工的区块奖励。
虽然Arweave、Sia和Storj的需求侧收入数据可以在Web3 Index上找到,但Filecoin的需求侧收入数据很难找到(如果有人能找到这些数据,我很乐意看到)。因此,我们不能将Filecoin纳入需求方收入比较。
关于Filecoin的收入,我们所知道的是,尽管其平台上存储的数据在增长,但他们的收入却保持持平。这可能是由于两个原因:首先,HyperDrive更新将存储入网率提高了10-25倍,导致对数据区块空间的需求较低(我们将在后面看到,这损害了Filecoin的代币价值)。其次,在不产生更高收入的情况下存储更多数据表明Filecoin实际上是免费存储数据的。因此,矿工得到的是一个不可持续的区块奖励,大约为每个区块20.56 FIL,这将随着时间的推移而减少,在不久的将来,Filecoin将需要提高存储价格,以激励矿工参与到网络中来。
图 18. Filecoin 的协议收入仍然与生态系统增长无关。资料来源:Messari
但是对于Storj, Sia和Arweave,我们可以看到在过去90天内需求端收益的产生。
图 19. Storj、Sia、Arweave 的需求方面的收入(过去 90 天)。资料来源:Web3 Index
因为Filecoin、Sia和Storj是基于合约的(临时)解决方案,其中用户支付持续存储数据的费用,所以我们可以假设他们的需求端收入中有非零的部分是经常性的。相比之下,我们可以假设Arweave 100%的需求端收入都是非经常性的,因为用户只需支付一次费用就可以永久存储数据。这意味着Arweave产生需求端收入的唯一途径是存储净新数据。这对Arweave来说是一个巨大的挑战,提醒我们将Arweave与DCS进行比较的不足之处。
可能被证明是护城河——或竞争劣势——的是DCS平台之间在需求端收入效率(大致等于价格)上的差异。我把需求方的“收入效率”定义为每存储一个字节的数据所产生的需求方收入。在过去的90天里,Storj和Sia每上传一TB分别产生了96.50美元和89.90美元的需求端收入,而Arweave每上传一TB产生了约10200美元的收入。这种定价模式是Arweave与其DCS竞争对手的另一个根本区别: Arweave对功能独特的服务收取溢价。这也意味着Arweave可以存储比DCS少113倍的数据,但仍能产生与DCS竞争对手相同的需求端收入。这表明Arweave不应该像其他解决方案那样存储相同数量的数据,因为它的服务和定价机制都是不可比较的。
代币估值
方法
Storj, Sia, Arweave和Filecoin被理解为1)实用代币(礼品卡)和2)交换媒介(货币)的组合。实用代币的估值基于其预期的未来效用;货币的价值取决于供求关系。实用代币的持有者可以用它们兑换服务——在这种情况下,就是云存储。为特定服务兑换实用代币的能力使其在结构上类似于传统礼品卡或代金券。但是,与礼品卡和代金券不同,实用代币是程序化提供和自主的,而礼品卡和货币是商业或政府提供的,(几乎)总是以不同的货币(通常是法币)发行。程序化供应保证了指定的供应时间表,这使我们能够精确的计算代币供应。(最近9.1%的CPI数据向我们展示了程序性货币供应的强大力量)我们将此与传统货币主义理论相结合,推导出每个代币的内在价值。
需要明确的是:我感兴趣的是使用传统货币理论和贴现现金流分析对代币价格随时间的变化进行估值。我不打算评估协议本身的价值(即产生的总收入[尽管收入很重要…]),也不打算评估存储矿工或存储供应商的利润。我也认识到这些协议产生的非凡文化价值,特别是当它们(不可避免地)成为公共产品时。也就是说,每个协议的代币价格可能不考虑这些,所以我也不考虑。
首先,一个重要的区别:传统的公开证券(如$AAPL: Apple)和代币(由协议发行)代表不同的东西。尽管协议产生资产流,但它们不会像苹果那样产生现金流。因此,代币不应与公开股票混为一谈。代币代表使用/交易的权利;公开发行的股票代表所有权。(代币不仅可以代表对实用程序/事务的权利——例如,它们还可以包括治理权。)随着时间的推移,代币的价格估值需要包含不同的机制:货币理论和贴现现金流分析。
代币的估值模型
我用来评估代币价格的主要框架是Chris Burniske在他的开创性作品:Cryptoasset Valuations(加密资产估值)中提出的模型。Chris认为,与其建模传统的DCF,还不如保持相同的结构,用交换方程代替现金流,这样我们就可以推导出每个代币的当前效用价值。然后,我们对未来效用价值应用贴现率来推导今天的内在价值。
替换为交换方程:MV = PQ帮助我们融入代币的货币性质。正如Chris(以及无数其他人)所承认的,这个模型有它的局限性(所有的预测模型都有),但它可能是我们拥有的最好的模型。鉴于缺乏完全有效的市场,以及预测未来固有的较大误差范围,该模型最好用于说明产生代币价值的各种杠杆。
Chris写道:“加密资产估值主要由求解M组成,其中M = PQ / V。M是支持规模为PQ、速度为V的加密经济所需的货币基础规模。”
Block unicorn注释:M = 资产基础规模,V = 资产的速度,P = 提供的代币资源的价格,Q = 正在供应的代币资源的数量。
代币估值模型:投入
为了预估M, V, P和Q,我将使用以下方法:
数学推导的投入
1. 最大供应量
2. 流通量
3. 流通量年复合增长量
4. 存储成本(1$/GB/年)或(1$/GB)
5. 存储成本年降幅(CAGR)
6. 数据存储市场的规模大小
7. 数据的年增长(CAGR)
这是由三巨头在过去十年中存储成本的年均下降($/GB/年)得出的,如下图所示(图20):
图 20. AWS、Azure、Google 的数据存储成本和 CAGR。资料来源:AWS、Azure、谷歌、Hunter Lampson。
主观的假设
1. 持有代币的百分比(未流通的公共供应量的百分比)
我假设,在2021年,50%的代币被持有。这种假设源于这样一个事实:从历史上看,大约一半的Coinbase用户将比特币严格地视为一种投资,而另一半则将其视为一种交易媒介。
2. 每年持有的代币变化百分比
我假设从2022年开始,代币持有的比例将以每年1%的速度下降。随着市场趋于平衡,价值增值的潜力变小,因此流通中的代币数量将增加(代币持有率下降)。这是难以估计的—同样,它最好被理解为有助于代币估值的杠杆。
3. 速度
假设每个代币的增长速度是20%,鉴于比特币的速度历史上一直在14%左右,我在这里使用20%是保守的做法。
4. TAM(获得全球数据市场占比)
我假设Arweave可以处理全球数据市场的10%,而Filecoin、Sia和Storj可以处理剩下的90%。永久数据存储是一个全新的市场,因此很难确定它可以处理现有数据市场的百分比,因此我在这里使用10%,希望保守一些。临时数据存储—当今主要的存储解决方案—必须占到数据市场的100%。如果我们假设现有数据市场的10%将过渡到Arweave,那么剩下的90%就留给Filecoin、Sia和Storj来处理。
5. 获得TAM的最大百分比
我假设TAM获得的最大百分比是Arweave, Sia和Storj的1%。因此,我假设Arweave捕获了全球数据市场的10%中的1% (Arweave总共捕获了全球数据市场的0.1%,Sia和Storj分别捕获了0.9%)。鉴于其牵引力和成熟度,我假设Filecoin捕获了25%的可用TAM(90%的25% = 18%的全球数据市场)。
6. 拐点
我假设2024年是每个网络达到拐点的一年,这一年达到了TAM获得百分比最大值的10%,这几乎是不可能预测的——另一个说明性的杠杆。
7. 饱和/年
我假设饱和/年(网络从TAM最大百分比的10%到90%需要的时间)对于Arweave、Sia和Storj是10年,对于Filecoin是4年,另一个不可能的预测。
8. 折现率
我假设贴现率为40%,这是这种风险水平资产的行业标准。
以下是所有固定和可变的数学推导的投入和主观假设的简略视图:
图 21. 代币估值模型中使用的固定和可变数学衍生投入和主观假设的简明视图。资料来源:CoinMarketCap、Uygun 和 Döngül,2021 年,Chris Burniske,Hunter Lampson。
关于Filecoin不同的投入:
1. 数据存储成本下降(CAGR) = 0%
2. 假设存储成本($/GB/年)= $0.002/GB/年
在表中,我明确的将Filecoin数据存储成本下降(CAGR)和假设存储成本($/GB/年)标记为一个非常主观的假设,尽管这方面的明确数据是可用的。我这么做是因为Filecoin目前的定价太低,难以持续。
首先,让我们从假设存储成本($/GB/年)开始。目前,Filecoin上的存储成本约为0.0000017美元/GB/年,或存储成本的0.0011%在三大提供商上。正如我上面所讨论的,Filecoin的定价模式是不可持续的,因为它是由区块奖励大量补贴的。自从他们2亿多美元的首次代币发行以来,Filecoin补贴了他们网络上的存储成本。随着他们放弃补贴,我们可以预期他们的存储成本将在当前水平上增加。在同等条件下,存储成本的增加,在固定的需求下,使$FIL更有价值(与任何代币一样),但我们可以假设,随着Filecoin不可避免地提高价格,其网络上的存储需求可能会减少,降低$FIL的内在价值。
很难说该团队将如何执行提高价格,即使价格仍然低于三巨头。如果我们以当前定价约0.0000017美元/GB/年运行该模型,则2022年的内在价值约为0.00美元/FIL,再次表明FIL今天的定价模型是不可持续的。因此,我估计未来10年Filecoin存储成本为0.002美元/GB/年(比三大存储价格便宜100倍)(假设数据存储成本下降[CAGR]为0%)。这保持了Filecoin的价格竞争力——使它们比三大解决方案便宜100倍——同时为代币价格提供了显著的价值。把这种投入看作个人对Filecoin可持续发展的期望,甚至是要求。
代币估值模型:投入
图 22.代币估值模型投入。资料来源:CoinMarketCap、Hunter Lampson
在同等条件下,模型在杠杆作用如下:
图 23. 产生代币价值的各种杠杆的图示。资料来源:Hunter Lampson
这个表指的是给定每个杠杆变化的一般投入,而不是保证,当杠杆增加/减少到任意高/低的数字时,投入总是正确的。例如,考虑速度:平均而言,随着速度的增加,代币价格下降。但一个任意低的速度水平,例如速度为0,将意味着代币每年交易0次,因此需要0的货币基础来满足生态系统。也就是说,通过避免结尾,表中引用的总体趋势是有用的。
发现
Arweave的经济效益是最具防御力的,其驱动因素是相对较低的$AR代币供应量和相对较高的存储成本($/GB)。这部分建立在我之前的结论之上,即Arweave是DCS产品中需求端收入效率最高的,这意味着它可以存储比同类产品少113倍的数据,并产生相同的需求端收入。此外,我假设Arweave捕获了全球数据圈的0.10%,这个假设足够保守,是合理的。如果实现这一目标,2032代币价格预计将比目前的水平上涨+182.91x。尽管Arweave较高的相对定价可能会强化其单位经济效益,但它也可能是阻碍用户采用的致命弱点,用户将最终决定Arweave的服务是否物有所值。
即使我们假设用户愿意支付这些额外费用,理论上,他们必须被说服在实践中使用产品。因为Arweave的产品与竞争对手有本质的不同,转换成本可能太高,服务也太独特,无法赢得新用户。尽管Arweave有潜在的优势,但高昂的成本和对全新市场的依赖可能会成为不可逾越的障碍。如前所述,Arweave产生需求端收入的唯一方法是存储新数据。从表面上看,Arweave似乎并没有每比特数据的需求端收益——这是所有CCS和DCS的竞争对手都能从中受益的东西。相反,我认为Arweave受益于非自愿重复的需求侧收益。Arweave不是向用户永久收费,而是预先获得“永久的经常性需求端收入”,这可能是Arweave最有价值的捐赠机制之一。
目前,由于其低廉的价格,Filecoin的经济是最不可靠的。给定一个固定的代币供应,公用事业的成本越低,支持它的货币基础就必须越小。这种观点将低定价定义为代币价值的消极属性,而不是积极属性。同样有可能的是,Filecoin的低定价为其被广泛采用奠定了基础。低定价也可能是Filecoin的关键区别,这可能是一个必要的护城河。
然而,我担心的是定价权在决定Filecoin的未来方面将发挥的重要作用。正如Tushar和Spencer所说,Filecoin(以及Sia和Storj)正在与三大巨头直接竞争临时存储市场。与三巨头展开价格战可能是灾难性的。如果Filecoin能够在没有不可持续补贴的情况下保持低价格,那么它的成熟度、生态系统的实力和整个行业的影响力将使它成为三巨头最有力的挑战者。如果最终演变成价格战——这可能是不可避免的——事情可能会变得很糟糕。
根据该模型,根据当前定价和2032年价格预测之间的差值,Sia的代币经济学使其价值比Storj高出4.5倍。通常情况下,Sia和Storj被归为Filecoin的弟弟。鉴于Sia和/或Storj的生态系统不那么强健,很难想象在不久的将来,它们会取代Filecoin在这一领域的主导地位。尽管如此,Sia和Storj的代币经济比Filecoin的代币经济更有吸引力。定价权对代币估值和每个项目的长期生存能力都是不可或缺的。
局限与对未来研究的思考
1. 云存储≠云计算。正如Christine Deakers所指出的,许多云存储用户同时对他们存储的数据使用云计算。DCS解决方案必须解决这个问题。Filecoin已经开始构建它的虚拟机——其他DCS解决方案可能也会效仿。
2. DCS解决方案需要更多的集成。正如Mark Gritter所指出的,大多数物联网应用不仅需要分布式存储,还需要去中心化数据库。如果DCS解决方案没有与传统的时间序列数据库进行本机集成,这可能是采用的主要障碍。
3. DCS解决方案应该允许位置选择性。Mark Gritter提到的一个例子是自动驾驶汽车。自动驾驶汽车收集的传感器数据流必须以去中心化的方式存储,以实现尽可能低的延迟。如果数据上传者(汽车和汽车公司)无法选择附近的位置存储数据,DCS解决方案可能无法很好的解决这个用例。
最后
(1)虽然云计算不同于云存储,但我们可以合理地做一组假设:首先,提供云计算服务的公司(如三大巨头)倾向于在它们存储的数据上提供这种服务。换句话说:客户通常在一个平台上同时使用计算和存储服务。
第二:我们可以假设,随着云计算公司占领更多的市场份额,它们从更好的单位经济中以越来越快的速度获益。一家公司的规模越大,它在硬件定价方面的谈判就越有效,这会降低客户的成本,吸引更多的用户,进一步增强其谈判能力。所以,当我提到三巨头占据了65%的云计算市场份额时,我们可以假设它们占据了类似数量的云存储市场份额。
(2)在这篇文章中,我使用术语“安全”和“安全”来描述在分布式节点集上高度复制的数据,这导致了更高的数据冗余,更一致的正常运行时间,并降低了审查和单点故障风险的可能性。
评论(0)
Oh! no
您是否确认要删除该条评论吗?