2021 Ceph 用户调查结果
连续第三年,我们对 Ceph 用户群体进行了调查,并发布了这些数据,供所有感兴趣的人参考。感谢 245 名在此次调查中分享您的使用情况、信息和意见的参与者。
本次调查的目的是更好地了解 Ceph 技术的采用情况,以及了解我们的用户的优先事项。参与仍然是可选的、公开的、匿名的和自主的,因此数据的有效性依赖于信任社区和公众提供准确的信息。我们不能声称本次调查通常代表 Ceph 用户群体,但值得注意的是,多年来一些回复的一致性。
您可以在下方找到报告和原始数据。
由于这是第三年,我们可以深入了解参与调查的用户的用法模式和优先事项随时间的变化情况。以下是一些我以及 用户调查工作组 的其他成员认为有价值的亮点。
您为什么使用 Ceph?
有时,调查数据会揭示调查本身随时间的变化。在 2018 年,我们要求用户确定使用 Ceph 的最重要的原因,您可以在下方看到结果。在 2019 年和 2021 年,问题询问了用户选择 Ceph 的所有原因。
结果表明,开源的价值和可扩展性始终是首要任务,当允许用户选择多个使用注意事项时,高可用性成为第三个最重要的特性。这些使用驱动因素与项目陈述的核心价值观非常一致,Sage 在最近的 Pacific 版本视频 中重申了这些价值观。
用户选择 Ceph 的前 3 个原因 ¶

谁在使用 Ceph?
Ceph 用户报告的部署遍布除南极洲以外的所有大陆(目前为止!),并且这种地理分布在一段时间内一直保持一致。虽然 2018 年仅询问区域,但 2019 年和 2021 年询问了国家/地区级别的信息。区域分布在所有调查中都保持相对一致。如果您在这里没有看到您的国家/地区,并且没有参加调查,请在下方留言,以便我们确保您获得应有的提及。
您的组织哪些部门使用 Ceph?
那些在组织内商业部门中识别出使用 Ceph 的用户在多年来一直保持相对一致,商业部门平均占三年以上的 64%。虽然在之前的调查中,我们要求用户识别单个组织类型,但今年我们允许组织选择多个部门,这反映了具有不同使命的组织。20% 的受访者表示拥有多个使命,通常是商业、学术和/或政府的组合。您可以在下方的分布中找到今年的数据。
用户希望 Ceph 社区将精力集中在哪里?
本次调查提出了三种不同类型的问题,以深入了解 Ceph 社区的优先事项。每个问题都提供了不同的表述语言,结果显示出一些有趣的响应差异。
基于加权类别优先级 ¶
当被问及“您认为 Ceph 开发社区应该将精力集中在哪里?”并提供预定义的响应集时,用户按如下方式对优先级进行排序,其中“可靠性”是明确的首要任务,而“性能”和“文档”实际上并列第二。
基于净推荐值 (NPS) 响应 ¶
在过去两年中,本次调查包括了经典的 净推荐值 问题“您有多大可能向同事推荐 Ceph?”并提供了一个分享选择该答案的首要原因的机会。
在将定性答案编码为可量化的类别(这更像是一种艺术而非科学,但对于构建数据很有用),响应的热图如下所示。

在此背景下,看起来“复杂性”会严重降低用户满意度,甚至出现在一些推荐者的回复中。如果让 Ceph 更易于使用和理解,是否会将那些反对者变成推荐者?如果您是其中之一,请在评论中告诉我们!
虽然“可靠性”和“可扩展性”更频繁地出现在推荐者分数(9 或 10 分)的原因中,但良好的或不好的性能都没有对决策产生显著影响。
基于开放式愿望清单优先级 ¶
我们还要求用户识别他们最希望的功能,这是优先事项的另一个指标。在这种情况下,用户没有被要求对功能类别进行优先级排序,而是被要求提供简短的定性回复。对回复进行编码(同样,其中包含一些主观性,但对于构建数据很有用)会产生下方的图表。
这些结果表明,用户对当前的可靠性水平感到满意,因为没有功能请求属于该类别,这与 NPS 响应一致,但不与加权类别优先级一致。“易用性”(复杂性的反面?)功能是第二大最常请求的功能,这与 NPS 响应一致,但不与加权类别优先级一致。
与加权类别优先级一致,性能相关的请求出现频率最高,但不与 NPS 响应一致。用户似乎对当前的性能水平感到满意,基于缺乏负面 NPS 响应,但在被询问时,他们经常请求性能相关的功能。我想这与组织趋势有关,即更多的工作负载或存储服务层合并到更少的不同存储系统中。
更多用户行为洞察
大多数用户报告运行 Nautilus 或更早版本(71%),这与用户声明的升级行为不符,63% 的用户声称在发布可用后一年或更短时间内更新主要版本。虽然人们可能会认为用户会并排运行 Octopus 和早期版本,以便在推出新版本之前进行测试,但只有 19% 的用户报告这样做。
AMD CPU 的使用量从之前的调查中几乎不存在到今年的 29% 跃升,ARM 的使用量也稳步增长,从 2018 年的 1% 增加到 2019 年的 5%,现在是最新调查中的 12%。
HDD 仍然是 Ceph 集群中最常报告的存储设备类型,尽管 SSD 正在迅速赶上。NVMe 设备的采用量也有增长,但不如非 NVMe SSD 增长。15 名用户报告在 2019 年的调查中使用 Optane,但这一数字在 2021 年降至 3。
23% 的用户报告他们的集群专门用于一种存储接口,这表明用户欣赏来自单个集群的多种存储接口的灵活性。这个数字得到了 34% 的用户报告 Ceph 集群具有单一用途的印证,而其余 66% 的用户至少将集群用于两个不同的用例。
最常见的单一协议集群使用 RBD,有 26 名用户报告。报告的 Ceph 存储接口的变化如下所示。
局限性、注意事项等
我声称没有对调查结果、数据收集方法或受访者外展方法进行详尽的审查,以寻找偏差或评估数据在多大程度上可用于提供可推广的结论。我不想暗示这些结果反映了整个 Ceph 社区。
尽管如此,我发现这些数据对于创建关于用户行为的假设很有用。希望您也觉得这些数据和结果具有洞察力或趣味性。
我们希望通过增加 Ceph 社区的参与来提高调查质量和结果。为此,请通过在下方留言告诉我们与您和您的同事联系的最佳方式。