Ceph 普查结果
你好!
从2月13日至18日,我们进行了首次 Ceph 普查。本次调查的目的是了解有多少 Ceph 集群,它们用于什么目的,以及它们与哪些技术一起使用。
普查在 ceph-devel 和 ceph-users 邮件列表中公布,并在 #ceph IRC 频道的讨论主题中放置了一个链接。总共有 10 个问题。调查默认情况下是匿名的,但如果选择,人们可以提供他们的电子邮件地址。总共,我们收到了 81 名受访者的回复。
原始回复(不包含电子邮件地址和其他个人身份信息)可在本文末尾找到。在此之间,是我尝试总结最重要的数据的过程。有些问题是可选的,有些允许选择多个答案,因此每个问题的回复数量通常多于或少于 81 个。请享用!

评估 Ceph、制定具体生产计划和正在生产中的用户数量几乎是三等分。
社区报告了 21 个生产集群,总原始存储容量为 1,154TB。显然,DreamHost 的团队没有参与普查;仅 DreamObjects 就超过 3PB!
预生产集群的总原始存储容量为 2,466TB(不包括报告的 20PB 集群)。
答案 # 评估/调查 36 预生产 24 生产 21

报告的总存储量为 5,635TB,其中大部分集群的存储容量小于 50TB。平均集群大小略大于 72TB。
由于此问题允许自由文本回复,我将每个回复转换为 TB。如果指定了范围,我选择了较低的数字。
在两个最大的回复中,一个是上面提到的神秘的 20PB 预生产集群,该集群为 OpenStack 部署提供存储。另一个是 GRNET SA 的 1PB 预生产集群。
答案 # <= 10TB 28 11-50TB 26 51-100TB 11 101-200TB 6 201-500TB 6 > 500TB 2

毫不奇怪,一半报告的 Ceph 集群用于提供云部署的存储。然而,私有云部署比公共云部署代表了更多的集群,这很有趣。
我没想到 Ceph 在备份和归档方面有如此多的兴趣,但我应该想到——Ceph 的低成本和易于扩展使其非常适合此目的。
我很高兴看到大数据成为一个流行的用例。许多开源分布式文件系统可以用来取代 HDFS,Ceph 也不例外。
答案 # 私有云 53 备份/归档 29 公共云 23 大数据 20 HPC 13 遗留 6

这个问题有点奇怪,因为“客户端”操作系统仅对某些用例重要。例如,REST 客户端运行的操作系统无关紧要,但对于 Ceph 的块和文件接口的客户端来说,它很重要。
即便如此,Ubuntu 仍然占据主导地位。其他回复中,Gentoo 和 SLES 排名靠前。
答案 # Ubuntu 45 Debian 25 CentOS 15 RHEL 12 其他 21

在服务器端,Ubuntu 是王者。超过一半的受访者表示他们目前正在运行,或计划在 Ubuntu 上运行他们的集群。
我们去年年初努力确保 Ceph 在 Ubuntu 上的体验良好,并且目前正在对其他主要发行版进行类似的努力。
Ubuntu 和 Debian 结合起来(apt-get 联盟!)占本次普查中反映的所有生产集群,除了两个。
答案 # Ubuntu 43 Debian 15 CentOS 7 RHEL 3 其他 12

这有点令人惊讶!实际上,是 两个 惊喜。
首先,OpenStack 是最主要的云堆栈。与 Apache CloudStack、ProxMox 和其他技术的集成正在产生兴趣——我预计在下一次普查中会看到更均匀的分布。
第二个惊喜是大多数受访者根本不使用云堆栈……即使第一和第三用例是云部署!
“其他”类别中的主要回复是 Ganeti 和 VMWare vCloud。
答案 # 无 35 OpenStack 17 ProxMox 6 OpenNebula 5 CloudStack 4 其他 11
好了!这就是我们首次 Ceph 普查的结论。我认为它非常有价值,并且感谢所有参与者的参与!可以在此处下载 CSV 格式的完整结果 此处。
我们希望定期重复此普查,并将继续发布结果。下次再见!
祝好,
Ross
