Ceph 普查结果

rturk

你好!

从2月13日至18日,我们进行了首次 Ceph 普查。本次调查的目的是了解有多少 Ceph 集群,它们用于什么目的,以及它们与哪些技术一起使用。

普查在 ceph-develceph-users 邮件列表中公布,并在 #ceph IRC 频道的讨论主题中放置了一个链接。总共有 10 个问题。调查默认情况下是匿名的,但如果选择,人们可以提供他们的电子邮件地址。总共,我们收到了 81 名受访者的回复。

原始回复(不包含电子邮件地址和其他个人身份信息)可在本文末尾找到。在此之间,是我尝试总结最重要的数据的过程。有些问题是可选的,有些允许选择多个答案,因此每个问题的回复数量通常多于或少于 81 个。请享用!

Status

  • 评估 Ceph、制定具体生产计划和正在生产中的用户数量几乎是三等分。

    社区报告了 21 个生产集群,总原始存储容量为 1,154TB。显然,DreamHost 的团队没有参与普查;仅 DreamObjects 就超过 3PB!

    预生产集群的总原始存储容量为 2,466TB(不包括报告的 20PB 集群)。

  • 答案#
    评估/调查36
    预生产24
    生产21

Storage

  • 报告的总存储量为 5,635TB,其中大部分集群的存储容量小于 50TB。平均集群大小略大于 72TB。

    由于此问题允许自由文本回复,我将每个回复转换为 TB。如果指定了范围,我选择了较低的数字。

    在两个最大的回复中,一个是上面提到的神秘的 20PB 预生产集群,该集群为 OpenStack 部署提供存储。另一个是 GRNET SA 的 1PB 预生产集群。

  • 答案#
    <= 10TB28
    11-50TB26
    51-100TB11
    101-200TB6
    201-500TB6
    > 500TB2

Use case

  • 毫不奇怪,一半报告的 Ceph 集群用于提供云部署的存储。然而,私有云部署比公共云部署代表了更多的集群,这很有趣。

    我没想到 Ceph 在备份和归档方面有如此多的兴趣,但我应该想到——Ceph 的低成本和易于扩展使其非常适合此目的。

    我很高兴看到大数据成为一个流行的用例。许多开源分布式文件系统可以用来取代 HDFS,Ceph 也不例外

  • 答案#
    私有云53
    备份/归档29
    公共云23
    大数据20
    HPC13
    遗留6

Client

  • 这个问题有点奇怪,因为“客户端”操作系统仅对某些用例重要。例如,REST 客户端运行的操作系统无关紧要,但对于 Ceph 的块和文件接口的客户端来说,它很重要。

    即便如此,Ubuntu 仍然占据主导地位。其他回复中,Gentoo 和 SLES 排名靠前。

  • 答案#
    Ubuntu45
    Debian25
    CentOS15
    RHEL12
    其他21

Server

  • 在服务器端,Ubuntu 是王者。超过一半的受访者表示他们目前正在运行,或计划在 Ubuntu 上运行他们的集群。

    我们去年年初努力确保 Ceph 在 Ubuntu 上的体验良好,并且目前正在对其他主要发行版进行类似的努力。

    Ubuntu 和 Debian 结合起来(apt-get 联盟!)占本次普查中反映的所有生产集群,除了两个。

  • 答案#
    Ubuntu43
    Debian15
    CentOS7
    RHEL3
    其他12

Stacks

  • 这有点令人惊讶!实际上,是 两个 惊喜。

    首先,OpenStack 是最主要的云堆栈。与 Apache CloudStack、ProxMox 和其他技术的集成正在产生兴趣——我预计在下一次普查中会看到更均匀的分布。

    第二个惊喜是大多数受访者根本不使用云堆栈……即使第一和第三用例是云部署!

    “其他”类别中的主要回复是 Ganeti 和 VMWare vCloud。

  • 答案#
    35
    OpenStack17
    ProxMox6
    OpenNebula5
    CloudStack4
    其他11

好了!这就是我们首次 Ceph 普查的结论。我认为它非常有价值,并且感谢所有参与者的参与!可以在此处下载 CSV 格式的完整结果 此处

我们希望定期重复此普查,并将继续发布结果。下次再见!

祝好,

Ross