开发者提问,用户回答:您的 Ceph 集群的使用场景是什么?

Laura Flores 和 Zac Dover

简介

2022 年 10 月,Ceph 项目进行了一项用户调查,以了解人们如何在实际环境中使用的 Ceph 集群。我们询问了 Ceph 用户社区、Ceph 开发者和存储主题专家,“您的集群的使用场景是什么?”

随着 Ceph 的功能和用户群不断增长,本次调查的目标是将更新后的使用场景与社区分享。我们还希望让初学者(例如来自 Google 夏季代码项目OutreachyGrace Hopper 女性计算庆祝大会 的学生)了解 Ceph 的所有使用方式。

如果您想了解 Ceph 的用途,或者只是想知道其他人如何使用 Ceph,那么这篇博文就是为您准备的。

调查分解

我们收到了来自用户/开发者/SME-storage 社区总共六十八份回复。

问题 1 是“以下哪一项最能描述您?”

  • 61 人 (89.7%) 将自己定义为 Ceph 用户
  • 1 人 (1.5%) 将自己定义为 Ceph 开发者
  • 6 人 (8.8%) 指定 其他,他们可以在其中输入更具体的回复
    • 2 人 (2.9%) 将自己定义为 Ceph 管理员
    • 1 人 (1.5%) 将自己定义为 Ceph 专家
    • 1 人 (1.5%) 详细说明他们是 集成工程师,负责开发/维护 OpenStack 和 Kubernetes 中 CephFS 的驱动程序接口
    • 1 人 (1.5%) 将自己定义为 开源贡献者
    • 1 人 (1.5%) 将自己定义为 大型 Ceph 用户 + 小型 Ceph 开发者

A pie-chart breakdown of survey participant descriptions. The breakdown is as described above.

图 1:调查参与者描述的饼图分解


问题 2 是“您是否有使用 Ceph 集群的经验?”

  • 68 人 (100%) 回答
  • 0 人 (0%) 回答

A pie-chart breakdown of the survey participants' cluster experience. The breakdown is as described above.

图 2:调查参与者集群经验的饼图分解


问题 3 是“您是否愿意分享您的集群的使用场景,以便我们可能将其包含在 Ceph 网站或文档中?”

  • 58 人 (85.3%) 回答
  • 10 人 (14.7%) 回答 ,此时他们会提前退出调查

A pie-chart breakdown of the survey participants' willingness to share their cluster use case publicly. The breakdown is as described above.

图 3:调查参与者愿意公开分享其集群使用场景的饼图分解


使用场景

在总共六十八份回复中,五十八人自愿分享其集群的使用场景。我们对收到的各种回复感到高兴。

A word cloud highlighting the most frequent key words from the user responses. Top 6 key words are "storage", "ceph", "cephfs", "rbd", "openstack", and "data".

上图是词云,突出了用户回复中最常见的关键词。


有几人报告将 Ceph 用于研究目的。

  • 一位匿名 Ceph 用户报告说,他们使用 CephFS 作为 IRI 数据库 的后端,用于存储约 700TB 的气候、地球物理、健康和农业数据,格式多种多样。他们选择 Ceph 来处理服务器每月经历的数百万次数据下载。
  • Andrew Ferris 写道,Ceph 在他的研究机构被用作大规模存储解决方案。正如 Andrew 所说,“Ceph 能够在更便宜的通用硬件上运行以及可扩展性对我们来说非常重要。”
  • Lance Joseph 报告说,Ceph 用于为研究人员和科学家提供大规模(+10 PB)湍流和海洋数据集。这些数据由 CephFS 和 S3 对象存储支持。
  • Mike Lowe 提到将 Ceph 作为国家科学基金会研究人员的后端存储。

其他人报告在测试和开发环境中使用了 Ceph。

  • 一位匿名 Ceph 用户使用 S3 API 对应用程序和微服务进行本地测试。
  • Kamil Madac 报告说,Ceph 作为一家拥有 100 名员工的公司的 OpenStack 私有云存储。该私有云用于内部生产虚拟机以及为开发的应用的开发/测试环境。
  • Kamoltat Sirivadhna,一位 Ceph 开发者,使用 Ceph 来开发 Ceph 项目的功能。
  • Goutham Pacha Ravi,一位负责开发和维护 OpenStack 和 Kubernetes 中 CephFS 驱动程序接口的集成工程师,使用 Ceph 进行早期集成测试。
  • 开源开发者 Ngwa Secrick Meh 使用 Ceph 集群来开发 Ceph Dashboard 组件的功能。

Ceph 用户有时会同时使用多个接口。

Enrico Bocchi 来自 CERN 报告了一种这样的场景。

CERN 使用 Ceph 进行块、对象和文件系统存储。主要使用场景是

  • RBD 用于 OpenStack 虚拟机(可引导卷、存储卷、glance 镜像)
  • RBD 用于其他存储服务(例如,连接到 RADOS 块设备的虚拟机,以提供 AFS 和 NFS,用作其他服务的后端存储)
  • CephFS 用于为 Kubernetes / OKD pod 提供持久卷(通过 Openstack Manila 集成)
  • CephFS 作为传统网络 POSIX 文件系统的替代品(例如,NFS)
  • CephFS 用于高性能计算 (HPC) 资源(一个超融合集群,该集群在同一服务器上具有存储和计算资源)
  • 对象存储用于容器注册表、GitLab 工件、监控(prometheus、cortex)
  • 对象存储用于全球软件分发通过 CVMFS (https://cernvm.cern.ch/fs/)
  • 对象存储作为备份目标(S3 到 S3,使用 rclone,文件系统到 S3,使用 restic)

不少用户在回复中强调了 Ceph 的成本效益可用性安全性弹性

  • Eneko Lacunza/Binovo 报告说,他们主要使用 Ceph 来实现具有成本效益的 HCI 集群。
  • 一位匿名 Ceph 用户,他们使用 Ceph 来存储 HCP 数据集和作业输出,报告说 Ceph 为他们提供了高吞吐量存储和可靠性,以应对繁重的 HPC I/O,以及在发生意外数据中心丢失时的可用性。
  • Andreas Haase 喜欢 Ceph 块存储的高可用性,并将其用于 VMWare 环境。
  • 另一位匿名 Ceph 用户写道,他们为需要高度数据保护以防范人为和自然灾害的客户提供 S3 存储。
  • 一位匿名 Ceph 用户报告说,他们能够在经济实惠的硬件上将 Ceph 作为弹性块、对象和文件系统存储运行在其 homelab 中。

正如一些用户所揭示的,关于 Ceph 的一个区别在于,它既有公共用例,也有私有用例。

  • Selectel 的 Ceph 工程师 Konstantin Shalygin 报告说,他的公司使用 Ceph 来提供云服务器和云存储服务。这些服务既可供公众使用,也可在公司内部私下使用。
  • Foysal Kayum 使用 RBD 池来提供公共云服务。
  • 一位匿名 Ceph 用户写道,他们使用 Ceph 来支持私有和混合云基础设施测试。
  • 一位将自己描述为“大型 Ceph 用户 + 小型 Ceph 开发者”的匿名参与者写道,他们使用 Ceph 作为公共云,具有基于 RBD 和 RGW 的产品。

在本节的结尾,我将介绍一些“意外”用例,这些用例证明 Ceph 几乎可以在任何情况下使用!

  • 一位匿名 Ceph 用户报告说,他们使用 CephFS 文件系统为一家非营利组织存储大型视频文件。他们强调,他们的系统需要具有弹性,能够应对硬件故障,因为并非总是有人手头可以进行技术支持。
  • 微软的 Alex Kernshaw 使用 Ceph 作为地理冗余语音邮件服务器的数据存储。CephFS、S3 与多站点以及 Pubsub 是支持其用例的组件。
  • 另一位匿名 Ceph 用户报告说,他们使用 Ceph 作为其 homelab 的存储层,其中 CepFS 作为远程文件系统。
  • Eugen Block 报告说,他们使用 CephFS 作为公司的工作和主目录,并使用 RBD 用于 OpenStack 和 S3 备份用于 Kubernetes。

结论

我们感谢社区中的所有参与者。感谢您选择 Ceph!如有关于调查的问题,请发送至 lflores@redhat.com