开发者提问,用户回答:您的 Ceph 集群的使用场景是什么?
Laura Flores 和 Zac Dover
简介 ¶
2022 年 10 月,Ceph 项目进行了一项用户调查,以了解人们如何在实际环境中使用的 Ceph 集群。我们询问了 Ceph 用户社区、Ceph 开发者和存储主题专家,“您的集群的使用场景是什么?”
随着 Ceph 的功能和用户群不断增长,本次调查的目标是将更新后的使用场景与社区分享。我们还希望让初学者(例如来自 Google 夏季代码项目、Outreachy 或 Grace Hopper 女性计算庆祝大会 的学生)了解 Ceph 的所有使用方式。
如果您想了解 Ceph 的用途,或者只是想知道其他人如何使用 Ceph,那么这篇博文就是为您准备的。
调查分解 ¶
我们收到了来自用户/开发者/SME-storage 社区总共六十八份回复。
问题 1 是“以下哪一项最能描述您?” ¶
- 61 人 (89.7%) 将自己定义为 Ceph 用户
- 1 人 (1.5%) 将自己定义为 Ceph 开发者
- 6 人 (8.8%) 指定 其他,他们可以在其中输入更具体的回复
- 2 人 (2.9%) 将自己定义为 Ceph 管理员
- 1 人 (1.5%) 将自己定义为 Ceph 专家
- 1 人 (1.5%) 详细说明他们是 集成工程师,负责开发/维护 OpenStack 和 Kubernetes 中 CephFS 的驱动程序接口
- 1 人 (1.5%) 将自己定义为 开源贡献者
- 1 人 (1.5%) 将自己定义为 大型 Ceph 用户 + 小型 Ceph 开发者

问题 2 是“您是否有使用 Ceph 集群的经验?” ¶
- 68 人 (100%) 回答 是
- 0 人 (0%) 回答 否

问题 3 是“您是否愿意分享您的集群的使用场景,以便我们可能将其包含在 Ceph 网站或文档中?” ¶
- 58 人 (85.3%) 回答 是
- 10 人 (14.7%) 回答 否,此时他们会提前退出调查

使用场景 ¶
在总共六十八份回复中,五十八人自愿分享其集群的使用场景。我们对收到的各种回复感到高兴。

有几人报告将 Ceph 用于研究目的。 ¶
- 一位匿名 Ceph 用户报告说,他们使用 CephFS 作为 IRI 数据库 的后端,用于存储约 700TB 的气候、地球物理、健康和农业数据,格式多种多样。他们选择 Ceph 来处理服务器每月经历的数百万次数据下载。
- Andrew Ferris 写道,Ceph 在他的研究机构被用作大规模存储解决方案。正如 Andrew 所说,“Ceph 能够在更便宜的通用硬件上运行以及可扩展性对我们来说非常重要。”
- Lance Joseph 报告说,Ceph 用于为研究人员和科学家提供大规模(+10 PB)湍流和海洋数据集。这些数据由 CephFS 和 S3 对象存储支持。
- Mike Lowe 提到将 Ceph 作为国家科学基金会研究人员的后端存储。
其他人报告在测试和开发环境中使用了 Ceph。 ¶
- 一位匿名 Ceph 用户使用 S3 API 对应用程序和微服务进行本地测试。
- Kamil Madac 报告说,Ceph 作为一家拥有 100 名员工的公司的 OpenStack 私有云存储。该私有云用于内部生产虚拟机以及为开发的应用的开发/测试环境。
- Kamoltat Sirivadhna,一位 Ceph 开发者,使用 Ceph 来开发 Ceph 项目的功能。
- Goutham Pacha Ravi,一位负责开发和维护 OpenStack 和 Kubernetes 中 CephFS 驱动程序接口的集成工程师,使用 Ceph 进行早期集成测试。
- 开源开发者 Ngwa Secrick Meh 使用 Ceph 集群来开发 Ceph Dashboard 组件的功能。
Ceph 用户有时会同时使用多个接口。 ¶
Enrico Bocchi 来自 CERN 报告了一种这样的场景。
CERN 使用 Ceph 进行块、对象和文件系统存储。主要使用场景是
- RBD 用于 OpenStack 虚拟机(可引导卷、存储卷、glance 镜像)
- RBD 用于其他存储服务(例如,连接到 RADOS 块设备的虚拟机,以提供 AFS 和 NFS,用作其他服务的后端存储)
- CephFS 用于为 Kubernetes / OKD pod 提供持久卷(通过 Openstack Manila 集成)
- CephFS 作为传统网络 POSIX 文件系统的替代品(例如,NFS)
- CephFS 用于高性能计算 (HPC) 资源(一个超融合集群,该集群在同一服务器上具有存储和计算资源)
- 对象存储用于容器注册表、GitLab 工件、监控(prometheus、cortex)
- 对象存储用于全球软件分发通过 CVMFS (https://cernvm.cern.ch/fs/)
- 对象存储作为备份目标(S3 到 S3,使用 rclone,文件系统到 S3,使用 restic)
不少用户在回复中强调了 Ceph 的成本效益、可用性、安全性和弹性。
- Eneko Lacunza/Binovo 报告说,他们主要使用 Ceph 来实现具有成本效益的 HCI 集群。
- 一位匿名 Ceph 用户,他们使用 Ceph 来存储 HCP 数据集和作业输出,报告说 Ceph 为他们提供了高吞吐量存储和可靠性,以应对繁重的 HPC I/O,以及在发生意外数据中心丢失时的可用性。
- Andreas Haase 喜欢 Ceph 块存储的高可用性,并将其用于 VMWare 环境。
- 另一位匿名 Ceph 用户写道,他们为需要高度数据保护以防范人为和自然灾害的客户提供 S3 存储。
- 一位匿名 Ceph 用户报告说,他们能够在经济实惠的硬件上将 Ceph 作为弹性块、对象和文件系统存储运行在其 homelab 中。
正如一些用户所揭示的,关于 Ceph 的一个区别在于,它既有公共用例,也有私有用例。
- Selectel 的 Ceph 工程师 Konstantin Shalygin 报告说,他的公司使用 Ceph 来提供云服务器和云存储服务。这些服务既可供公众使用,也可在公司内部私下使用。
- Foysal Kayum 使用 RBD 池来提供公共云服务。
- 一位匿名 Ceph 用户写道,他们使用 Ceph 来支持私有和混合云基础设施测试。
- 一位将自己描述为“大型 Ceph 用户 + 小型 Ceph 开发者”的匿名参与者写道,他们使用 Ceph 作为公共云,具有基于 RBD 和 RGW 的产品。
在本节的结尾,我将介绍一些“意外”用例,这些用例证明 Ceph 几乎可以在任何情况下使用! ¶
- 一位匿名 Ceph 用户报告说,他们使用 CephFS 文件系统为一家非营利组织存储大型视频文件。他们强调,他们的系统需要具有弹性,能够应对硬件故障,因为并非总是有人手头可以进行技术支持。
- 微软的 Alex Kernshaw 使用 Ceph 作为地理冗余语音邮件服务器的数据存储。CephFS、S3 与多站点以及 Pubsub 是支持其用例的组件。
- 另一位匿名 Ceph 用户报告说,他们使用 Ceph 作为其 homelab 的存储层,其中 CepFS 作为远程文件系统。
- Eugen Block 报告说,他们使用 CephFS 作为公司的工作和主目录,并使用 RBD 用于 OpenStack 和 S3 备份用于 Kubernetes。
结论 ¶
我们感谢社区中的所有参与者。感谢您选择 Ceph!如有关于调查的问题,请发送至 lflores@redhat.com。