Ceph Days Silicon Valley 2025

将 Ceph 带到加利福尼亚州硅谷

一场为分享 Ceph 的变革力量并与加利福尼亚州硅谷的社区一起培养充满活力的 Ceph 社区而举行的全天活动!

Ceph 专家团队、Ceph 的客户和合作伙伴以及 Ceph 社区将携手讨论 Ceph 项目的状态、最近的 Ceph 项目改进和路线图以及 Ceph 社区新闻。 一天结束时将举行社交招待会,以促进更多的 Ceph 学习。

重要日期

  • 征稿开始 2025-01-13
  • 征稿结束 2025-02-21
  • 演讲者收到接受确认 2025-02-28
  • 日程安排公布 2025-03-07
  • 活动日期 2025-03-25

注册开放!


日程安排

时间摘要
演讲者
上午 8:00签到和早餐
上午 9:00欢迎
Vincent Hsu (IBM)
上午 9:10主题演讲 - Ceph 的现状

展望 Ceph 路线图、当前开发重点以及 Ceph 社区的最新动态。 幻灯片

Neha Ojha (IBM)
上午 9:30大规模 Ceph 运维

在本次演讲中,我们将介绍 DigitalOcean 使用 Ceph 作为 Block 和 Object 工作负载的主要存储后端的过程,以及我们如何自动化、监控、告警和日常运维 Ceph。 幻灯片

Alex Marangone (DigitalOcean)
上午 10:00MSR(多步重试):一种允许每个故障域使用多个 OSD 的 CRUSH 泛化

在某些用例中,人们可能希望例如将 8+6 纠删编码池分布到任何主机(或机架)不超过 4 个分片。现有的 CRUSH 规则难以处理,因为 CHOOSELEAF 是允许将 OSD 映射到另一个故障域的唯一方法,但 CHOOSELEAF 不允许将多个 OSD 放置在每个故障域。MSR 规则将 CRUSH 算法泛化,以便在仍然尊重放置限制的同时重试完整的选择序列。本次演讲将介绍该算法、实现和用例。 幻灯片

Samuel Just (IBM)
上午 10:30茶歇/咖啡休息
上午 11:00沃尔玛 9 年 Ceph 历程

本次演讲涵盖了 Ceph 在沃尔玛的早期发展,旨在为我们的本地云提供可靠、灵活、面向未来的存储,以及它如何发展以支持沃尔玛的三重云模型,我们发现的大规模运维 Ceph 时遇到的挑战,以及支持各种用例(从延迟敏感数据库、电子商务应用程序、备份等)的情况。 幻灯片

Pavan Rallabhandi (Walmart)
上午 11:30支持 3 个可用区 Stretch 集群

跨 3 个区域的 Ceph 集群面临数据丢失的潜在场景,这是由于不可预见的情况造成的。例如,如果我们有 6 个副本分布在 3 个数据中心,最小大小为 3,并且设置旨在防止仅在 1 个数据中心可用时发生 I/O,但是,存在一个边缘情况,由于在确保数据可用性时临时 PG 映射过程中的保护不足,PG 变得可用。这种场景存在风险,当唯一幸存的数据中心接受写入时,然后 2 个不可用的数据中心恢复。与此同时,幸存的数据中心突然关闭,这意味着我们将面临数据丢失的情况。为了防止这种情况发生,我们创建了一个解决方案,该解决方案利用了 Stretch 模式中的现有功能,该功能将限制我们选择进入 PG 的 acting set 的 OSD 的方式。本次演讲将深入探讨此功能如何在最新的 Ceph 上游中实现,以及其他改进 Stretch 集群用户体验的最新 Ceph 上游发布功能。 幻灯片

Kamoltat (Junior) Sirivadhna (IBM)
中午 12:00零信任数据湖仓

本次演讲探讨了 Ceph 与 Apache Polaris 的集成,Apache Polaris 是一种用于 Apache Iceberg 的高级技术目录。Polaris 引入了凭证分发,其中它为引擎生成会话令牌,这些令牌用于对象存储,其范围根据目录命名空间和表策略限定。这样,表和命名空间级别的访问控制在存储级别强制执行,而不是要求引擎本身成为受信任的策略执行点。我们将演示集成,并详细解释此功能与 Ceph 的 IAM 和 STS 功能协同工作的方式。 幻灯片

Kyle Bader (IBM)
中午 12:30午餐
下午 1:30NVMe 的有力论据

如何通过拥抱 NVMe 为未来做好准备,以及何时将旋转磁盘留在过去。 幻灯片

Jason Burris (Sony)
下午 2:00大规模 Cephadm:为什么是时候重新考虑容器化 Ceph 部署了

让我们面对现实吧:Cephadm 还没有赢得所有人的青睐。许多长期 Ceph 用户仍然更喜欢基于软件包的部署,并使用自定义自动化,认为容器会增加不必要的复杂性并降低控制力。

在本次演讲中,我们将深入研究 Cephadm:它的存在原因、它解决了哪些问题(以及制造了哪些问题),以及它与以前的部署工具(如 Ceph-deploy、Ceph-Ansible、DeepSea 和 Rook)相比如何。我们将着眼于 Cephadm 的反对者的主要担忧,从容器开销到故障排除,并讨论这些担忧今天是否仍然有效。

最重要的是,我们将着眼于实际结果,从 Pawsey 100 节点、4000-OSD 规模测试开始,该测试证明 Cephadm 并非仅适用于玩具集群。我们还将介绍最新的可用性改进以及 Cephadm 的下一步发展方向。

幻灯片
Ernesto Puerta (IBM)
下午 2:30CephFS 基础知识和最新动态

我们从 CephFS 架构和现代组件的简要介绍开始,重点是较新的组件,例如 ceph-mgr 在使用 CephFS 文件系统中的作用。然后我们转向新功能:mgr/volume 已发展成为一个完整的解决方案,用于可扩展地处理内部和公共云文件系统,并获得了新的功能,例如服务器端静默,它能够实现多客户端、多卷的一致快照。文件系统协议与 samba 和 NFS-Ganesha 的集成得到了显著改进。了解这些以及其他新功能!如果有剩余时间,我们将预览 CephFS 在未来发展的路线图。 幻灯片

Greg Farnum (IBM)
下午 3:00小吃休息
下午 3:30Ceph 遥测 - 为什么、是什么以及如何

无论您是 Ceph 用户还是开发人员,您可能都想知道:有多少 Ceph 集群?他们运行的是什么 Ceph 版本?它们的存储容量分布如何?Ceph 的遥测模块提供了这些问题的答案。在本届会议中,我们将深入研究该模块,并探讨它为用户和开发人员带来的价值。 幻灯片

Yaarit Hatuka (IBM)
下午 4:00优化大规模 Ceph:来自大规模运维和性能调优的经验

Ceph 是一种功能强大、可扩展的存储解决方案,但在大规模运维它时会面临独特的挑战。在本次演讲中,我将分享多年管理和支持一些最大 Ceph 部署的经验。我们将探讨维护稳定性、确保高可用性和优化对苛刻工作负载的性能的最佳实践。关键主题将包括为大规模客户调优 Ceph、排除常见的性能瓶颈以及从 Ceph 部署中获得最佳性能的策略。无论您是运行不断增长的集群还是支持关键任务型工作负载,这些实用经验都将帮助您充分利用 Ceph 部署。

Dan van der Ster (CLYSO)
下午 4:30闭幕讨论和总结
所有演讲者
下午 5:00社交招待会
下午 6:00活动结束