如何为企业选择最合适的企业数据存储解决方案?
by Canonical on 23 October 2024
围绕 IT 基础架构所做的选择对业务成本和性能都有很大的影响,其中涉及到运营、财务、数据分析和市场营销等多个领域。鉴于数据在所有这些领域中的重要性,甚至是在整个企业中的重要性,在选择新的存储系统时做出正确的决定至关重要。本篇文章将介绍选择时的一些考虑因素,以确保您在成本效益和性能之间取得平衡。
一、性能
存储性能涉及多个维度,首先来考虑最简单的度量指标:
IOPs(Input/Output operations per Second)– 每秒输入/输出操作数,即一秒钟内可处理的操作次数。
响应时间(Response time)– IO 操作处理后安全存储到存储系统中并向请求应用程序发送确认信息所耗用的时间。
带宽(Bandwidth)– 一秒钟内可以传输的数据量的度量方式。
如果考虑每次 IO 操作的大小,情况会变得更加复杂。每次 IO 操作的大小对所用总带宽会有影响。传输 4KB 的数据比传输 1MB 数据所需的时间更少,因此会影响 IO 请求的响应时间。
我们来看两个例子:
1. 数据库
数据库通常使用较小的 IO 大小,每次操作通常只更新一个数据库表,因此所用的总带宽将会很低。但是,响应时间对于该用例而言至关重要,因为数据库接收到数据已安全写入的确认信息越快,处理下一个事务的速度就越迅速。
2. 流媒体
编辑多个 4k 视频流时,视频编辑应用程序需要访问所有这些数据,因此相较于每次 IO 操作请求的响应时间,更加重要的是利用存储系统的所有可用带宽,尽可能快地传输整个视频文件。
二、可扩展性
所有企业组织在其存续期间的某个时刻都会面临数据增长的情况。全球每天产生数 EB 的新数据,虽然很少有企业组织必须要处理如此规模的数据,但他们的存储系统也应该是可扩展的,避免现有的工作负载出现中断。
在某些系统中,通过不断地添加磁盘机架(纵向扩展)可以实现,这样虽然可以扩增容量,但并不会提升系统控制器的性能。在更加新式的横向扩展存储系统中,扩增容量的同时也能提升计算能力,因此同时实现更大容量与更好性能。
三、可靠性
存储系统的主要目的是安全存储数据。如果应用程序不能一致地检索数据,存储系统则几乎无用。为了保护数据,新式存储系统采用镜像、奇偶校验或纠删码等技术来确保磁盘或 SSD 的丢失不会导致数据丢失。存储系统还具有多个控制器和多个客户端连接,以此确保在任何这些组件出现故障时都具有高可用性。横向扩展存储系统具有更高的可靠性,因为组成集群的软件组件分布于多个节点,这使得集群能够经受多次硬件故障。
四、灵活性
存储系统必须能够容纳许多不同的工作负载,且每个工作负载都有各自的要求。有些可能要求高性能,有些可能要求存档,但无论什么要求,在这些不同类别的存储池之间进行迁移数据的功能都很重要,因为这样可以为其他应用程序释放宝贵的快速存储空间。
容量扩增和消耗方面,能够以牺牲一定性能的方式从小型存储系统扩展到大型存储系统非常重要。迁移数据一直都充满挑战,并且可能导致应用程序运行中断,只是迁移到更大容量的存储系统应该成为“过去式”!
当企业组织不再需要用到存储系统的全部可用容量时,能够缩小集群规模也很重要。这就是横向扩展系统比专有纵向扩展系统更具优势的地方,因为它们是基于通用硬件构建而成,这些硬件可以根据需要重复用于其他应用程序。
五、功能集
在比较多个解决方案时,聚焦于对您来说重要的功能是很重要的。您需要使用哪些协议(块、文件或对象),系统是否支持所有这些协议?您是否需要快照、克隆等本地复制功能?如果需要,系统可以创建和管理多少此类复制数据?您是否会需要远程复制,或者静态数据加密或对象版本控制等合规性功能?
与企业组织中的应用程序所有者进行合作,有助于明确真正重要的功能,而不是根据供应商有时共享的“英雄存储数字”或极限值来选择解决方案。
六、成本效益
在以上各个领域中,做出的决策有可能导致存储系统成本增加,因此用例的需求与系统的功能相匹配显得至关重要。例如,我们可以构建一个全部采用闪存盘的存储系统,但是对于不经常访问的存档类存储来说,有必要这样做吗?同样地,在考虑可用功能时,您是否需要远程复制,该功能是否需要额外的许可费用?
实事求是地说,了解您不需要的东西和了解您确实需要的东西一样重要!
七、企业存储的开源选择
要想在性能、可扩展性、灵活性和成本等所有需求方面取得平衡,可能需要做出妥协,并深入了解自己想要在这些方面取得的效果。
专有存储阵列通常需要为支持服务和未来升级预先支付大量费用,并且在某些情况下,升级困难且耗时,特别是必须从较小系统迁出以便进一步扩展的情况下。 公共云解决方案初期既便宜又灵活,但在您存储了大量数据之后,它就不再是最经济有效的方法了(如果您有兴趣了解更多详情,请点击此处阅读我们该主题的相关白皮书!)。
Ceph 等开源存储系统已可用于企业部署,并且可以为本文中描述的所有需求提供具有经济效益的解决方案。Canonical Ceph 是一个适用于所有规模和所有工作负载的存储解决方案,从边缘到大规模企业级部署,以及所有协议(块、文件和对象)均可适用。
具有不同性能、容量和协议需求的各种用例都可以通过单个横向扩展集群进行管理。Ceph 能够利用商用硬件横向扩展,这意味着扩展为增量模式,并且可以根据性能或容量需求进行调整。

了解更多

下载我们的白皮书 – 面向企业的软件定义存储,了解以下信息:
- 企业在扩展存储系统时面临的预算挑战
- 开源式软件定义存储如何为基于遗留设备的存储系统提供可行的替代方案
- 如何使用 Ceph 来确保:
- 可靠性
- 可扩展性
- 灵活性
- 如何在扩展规模的同时保持成本效益
- 如何通过整合到单个多协议存储集群中的方式来减少数据孤岛
- 如何通过本地和远程数据复制为灾难情况做准备
- 托管服务如何在降低成本的同时提供“体验即服务”
更多资源
订阅博客文章
查看更多内容
Canonical 发布 Ubuntu 26.04 LTS Resolute Raccoon
Ubuntu 为企业工作负载提供深度芯片优化与前沿安全防护(第 11 个长期支持版本)。 2026 年 4 月 23 日,Canonical 正式发布代号为 “Resolute Raccoon” 的 Ubuntu 26.04 LTS,用户可通过 Ubuntu 下载页面进行下载并安装。 Resolute Raccoon 在过渡版本推出的高稳定性优化基础上进一步升级,支持 TPM 硬件全盘加密、优化应用权限弹窗提示功能、为基于 Arm® 架构的服务器提供 Livepatch 实时补丁更新,并采用基于 Rust 语言的工具以提升内存安全性。该版本原生支持 NVIDIA CUDA、AMD ROCm 等行业领先的 AI/ML 工具包,使 Ubuntu 26.04 LTS 成为 AI […]
快速推进 Renesas RZ 平台上的工业与 AI 部署
已认证的 Ubuntu 24.04 LTS 镜像现已可用 Canonical 欣然宣布,面向 Renesas RZ/G2L 和 RZ/G2LC 64 位微处理器(MPU)平台的已认证 Ubuntu 24.04 LTS 及 Ubuntu Core 24 镜像现已正式发布通用(GA)版本。借助可直接用于生产环境的 Ubuntu 版本,用户可获得企业级安全保障、长期技术支持,并充分启用 Renesas RZ/G 系列丰富的多媒体功能。 除面向 RZ/G2L 和 RZ/G2LC 的 GA 发布外,Canonical 同时推出适用于 Renesas RZ/V2L 平台的 Ubuntu 镜像,并提供 AI Snap 教程,用于在 Ubuntu 上部署 Renesas AI 应用。该镜 […]
SQL Server 2025 已在 Ubuntu 24.04 LTS 上正式发布
Microsoft 已宣布 SQL Server 2025 在 Ubuntu 24.04 LTS 上正式发布通用(GA)版本,首发版本为 CU1。这一里程碑意味着企业可在我们最新的长期支持版系统上部署关键业务工作负载,受益于可预期的稳定性与最新内核。 更新你的软件源 如果您一直在测试预览版,必须切换软件源配置,以确保使用正式生产版本。要切换软件源配置,请将您的源从 mssql-server-preview.repo 更新为 mssql-server-2025.repo。继续使用预览版软件源可能会导致安装不适用于生产环境工作负载的预发布版本。 Linux 增强功能 SQL Server 2025 CU1 针对在 Linux 基础设施上管理数据库推出了特定改进。 新增的动态管 […]