帮助中心
云计算时代:什么是数据回流?



在公共云中保存和使用数据的高昂成本正日益成为公司的一个难题。企业正在寻找更具成本效益的替代方案,这就是为什么我们看到越来越多的数据回流案例(将目前在公共云中的数据提取出来,在数据中心或裸机上重新托管的行为)。

这篇文章介绍了数据回流以及离开公有云而选择内部裸机存储的影响(包括正面和负面)。请继续阅读,了解数据回流背后的主要驱动因素,并看看撤回基于云的数据对你的底线来说是否是一个合理的举措。

什么是数据回流?


数据回流是将数据从公共云转移到自我管理的存储(如数据中心专用服务器或私有云)的过程。根据一个公司决定重新托管的数据的多少,回流是这样的:

  • 全部(当一个组织提取所有数据并切断与公共云的联系)
  • 部分(当一个公司决定从云中提取部分但不是全部数据时,这通常发生在一个团队试图提高性能或降低云成本时)

随着企业意识到将大量数据保存在公共云中的高昂成本,数据回流变得越来越普遍。当你有大量的存储需求时(例如,如果你有几个PB的非结构化数据,你经常访问),基于云的存储并不像更传统的解决方案那样经济。

平均而言,基于云的选项的使用成本是现场数据托管的两倍。即使我们考虑到现场存储所需的开销,这一统计仍然是真实的,这包括以下价格:

  • 管理硬件的工作人员
  • 数据中心空间
  • 电力
  • 物理安全

价格的巨大差异背后的主要原因是出口成本。供应商不向你收取上传数据的费用,但你要为容量和数据传输付费。将数据发送到供应商的基础设施之外的传输是昂贵的,往往构成了云计算每月账单的最大部分。

成本并不是公司选择遣返数据的唯一原因。其他常见的原因包括。

  • 合规规则的新更新
  • 网络延迟的问题
  • 对云计算安全性的担忧
  • 希望实现更高水平的数据冗余
  • 由于供应商方面的错误而导致的频繁的停机时间
  • 影子IT的问题(未经授权使用公共云资源)
  • 决定追求一个不同的云计算部署模式


数据回流的优势


像大多数IT决策一样,选择数据回流既有优点也有缺点。让我们仔细看看撤回公共云数据的最突出的好处。

降低成本和更好的投资回报率


成本是主要优势,也是数据回流的主要原因。虽然一个内部数据中心的建立是昂贵的,但公共云的成本随着时间的推移开始增加,因为你每月都要支付:

  • 存储卷
  • 服务器实例
  • 每次使用的服务
  • 数据传输成本(数据流量)
  • "隐性成本"(最近的研究显示,企业每年在公共云资源上花费超过620亿美元,他们既不需要也不使用。)

迟早有一天,你的云计算总支出会达到数据中心托管设备的价格。然而,到那时,你已经把这些资金花在了云计算的运营费用上,尽管有投资,但你将不拥有任何硬件。从这个角度看,数据中心托管的投资回报率要高得多。

请记住,基于云计算的存储费用也是不稳定的,很难预测。预计的费用很快就会超过预算以来:

  • 供应商改变定价
  • 你的IT需求随着时间而改变
  • 团队往往低估了在云端操作的成本
  • 复杂的IT环境往往会受到影子IT的影响

在现场存储系统中,成本不会因为你对数据的处理而改变。如果你的IT需求增长,你将需要投资更多的硬件,但你永远不会像基于云的存储那样,在账单上 "过火"。

对你的数据安全自己控制


在公共云中托管数据意味着供应商负责存储和保护信息的安全。这种安排对一些人来说是天赐良机,但对那些希望在数据安全方面有更多亲力亲为的公司来说,这可能是一种破坏性的安排

当你把数据保存在公共云中时,也有几个独特的问题:

  • 数以百计的租户(甚至更多)共享公共云基础设施,这就引入了内部托管所不存在的风险因素。
  • 对于哪些控制措施能保证基于云的数据安全,缺乏可见性。
  • 客户的团队负责使用供应商提供的措施,所以有足够的空间进行错误配置(最常见的错误发生在云安全政策中)。
  • 供应商拥有你存储在公共云中的文件的权利(除非你签署的SLA另有规定)。
  • 公共云使最终用户能够从任何地方访问数据,所以总是有可能与错误的人分享数据。

虽然供应商的故障很少,但公共云用户必须知道它们是一种可能性。2018年8月,AWS的一个错误暴露了属于GD的约31000个系统的关键业务数据。如果该公司在数据中心保留数据,这一事件就不会发生。

遣返数据可以实现公共云无法提供的接近和物理控制数据的水平。你还可以通过减少你的数据可能出错的事件数量来限制攻击面。想想看,这就像把钱放在家里的保险箱里和放在银行的保险箱里一样--银行当然是安全的,但你对他们如何保护保险箱没有发言权,而且他们是抢劫的主要目标。从这个角度看,你的钱放在家里更安全,这是一个强有力的理由。


没有依赖供应商的风险


当一个公司过于依赖一个云供应商时,就会出现供应商依赖。如果你在一个供应商处存储数据的时间过长,并围绕该存储建立一个应用架构,锁定自然会随着时间的推移而增长。然后你就无法在没有高额转换成本的情况下转换到另一个平台(无论是内部的还是属于另一个供应商的)。

数据返还确保你的存储永远不会比你的内部团队更依赖任何供应商。你的员工管理着数据集,没有 "卡 "在任何第三方的风险:

  • 数据返还的解释
  • 更好的延时

虽然公共云提供几乎无限的存储容量,但你访问和使用基于云的数据的能力取决于互联网连接。如果你在内部进行处理,而与公共云数据的连接速度很慢,那么操作就会出现滞后。

滞后对于某些用例(如备份和恢复或电子邮件操作)可能不是问题,但对于某些工作负载是不利的,比如:

  • 实时分析
  • 网络安全应用
  • 传感器
  • 物联网应用

如果你有一个严重依赖数据集的延迟敏感的应用程序,现场托管信息(或使用边缘服务器)比使用公共云提供更少的滞后。你缩短了通信路径,而且内部团队有机会对存储、计算和网络资源进行微调,以适应该应用程序。

更容易遵守数据法规


公共云供应商(尤其是超大规模的供应商)努力工作,以满足政府和行业的要求,如HIPAA和PCI。然而,在公共云中满足法规有一个主要问题:数据位置。如果你的企业属于要求数据托管在特定地区的法规,使用公共云可能会使你陷入法律(和财务)的麻烦。

与其在特定地区建立云服务器并依靠第三方不移动信息,一些企业更愿意完全控制并将数据迁移到内部系统。


数据回流的弊端


以下是选择数据回流的最明显的挑战和缺点。

  • 无论你决定建立什么系统(私有云、专用服务器、主机托管设备等),你都必须为数据中心托管数据所需的硬件留出预算。
  • 你必须雇用一个内部团队来配置和管理新的IT环境。
  • 你的团队完全负责设置保护,并保持现场数据的安全,防止潜在的漏洞、泄漏、网络攻击和对数据完整性的威胁。
  • 这取决于你的员工,以确保数据的充分可用性。
  • 当出现问题时,要由你的团队来解决这个问题。在停机的情况下,没有供应商可以求助,所以在你决定从公共云中提取任何东西之前,确保你的团队知道如何管理现场数据库。
  • 数据遣返有时会破坏团队的化学反应和文化。一些员工可能会觉得公司在退步,再加上你不得不给他们的工作日增加一些新任务。
  • 有时,将数据拉回现场会导致速度或性能的损失。在这种情况下,你必须重新优化所有使用该数据集的服务和工作负载,这个过程往往至少要持续几天时间。
  • 一旦你离开公有云,你就不再有机会获得无尽的按需资源,所以要告别快速配置和即时扩展。如果你需要更多的存储,你必须预留资源并购买新的硬件。
  • 无法评估一个工作负载、应用程序或数据集是属于云还是现场?我们关于内部托管与云托管的文章有助于为你的软件挑选一个最佳环境。


如何回流数据?


监测云资源的使用情况,并定期将这些成本与其他存储方法进行比较。如果很明显,另一种存储方式为你的使用情况提供了更高的投资回报率,那就是数据回流的时候了。这个过程是这样的:

  • 首先,确定你要遣返的数据,并概述变化的目标。你是要全部遣返,还是部分遣返更有意义?
  • 考虑任何可能减缓或阻止从云端迁移的供应商锁定、架构或终端用户问题。
  • 将计划分成几个阶段,并设定关键绩效指标,使你能够监测进展。
  • 决定你的数据的最佳托管环境是什么。你是想把数据带回现场机房,还是租一台专用服务器更合适?或者是混合云的方式?
  • 确定你的团队的技能水平。根据员工的经验程度,一些托管选项将比其他选项更有吸引力。
  • 对项目进行详细的成本效益分析,以评估每个可行方案的财务影响。
  • 计划一下团队如何在数据有了新家后更新应用架构。是否有提高性能或减少滞后的空间?
  • 开始从公共云中转移数据。请记住,移动需要时间,如果你没有备份存储,依赖有关数据的应用程序将在这个过程中停机。冷档案通常比频繁访问的存储库更容易移动,所以要制定一个对用户体验影响最小的计划。
  • 进行广泛的测试,看看与数据集相关的所有应用程序和服务是否表现得很好。


何时遣返数据?


当你发现从公有云迁移到其他地方将有利于以下一个(或多个)业务领域时,你应该遣返数据。

  • 你的底线
  • 安全水平
  • 服务性能

以下是一些常见的情况,在这些情况下,数据回流是正确的商业行动:

  • 云存储的费用越来越难以控制。一旦公共云的费用开始超过预期,就开始考虑其他的存储选项(或者如果你正在为你不使用的资源付费)。
  • 转移到一个更适合的托管环境。数据回流往往意味着企业已经找到了更适合其使用情况的存储方案。企业旨在解决的最常见的问题是滞后和可用性问题。
  • 新的合规规则。法规的更新迫使更严格的行业的公司将数据从公共云中遣返。
  • 使用云已经走到了尽头。在每个项目的初始阶段,公共云的影响最大。一旦你的团队开始分析资源使用趋势,就开始定期进行成本效益分析,看看是否有必要进行数据遣返。
  • 仓促地采用云计算。糟糕的初始规划、举一反三的策略以及缺乏全面的云迁移计划是将公共云数据拉回现场的常见原因。请记住,减少损失总比全身心投入到错误的存储解决方案中要好。
  • 云供应商倒闭。如果供应商倒闭,客户别无选择,只能将他们的数据撤回。虽然这些情况很少,但公司必须有一个灾难恢复计划,以防供应商倒闭。
  • 数据回流只是云计算世界中的一个上升趋势。在我们关于云计算趋势的文章中了解其他情况。


不要惧怕数据回流,始终追求最佳的存储解决方案


数据回流是为了追求新的IT机会,优化支出,并提高应用程序的性能。这三个因素在你对公共云的承诺之前,所以确保你的团队总是考虑在云中运行的每个数据库、工作负载和服务的托管替代方案。

文章相关标签: 数据回流
购物车