关于数据中心基础架构管理

2024-03-06

  当前,全球范围内对基于IT的新型应用程序的需求以及整合物理资产所带来的经济效益,导致了数据中心在规模和密度方面的空前扩张。数据中心空间和电力资源方面的限制以及管理大型数据中心的巨大复杂性,则催生了一类具有集成流程的工具——数据中心基础设施管理(DCIM)的兴起。

  一旦经过了正确的部署,全面的DCIM解决方案可为数据中心运营人员们提供关于所有数据中心资产以及它们之间的连接性和关系的清晰的可视性,以支持基础设施——网络、铜缆和光缆、供电链和冷却系统。DCIM工具使数据中心运营经理能够识别,定位,可视化和管理所有物理数据中心资产,简单地提供新设备并自信地规划未来增长和/或整合的能力。这些工具还可以帮助控制能源成本,并提高运营效率。市调研机构Gartner公司表示:DCIM工具正在快速的会成为数据中心的主流,其渗透率已经从2010年的1%增长到2014年的60%。

  本文中,我们将与广大读者朋友们讨论一些重要的数据中心基础设施管理方面的问题。我们还将分析DCIM产品如何为数据中心经理们提供他们所需的洞察力,信息和工具,以简化运营,实现数据中心资产管理自动化,优化所有资源 的使用——包括系统、空间和功耗,冷却和人员,进而降低成本,提升数据中心运营能力,以支持未来的业务需求,甚至延长数据中心的使用寿命。

 

为什么选择DCIM?

 

整合和建设更大规模的数据中心的趋势基本上是受到规模经济效益所驱动的。技术进步加快了这一趋势,如基于Web的应用程序、系统虚拟化,以更小的占地面积提供功能更强大的服务器,以及更多的低成本带宽。

  不多年以前,大多数计算机站点都还足够小,因此当地专用IT和设施人员可以通过手动流程和工具(如电子表格和Visio图表)合理管理所有大部分的内容。而现在,IT部门和设备专业人员需要更好的工具和流程来有效地管理庞大的物理资产库存和现代数据中心基础设施的复杂性的这一趋势已经变得非常明显。经验表明,一旦数据中心拥有接近50-75机架,通过电子表格和Visio进行管理将变得笨拙和无效。

  此外,现代数据中心的向外扩张和机架密度的增加已经造成了严重的空间和能源消耗问题,引起了企业以及政府监管机构的关注并纷纷采取行动。IDC报告,数据中心电力和冷却成本已经从2005年的250亿美元上升到2010年的450亿美元。此外,据数据中心行业的全方位媒体咨询商DatacenterDynamics的研究报告称:美国和欧洲市场的数据中心经理表示,他们最关心的三个问题是增加机架密度,适当的冷却和功耗。看似在一夜之间,对数据中心基础设施和资产管理工具的需求已经成为IT和设施管理中压倒一切的,受到高度重视的挑战。

  在最高级别上,企业数据中心应该通过有组织的运营,以可靠,安全和经济的方式提供优质服务,以支持企业的业务运行。然而,数据中心内三大主要部门(设施,网络和系统)之间角色和职责的自然演变本身使这一目标难以实现。过去,数据中心这方面的责任是根据与基础设施物理层有关的特定专业知识进行分配的:

  设施:物理空间,电力和冷却

  网络:光纤和铜缆、局域网、SAN和广域网

  系统:大型机、服务器、虚拟服务器和存储

  显然,一大主要挑战是将各种数据中心功能之间的责任和活动衔接起来,以最大限度地减少由于每个部门群体明确定义的特定角色而容易产生的延迟,浪费和潜在的操作混淆。

 

什么是DCIM?

 

    基本的DCIM组件和功能包括:

  一个单一的存储库:一个准确,权威的数据库,用于存放来自数据中心和所有物理资产站点的所有数据,包括数据中心的布局,以及IT、电力和HVAC设备的详细数据信息。

  资产发现和资产追踪:用于捕获资产及其细节,关系和相互依赖性的工具。

  可视化:图形可视化,跟踪和管理数据中心的所有资产及其相关的物理和逻辑属性——服务器、结构化电缆、网络、电力基础设施和冷却设备。

  配置新设备:自动化工具,支持迅速可靠地部署新系统及其所有相关的物理和逻辑资源。

  实时数据收集:与实时监控系统集成,收集实际用电量/环境数据,以优化容量管理,从而允许查看实时数据与假设的铭牌数据。

  过程驱动结构:改变管理工作流程,以确保完整而准确的添加,更改和迁移。

  容量规划:容量规划工具,通过假设分析和建模,用于确定未来占地面积和机架空间、功耗、散热扩展的需求。

  报告:简化报告以设定运营目标,衡量绩效并推动改进。

  一套整体的方法:跨越数据中心各个组织部门领域——设施,网络和系统,填补所有功能上的空白;由所有数据中心域和群组使用,不管层次结构如何,包括管理人员,系统管理员和技术人员。

  一套全面的DCIM解决方案将直接解决资产管理,系统配置,空间和资源利用以及未来容量规划等主要问题。最重要的是,它将提供一个有效的桥梁来支持设施和IT人员之间的运营职责和依赖关系,以消除潜在的孤岛。

 

在您企业数据中心工作的DCIM

 

1、DCIM在工作中帮助您数据中心进行日常操作运营

 

  对于DCIM可以提供给数据中心的价值,也许最容易理解的方法是:首先考虑一下典型的数据中心每天的运营中所出现的几个简单问题。然后问问你自己,你将如何回答这几个问题以及如何回答得有多快:

  我们的数据中心拥有哪些服务器,它们分别都被安装在哪里以及它们的功能是什么?他们的容量有多少被利用,都有哪些应用程序运行在这些服务器上,谁拥有这些应用程序?

  这些服务器是如何供电的,它们使用了多少电力资源?他们如何连接到网络的,以及都连接到了哪些网络?

  是否有任何服务器接近可能导致其出现故障失败的功率或发热阈值?

  我们的数据中心是否有当前的动力链,网络和服务器依赖关系图,以便能够告诉我们如果服务器或电路出现故障或UPS即将进行计划维护的话,哪些系统或电源会受到影响?

  我们是否有足够的电源和网络连接来在此机架中添加额外的服务器?

  我们今天在数据中心是否有足够的空间,电力和冷却能力来支持新的关键应用所需的新服务器/机架?

  考虑一下为了回答上述每个问题,您企业需要针对当前流程采取的具体步骤:

  您数据中心需要收集哪些数据?

  收集数据需要多长时间?

  需要哪些资源?

  这一流程需要涉及到多少人的参与,而这些参与的人员又来自多少个相关的组织部门?你如何与他们沟通并协调他们的活动?

  需要进入多少次数据中心以验证记录的数据,并收集其他数据?

  一旦获得了所有可用的数据,还需要进行哪些额外分析,以及您对所采取措施的准确性有多大信心?

  通过恰当的部署DCIM,您企业数据中心将能够立即查看整个数据中心的运营情况,并深入到任何所需的细粒度级别,只需点击几下鼠标,即可清晰的了解这些问题以及其他许多问题。

  此外,您企业数据中心的DCIM可以为您提供自动化工具和假设模型,以简化任何所需的系统迁移或新系统的配置,同时充分利用现有空间,电力和冷却能力。

 

2、DCIM工具能够帮助您企业制定更美好的未来规划

 

  除了处理日常任务和问题之外,每处数据中心的管理员都有机会通过主动的分析,计划,行动和管理来提高整体性能,降低成本,并优化现有资源的使用。同时,如果能够更好的考虑如下相关问题的话,则可以带来运营方面的改进:

  在投入大量资本支出以实现额外的扩展之前,我们数据中心如何配置新的系统来优化现有空间,电力和冷却系统的使用情况?

  我们数据中心的电源和散热要求是否是以降额铭牌规格或实际数据为基础的?

  在不久的将来,我们的数据中心是否存在用尽空间,电力和冷却的风险,或者我们的电力和/或冷却基础设施是否存在过度配置或配置不足?

  当我们数据中心在配置额外的服务器时,我们是否能够全面了解整个供电链或是仅仅只查看机架上的电源的可用性?

  我们如何识别服务器或其他数据中心资产是否超出了保修期范围或是否需要维护或保修更新?我们如何正确的实施规划,管理和可视化两处或更多的数据中心站点的整合?

  数据中心基础设施是否会支持通过引入虚拟化技术来提高利用率?准备虚拟化需要做哪些改变?

  我们数据中心的电源和散热措施是否妥善配置和均衡,以实现高效可靠的操作?

  通过收集,挖掘和分析实际的历史运营数据,您数据中心的DCIM再一次证明了其是非常宝贵的。DCIM报告,假设分析和建模将帮助识别改进运营和降低成本的机会,以便您可以自信地规划和执行数据中心的更改。

 

DCIM使用入门

 

像任何其他工具一样,使用DCIM产品以实现其价值与整个数据中心员工使用的规范直接相关。最关键的是最初使用DCIM数据库的员工以及对该数据库的持续维护。一些DCIM供应商提供的工具可以自动化资产/基础设施的大部分初始发现和数据捕获——物理和虚拟系统,布线和电源链。这些工具可以从现有的电子表格和其他来源导入数据,首先验证,匹配并与发现的数据同步。

  在供应商经验丰富的数据中心专业人员的支持下,您企业将构建一个可信的数据库,成为所有域和级别(系统,网络,设施,管理人员,系统管理员和技术人员)的单一存储库。这成为整个数据中心工作人员用来跟踪和可视化资产及其关系和绩效的单一面板。

  一旦建立了最初的DCIM资产数据库,全体员工必须遵循变更管理的最佳实践方案,以保持完整和准确的存储库,否则DCIM的价值将开始恶化,并且系统将被废弃。大多数DCIM供应商提供基于计算机的工具来促进和实施这些流程,以加快工作流程,并保持数据库的准确性。结构化的变更和工作管理流程可以协调和跟踪数据中心员工在安装,配置和提供新服务时的工作。这为统一各种数据中心域提供了战术“粘合剂”。

 

通过DCIM所交付的结果及带来的回报

 

实施DCIM解决方案并建立起相应的使用流程的所能够为企业客户带来的回报可能非常巨大。您企业可以借鉴和参考以下相关媒体的报道和介绍,以确定哪些为能够您企业数据中心提供了最直接的机会:

  据Computerworld.com网站报道:在全美国1180万台服务器中,大部分服务器的容量都在15%以下。

  Computer Associates公司称,在企业数据中心中,有接近五分之一的服务器都已经不再使用,应该被淘汰。

  据美国洛基山研究所的调研报告称,数据中心业界的平均能源效率非常低。对于这些数据中心而言,每消耗100瓦,只有2.5瓦产生有用的计算。

  市场调研机构Gartner公司报告称,IT基础架构的数量增长将超过大多数企业组织可用的数据中心空间。超过70%的美国企业数据中心将面临与能源消耗,建筑面积和成本有关的明显中断。 Gartner建议将数据中心的温度提高到至少75°F,以降低散热需求。

  IDC预计,超过50%的数据中心将会出现空间不足。

  美国Sprint公司通过淘汰其127款应用程序、报废或重新部署了超过2230台服务器,并释放了291,042 GB的存储空间。这转化为2800万美元的可重新部署资产,并使得其运营成本降低了2000万美元,数据中心相关碳排放量减少了10450公吨。

  上述这些介绍强调了您企业的DCIM解决方案可以帮助实现成本节约,资源优化和设备寿命延长的一些可能的机会。