疫情完全地改变了我们“维持业务不间断”的方式和想法,企业原先只注重基础设施,来实现“业务持续性”,现在则纳入了更多元化的考量。
现在,终端用户不再只是唯一“在家办公”的族群了。许多IT人员也开始进行远程办公,这也让数据中心基础设施管理和运维变得更加重要。除此之外,远程工作此一大趋势,也为IT环境的运营带来了更多难以预测的压力和难题。尤其是假日期间、月底等需求高峰期,IT团队需要确保有足够的虚拟机资源和网络带宽,能支持关键业务的工作负载。
在当前对IT基础设施依赖性极高的时代,IT专家需要确保基础设施的高可靠性、高性能,让WFH工作者,也能够访问他们需要的应用和数据。预防停机和业务不间断,比以往都来得更加重要。
如何优化数据中心?
为了应对这些挑战,企业需要有一个灵活高效的数据中心基础架构。这次,我们邀请到瑞技东南亚高级账户经理 Anla Yang,和我们分享五个让数据中心变得更敏捷、灵活的关键领域。
一、冗余设备
数据中心基础设施设备故障,是不可避免的。根据Ponemon Institute研究指出,UPS故障是数据中心停电的主要原因之一。无论是服务器还是交換机的单点故障,都可能造成停机。因此,您的数据中心应该要有冗余设备、电力和网络连接,能实现自动故障转移和远程管理。
我们建议企业投资、采用合适的监控工具,确保能及时发现并解决任何问题,才不至于影响IT基础设施的运营。
二、制冷
现今的高性能设备和密集的数据中心设计,对于制冷的需求也比传统基础架构更多。通常,IT决策者需要重新审视他们的冷却基础设施,以确保能够处理工作负载。这一点非常重要,因为“制冷”占了数据中心总能耗的40%。列间空调和冷、热通道,都可以帮助打造合适的数据中心环境。
此外,企业也可以考虑使用 AIOps(在IT运营中使用人工智能技术),以更好地衡量、优化能效水平。
三、电力
无论是针对运营成本还是可靠性,能确保数据中心有足够的电力,并极大优化电力负载,都是数据中心运营中极为重要的一环。过度的电源负载,会导致系统故障;将过大的电源使用于低密度机柜,也会造成能源浪费。对电力系统进行全面性的检查,能够让企业了解这些问题是否存在。
对于老旧的电力IT基础设施进行淘汰和替换,也十分重要。Gartner指出,服务器消耗了60%的有效负载功率。企业可以减少不必要的工作负载,降低这种情况的发生。此外,还可以通过集成虚拟机、使用较为节能的服务器替换旧服务器,来大为降低能耗。
四、空间
传统来说,数据中心的生命周期为15年,但疫情为DC运营带来了快速变化,让预测需求变得更加困难。模块化数据中心解决方案,随插即用、能快速搭建的特性,能满足现今企业对敏捷性和可扩性的高度需求。
企业的部署模式选择分为以下几种——
-
本地部署(将应用程序托管在企业自建数据中心里)
-
第三方数据中心/Colo数据中心(为其服务器或硬件租用第三方数据中心空间)
-
云(按需选择,将其应用程序托管在公共云中)
五、利用AIOps提升自动化
现在,我们对于IT人员管理复杂基础设施能力的需求,比以往都还要更高。在多云环境中,我们需要在不提升成本支出的前提下,提升运营的效率。
也因此,AIOps(在IT运营中使用人工智能技术)已成为支持当今高度多元、分布式 IT 基础架构的强大替代方案!AIOps可以帮助IT运营团队监控大量日志和警报,了解可能影响用户体验的实际性能问题。AIOps的应用变得越来越普及,越来越多的企业,都开始使用基于AIOps的工具,来找出运营问题的根本原因。
Gartner指出,AIOps的重要性正在不断上升,并预测大型企业使用AIOps监控应用程序和基础设施的比例,将从2018年的5%,在2023年上升至30%。
考虑到数据中心的重要性,以及在充满挑战的环境中提供支持所面临的难题,企业持续关注并承诺持续改进数据中心运营效率和性能,都非常重要。通过关注以上五个重要参数,企业可以打造对更灵活、敏捷的数据中心,以因应不断变化的业务需求,更好地防患未然!