
(1)管理机柜气流
许多热点的出现是因为设备排出的热风在机柜内部或机柜周围发生再循环。因此,改善机柜气流管理对于解决热点至关重要。开放的机柜U空间和进出线口是造成热风再循环的主要原因,直接导致热点产生。改善机柜气流状况最简单、最经济有效的方法之一是利用盲板封堵未使用的机柜U空间,并在机柜的进出线口位置安装毛刷。企业应更新数据中心运行流程,规定凡有移动、添加和更改操作,便要安装盲板和毛刷。
某些类型的交换机和路由器采用侧向气流。如果在安装这些设备的数据中心内,机柜气流采用从前向后的传统模式,则交换机/路由器的排出的热风可能返回进风口并造成热点。
我们可以利用机柜侧向气流分配单元以可预测方式直接向侧向气流设备送入冷风,而不会造成热点。如果平均制冷总量充足,但在功率密度高于均值的机柜中产生热点,此时可以增加风机辅助型设备,通过改进气流状况和增加制冷量来改善制冷效果。风机辅助型设备设备可有效地从功率密度为3kW以下负载的相邻机柜“借用”气流以支持机柜负载。此方法可最大限度地降低机柜顶部和底部间的温差,并防止设备排出的热风再循环至机柜的进风口。所有排风设备在部署时必须十分小心,以确保来自相邻空间的气流不会造成相邻机柜温度过高。这些设备应使用UPS供电,避免设备在断电期间发生制冷中断。在高密度环境中,启动备用发动机期间也可能发生过热现象。
(2)管理机房气流
在改善机柜气流管理后,下一个重要步骤是改善机房内的气流管理。首先,是密封高架地板中所有的开口。使用毛刷密封机柜后部和PDU下面的进线口。导致意外气流泄漏大都由这些开口造成。还可利用空气阻尼泡沫或软垫密封制冷单元周围的缝隙和其他地板空隙,在地板缺损的部位铺上实心地板,找出造成气流旁通的穿孔地板并改用实心地板。例如,如果一个空机柜前铺了穿孔地板,则应将其换为实心地板。此外,还可遵照侧栏中的操作程序对地板下的气流进行重新平衡。正确铺设地板并密封高架地板中的缝隙有助于回收利用损失的制冷量。
另一个导致热点问题的因素是机柜顶部上方和机柜行末端周围发生的冷热气流混合。解决这一问题的一个最佳实践是通过遏制通道和/或机柜气流将冷热气流分开。通道气流遏制不仅有助于消除热点,与传统的非气流遏制数据中心设计相比还更加节能。
可以用一个送风设备替换机柜的后门,从而将其变为一个主动式风管机柜。需注意这些设备将使机柜的总深度增加大约250mm,这可能会增大每两行相邻机柜之间的间距。通常情况下排入热通道的热风会被收集起来并向上推送,然后沿管道进入回风通道。此举可防止气流在机柜进行再循环并提升制冷系统的效率和制冷量。主动式独立垂直风管系统中的风扇可支持高达12kW的机柜功率密度,并能克服不佳通道压力或因服务器排风口线缆过度密集而导致的压降。但主动式垂直风管系统很容易为数据中心的其他区域带来意想不到的问题,因此在部署安装时应格外小心。在这些设备中必须使用盲板和机柜侧面板。主动式风管系统是耗电设备,因此需要监控和维护。
(3)转移问题负载
如上所述,转移问题负载的方法是在发现“问题”负载之后将其转移到低密度机柜,从而消除热点。为机房配备制冷设备,让机房冷却到低于机柜潜在峰值的一个平均值,并将负载分摊到几个机柜,从而将任何负载超过设计平均值的机柜负载分流。请注意,将设备负载分摊到多个机柜会使机柜内出现大量未使用的垂直空间。必须用盲板将这些空间密封,防止制冷性能降低。如果可以拆除一台服务器或其它关键性设备,此举几乎毫无成本却可解决热点问题。
(4)改变温湿度传感器的位置
在多数陈旧的数据中心,都是在机房空调回风气流中安装温度探测器,使得气流具有不可预测性。此举还会导致机房空调负载不均衡,从而使服务器进风口的温度发生波动。将温度探测器转移到送风气流中(这里的送风可控制而且可预测)可使IT设备进风口的温度更加平稳。如果与气流遏制方法结合使用,改变温度探测器的位置还能提高送风温度,从而减少制冷系统的能耗,同时无需担心送风温度是否会有大幅波动。
(5)利用数据中心基础设施管理软件控制制冷单元的气流
有些系统可以根据IT机柜前方的温度控制单个机房的制冷单元。这些系统可使用模糊算法动态预测和调整制冷单元的风扇转速,并测算哪些制冷单元可关闭。通过控制进入数据中心的风量可以限制旁通气流量。Vigilent制冷系统就是这种系统的一个典型。

结论
下面的前四种最佳实践之所以有效,正是因为这些实践解决了数据中心气流旁通或再循环问题,或同时解决了这两个问题。最后一个新方法只有在气流管理完全落实到位之后方可采用。
热点会严重影响服务器的可靠性和性能,甚至会造成服务器的损坏。热点通常出现在IT设备的进风口位置,原因包括低效的气流管理,如冷气流泄漏(即气流旁通)和设备排出的热风再循环等问题。巡视感知温度、手动测量温度或自动监测是三种识别热点的主要方法。
数据中心运维人员为消除热点,采用了许多应对措施,但大都不尽人意,有的仅能作为应急情况使用,而有的却无济于事,有的甚至会使问题雪上加霜。消除热点的最佳实践包括机柜和机房的气流管理、气流遏制、问题设备转移、改变温度传感器位置以及通过数据中心物理基础设施管理软件控制制冷单元的气流。用这些方法解决热点问题不仅简单易行,而且成本低廉,行之有效。