蓄电池已经在我们的生活中很普遍了,家电、汽车等蓄电池的应用范围非常广泛。蓄电池在我们的生活中扮演着十分重要的角色,我们都知道,那就是电池用旧了要全部换掉,绝不能新旧混装搭配使用。
由于人们在蓄电池的使用中并不十分了解,所以在蓄电池使用中多多少少会出现一些错误。例如,新旧蓄电池一起串联使用,殊不知,这种做法会缩短新蓄电池的使用寿命。
新蓄电池由于化学反应物质较多,端电压较高,内阻较小,而旧蓄电池端电压较低,内阻较大,一般12V新蓄电池内阻为0.015-0.018欧姆,旧蓄电池的内阻却多在0.085欧姆以上,如果将新旧蓄电池串联使用,那么在充电状态下,旧蓄电池两端的充电电压将高于新蓄电池两端的充电电压,结果造成新蓄电池尚未充满,而旧蓄电池早已经过高,而在放电状态下,由于新蓄电池的容量比旧的蓄电池容量大,结果造成旧蓄电池过量放电,甚至引起旧蓄电池反极,蓄电池鼓胀造成副作用。它会损耗新蓄电池的电能,同时也会造成电器内部的电压不稳,也存在着旧蓄电池使用过度所带来的危险。
新旧蓄电池千万不能混搭使用,混搭使用不但不能省电,反而浪费电能,结果是得不偿失。蓄电池组是数据中心后备电源系统中非常重要的一环,但又是主要的故障点。美国Ponemon研究院2010年的报告中这样描述,“从受访的453个数据中心用户处得到反馈,80%的数据中心在运行过程中遇到过局部或整体电源事故。平均每次电力故障给用户带来的损失是50万美金,其中65%是由于UPS系统蓄电池的故障引起的,51%是人工操作失误。近日据国内多家媒体报道,2014年6月,国内某商业银行总行机房突发线路电气故障并引发火灾,初步估计是由于机房电气系统方面着火。
本文主要是从美国NDSL集团的CELLWATCH蓄电池监测产品如何帮助用户预防蓄电池燃烧方面来阐述的。蓄电池燃烧的原因主要有三项:
1,蓄电池过度充电及电池热失控故障
如果蓄电池出现过度充电,电池会产生大量的可燃易爆气体,并通过密封阀排出,如果遇到火花很容易引起火灾。另外,如果蓄电池出现过充,电池内部会产生过多热量并且不能及时得到释放,会引起蓄电池本身的热失控事故,进而引起蓄电池燃烧及火灾。
CELLWATCH解决方案:最新版系统提供了专业检测,预警和防止电池热失控的功能(基于TRC热失控控制器)。
CELLWATCH系统通过电压、电流及温度三个参数的监测,在热失控现象处于早期状态时就能全面并准确地判断到。发现热失控现象后CELLWATCH会通知数据中心管理者,进而采取相应的措施把故障处理。如果在预定时间内用户并没有采取任何措施,为防止热失控现象进一步恶化,CELLWATCH会把电池串与充电器脱钩。这个步骤的重点是用户的负载在整个过程中还是会受到保护直至相关措施得到实施,Cellwatch可以按照IFC608.3的要求将热失控电池组与充电器断开,彻底避免热失控引起的电池火灾隐患。
2,蓄电池单体间连接松动;
蓄电池单体间连接条松动,是蓄电池系统经常会遇到的故障。主要是由于安装时没有紧固、或是电池使用两三年后因为连接条金属铜的热胀冷缩造成连接松动。当蓄电池组放电或较大电流充电时,因连接松动造成连接部件间电阻过大、热量积累、温度升高,进而引起电池塑料外壳冒烟起火。燃烧过程中电池内部化学反应而产生的可燃气体会起到助燃的效果,严重的会引起整组电池或整层电池组燃烧。但并不是所有的连接松动都会引起燃烧,取决于松动的程度以及电池组电流的大小。
CELLWATCH解决方案:同时监测蓄电池与电池间连接。
CELLWATCH系统采用的是电池正极连接法(如右图)。两根测试线之间形成一个欧姆值(内阻值)的测试回路,每个测试回路监测的对象是一节电池及两个电池间连接条的欧姆值。当电池内阻发生变化或者连接条发生松动,都会被发现并跟踪直至产生告警,以便用户能及时排出安全隐患。
对比普通的单体温度检测法
也有厂家采用测试线直接连接电池正负极的方式,采用单节电池单个监测模块的设计,主要利用单节电池温度的监测功能来提供类似的告警。这种方式的局限性在于不能及时发现连接松动的隐患,因为我们在上面连接松动故障分析中看到,连接条松动并不一定会引起温度上升,只有在大电流时才会引起电池温度上升,进而引起电池燃烧。
综合这两种监控方式相比来讲,如果在线电池监测系统能在监测电池的同时也能监测到电池单体连接状态,会帮助用户及时发现连接条松动的隐患,防止电池火灾的发生。
3,蓄电池壳体渗漏;
蓄电池一般采用塑料外壳,蓄电池都比较重,在搬运过程中容易因碰撞造成外壳出现细小裂缝,当电池内部没有压力时,不容易看到电池漏液。在电池进行充放电后,内部压力增大,会加速电解液(硫酸)从电池裂缝中渗出,渗出的硫酸流到接地的电池架上会引起短路而引发火灾事故。
CELLWATCH解决方案:通过连续的电压扫描及每天的欧姆值监测,Cellwatch能够更好地检测到电池漏液。这个不能代替接地故障的检测,但Cellwatch能发现一些电池故障的症状。
综上所述,我们可以看到如果采用可靠、稳定的蓄电池在线监测系统,可以从根本上帮助用户解决蓄电池维护难、故障发现难的问题、帮助预防因为蓄电池问题引起的火灾,极大地提高数据中心电源系统的安全性。CELLWATCH产品在帮助用户保障蓄电池系统安全性的基础上,向用户提供了管理蓄电池的有效手段,从而避免蓄电池的提前报废和过度使用,给用户带来很好的投资回报。
高密度数据中心发展至今,迫切需要解决的问题是降低PUE值。随着电子信息机房IT设备和供配电系统的高度集成化,机房散热量日渐趋高,必须要有强大的制冷系统,来维持机房的环境温度能保持在一个合理范围内。从图1中可以看出,电力在数据中心的消耗仅有33%供给了IT负荷,散热负荷却高达63%,也就是说,散热负荷已经远远超过了IT设备的负荷。这意味着,降低IT设备的发热量,可相应地降低散热负荷,也就是降低了用于制冷设备的电力,这对于降低PUE值是一个关键的因素。
在现代电子信息机房中,空调负荷主要来自计算机主机设备、外部辅助设备的发热量,这些发热量大约占机房空调总热量的80%~95%,而在计算机主设备(包括服务器、存储、网络等)中,服务器所产生的热量约占到80%左右。可见,降低服务器的发热量,从而降低制冷系统的能耗是至关重要的。
目前,很多数据中心的服务器散热采用风冷技术,即用空气来冷却。空气并不是很好的冷媒。若采用液冷,其冷却效果比空气强1000~3000倍。风冷所不能解决的高能耗、低性能的问题,用液冷技术却可以得到显著的改善。服务器也因此实现了高密度、低噪音、低传热温差、全年自然冷却的效果。
液冷是利用工作流体作为热量传输的媒介,将热量由热区传递到远处再进行冷却。由于液体比空气的比热大很多,散热速度也远远大于空气,因此制冷效率远高于风冷散热,由于省去了风扇,也能达到降低噪音的效果。
液冷服务器不用压缩机制冷,使得整个系统全年PUE值下降到1.2以下并非难事,同时服务器CPU可超频运行,计算性能可提高12%。国外研究表明,CPU核温每提高10℃,可靠性降低一半。而液冷服务器的CPU核温比风冷极限温度可低20~30℃,可靠性必将大大提高。
1 液冷服务器的原理
制冷系统的制冷原理主要在于冷量传输的途径差异。冷媒的全热为显热与潜热之和。湿热是液体在加热或冷却过程中,温度升高或降低而不改变其原有相态,所需吸收或放出的热量时,不发生相变;而潜热是相变潜热的简称,为单位质量的物质在等温等压情况下,从一个相变化到另一个相时,所吸收或放出的热量。这是物体在固、液、气三相之间以及不同的固相之间相互转变时具有的特点之一,固、液之间的潜热称为熔解热或凝固热,液、气之间的潜热称为汽化热或凝结热,而固、气之间的潜热称为升华热或凝华热。
对于超高功率密度的数据中心来说,风冷技术难以实现对系统的高效散热,而水冷或液冷有两大好处:一是把冷却剂直接导向热源,而不是像风冷那样间接制冷;二是和风冷相比,每单位体积所传输的热量(散热效率)比风冷高几千倍。
由于液体的比热容大,能吸收大量的热量而保持温度不会有明显的变化,液冷系统中CPU的温度能够得到很好的控制,突发的操作不会引起CPU内部温度瞬间大幅度的变化,因此能允许CPU进行超频工作,从而节省服务器的数量。此外,由于泵的噪声很小,整个液冷系统的噪音比与风冷系统小很多,可达到“静音机房”的效果。此外,由于省掉了风扇及机房专用空调系统,因此节省了电费和耗能。
该技术可广泛应用于超高功率密度数据中心中服务器的散热,为数据中心的散热问题提供一个优异的解决方案。
图2 给出了风冷服务器与液冷服务器的比较。
值得一提的是,服务器的液冷技术并不需要昂贵的水冷机组,在减少总体拥有成本的同时,显著提高了数据中心的能源效率,而且做到了绿色环保。它还可以控制运营成本,使初始投资实现快速回报。这在那些高电力成本、高运营成本的数据中心显得尤其重要。
使用液冷系统的节能效果十分明显。服务器前部必须要保持25℃以下才能稳定工作,精密空调想要保持这个温度,必须在空调冷风口达到18~20℃,而液冷媒只要能达到20~25℃就可以。另一方面,远程制冷的效率比较低,而液冷媒在相对封闭的运行环境中,效率较高。
形象地理解,液冷设备与精密空调的区别,就像冰箱制冷与冷库制冷的区别。对机房来说,液冷媒将每个机柜包装成为一个“冰箱”,而精密空调则把整个机房制冷视为一个“冷库”,其能耗的差别不言而喻。使用液冷技术节能的效果不仅仅在于制冷方面,液冷技术有一个与众不同的系统,叫Freecooling(自然冷却系统)。液冷媒的进口温度需要低于15℃,而当环境温度低于15℃时,就可以不需要通过循环制冷来制冷液体,仅仅用自然冷量制冷即可。这一切都是自动调节的,不需要人工操作。使用液冷系统的节能效果十分明显。
2 液冷服务器的种类
液冷服务器的种类一般是按采用的模式和选用的冷媒来区分的。
按照系统模式,液冷服务器可分为直接冷却和间接冷却两大类;按照工作介质的不同,可分为水冷和其它制冷剂冷却,制冷剂除水以外,还有变压器油、矿物油、19.8%的乙二醇溶液、13.6%NaC的盐水、FC-75、Coolanol45、二甲烷饱和溶液等;按照是否发生相变,可分为温差换热(利用制冷剂的温升来带走热量)和相变换热(利用制冷剂的气化潜热来带走热量)。
(1)间接液冷服务器
间接液冷服务器又叫冷板式液冷服务器,其原理图如图3所示。如图中所示,冷媒与被冷却对象分离,并不直接接触,而是通过液冷板等高效热传导部件将被冷却对象的热量传递到冷媒中。对于原有的风冷方式来说,仅需将原风冷散热片替换为液冷散热片,并将冷媒管路引出机箱即可。在间接冷却方式中,冷媒有其自身通路,并不与电子器件直接接触,因此只要液体管路密封性好、冷媒不泄漏,那么系统对冷媒种类的要求较低,多种冷媒均可实现其功能。
缺点是由于增加了传热过程热阻,传热温差增大,制冷效果逊于直接冷却式,且需要额外安装风扇对机房的其他元器件进行散热。
(2)直接液冷服务器
直接液冷服务器又叫浸没式液冷服务器,其原理图如图4所示。如图中所示,发热元器件与冷媒直接接触,即将服务器主板、CPU、内存等发热量大的元器件完全浸没在冷媒中。由于冷却液与被冷却对象直接接触,散热效果更佳,能一次性解决全部元器件的散热问题,无须额外配置风扇、散热片等。但此系统对原有的风冷系统有较大改动,需制作密封舱体用来盛放冷媒。另外,对冷媒的要求较高,需具备绝缘性好(不导电)、无毒无害、无腐蚀性等物理化学特性。
直接冷却式能解决更高热流密度的散热问题。直接冷却式是利用液体的温差或相变将热量直接带走,减少了传热过程的热阻,冷却效率更高。而且,冷却制冷剂蒸汽只需40℃的进水,由于全国很多地方全年温度都是在40℃以下,因此可实现全年自然冷却,PUE值可降至1.05左右。
服务器设计者和数据中心运营商主要关注的问题是数据中心系统的稳定性。然而,在液体冷却系统中,一个接头的失效就会导致冷却液无法自动替补供应。因此,对机械冲击的抵抗能力及可靠性是液体冷却系统快速插拔接头的重要特征。服务器设计者就需要构造优良、锁紧机构简单、制作材料耐用并兼容的快速插拔接头。这种接头必须能够长期保持连接状态,但在断开进行维护时快速接头内集成的阀门能够迅速动作,以避免冷却液的溢出。使得密封件应当与冷却液兼容,以避免膨胀、收缩或者变形。
在使用液体冷却系统时,为了更好地保障电子设备周围设施的安全性与可靠性,数据中心运营商需要采用坚固耐用且保证无滴漏的连接设备。快速接头连接后的多重密封和无密封摩擦功能,能够保证液体冷却设备即使在长时间处于连接状态和压力的情况下,在断开时也能保证无溢漏,大大提高了液体冷却系统的安全性和可靠性。
此外,简单易用、设计直观的快速插拔接头可以满足液体冷却系统操作及维护的便利性。
比如,彩色编码的设计为冷却管理提供即时视觉上的辨别,这种易用且直观的设计更加方便技术人员使用和维护。产品配有高质量阀门的一键连接或扭锁式接头,操作简单快速,并且在断开时阀门完好闭合。对于惯于连接和断开以太网和电源电缆的技术人员而言,直观设计的快速插拔接头更方便使用。
3 国内外服务器液冷技术发展现状
(1)国内服务器液冷技术发展现状
目前国内知名的多个设备、软件厂商推出了液冷服务器系统产品,包括曙光、华为、神威蓝光等。
曙光推出的TC4600E-LP液冷服务器是以原有风冷型刀片为原型,进行了液冷改造设计,除去CPU和显卡的风冷式散热器,改造为液冷冷板。图5为TC4600E-LP液冷服务器的前、后视图。
TC4600E-LP采用CPU冷板技术以及先进的防泄漏技术,具有以下优越的性能:
①风扇功耗降低70%,具有更优的整机效率;
②CPU可超频运行,计算性能提高12%;
③CPU核温可降低30℃,平均无故障工作时间延长50%,具有更高的可靠性;
④噪声比风冷板机型低20dB(A),具有更低的噪音指数;
⑤由于处理器的热量通过水冷带走,不需要安装大量的机房专用精密空调;
⑥液冷系统采用30℃的常温进水,可以实现全年自然冷却,PUE值轻松降至1.2以下。
华为公司的液冷刀片服务器采用高集成LCS(Liquid Cooling System)设计,在1个标准的42U机柜中通过部署三台装配有高性能冷板(CH121 CH140刀片服务器)的E9000融合架构刀片服务器,即在部署96个2路刀片服务器的情况下,对86%的器件进行液体冷却,相比传统的风冷散热设计可实现50%~60%的能耗降低,有助于将数据中心PUE值降至1.2以下。华为公司间接液冷服务器如图6所示。
神威蓝光公司的间接液冷服务器中的冷却用水是内部封闭循环,是来自矿泉水厂处理过的纯水。中间是铝制液冷散热板。神威蓝光公司的间接液冷服务器的优势是集成度高,水冷散热高效,可在一个机柜内存放更多的CPU,仅依靠9个运算机柜就达到了很高的运算能力。神威蓝光间接液冷服务器如图7所示。
目前国内有很多企业已经开始研发液冷服务器产品,但截至目前,大部分企业使用液冷技术多采用纯水作为冷媒。众所周知,含杂质的水是电的良导体,一旦冷媒泄漏,与主板上的尘埃等杂质混合,后果不堪设想。且选用水作为冷媒,是利用水的温升带走发热元件的热量,只利用了水的显热,并没有发挥其全部功效,还有很大的潜能可以发挥。
(2) 国外液冷服务器的现状
国外液冷服务器的用户主要还是大型数据中心和超级计算中心,已经有一些用户开始使用液冷服务器。比如美国国家安全局、美国空军、CGG、ORANGE、VIENNA科学计算集群、日本东京工业大学已经使用了Green Revolution Cooling的浸没式液冷技术,美国AFRL、ERDL、法国TUTAL、欧洲AWE等使用了SGI的液冷服务器,德国LRZ已经使用了联想(原IBM)的Next Scalen x360 M5冷板式液冷服务器。
IBM的新SuperMUC超级计算机中心(LRZ)Super MUC与IBM xiData Plex均采用了水冷技术,即采用40℃的温水作为IT设备制冷的冷媒工质。比起普通的风冷系统,这种水冷系统的散热效率高4000倍,能耗也大幅度降低。除此之外,其产生的热水可以给莱布尼兹超级计算机中心园区的其他生活建筑供热,每年可节约125万美元。IBM间接液冷服务器如图8所示。 |