扫一扫下载界面新闻APP

探访百度阳泉数据中心:可存储30万个国家图书馆的藏书信息量

百度阳泉数据中心已建成投产12万平方米,上线服务器超过15万台,有超过300万个CPU核,存储容量超过了6EB。

记者 | 肖芳

2019年春晚,百度App顺利“过关”,抗住了比平时高几百倍的流量压力。

百度官方公布的数据显示,春晚期间,全球观众参加百度App互动次数达到208亿次,春晚数据流量为每秒峰值5000万次,每分钟峰值10亿次。边看电视边抢红包对用户来说只是点点屏幕,但对于保障互动正常进行的数据中心来说,这并不容易。

百度系统部总监张炳华表示,1月6日,他在内网看到百度拿下2019年春晚独家互动合作伙伴的消息,第二天就收到了具体的保障任务,很多同事过年回家的计划被打乱。他把整个保障过程形容为“数据海啸、惊涛骇浪”。

百度阳泉数据中心在春晚红包互动中发挥了关键作用。近日,界面新闻记者实地探访了百度阳泉数据中心。

亚洲单体规模最大的数据中心

AI时代,数据已经像水电煤一样成为基础设施一般的存在,这在10年前难以想象。

百度智能云产业智能化业务负责人李硕以一个人脸识别的案例讲述了其中的变化:在很多视频素材中找到清晰的人脸素材,并且跟目标人脸进行比对识别出来。现在,智能设备1秒内就可完成。而在10年前,这种计算量对电脑来说很难做到。

这个变化的背后是互联网公司大规模搭设服务器,并发展成为数据中心。

目前,百度阳泉、顺义、南京等地区都已部署数据中心,阳泉是三地中最大也是亚洲单体规模最大的数据中心。

据了解,百度阳泉数据中心已建成投产12万平方米,上线服务器超过15万台,有超过300万个CPU核,存储容量超过了6EB,可存储的信息量相当于30多万个中国国家图书馆的藏书总量。

阳泉云计算中心在2012年就开始规划,整体的设计具有比较强的前瞻性。张炳华介绍称,当时服务器机柜就是按40A电流规划的,但8年过去了,目前IDC供应市场上,主流供应的机柜基本还停留在20A (4.4kW)。未来5年,CPU的功耗预计会增加3-4倍到300多瓦,单机柜功率密度会大幅提升到20千瓦-30千瓦,百度未来新建的数据中心,就是按这个功率密度去规划的。

在节能方面,阳泉数据中心也做了很多创新。比如在供电上,阳泉数据中心采用市电直供+HVDC offline技术,供电效率达到99.5%;在冷却上,采用OCU(Overhead Cooling Unit)模块、液体冷却等技术,全年超过96%时间实现自然冷却。

2018年,百度阳泉云计算中心年均PUE(电力使用效率,即数据中心总能耗与IT能耗之比。PUE值越接近于1,表示效率越高。)突破了1.10,达到1.09,比全国数据中心平均1.73的水平在基础设施能效方面提升了88%。阳泉数据中心每年可节省电量达到2.5亿度,相当于13万户居民一年的用电量。

天蝎整机柜服务器

目前,阳泉数据中心使用了天蝎整机柜服务器、“冰山”冷存储服务器、X-MAN超级AI计算平台等多种百度自研计算系统。其中,2017年上线的X-MAN 2.0,是采用液体冷却技术的GPU解决方案,散热效率较高。规模应用后,可以全面去除制冷机组,全面实现无冷机运行。

阳泉数据中心还使用了百度自主研发的交换机,支持10G、25G的通用计算网络接入和100G的AI高速无损网络互联技术。从数据中心覆盖用户时延不超过30ms,从POP点覆盖用户的时延不超过10ms,从CDN覆盖用户的时延不超过2ms。

百度智能云、百度App、百度地图、智能城市、小度、Apollo等百度系产品都依托于阳泉数据中心提供强劲的计算能力。

如何保障数据安全?

云计算业务正在支撑百度向B端业务拓展。据《财经》报道,百度云已经成为百度下一个业务增长点,百度今年为百度云制定了百亿元人民币营收目标。

百度2018年第四季度财报首次公布了百度云的营收数据:当季营收11亿元,同比增长100%。李硕表示,百度云现在主体进军的是金融、互联网和媒体等行业,同时也在公共安全、通信、能源和交通等行业不断纵深拓展。

服务的客户越来越多,也意味着百度云必须在服务稳定性和数据安全上做出更多努力。否则,一旦发生不可预知的灾难,数据丢失造成的损失将是无法计算的。

百度阳泉云计算中心监控中心

李硕介绍说,在稳定性上,百度拥有一套智能调度系统,采用分层机制,基本能够做到N+1的服务模式,即一个用户可以通过多个入口来访问百度的服务。比如,在阳泉能够访问的服务也可转到西安进行访问。如果是非常火的数据,百度云会在多个系统中增加备份,南方的用户可以在广州访问,北方的用户可以在阳泉或青岛访问。对于相对比较冷的数据,备份会相对少一些,但即使10年没用到,用户也可以在使用时能够快速访问。

“随机关掉百度的任何一个数据中心,我们访问依旧没有任何问题,这是上层服务设计需要做到的。”李硕表示。

百度阳泉云计算中心通过AI控制,可将网络故障排查时间缩短至5分钟。同时,阳泉数据中心设置了7*24时值班,负责现场运营管理、故障处理和维护保养,一旦有突发情况,可以快速反应。

张炳华表示,百度奉行开放创新、合作共赢的思路,希望通过开源和开放,把中国的数据中心产业生态做好,缩小与国际先进水平的差距,“大家一起想办法把蛋糕做大,把规模效益做起来,让每个参与者都是受益者。”

未经正式授权严禁转载本文,侵权必究。
表情
您至少需输入5个字

评论 4

相关文章