9月24日消息,Facebook周四(9月23日)因系统出现错误而中断了2.5个小时,Facebook旋即公布细节并向使用者道歉,而这也是该站四年来最严重的一次故障。
根据外电报道,本周三就零星传出使用者无法存取Facebook,周四影响的使用者更多,包括美国、欧洲及南美的使用者都一度无法存取Facebook。 Facebook则坦承该站曾一度完全关闭。
Facebook说明,该站自动化系统的目的是检查快取中无效的配置值,再通过永久储存中的更新值取代,此一方式在快取出现临时问题的时候运作良好,但永久储存无效的时候则不然。 Facebook周四改变了配置值被视为无效时的永久复制,代表每一客户端看到无效值时都会尝试去修补它,因而必须要向丛集资料库传送请求,但每秒数十万笔的请求很快就淹没了丛集资料库。
更严重的是,当客户端向资料库请求出现错误的时候,会删除对应的快取值,这意味着就算原本的问题被解决,仍会继续传送请求,因此,只要资料库未能满足某些请求,就会造成更多的请求,而陷入资料库无法修复的回馈循环。
Facebook指出,演变至此要停止该回馈循环只能终止所有连至资料库丛集的流量,也就是关闭该站,一直等到修复资料库及排除故障原因时才逐步开放。目前Facebook已关闭尝试更新配置值的系统,并着手研究新的配置系统设计。