不久前,在业内的一次会议上,优酷CTO姚键透露,目前,优酷每天有2亿次的视频播放,每天能覆盖3500万的用户,每个月能覆盖不重复的用户也达到了2.8亿。
如此大的访问量和用户数必然对优酷的网站架构及数据存储提出了很高的要求,作为一直以来以“快者为王”为经营理念的视频网站,优酷是如何应对每天海量的数据存取要求,又是怎样保证流畅、清晰的用户体验的呢?
为此,CIOAge独家专访了优酷CTO姚键,请他讲一讲优酷的IT部署策略。
分布式存储+多点备份
为应对数以PB计的海量数据,视频网站需要容量大、性能适中、可扩展性更强的存储架构,并且在数据备份、数据快速查找上也都对服务器提出了更高的要求。
据姚键介绍,优酷采用分布式的存储结构,服务器和存储设备分布在全国各地数十个节点,这样对于海量的用户,可以就近访问速度快的节点,获得最快的视频体验。目前,优酷的分布式存储系统已经运行超过5年,从服务器数量、扩展能力一直保持良好的势头。并且多年来一直保持一定程度的系统性能余量,可以视用户增长情况随时扩充服务能力,所以即使在访问高峰期依然可以安全运行。此外,优酷自行开发了复杂的视频散列系统,以最大程度上加强存储的效率,以独立的查找算法保证可以再数亿视频中快速定位到所需要的文件。
而针对数据备份,由于每日访问量庞大并且网络规模巨大,在单点上备份数据意义是很小的,难以快速发布到全网中,所以优酷在全国有数个视频存储节点,任意文件都在全网内多个节点存在多个拷贝,多个节点可以互为备份,保证任意节点失效不会对文件的安全性造成影响。
这种部署结构虽然极大的保证了用户的访问体验和数据安全,但日常的维护也是不小的工作量。姚键称,在数据中心维护上优酷采用“半自行维护+合作伙伴维护”的方式,在大型数据中心采取自行维护,这样响应快并且保证重点数据中心的安全,在部分小规模节点采用合作伙伴维护方式,以此来得到较高的性价比。