仿如工业时代人们对铁路、公路、机场等基建的热衷一样,智能化时代,支持大数据应用的机器学习训练平台成为新的基础设施。大数据的存储、分析和机器学习能力已经成为新的基础设施需求,计算能力的高低决定人工智能产业和智能服务的水平。作为大数据和机器学习发挥价值的基础,同时也是企业高效构建AI能力的关键,超算平台的社会经济价值正伴随着人工智能、5G等技术的发展而被快速激发与放大。
人工智能技术是当前推动产业升级的关键技术之一,其爆发离不开三大因素的支撑——贴近真实应用环境的海量数据、有效的深度学习算法模型、高效的异构并行计算能力。要实现人工智能技术的产业化落地,关键在于构建一个能够提供高效异构并行计算能力,以及海量数据高速访问能力的平台,在此平台开展以深度学习应用为代表的智能计算。
为抢占人工智能发展先机,赋能区域的产业智能化升级,2017年底,厦门市政府联合云知声(厦门)启动面向深度学习应用大规模异构并行计算平台——厦门人工智能超算平台项目建设,该项目计划总投资约1亿元人民币。基于该平台的超算能力,可开展图像视觉、语音语义、自然语言处理、类脑运算等技术的机器训练和应用验证,满足各行各业用户的数据运算和存储需求。可应用于智能家居、智慧医疗、智能制造、机器翻译等多于15类30子项的AI示范性工程项目,服务于有大规模计算需求的中小企业、院校、政府机构等。
截止2019年12月18日12时18分,厦门人工智能超算平台浮点运算能力正式突破1亿亿次/秒(10 PFLOPS),成为中国东南区域计算能力首屈一指的超算平台项目。
厦门人工智能超算平台针对海量大数据的应用场景和深度学习计算的特点,在设计中做了针对性的优化和定制,能够为各种人工智能算法提供充足算力和数据运算支撑。基于内部研发的异构计算资源管理和调度系统,通过计算任务容器化和图形化的任务交互,实现计算任务的全流程管理和一键式分布式运行。同时,针对智能计算对海量真实应用场景数据的访问特点,平台提供海量数据存储访问系统,构建具备 PB 量级的高 IO 和高可靠的分布式存储系统。
平台功能特点包括:
l 支持 CPU、GPU、FPGA 多种人工智能异构硬件的资源管理和计算任务调度,该平台各节点通过 100G InfiniBand 高性能网络互联,具有高带宽、延时低特点,同时支持数据的 RDMA 操作;
l 支持主流的机器学习框架,实现多框架、多版本任务镜像的统一管理和混合运行调度,在超算平台上实现 ASR、CV、TTS、NMT、NLU 等人工智能技术的快速迭代演进;
l 支持智能化计算,实现模型快速调参、自动模型结构搜索、模型压缩量化等模型优化技术;
l 支持实时图形化的平台运行状态监控和报警,便捷易用的任务管理功能,支持多用户的平台访问认证和授权。
值得关注的是,因在经济实力、技术研发、融合创新能力和应用带动力等方面具备显著的正向效应,该平台先后获评“工信部人工智能与实体经济深度融合创新项目”、“发改委服务业发展引导示范项目”两项国家级奖项。
相关数据显示,到2020年,全球AI市场规模将达到1190亿元,年复合增长率高达19.7 %;而在中国,人工智能市场2020年市场规模将达到91亿元,年复合增长率更是高达50%。
高效异构并行计算能力和海量数据高速访问能力的超算平台作为实现人工智能技术落地与产业结合实现的关键,其在智能化时代中所扮演的角色显而易见。由云知声承建并运营的厦门人工智能平台立足东南,辐射全国,将承担各种大规模科学计算和工程计算任务,同时以其强大的数据处理和存储能力为社会提供云计算服务,推进“中国制造2025”,成为推动行业智能化的使能者、助推器。