基于迁移学习的基础设施成本优化框架，火山引擎数智平台与北京大学联合论文被KDD收录

时间：2023-08-15 20:41:29 来源：互联网编辑：汪淼 IP：北京 发表评论无障碍通道

近期，第29届国际知识发现与数据挖掘大会(ACM SIGKDD Conference on Knowledge Discovery and Data Mining，以下简称KDD)在美国加州长滩举办。由火山引擎数智平台，北京大学计算机学院和蒙特利尔学习算法研究所等单位合作的论文《Rover: An online Spark SQL tuning service via generalized transfer learning 》(以下简称Rover)成功被大会收录。Rover由北京大学的沈彧和火山引擎数智平台的任鑫宇杨担任共同第一作者，北京大学的崔斌教授担任通讯作者。

图：论文题目和作者信息

KDD会议始于1989年，是数据挖掘领域历史最悠久、影响最大的顶级学术年会。KDD广泛的交叉学科性和应用性吸引了来自统计、机器学习、数据库、万维网、生物信息学、多媒体、自然语言处理、人机交互、社会网络计算、高性能计算及大数据挖掘等众多领域的研究者，为来自学术界、企业界和政府部门的相关人员提供了一个学术交流和成果展示的理想场所。

Apache Spark作为主流的分布式计算框架，在工业界得到了广泛的应用，字节跳动内部庞大的例行计算任务每天消费数百万core CPU及数十PB RAM规模的计算资源。每个Spark任务通过200余个相互关联的配置参数启动，但是，由于平台默认配置缺乏弹性，任务环境多样，终端用户经验不足等问题，相当数量的计算资源常因不合理的配置而被浪费。传统上，有经验的大数据工程师可以依据每个任务的运行情况，对其配置进行人工分析和调整。然而，这种人工调优方式在面临在高维参数组合时往往有天花板，并伴有运维迭代成本高昂等问题，使得其难以被规模化。

为了解决此问题，火山引擎的工程师和北京大学的研究者一起设计了一种结合机器学习方法与人类专家知识的基础设施成本优化框架(如图1所示)，该框架以贝叶斯优化算法为基础，使用高斯过程作为代理模型学习配置参数集与任务成本/运行时长的关系，并通过可信赖的迁移学习机制，从人类专家知识编码中获得安全性和可解释性(如图1中Expert-assisted Optimization部分所示)，并从相似的历史任务中获得额外的收敛加速特性(如图1中Controlled History Transfer部分所示)。

图：Rover优化器的整体架构

该方案能自动化识别和调整例行计算任务的配置参数集，在不破坏任务服务等级的前提下压缩资源浪费，有效节省运行成本。经验证，Rover在公开任务集及字节跳动内部的实际部署中，对比当前市面领先的解决方案，在极限收益，收敛速度和安全性方面均有进一步提升。

图：Rover对比4家市面上领先解决方案在内存降低率上的Benchmark

Rover是基于火山引擎DataTester在字节跳动内部应用的自动调参系统优化器内核、增加迁移学习机制演化而来，并通过自动调参平台的配套服务来实施和运行的，目前该项研究已经在字节跳动上万个Spark数据开发任务上得到应用，已帮助公司节约700万元/年的资源成本。未来，这项技术将在字节跳动内部的大数据计算基础设施上大规模部署，预计每年将会节约近十亿元，还将通过火山引擎数智平台为外部企业提供通用优化器服务，可应用于基础设施成本优化，线上算法超参数优化等多种场景。

据了解，火山引擎数智平台(VeDI)是新一代企业数据智能服务平台，旗下的A/B测试产品DataTester经历了字节跳动的10年打磨，目前服务于字节跳动内部500余个业务线，也服务了包括美的、得到、凯叔讲故事等在内的上百家外部企业，为企业业务的用户增长、转化、产品迭代、运营活动等各个环节提供科学的决策依据，将成熟的“数据驱动增长”经验赋能给各行业。

附录论文地址：https://dl.acm.org/doi/10.1145/3580305.3599953

(作者：韩圣瀚)

秋日的北京，创新涌动、合作如潮。经过五天密集而富有成效的大会议程，国际科技园及创新区域协会(IASP)2025年世界大会于9月19日在北京国家会议中心圆满落下帷幕。本次大会以“追求卓越——创新集群助力高质量发展”为主题，成功搭建了全球科技园区开放对话、务实合作的

当游戏从单纯的娱乐工具逐步演变为数字陪伴与精神载体，Z 世代用户已将其视作重要的情绪消费场景。搭载英特尔酷睿处理器的高性能游戏设备，以及英特尔酷睿Ultra处理器的AI PC，有效兼顾游戏体验与生产力、AI应用场景的需求，受到Z世代玩家青睐。《2025 游戏行业抖音经营

九月末的北京，秋意初显。在大北农凤凰国际创新园的神农广场上，9月23日就会迎来一场热闹的丰收节。一曲《大丰收礼赞》将以恢弘鼓声正式敲响丰收节的序幕。随后，现场奏唱《国歌》与大北农企业之歌《强农报国》，来自全国各地的农业代表、企业嘉宾与市民观众将共同见证

9月20日，在2025中国摩博会的璀璨舞台上，EJEAS爱骑仕以“无线电MESH对讲技术”引领行业革新，正式全球首发最新力作——X10幻影Plus摩托头盔对讲机。这一突破性产品不仅重新定义了专业摩托骑行通讯的技术标准，更以前沿科技与创新设计的精妙融合，瞬间成为全场瞩目的焦

9月19日-21日，2025中国数字音乐产业大会在厦门召开，19日，大会分论坛“数字音乐版权生态建设论坛”正式举行。本次分论坛由中国音数协数字音乐工作委员会、中国音数协数字音乐产业研究专家委员会主办，网易云音乐、国家版权创新发展基地(四川天府新区)联合协办，汇聚了

9月19日8点，iPhone 17系列新品全面开售。与往年新机发售不同的是，今年消费者的购机需求中，“快”成为了核心关键词之一。越来越多渴望尽早体验新机的用户，开始通过即时零售平台下单 iPhone 17 。《iPhone17首销调研》报告更是显示，33.96%的用户希望“越快越好，愿意

9 月 10 日，全球空间智能领导品牌 Aqara 今日正式发布智能隐形窗帘电机 C200。作为首款原生支持 Apple Home 的隐藏智能窗帘，不仅采用全嵌隐藏设计，C200 还可让用户可通过 iPhone、Apple Watch、HomePod 等设备无缝控制窗帘，尽享专属「果粉」的高阶智能生活体验。同

近日，高端母婴品牌BeBeBus母公司不同集团于9月15日至18日公开招股，预计9月23日正式上市。基石投资者包括波司登集团关联的信庭基金、百亿级私募机构上海通怡投资及来自新加坡的Great Praise Investment，总认购金额达1500万美元，市场认购反响热烈。从新锐品牌变成国内

在华为全联接大会2025(HUAWEI CONNECT 2025)上，华为宣布HarmonyOS 5终端设备数量已突破1700万台，鸿蒙生态全速进击发展，AI全场景体验全面升级，并正式启动“天工计划”，未来将投入10亿元人民币资金与资源，全面支持鸿蒙AI生态创新，携手开发者共同迈进鸿蒙AI新阶段。

日前，2025中国摩托车重庆论坛隆重举行，来自全国摩托车产业的领军企业、行业专家齐聚山城，共谋行业发展新路径。在备受关注的“新机遇、新模式”圆桌会议环节，九号公司中国经营事业部总裁何飞龙分享了九号公司在产品创新、前沿技术布局与用户体验升级方面的实践，并提

9月19日，第二十三届中国摩博会在重庆开幕，九号公司中国经营事业部总裁何飞龙携上市即爆款的智能电摩M5车型受邀参加展会。活动现场，何飞龙谈到，一辆真正优秀的电动摩托车需在智能、性能与体验三大维度实现统一，这正是定义“下一代智能电动摩托车”的核心标准。图：

在汽车消费市场持续迭代与变革的浪潮中，ZCAR竹子买车凭借其前瞻性的商业模式和极致的用户服务，自2014年成立以来，始终以“缩短人与汽车的距离”为使命，重新定义人与车的连接方式，成为汽车新零售赛道中一股不可忽视的创新力量。创新模式：打破传统，构建“汽车超级体

9月18日，在第十届华为全联接大会上，华为副董事长、轮值董事长徐直军表示，基于全球首个通算超节点TaiShan 950打造的GaussDB多写架构，无需改造，便可实现性能提升2.9倍，最终可平滑替代大型机、小型机上的传统数据库。“TaiShan 950加上分布式GaussDB将成为各类大型机

9月20日，Faraday Future(纳斯达克代码FFAI，简称FF)在洛杉矶总部召开919未来主义者日暨股民社区日，公司宣布战略投资纳斯达克上市公司QLGN公司4100万美元，公司创始人、联席CEO贾跃亭基石投资400万美元，与QLGN公司展开全面合作，全面聚焦Crypto“三驾马车”业务及Web3

9月20日，Faraday Future(纳斯达克代码FFAI，简称FF)在洛杉矶总部举行919未来主义者日暨股民社区日，宣布战略投资纳斯达克上市公司Qualigen Therapeutics, Inc.(NASDAQ: QLGN)进行战略投资并启动Crypto和Web3业务合作。QLGN盘后最高涨111%，股价从每股2.8美元涨至6美元

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.