伴随着海量数据的冲击,数据处理分析能力在业务中的价值与日俱增,各行各业对于数据处理时效性的探索也在不断深入,作为主打实时计算的计算引擎 - Apache Flink 应运而生。
为给行业带来更多实时计算赋能实践的思路,鼓励广大热爱技术的开发者加深对 Flink 的掌握,Apache Flink 社区联手阿里云、英特尔、阿里巴巴人工智能治理与可持续发展实验室 (AAIG)、Occlum 联合举办 "第三届 Apache Flink 极客挑战赛暨 AAIG CUP" 活动,即日起正式启动。
划重点:作为全球首个基于推荐系统的流量攻击实时检测比赛,我们首次公开了 100 万流量作弊识别真实数据集!并应用 Intel SGX 加密技术保障风控模型数据安全。
过去两年,阿里云和英特尔、Apache Flink 社区联合举办了第一届和第二届 Flink 极客挑战赛,运用 Flink,Analytics Zoo,Proxima 等平台和技术,引导选手在垃圾分类,实时疫情追踪等热点民生问题上进行了思考和创新;阿里巴巴人工智能治理与可持续发展实验室 (AAIG) 主办了七期安全 AI 挑战者计划,如人脸识别对抗赛、辱骂文本对抗赛、防御模型白盒以及无限制对抗赛等,勇闯 AI 对抗无人区,并发起 AI 治理多学科交叉结合的新项目 AAIG-CUP。
今年的第三届 Flink 极客挑战大赛暨 AAIG CUP,利用了第三代英特尔®至強®可扩展处理器的 Intel® SGX 技术,引导选手在隐私保护的机器学习方面进行探索和开发。本届比赛将继续面向全社会开放,个人、高等院校、科研单位、企业、创客团队等人员均可报名参赛。
赛题背景
随着互联网的发展,网购成为越来越多人的选择,据阿里巴巴财报显示,2020 财年阿里巴巴网站成交总额突破一万亿美元,全球年度活跃消费者达 9.60 亿。
为了满足不同用户的个性化需求,电商平台会根据用户的兴趣爱好推荐合适的商品,从而实现商品排序的千人千面需求。为了获取更多的平台流量曝光,将自己的商品展现在更多的消费者面前,部分商家通过 HACK 平台的推荐机制从而增加商品的曝光机会。其中一种典型的手法为 "抱大腿" 攻击,该方法通过雇佣一批恶意用户协同点击目标商品和爆款商品,从而建立目标商品与爆款商品之间的关联关系,提升目标商品与爆款商品之间的 I2I 关联分。
商家通过这种方式诱导用户以爆款的心理预期购买名不符实的商品,不仅损害了消费者的利益,降低其购物体验,还影响了平台和其他商家的信誉,严重扰乱了平台的公平性。实时拦截此类行为,有助于在保证推荐的时效性的同时,保护实时推荐系统不受恶意攻击影响。
如何准确、高效地识别这类型的恶意流量攻击,实时过滤恶意的点击数据是推荐系统中迫切需要解决的问题。
除此之外,此类实时风控系统对数据安全的要求较高。如果系统的拦截算法意外泄漏,HACK 平台将得以针对性地加强恶意流量的伪装能力,增大平台监控恶意流量的难度。因此,此类系统有必要部署在加密的可信环境中。
本赛题要求选手基于 Flink,Analytics Zoo/BigDL 等组件,在 Occlum 环境中搭建保护数据安全的 PPML (Privacy Preserving Machine Learning) 应用,实现对恶意流量的实时识别。
赛程安排
本次大赛分为初赛、复赛和决赛三个阶段,时间安排如下:
初赛阶段
参赛队伍将采用 docker 镜像的提交方式,由选手提交打包好的代码镜像来运行得出搭建结果;参赛队伍通过天池平台下载小型训练集和测试集,用于本地训练和调试算法;最终完成的代码镜像提交到天池平台后,由评测系统在完整数据集上训练与预测。
复赛阶段
进入复赛后,将会进一步要求选手在半监督数据集上训练深度学习模型,同时鼓励选手在工程上做一些优化与创新。
决赛阶段
最终的决赛将以答辩会的形式进行,晋级决赛团队需提前按照要求准备答辩 PPT,而在场评委将根据选手的技术思路、理论深度现场表现进行综合评分。
活动激励
据悉,本次大赛最终将产生:
· 冠军队伍 1 支,奖金 10 万人民币;
· 亚军队伍 2 支,奖金各 5 万人民币;
· 季军队伍 3 支,奖金各 2 万人民币;
· 优胜奖队伍 4 支,奖金 1 万人民币。
同时,本次大赛在报名阶段还将延续上一届的 "鼓励师计划" 玩法,成功邀请小伙伴参赛即可成为鼓励师赢取丰厚的礼品!
彩蛋:本次比赛颁奖典礼预计将于 12 月 Flink Forward Asia 2021 (近期正式上线) 主论坛举办,活动信息获取欢迎关注 “Flink 中文社区” 公众号,更多参赛秘籍等你 Get~!
点击赛事官网链接了解更多信息:
https://tianchi.aliyun.com/specials/promotion/3rdapacheflinkperformancechallenge?spm=5176.12281976.0.0.88df7671uAVYfB?utm_content=g_1000289892