2018年岁末,暨“法研杯”夺冠之后,国双数据科学团队又从专业赛场中摘得一项大奖归来——“AI Challenger 2018全球AI挑战赛”季军!若要了解这项荣誉的含金量,还得从比赛的背景说起。
国双获奖团队与创新工厂董事长李开复合影
什么是全球AI挑战赛?
“AI Challenger 全球AI挑战赛”是面向全球人工智能人才的开源数据集和编程竞赛平台,致力于满足AI人才成长对高质量丰富数据集的需求,推动AI在科研与商业领域结合来解决真实世界的问题,首届AI Challenger 全球AI挑战赛于2017年举办。
本届全球AI挑战赛由创新工场、搜狗、美团点评、美图公司联合主办,于2018年8月29日正式启动,吸引了来自全球超过10000支团队参赛。其中美团点评NLP(自然语言处理)中心提出的”细粒度用户情感分析”赛道最受欢迎,参赛队伍数量最多。值得一提的是,国双正是在此赛道中获得季军。
截至目前,AI Challenger平台用户超过30000名,覆盖国家增至81个,覆盖高校1100所,覆盖公司990家。2018年AI Challenger平台用户增长了170%。部分参赛名单可以了解一下:
经过层层筛选,最后共有40支队的83位参赛者进入 AI Challenger 2018 年度总决赛答辩。12月18-19日,经过两天总决赛答辩的激烈角逐,最终评选出冠亚季军与优秀奖。
为什么细粒度用户情感分析最受关注
本届大赛共分为观点型问题阅读理解、英中文本机器翻译等10个不同赛道,对应的10个数据集均为行业最大、其中5个为行业首创。那么,最受关注、参赛人数最多的赛道为何是细粒度用户评论情感分析?
众所周知,作为人类智慧结晶,自然语言处理是人工智能领域最为困难的问题之一,而这其中又以人类的情感为最,但也正因如此激起了无数人挑战高峰的探索精神。如何让机器通过网上评论分析用户情感?为此,本届大赛的主办方之一美团点评,提供了一个高质量海量数据集(即用户评论数据集),共包含6大类20个细粒度要素的情感倾向,助力参赛选手寻求更精准的算法预测用户情感。
这些数据集中的评价对象,按照粒度不同一般划分为两个层次:例如服务、位置、价格等为粗粒度评价对象;而服务人员态度、交通是否便利等则为细粒度情感对象。每一个细粒度又分为正向、中性、负向、未提及4种状态,参赛队伍通过对海量数据不断地重复训练、建模、打标签,最终找到最佳算法。尽管在参赛之前,国双一直有在自然语言处理领域进行相关研究,比如汽车、司法等垂直领域的经验就走在行业前列,司法领域更是在“法研杯”中夺得冠军,但如此次针对用户五花八门的评论进行研究还是第一次,很多事情都得从头开始研究,毕竟人类的语言表达能力还有想象力实在充满了无穷奥妙。不过,也正是因此才更加突显了获奖队伍的综合素质。在这次比赛中,国双团队短短时间内就完成了学习、消化、吸收、输出、优化并最终摘得大奖的全过程,其惊人的学习能力以及创新精神令人侧目。
国双参赛团队的获奖感言
这是一支低调到“令人发指”的团队!获奖这件事儿压根没想过宣传。不过,在之后的采访中又渐渐被他们的认真与执着打动,这就是一群专注于技术的年轻人啊!
听听他们怎么说:
首先获奖这件事,不到最后一刻谁也无法得知结果,所以更不能对别人说了。而且,因为加入得比较晚,前面初审时我们的成绩并不算太好,不太好意思说出来。至于得知获奖之后,只顾着自己高兴了,没有想到宣传这件事……
并且,比赛对我们来说收获最大的还是参与过程中自身的积累以及向对手学习的地方。在短短的时间内围绕一个主题迅速学习、操作再优化,可以说是最高效率的技术创新了。并且,这次参赛队伍非常多,都是来自国内外高等院校、科研院所、企业的专业人才,是一个非常好的了解行业水平的地方,我们也学到了很多知识,包括其他队伍的一些建模思路等,这些就是最大的收获。
走到总决赛时其实大家的差距都不是很大。我相信不仅是我们,所有的参赛队伍技术上都没有做到极致,只要还有时间,我们的技术就还有继续优化的地方。因此,我们也清楚地知道,总决赛并不是结束,只是一个开始。赛后我们的工作反而更多,需要花时间沉淀、吸收,继续优化,并扩展到应用场景,说到底这只是一次比赛,未来的旅途还长!
还有什么好说呢?为他们鼓掌吧!期待这群年轻人走得越来越远,国双发展得越来越好!