百度港股上市仪式上,有三位比较特殊的敲锣人。
一位是郭梅,34岁,一位7岁孩子的母亲,她此前曾在煤矿企业做了8年的监控员,为了女儿获得更好的教育,举家来到家乡200多公里外的陌生城市太原,一个偶然的机会,她在招聘网站了解到“数据标准”这个行业,经过学习和培训,成为了百度(山西)人工智能基础数据产业基地的一名“AI数据标注师”。
另外一位是雷建伟,曾是一名武警,在服役期间担任驾驶员职务,曾执行多次长途押解任务。目前他退伍五年,也曾在退伍之后陷入职业规划的迷茫,2019年他在报纸上看到云图科技在招聘自动驾驶安全员,通过了重重考试,在当年年底参加了入职培训,现在成为了一名合格的“5G云代驾”安全员。
最后一位是郭佳慧,她是一名普通的12岁初中女生,不会写代码,但在理工男爸爸的教育下,关注上了百度EasyDL平台推出了免费的直播课,后来她在疫情期间发现公共场合检测佩戴口罩的工作既辛苦、效率又低,所以通过EasyDL平台指引,根据平台提供的算法模型,开发出了检测口罩佩戴的AI程序,成为了年龄最小的百度飞浆开发者。
这三位敲锣人都是在百度AI开放生态战略下诞生的“新职人”,也代表了百度AI生态能力的覆盖范围。
3月23日上午9时30分,百度A类普通股正式在港交所挂牌交易,此前百度宣布面向全球发售9500万股A类普通股,以每股不超过295港元的价格,最高募集约318亿港元。这也使其成为继阿里巴巴、京东和网易等互联网公司之后,又一家赴港二次上市的重量级中概股,也是真正意义上的国内“AI第一股”。
2020到2021年的百度重获聚光灯——从官宣造车,再到芯片部门独立融资,最后突破千亿美元,随后传出赴港上市……这一系列的动作也让曾经被认为早已淡出BAT的百度,收获了全新的面貌。
百度在招股书中也特别提到了此次募集到资金用途中针对AI人才的一项:持续科技投资,推动AI业务商业化,包括吸引及留用人才,特別是人工智能与软件工程师、数据科学家和其他研发人员,以改善我们的AI的能力。
这正是人们心中百度的两极——一个是市场舆论和分析师心中的百度,过去的“搜索”和“广告”给百度定了性,品牌一度蒙尘,人们也热衷讨论于此;而如今再次赢得资本市场的认可,是因为AI业务的持续关注起到了关键作用。另一个是技术世界里的百度,百度拥有几乎是中国乃至世界最懂技术的管理层,它才能更早地抓住AI人才的“抢人大战”,建立人才体系,在AI领域创造了大量的技术、人才和岗位,随着科技的迅速发展也创造了大量的新兴职业,影响着人们的生活,不知不觉中人们也被卷入到了全新的人工智能时代中。
技术百度
百度的AI是从哪来的?长期关注百度的人应该并不陌生,时间点是在十年之前。
2010年起百度开始投资AI,当时移动互联网方兴未艾,对于人工智能更是懵懂,百度投资AI的目的也主要是为了提升搜索能力,百度在当年成立了“自然语言处理部门”,在语言文字之上又相继拓展了语音和图片技术,在进行了相关研究之后,定下了在知识图谱技术上长期投入的战略。
2013年,百度深度学习研究院(IDL)成立, 百度是中国互联网企业中第一个把Deep Learning(深度学习)提到核心技术创新地位的企业。在李彦宏的眼中,百度IDL的目标是成为“AT&T-Bell labs,Xerox PARC这样的一流的研究机构”。如果把这些宏大的目标放在当下,多少也算得上是投身科学技术的“硬核创新”。
不过在宣布投资AI的当时,百度的业务并非是一帆风顺,尤其是在用户的感知层面不高,后来百度也将技术下放到广告盈利这方面,在市场上也遭到了一些质疑和挑战。
接下来的几年,百度在技术上小心探路,在视觉以及语音等技术上不断积累形成强大的知识图谱。随后百度大脑正式面世,同时百度宣布开放战略。
2017年,基于百度大脑等底层技术的支撑,百度开始向更上层的应用面开发。在百度大脑以及强大的知识图谱等基础上,百度相继推出语音交互系统DuerOS和智能驾驶开放平台Apollo,同时,百度也借此也形成了AI的整体战略。
彼时的移动互联网21世纪初开始萌芽,2013年已经进入全面的发展阶段。对于技术执着的百度,在当时也被认为完全错过了移动互联网的红利时期,而且当时的百度的技术创新也只是在一些AI的微应用,后续的DuerOS与Apollo在当时也没有呈现出清晰的落地场景和商业化路径——人们还是觉得AI太远,嘘声和泡沫比赞扬率先到来,并没有太多人认同百度在技术上的“长期价值”。
不过这并没有影响百度对于技术的研判。
从百度的公司历史来看,它更擅长捕捉一些更高门槛的技术革新带来的商业机会,反而在模式创新加资本运作的移动互联网时代错失了另外一些机会。但这某种程度反而体现出这家公司的“技术基因”。
Google 1998年在美国成立,百度则是由李彦宏在2000年创立于中关村。虽然在时间上百度公司是后来者,但搜索技术的核心——超链分析——发明者其实是李彦宏。1997年2月李彦宏提交了超链分析的专利申请,当时李彦宏所在的公司已被道琼斯公司收购。所以,这份专利所有人是李彦宏当时所在的道琼斯公司,发明人是李彦宏本人。1998年4月李彦宏赴澳大利亚演讲搜索前瞻技术,其中听众席上就有Google的佩奇和布林。1998年10月Google上线,同年申请了PageRank的专利,但由于Pagerank与李彦宏之前申请的超链分析专利具有相似性,美国专利商标局2001年9月才获准了PageRank专利申请——这也证明了李彦宏的百度对于技术嗅觉确实灵敏。
(2018年11月,百度研究院核心科学家齐亮相)
虽然当时语音交互和自动驾驶不完全被认可,百度仍在加强技术投入。在百度公布的最新的年报数据中,核心研发费用占收入的比例数据达到了21.4%。
有人做过统计:2011年到2020年前三季度近十年间研发支出统计表中,百度的研发投入强度则分别是:9.2%、10.33%、12.86%、14.23%、15.33%、14.39%、15.24%、15.42%、17.08%、18.02%。
同一时期,Google的研发投入强度则分别是:13.62%、13.54%、13.29%、14.9%、16.38%、15.45%、15%、15.65%、16.07%、16.36%。
十年之间,百度已经对AI全产业链进行了全面布局,涉及深度学习框架、AI芯片、AI应用、智能云、自动驾驶、小度AI助手等多条业务线。据资料显示,百度在AI技术研发上的投入早已超过1000亿元。
可以说,百度确实错过了一些风口,但对于技术的长期执着算是中国公司中比较特立独行的一个。
2020年四季度报中,百度核心非广告收入同比增长52%,表明百度在技术创新上的定力已显成效。这也终于让市场重估技术的价值,也一定程度上抹去了人们对于那个时代的百度的看法。百度也因此重获千亿美元估值——只不过,百度进行的是一次长达十年的技术长征。
军校百度
深耕AI 10年的百度自然已成了世界一流的AI公司。数据显示,截至2020年10月30日,百度持有AI专利2682项,是中国拥有最多AI专利数量以及AI专利申请数量的公司,同时也入围全球AI公司TOP 5。
而根据斯坦福大学的统计,全球期刊来自中国研究者的AI论文引用数量,在2020年首次超越美国。一段时间内,AI也变成了国与国之间的战斗。
百度对于技术长达十年的投入,不光只是付诸于金钱。人才招揽和培养体系建设,也构成了百度AI的另外一个侧面。
始于2005年的“百度之星”技术大赛,其实就是对于技术长期主义的一种存在。百度之星举办之初,目的在于加深百度公司与技术人才的联系,储备百度的搜索技术人才库,打造一个技术人员竞技、交流的平台,更早的时间,其实是面向高校学生的计算机编程爱好者,而现在也转换为充分挖掘中国AI人才的程序设计大赛。
16年来,百度之星累计参赛选手接近30万,一度成为了国内程序员的 “造星工厂”,在这个大赛上,也涌现了一批业内大牛。
人工智能技术的投入期,百度一开始从美国招揽华人AI人才回国,百度的策略是建立底层的架构平台,比如现在的飞桨基于百度自己的深度学习技术研究和业务应用,提供开发便捷的产业级核心框架,并能支持超大规模深度学习模型训练,有多端多平台部署的高性能推理引擎和覆盖多领域的工业级模型库。但要做到让人工智能人人可得人人可用,更需要得是更多的更上层应用的开发人才。
在AI发展的前期,企业的AI人才都是去高校挖教授和研究员,美国的大公司的顶尖人才基本来自于此。但问题是当时的中国并没有相关的AI人才,于是百度就去美国挖人回国。
2013年,百度就花了数千万挖来数据挖掘、自然语言处理、深度学习领域的十来位大牛,包括一些学者和教授。可以说国内的第一批AI人才,是百度找回来的。
聚是一团火,散是满天星。
2012年加入百度的余凯,此前曾在美国NEC研究院担任部门主管,2013年在余凯的主导下,百度首个研究院百度深度学习研究院成立,而在他的直接影响下,也延揽了Andrew Ng等一批世界顶尖技术专家相继加入百度等中国互联网公司。2015年余凯离开百度,成立地平线机器人科技,如今生产出负责智能驾驶使用的芯片,甚至地平线也被称为“中国的mobileye”。
这个名单上有更多的名字。有媒体统计过,百度曾经大力发展的自动驾驶,带动起了国内整体自动驾驶创业项目的发展。目前百度系几乎占据了整个国内自动驾驶创业领域,有王劲创办的景驰、楼天成创办的小马智行(Pony.ai)、佟显乔创办的行星科技(Roadstar.ai)、张哲创办的Drive.ai、杨文利创办的领俊科技、鲍君威创办的Innovation、吴夏青创办的DeepMap.ai、倪凯创办的HoloMatic。
除此外,在人工智能的各个领域,都有百度系的身影。
百度CTO王海峰在2020年的一封内部信上提到:新基建下,中国AI人才缺口巨大。据测算,到2025年中国AI人才缺口将达到1000万。
去年6月19日,百度宣布未来5年预计培养AI人才500万,为中国智能经济和智能社会的发展提供AI人才保障。截止目前,百度已经培养AI人才超过100万。
而如今百度通过开展中国高校计算机大赛人工智能创意赛、在全国开展深度学习师资培训班,参与编撰《深度学习导论与应用实践》等人工智能教材,上线多门基于飞桨的免费精品课、成立黄埔学院的等等举措促进AI人才培养。
2019中国高校计算机大赛人工智能创意赛中,来自云南师范大学的徐国秦同学为了帮助云南的三七种植户解决病虫害初期难以被发现的问题,它拍摄了1000多张早期病虫害的照片,并联合农业专家对图片进行数据标注。然后他通过百度飞桨的一站式训练和服务平台EasyDL定制化图像识别中的物体检测模型,帮助三七种植户开发了简易的AI病虫害检测平台,模型精确率达到了90%以上。
很多企业都迫不及待地想要招揽AI人才,但百度也把人才体系培养放在了更重要的问题。可以说这方面,百度已经建立出了一套联合社会/学校和产业的人才协同生态。
撑起新百度
百度2020年第四季度及全年未经审计的财务报告显示,第四季度非广告收入42亿元,同比增长52%,以智能云、智能驾驶及其他前沿业务为代表的AI新业务已成为拉动百度中长期增长的新引擎。
百度的高成长性来自于对于技术的前期投入,目前已经到了收获期。以移动生态为主的成熟广告业务、快速发展的智能云新兴业务和自动驾驶等引领行业的前沿业务等三个引擎,被认为是重新审视百度的新视角。
而就在此前,高盛、瑞银等分析机构也修正了百度的估值模型,将百度业务分为成熟业务、成长业务和前沿业务,针对不同的业务采用了不同的估值方法,开始为百度智能云、Apollo等AI业务进行独立估值。
这些引擎其实都与百度布局的AI技术有关。比如百度旗下的Apollo业务被认为要对标Google旗下Waymo业务,Waymo的估值是300亿美元。
百度培养的人才和百度构建的国内为数不多的全栈AI技术协同也是被考虑的因素之一。这些“业务”并不能被计算为财报里的估值数据,同时,人工智能的背后也对应着数据、算法和算力的较量。
同时,百度AI也在吸纳更更年轻力量加入,12岁的敲锣人郭佳慧便是其中之一。郭佳慧开发的程序发布到百度AI市场后,已经吸引了3000多次的调用。原本打算长大当老师的她,现在成了彻底的AI迷,“长大了要做人工智能,要考上人大的人工智能专业”。
十年的技术百度,百度种下了种子,浇上了水,小树苗咿呀摇曳,人们终见森林。