从1956年的达特茅斯会议至今,AI已经走过了近70年的历程。这70年间,对于AI的期待有之,对于AI的恐慌有之,资本对于AI的追捧此起彼伏,技术人对于AI的探索应用也从未停歇。
千禧年时的我们,未曾畅想过移动互联网的繁盛,2022 年的我们,又该如何畅享未来 20 年的AI 发展进程?AI + 医疗会让我们活到 100 岁吗? AI 将如何让元宇宙变为现实? AI 可以帮人类找到幸福吗? AI 会加深偏见吗? AI 会抢走人类的工作吗? 传统企业是否能享受到 AI 红利?
5月8日晚,腾讯云TVP尖峰对话创新工场董事长兼首席执行官、创新工场人工智能工程院院长、《AI未来进行式》联合作者李开复,浙江大学教授、腾讯优图实验室高级顾问、杰出科学家沈春华,第四范式副总裁、腾讯云 TVP 郑曌担任主持,邀请了 50 位来自 AI 领域的 CTO 与技术专家参与论坛讨论,碰撞出关于 AI 的未来火花。
李开复:《AI 未来进行式》与技术发展的动向
《AI 未来进行式》的创作起源
《AI未来进行式》这本书的创作起源主要有两方面原因,首先我认为 AI 是一个特别重要的技术,每个人都应该去了解它能创造什么机会,和自己有什么关联。父母可以帮助孩子做学习规划,年轻人可以为自己做职业规划,然后也会看到未来AI可能带来很多新的工作机会,我希望用讲故事的方式,把这本聚焦 AI 技术的科普书籍写得让每一个人都能读懂,目前来看反响还是不错的,让很多完全不了解 AI 的人大概搞懂了 AI 是什么意思。
另一方面,我自己作为一个理工科出身的技术人,在本科、博士的时候研究的就是机器学习,我深深地感受到技术人普遍欠缺场景想象力,这也是为什么 AI 在语音识别、自然语言、计算机视觉这些领域做了近 40 年,却还在关注类似的问题。很多新的场景落地是需要更有想象力的,所以我也希望用跟科幻作家合作的方式,把故事描述清楚,让我们这些做技术的人可以看到未来 AI 可能的应用场景,带来的挑战,又将如何化解,给大家一些灵感与建议。
所以这次和科幻小说作者陈楸帆合作创作《AI 未来进行式》的两个重要的目的,一是把难的技术给所有的人讲懂;二是希望给一些技术很强,但是场景想象力不是那么强的理工人,或做 AI的技术人,也让他们对未来的这种愿景和未来的场景能有一些灵感和建议。
AI 领域的投资经历与 AI+ 云的模式分析
得益于很多投资的经历,我也在其中学会了一些跨领域的知识,我个人认为 AI 创造的最大价值,一定是和场景的结合。在相关投资经历中,可以总结出三个 AI 创业的发展阶段:第一个是在比较早期的阶段时,因为 AI 技术人员很厉害,选择了先创立公司,再做应用;第二类是在某些领域,AI 已经可以创造很大的价值,比如我们当时投的第四范式、创新奇智、极飞科技等等,都有非常强的商业应用和落地场景。它们先靠场景落地,之后再做平台。而今天 AI 已经进入了第三个阶段, AI 会和其他的科学交叉,也就是说 AI + Science,AI 可以被用在发明新药、基因编辑、新材料新能源等方向。《AI 未来进行式》这本书里包含了这三种方向,比如说在智能交通、无人驾驶就是一个重要的领域,比如说刚才说的 AI 制药,AI 在新能源方面的应用,这本书都会涉及,因为我们投资也要关注和了解这些产业领域,所以我们也尝试在书中描述出这些场景,而我们调研出的趋势则会给写作带来一些新的灵感。
创新工场投资的初创企业大多都会用到云,很多公司也有跟腾讯云在内的一些云厂商合作,在私有云领域尝试更快速地构建一个 AI 解决方案,这其实是跟云平台非常好的结合点。我们也投资了一些帮助云在算力方面加速的项目,当然包括 AI,也包括普通的 workload,我觉得这也代表了云的未来会快速提升。一个很有意思的现象是,中国的 AI 技术从创业公司、使用率、产生的价值等方面,并不输于美国。虽然美国的科研能力更强,但中国的落地成果也并不落后。在云计算领域,美国的领先优势比较大,但中国的成长空间很充足,美国的云计算虽然已经完成了部署,但到现在才开始把 AI 能力放进去,而中国的云计算已经在做 AI 的解决方案了,这是很有意思的现象。
在《AI 未来进行式》这本书里没有描述 AI+云,不是因为云计算不重要,恰恰是因为云太重要了,它已经成为了必须有的一个平台型的(技术服务),就像操作系统、数据库一样,已经不需要刻意去强调它的重要性。比如在无人驾驶领域中,我们假设的云和带宽都比现在大和快很多,包括 5G、6G 发展以后,对于云上数据调动的挑战,跟边缘计算的融合,这些在书中都有描绘。
NLP 技术的发展与应用
《AI未来进行式》书里有一个「双雀」的故事章节,在这个故事里,AI 成为了孩子成长的陪伴助手。在人类老师的主导下,AI 化身为一个长期陪伴的助教角色,将孩子的学习与兴趣相结合,变得更有效率与主动性。虽然在 AI 时代,我认为人类老师的教育工作 AI 是替代不了的,但是 AI 可以做很多有益的补充,因此在这样的场景下,NLP(自然语言处理) 的技术就是其中的关键点。
在我大二的时候,我刚开始接触的第一个 AI 技术就是NLP(自然语言处理)。与早期 NLP 的发展相比,最近几年很多技术正在发扬光大,深度学习是其中的一个重要核心。我们看到一个很大的突破就是自然语言处理的领域正在用自监督学习的技术去做海量数据的标注,这解决了一个巨大的瓶颈。从这个模型做出来以后,带来了包括 bert、transformer、GPT3、LaMDA 在内的诸多 NLP 领域的技术突破。
我认为 NLP 在未来三到五年应该会有非常多的发展,一方面是在过去已有的应用,比如语音识别、机器翻译等方向有更多突破;另一方面是在还没有发生的场景下得到很多尝试,比如语音对话型的终极搜索引擎等等。NLP未来的发展,既会把已有的应用从不可用变成可用,从可用变成好用,也会把过去不可能做的应用变成可能做,这是我们现在重大的投资方向,也非常看好这个领域。
沈春华:优图实验室与腾讯AI的产业布局
优图实验室的技术投入
优图是腾讯旗下最顶级的人工智能实验室之一,过去多年一直专注于计算机视觉领域的基础研究和落地的探索。优图的 AI 能力,比较具有代表性的有大家耳熟能详的微信刷脸支付、自动 AI 美颜等等消费互联网领域的应用; 同时,实验室在工业质检、金融、教育等产业领域也有非常广泛的落地。
因为腾讯是做消费互联网产品起家的,非常擅长洞察用户的需求,这种能力现在在产业互联网领域也正在进行验证。我个人理解 C to B 肯定是产业互联网非常重要的一环,这个可能也是腾讯独特的优势,因为腾讯长于通过连接器类型的产品如公众号、小程序、企业微信等等,帮助 B 端伙伴更好地服务下游的客户。
产业互联网向纵深发展的过程中,更多考验的是综合解决方案的能力,腾讯在这些垂直行业有很多年的深耕和非常多的技术落地的应用场景,在几个垂直领域也梳理出了一些标准化解决方案,可以得到快速的复制,这是腾讯做 AI 应用和其他公司比最大的优势。
腾讯如何用 AI 技术助力实体经济发展
一方面,云和 AI 的深度融合将语音识别、图像识别、NLP 等基础 AI 能力封装成了适用不同场景的 API 或工具性软件,让 AI 成为各行各业优化生产、提高效率的工具。比如在工业制造领域,腾讯工业云结合计算机视觉的经典技术,加上云端 GPU 强大的算力,可以为工厂提供超高准确度的基于 AI 的质检方案系统,将人工需要二十分钟才能完成的质检工作压缩到几秒钟,带来了质的飞跃,每年能节省数千万成本。
另一方面,云和 AI 的深度融合也将非常高深复杂的统计机器学习/深度学习的算法和理论,转化成了普通开发者也可以轻松调用的 API,极大降低了 AI 应用的门槛,让 AI 成为中小企业和普通开发者都可以轻松使用的工具,使得各行各业人才把AI带到更多的产业落地场景,从而产生更大的经济和社会价值。
腾讯通过腾讯云,为各行各业的行业伙伴和开发者提供了数百项 AI 原子能力,覆盖了机器视觉、NLP、模式识别等众多领域,打造了面向不同行业场景下的 AI 解决方案,让更多中小企业可以快速地部署、应用 AI,让 AI 产生价值,帮助产业进一步数字化发展和转型升级。
AI 的价值与技术的双刃剑
如何看待 AI 的社会价值与意义
李开复:在《AI 未来进行式》这本书里,我对 AI 的价值采取的是比较有建设性的思考态度。业界对 AI 的负面作用讨论已经比较多了,但我个人认为技术本身是中性的,对技术的应用正确与否才是造成不同影响的原因。我们可以看到,从长远来说 AI 肯定会持续创造巨大的经济价值,同时能够更精准、便宜、有效地把事情做好。
同时,AI 也是一把双刃剑,它可以帮我们省去很多重复性的任务和工作,但在这个过程中必然会有一部分人的工作岗位被 AI 所取代。但从正面的角度来看,当这些工作岗位的取代发生时,也必然会创造一些新的工作机会。我认为 20 年以后会达到一个非常美好的状态,这个状态就是人类会有更多的时间去做只有人类能做的事情,符合个人的兴趣和能力来做的事情,让每个人的工作更有趣更满意。
同时,伴随着 AI 和其他多种技术的成熟,未来我们有可能将生产的成本降到非常低的程度,这就可能有机会把贫穷和饥荒彻底消灭,这也是一个重大的人类历史里程碑。当然,达成这些目标还有很多挑战,但至少从技术层面来看是有机会的。
虽然目前 AI 的应用还有推荐算法的信息茧房效应、隐私保护等等问题,这都是 AI 技术应用后的一些普遍社会现象。不过我认为,一个新技术推出的时候一定会对社会产生冲击,但最后的解决方法都是技术人发明了新的技术来解决了这些负面影响,今天来听直播的这批人可能就是未来化解 AI 大部分问题的工作者。
沈春华:AI 理想国到底是什么样的,没有统一的答案,但我相信「科技向善」是其中的一种解读。AI 最大的价值就是服务于人,服务于社会。
一方面 AI 已经能够让社会更便捷,比如 Siri 语音助手、微信刷脸支付,现实生活中已经随处可见。另一方面 AI 也在攻克社会领域中一些以前解决不了的问题。优图之前利用 AI 技术协助寻人,帮助很多走失多年的儿童找到了自己的父母。去年,优图联合了国家天文台发布探星计划,利用优图的计算机视觉技术帮助中国天眼 FAST 大大提升了脉冲星的搜索效率,把以前一年甚至更长时间才能处理完的数据,现在用机器学习的技术可能几天就处理完了,这是几个数量级的提升,可以极大加速科学探索的效率。
另外,我自己刚刚开始接触一点 AI For Science 的研究,比如利用人工智能的算法,来做蛋白质序列的分析,据我所知优图实验室、以及浙江大学上海高等研究院等机构在这些方向上都取得了比较好的阶段性的成果,这都是非常好的例子,我相信我们会看到越来越多这样的例子。
AI 与医疗的美妙结合
李开复:我们认为从现在到未来的十年,甚至二十年间,医疗都会是一个非常好的投资领域。具体有几方面原因,一是传统的医疗行业现在正全方位数字化,包含医疗流程信息化、可穿戴设备记录全程健康数据、以及新技术产生海量生物学数据等带来的大量数据将成为 AI 的“养料”,产生有价值的算法,在疾病预警、诊断、治疗、监测、长期管理等方面辅助医生进行诊断和治疗。二是医疗不仅仅是海量数据的 practice 和 science,比如每种癌症样本可能很多医学院一年也没有太多,医疗的数据是用来教学的,我们的数据是用来教 AI 的,当教学数据只有很少样本的情况下,海量数据训练后的 AI 能力领先性就产生了。三是医学知识太多了,医生不可能做到全知全能,他看一个病人能够了解病人的背景和病例的时间也是有限的,看病的时间更是有限的。
因此,我认为 AI 在医疗行业的优化迭代,的确可以做得更好,但是还要综合考虑各种利益、道德、法律的问题,所以在落地实际诊断方面,还是会需要更多的磨合和训练。我认为在诊断方面更易被业界接受的是人机协作模式:以医生为主,他是 AI 的老板,AI 协助他做诊断,这样的话,在医生的基础之上,AI只会提高他正确诊断的概率。
从投资的角度看,我们认为其实在医疗行业,做新药研发是一个非常好的领域,这也与 AI 的目标高度一致。因为在这样的场景下,人的想法和 AI 的想法是一致的,都是如何用最低成本、最短时间研制一个最有效的新药,这样的方向上,做 AI 的技术人群与真正的业务方诉求都是一致的,可以用合力把事情做好。这方面我们也有一些投资的案例在跟。
最后我想讲的是,医疗行业背后有很多生物学、化学、制药等领域人员,他们处于电脑模拟之后、临床之前的实验室工作阶段,这其实也非常适合 AI 去做。它带来的价值不是取代了人力成本,更重要的是机器本身可以 24 小时不间断地做实验,研发的进程指数级提升。最终 AI 理想的效果是让新药研发更快,成本更低,让很多罕见病,不可医的并都变得可医,让人享受更长久的健康,这是我们可以期待的,也是 AI 能做出的最大且没有争议的贡献。
沈春华:过去这几年我在澳洲的大学工作的时候,也做了一些医学图像方面的研究。我非常赞同刚才开复老师提到的一点,就是对医学图像的从业者来说,AI 的目标,至少从现阶段来看,不能取代医生来看病。 所以我们应该去做工具,去帮助医生去看 X 光、CT 图像,更好更快地辅助医生做诊断。
AI 本身如果要彻底取代医生的话,我觉得还有很多的问题要解决。比如说现在的 Deep Learning 算法的可解释性。这个可解释性问题如果不解决的话,没有人敢直接拿 Deep model 预测出来的诊断给到病人,因为你都不知道算法的决定是怎么做出来的。
腾讯有一个医学图像的团队开发了一个系统叫做 “腾讯觅影”,这是个通过 AI 辅助诊断新冠肺炎的一个解决方案。这个系统利用患者的 CT 图像,可以在一分钟或者更短的时间里给医生提供一个辅助的诊断结果,从而帮助医生更准确地来判断患者肺炎的严重程度以及发展过程。
大家都知道一次胸部的 CT 扫面往往可以会产生几百张的影像,如果完全依靠人眼来看的话,要十几二十分钟,现在用 AI 的算法,可以把医生的检查效率提高一个数量级,这样可以让患者得到更及时的治疗。
所以我个人觉得, AI 是一个用来帮助医生做快速诊断,提升效率的助手,这可能是未来几年发展的一个方向。
如何做好科技向善,避免数据隐患双刃剑?
李开复:数据隐患的这些问题,已经造成了很多人对 AI 的认知是负面多于正面,这是一件很不幸的事情。正如前面所说,AI 确实带来了一些问题,但也会随着时间、新技术去化解,包括一些相关法律法规的健全和完善,Web 3.0 把数据还给个人等等方式。这些都是可以探索的方向,而且解决方案并没有我们想象的那么难。
比如隐私保护的问题,如何确保数据不被滥用,就涉及到很多隐私计算的算法,比如联邦学习。以联邦学习为代表的隐私算法,可以让我们鱼与熊掌兼得,既能把数据授权去做训练,又能确保对训练模型中的数据构成脱敏的作用,不至于产生隐私问题。
从大数据到推荐算法,这其中的确产生了很多不好的社会现象,这引出了 AI 领域一个很有趣的题目,我们如何能让一个目标函数去衡量一个相对长远、比较困难的事情。商业化落地的 AI 算法,最大化的是大公司的利益,但我们也应该考虑个人对 AI 千人千面的需求。有没有可能将个人的需求作为目标函数参考进来,去训练 AI 的模型,兼顾企业和个人的需求,这是非常值得去思考、突破的技术方向。
而另一点,偏见的问题其实主要来自于数据的不平衡,这些问题是做 AI 的技术人应该警惕的,我们做产品之前要确保数据有合理的覆盖度、平衡度,除了个人的观念,也需要有一些工具的提醒校正。这背后涉及到的可解释性相当困难,一方面我们可以做一些可解释的机器学习模型,另一方面可以试着对已有的标准模型做可解释,但不要对结果的精确性、细腻度过于吹毛求疵。
最后我想说的是,我们批评 AI 这么多,人难道就会做得更好吗?人会比 AI 更没有偏见吗?其实不然,以色列做过一个实验,法官在午餐之前做出的判决会比午餐之后更苛刻,代表他不爽了以后就不顾工作的公平了。人的偏见是很严重的,而且人会隐藏、拒绝承认自己的偏见。AI 是一个客观、公平、透明、基于数据的领域,所以我们有更大的希望把 AI 做成一个低偏见的决策者,远远比人的偏见来得低。我们不要因为外部的力量放大一些个别的案例,但其实我有信心在这四点上都能做的比现在好很多,而且跟人相比做得更好。
对技术人来说,怎么看待AI技术的两面性?
沈春华:Deepfake 这样的技术最早开源出来的时候,有些人用来它去替换、生成人脸图片。现在伪造出来的人脸图片越来越逼真,已经到了人眼都难以区分真假的地步。这确实会带来很多风险。这些伪造的图片、视频信息在网络上传播,会带来挑战。Deepfake 实际上是基于过去几年的 GAN 的技术。
据我所知,至少针对 GAN 生成的图像,即使人眼看不出真假的差别,但对于算法来说还是能够捕捉到细微的差别,因为生成的数据和真实的数据之间,它们的分布存在一个 domain gap。就是说你用大量的数据去训一个深度学习的判别真假图像的模型,目前是很容易判断这个图像到底是生成的,还是真实的。至少目前是这样。
如果说,我们哪一天发明了一个算法, 不管是基于什么样的生成模型,可以是 GAN,可以是别的生成模型,如果说它生成的合成数据,算法也分辨不出真假。那么对于深度学习的研究人员来说将是重大的好消息。为什么?因为我们现在训练深度学习模型,比如分类器做识别的模型,往往需要大量的人工标注的数据。如果说模型生成的合成数据和真实的数据之间已经没有domain gap,数据分布一模一样,那么我们就可以利用这样的技术去得到大量的训练数据,不需要去做人工标注了。这将极大降低数据成本。
TVP 大咖发问关于 AI 的那些事儿
传统企业如何使用AI技术,难点何在?
李开复:据我观察,国内很多传统企业数字化并没有做得很好,当开始使用 AI 的时候碰到的问题是需要海量的资源和时间先把数据整合好,然后才能进入到 AI 的落地环节。许多传统企业的企业家或是没有意识到这样的挑战,或是下面的数字化团队没有做好信息同步,最后发现做了很多努力 AI 还是不能起作用。其实数据的储存、整理、分析是最难的部分,一旦做好了,落地 AI 反而是相对较小的问题。
还有很多其他的挑战,比如每个行业需求都不一样,没法做到一个平台解决所有行业的问题。我们投资的很多公司目前都还是在做解决方案,从长期来说,我们当然是希望能解决一切问题,但这背后需要很多的时间和技术探索。整体来说,未来五年国内大部分的 AI 应用还是需要一个解决方案提供商,它可以是云,也可以是垂直的 AI 企业。同时我们仍旧需要继续探索如何能诞生一个更标准化的 AI 能力或者平台,可以覆盖大部分行业场景下的用户需求。
沈春华:对,我觉得这可以说是所有的云计算的提供商他们正在做的一个事情, 目的就是使应用 AI 技术的门槛大大的降低, 然后能够快速的去铺开,但是这还有很长的路要走。我相信随着技术的发展,我们有一天是会达到那一步的,这个过程可能会比较长。
AI 的理论是否遇到了实际应用的天花板?
李开复:我觉得其实在深度学习的平台上还有很大的机会,尤其是考虑到应用的场景的话,其实问题不是在我们没有发明足够多的好算法,而是我们没有能够想出方法把它更快引入应用,所以我觉得应用还有很大的红利空间。
也有人提出,深度学习本身是一个黑盒为主的技术方向,背后的理论基础不够强,希望能够推进,这是可以理解的。也有人提出一些想法,认为深度学习本身能不能像人一样做可解释化、可分析地发展,需要有办法把人脑、人的思维特点与深度学习相结合,产生 1+1>2 的发展,这也是一个方向。我觉得做理论的多参与 AI 是好事,但至少从应用的角度来说,我们现在并不是因为欠缺理论基础让我们碰到了应用的瓶颈。
沈春华:我补充一点。我一直在做计算机视觉相关的算法。我个人理解,不管是计算机视觉也好,还是 NLP 也好,在过去几年有人觉得深度学习的技术发展是不是到了一个瓶颈了,下面就很难发展了。但是,过去几年我们看到的是,突然一下子就又出来一个突破性的算法,带动整个领域的发展。这样的例子在过去几年非常多。这一次的人工智能发展起来到今天算的话可能也就 10 年时间, 如果从 2012 年 Hinton 的那篇 ImageNet 的图片分类的论文开始算,刚好 10 年时间。
你看它的发展过程就是从 AlexNet 开始,从各种各样的卷积神经网络到了一个瓶颈期, 大家都觉得是不是好像没得做了,发展到了一个瓶颈,突然 Transformer 被发明出来, Transformer 又大大地提升了很多任务上的性能。然后刚才提到的 GAN 技术, GAN 到现在也没几年时间。GAN这样的生成模型现在能达到的效果放在短短几年前也是很难想象的:生成模型怎么能得到这么漂亮的结果?
三年前 GPT3 技术被发明出来,GPT3 颠覆了过去几十年的 NLP 的研究成果。我个人觉得 AI远没有到天花板,或者是到瓶颈期这样的程度。AI 这个领域的发展非常快。
分享最后,本场主持人郑曌感慨良多,他表示李开复老师长期对AI领域的研究和探索给了我们非常多新鲜的观点和视角,沈春华老师作为AI领域的顶级学者,也带领我们领略到人工智能技术的深度魅力。
结语
通往未来的道路从来不是一片坦途,这要求创造未来的这批先驱能够坚定自己的信念,秉持科技向善的原则去应用并无好坏之分的技术本身。20年后的AI发展将是怎样的,本次讨论所勾勒出的仅仅只是冰山一角,还有更多的场景等待每个从业者去想象、去突破。
TVP 自成立之初,便希望能够“用科技影响世界”,让技术普惠大家,践行科技向善的初心与本心。未来的路上,愿我们一路携手并肩,共同前行。