ITBear旗下自媒体矩阵:

微软AI负责人苏莱曼:信息处理、长期记忆、三方交互是AI的三个阶段

   时间:2024-10-18 17:17:29 来源:ITBEAR编辑:茹茹 发表评论无障碍通道
留胡子的男人

描述已自动生成

图注:微软AI CEO穆斯塔法·苏莱曼

2024年诺贝尔奖的各个奖项已经全部揭晓,令人瞩目的是,诺贝尔物理学奖与化学奖双双花落AI领域。AI技术及其应用成为今年诺奖最大的亮点。诺奖对AI相关成果及科学家的高度认可,不但有力地推动了AI技术的进一步发展和跨学科研究的深化,也预示着AI将以更快的速度推动人类社会的经济增长和高质量发展。

AI的发展速度惊人,这在人类历史上尚属首次——机器学会了运用我们的语言。但AI所提供的信息能否符合人类的认知需求和价值判断?AI能否真正理解语言背后的情感内涵?在AI与人类深度交互的背景下,如何确保数据和隐私安全?从长远来看,哪些挑战可能成为制约AI持续发展的根本性因素?

在直面这些难题的同时,苏莱曼先生对如何最大限度利用技术满足用户需求给出了一个清晰的路线图。他探讨了人工智能的发展、伦理问题以及未来的技术前景。这正是本次苏莱曼先生采访带来的启示。

张祺博士

微软全球资深副总裁

微软AI亚太区总裁

穆斯塔法·苏莱曼与WIRED的资深记者Will Knight近期的深度访谈:

观点导读

Copilot 愿景:

我们的目标是创造一种伙伴间的持续互动体验。这不仅仅关乎技术,更在于提供情感支持。这正是科技时代的迷人之处——和真正理解你的AI伙伴互动。它会引导、鼓励、支持并教导你,让你不再觉得是在与一台机器交流。

AI 智能体的三个阶段:

信息处理阶段:AI处理你所处理的相同信息——看到你所看到的,听到你所听到的,阅读你所阅读的文本。

长期记忆阶段:AI拥有长期、持久的记忆,随着时间的推移建立起共同的理解。

交互阶段:AI通过发送指令和采取行动与第三方交互——购买物品、预订服务、规划日程。

与OpenAI的关系:

我们对OpenAI的模型进行了微调,使其不仅专注于数学和科学问题解决,还能进行并列比较和消费者分析。当你遇到难题或想要推理某件事情时,它能够进行并列比较或大规模分析。

AI的挑战:

挑战在于如何打造可信赖的技术,使其感觉像一个非常亲密和个性化的体验。建立信任体验的基础后,我们可以深入到更复杂的方面,例如代表你购买东西、进行谈判、签订合同或规划日程。

完整访谈

主持人: Copilot的愿景是什么?

穆斯塔法·苏莱曼: 我们正处于一个惊人的转型点。AI伙伴现在能够看到我们所见,听到我们所听,并使用我们沟通的同一种语言。这种新的设计理念关注的是持久性、关系和情感。我们正在打造一种体验,是关于与伙伴进行持久、持续互动。

主持人: 你从Inflection AI加入微软,该公司专注于构建支持性和同理心的AI。听起来你在新的雇主这里也保持了这种理念。

穆斯塔法·苏莱曼: 我一直相信AI具备提供支持的潜力。情感支持实际上是我19岁时参与的第一个项目,那时我启动了一项电话咨询服务。这正是这个技术时代的美妙之处——与一个真正了解你的AI伙伴互动。它会指导你、鼓励你、支持你、教导你。我认为这将不再让人感觉像是在跟一台计算机互动。

主持人: Copilot Vision是什么?这个“labs”功能将让Pro用户尝试到什么?

穆斯塔法·苏莱曼: Copilot Vision让你能够说“那边的东西是什么(在你的屏幕上)?”或“等一下,那是什么?你觉得那个怎么样?”在你坐在电脑前时,会有很多这样的小瞬间。这个AI伙伴可以看到你所见,并实时与你讨论你正在看的内容,这是非常了不起的。它在某种程度上改变了你在数字生活中的体验,因为你不必再费力键入内容。

主持人: 这听起来像是Recall,那项有争议的、现在需要选择的Windows功能,用于记录用户屏幕上的内容。

穆斯塔法·苏莱曼: 保护用户的隐私是至关重要的。目前我们不会用Copilot Vision保存任何内容,因此一旦会话结束后关闭浏览器,所有内容都会消失,完全删除。但我在思考是否以及如何在未来引入这一功能,因为很多人确实希望有这样的体验。如果你可以说,“我前几天在网上看到的那张图片是什么?那个表情包是什么?”我想我们总有一天得研究这个问题。不过目前,Copilot Vision工具是这样的。我们需要随着时间进行实验,看看如何在这方面做更有意义的事情。

主持人: 你们还推出了Think Deeper,这将使Copilot能够处理更复杂的问题。这是基于OpenAI的o1模型,也就是Strawberry,对吗?

穆斯塔法·苏莱曼: 是的,类似于Strawberry。我们对OpenAI的模型进行了调整,为了更符合消费者的需求,我们让它以一种更符合AI伙伴主题的方式运行。

主持人: 有什么区别?

穆斯塔法·苏莱曼: OpenAI的模型更专注于纯数学和科学问题的解决。我们试图让它专注于并列比较和消费者分析等内容。当你在解决一个难题时卡住了,想要推理时,它可以真正列出一个并列比较,或者进行大规模分析。

主持人: 微软的人们已经在使用这个新版本的Copilot了吗?

穆斯塔法·苏莱曼: 是的,大家都在使用。我们几天前刚在公司内部全面上线。所以每个人都在使用,并且提供大量反馈。我们的反馈渠道非常繁忙,这很有趣。

主持人: 人们会记得Clippy,微软最后一个Windows AI助手。那里的员工有看到相似之处吗?

穆斯塔法·苏莱曼: 我前几天见到了比尔·盖茨,他说,你知道吗,你给整个AI的命名搞错了?应该叫Clippy。这确实显示了盖茨这样的人的前瞻性。他们不仅能预见未来两年,还能预见未来二十年。

主持人: 新功能是否是朝着所谓的AI伙伴迈进了一步,AI伙伴可以在电脑上帮你处理有用的琐事吗?

穆斯塔法·苏莱曼: 是的,绝对是。

第一阶段是AI处理与用户相同的信息——看到用户所见、听到用户所听、阅读用户阅读的文本。第二阶段是AI具备长期、持续的记忆,随着时间的推移建立起共同理解。第三阶段是AI通过发送指令和采取行动与第三方互动——比如购买东西、预订东西、规划日程。我们正在研发实验模式中的这两个功能。

主持人: 你们有一个可以为你去购买东西的Windows人工智能代理吗?

穆斯塔法·苏莱曼: 还有一段路要走,但没错,我们已经完成了闭环,实现了交易。这项技术的问题是,你可以让它在50%、60%的情况下运行,但要达到90%的可靠性还需要付出很多努力。我已经看到了一些令人惊艳的演示,它可以独立完成购买等操作。但我也见过一些出状况的时候,技术不知所措,无法正确应对。

主持人: 能多告诉我一点所谓“出状况”的事吗?它是否用盖茨的信用卡去买了辆兰博基尼?

穆斯塔法·苏莱曼: 如果它用的是盖茨的信用卡,那就好笑了。但不,如我所说我们还在一步步摸索。这项技术仍然处于实验室阶段。还有很长的路要走,但我想进展可以按季度来计算,而不是按年。

主持人: 在实现你所描述的人工智能未来的过程中,你面临的最大挑战是什么?

穆斯塔法·苏莱曼: 这里的关键在于如何打造一种值得信任的技术,因为这将是一种非常亲密和个人化的体验。我们必须做好安全和隐私的部分。我认为真正的挑战在于如何设计对话,使AI伙伴能够明确地表达边界,能够说出“这是我不准备参与的事情”。

如果我们能做到这一点,那就是建立信任体验的基础,然后我们就可以进一步推动更复杂的方面,例如让它代表你购买东西、代表你谈判、代表你签订合同,或者为你规划一个周六下午涉及三四个不同站点的行程。你会说:“我相信你,Copilot,你能搞定,对吗?”这正是我们努力的方向。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version