在中国的人工智能领域,长久以来存在着一种现象,我们可以称之为“AI商业化焦虑与应用空白综合征”。每当有新的AI技术问世,总是伴随着一阵惊叹,诸如“AI将彻底改变生活”的言论不绝于耳。然而,当这股热潮逐渐退去,随之而来的往往是质疑声:这项技术能真正实现商业化吗?为什么我们还没有看到AI的超级应用?为什么AI似乎仍遥不可及?
AI仿佛总是在技术期待的巅峰与应用失落的低谷之间徘徊。大型模型是否真的只是雷声大雨点小,难以催生高增长、高商业价值的实际应用?
不过,近期国外一款应用的爆火为我们带来了新的启示。NotebookLM的核心团队宣布集体离职,计划打造新的大模型应用。这一消息之所以引起广泛关注,是因为NotebookLM本是今年欧美最引人注目的大模型应用之一,而它的出圈并非因为其作为AI笔记本的基础功能,而是一个附加的尝鲜功能——AI播客生成。
通过NotebookLM的成功,我们可以探讨AI与声音结合的商业潜力,以及如何打造出具有高增长潜力的AI应用。或许,越来越多的热门应用正在证明,所谓的“AI应用缺失症”并非不治之症。
NotebookLM原本是由谷歌一个小组开发的AIGC写作工具,在众多竞争对手中并不出众,多年来一直默默无闻。然而,最近添加的一项功能——播客生成,却让它迅速走红。这项功能允许用户上传文档、文本、网页以及YouTube视频,由AI生成音频播客。与其他音频功能不同的是,NotebookLM生成的播客不是简单的文本朗读,而是两个主持人的对谈形式。
这两个AI主持人会根据提供的素材进行分析、讨论,甚至相互调侃,还能发出笑声。例如,输入一本历史书籍,NotebookLM就能生成多集的历史解密类对谈播客。如果输入个人资料,它也能生成两位AI主持人对你进行夸赞的聊天内容,他们有理有据,一本正经地分析你的卓越之处。
这种新颖的内容生成模式激发了网友的创作和收听热情,玩法也越来越多样。有人甚至认为,这可能是第一款不是因模型能力,而是因应用体验获得认可的AI。
NotebookLM的背后是谷歌的Gemini 1.5 Pro大语言模型,它能够处理多达1500页的内容,支持超长上下文的多轮对话。而音频功能则基于谷歌的语音模型实现。NotebookLM是一个典型的AI原生应用,它基于多个大模型,利用了AIGC和多模态等AI机制,创造了传统移动应用无法实现的服务体验。
这表明,只要找准能力和市场,AI应用完全有可能吸引流量并实现商业化。
NotebookLM的成功之处在于其精准的市场切入点。在美国,播客市场需求庞大,甚至有望超越短视频。美国用户,尤其是年轻用户,普遍有收听播客的习惯,明星、运动员、脱口秀演员也经常通过录制播客来表达自己。在这样一个关注度高、需求量大的市场上,AI带来的两人对谈播客这种前所未有的应用体验,让NotebookLM在短短几个月内迅速出圈。
当然,如果仅关注AI播客生成本身,NotebookLM的意义可能会被大大低估。首先,播客市场在国内远不如欧美火爆;其次,AI播客生成的商业化潜力有限。但NotebookLM所代表的AI音频赛道具有更广阔的商业化空间,至少能缓解AI行业的商业焦虑。大量冗长的内容可以通过转换为音频的方式提高触达效率。例如,谷歌广告团队正在研究基于NotebookLM的生成能力来打造销售问答,以培训新人。原本厚重的资料可以被模拟成销售人员与顾客之间的对话,新入职的销售可以直接学习如何与顾客交流。
类似的应用还有很多,如产品说明书的音频版、在线教育的问答机制等。我们经常面临资料过多、过长不看的困境,而现在或许可以向AI寻求帮助。
NotebookLM还可以与机器视觉结合,比如健身教练的工作主要是观察训练者并指导动作,回答训练者的问题。如果NotebookLM具备视觉能力,或许AI播客可以变成AI私教。
这些探索证明,一个成功的AI应用往往具有连锁反应。它不仅能在本领域获得用户的追捧,还具有持续扩散商业影响力的潜力。即使你对AI播客不感兴趣,对AI音频赛道毫无了解,NotebookLM也展示了优秀AI应用的核心要素:输入简单,输出惊喜,贴近用户。
如今,大模型已经能够完成许多前所未有的任务,但总是难以出现引发广泛讨论和传播的爆款应用。NotebookLM的火爆告诉我们,其中一个重要原因是产品设计的缺失。与其他AI应用相比,NotebookLM在产品层面有一个显著特点,即整体UI设计简洁明了。AI播客生成只是NotebookLM的一部分功能,用户打开门槛较高。因此,项目团队简化了整体UI设计,如一键上传源文档,支持多种文件源和格式。这种友好的用户界面设计降低了创新型AI应用的使用门槛,避免了因繁琐操作而劝退用户。
与输入端尽量简化形成鲜明对比的是,NotebookLM在输出端提供了非常完整且复杂的内容。虽然用AI生成播客已不再新鲜,但NotebookLM能生成两人对谈播客,且对谈内容有语气、有节奏,甚至富有幽默感。这种惊喜感和意想不到与极简的输入形成了对比,成为产品出圈的动力。
NotebookLM成功的另一个关键因素是它找到了在欧美具有市场号召力的播客领域。正是因为播客本身有市场需求且受关注程度高,NotebookLM带来的AI惊喜感才能顺利激活用户认同。NotebookLM再次证明,贴近更能接受AI的年轻人市场,尤其是他们的生活、娱乐和消费模式,是AI应用成功的关键。
一款成功的AI应用需要具备三个要素:极简的用户界面与生成规则、具有惊喜感与震撼力的AIGC效果、贴近用户注意力尤其是年轻人注意力的市场定位。从大模型的能力出发,找到这三个条件,就能大致勾勒出AI应用的轮廓。
所谓“AI应用缺失症”,从积极的角度看,实际上是众多具体的机会所在。