近期,据国外媒体报道,DeepSeek AI因其高效的训练效率而备受瞩目。与Open AI的ChatGPT及其他机器学习平台相比,DeepSeek AI在过去一周内人气急剧上升。
技术行业分析师Ben Thompson在其网站Stratechery上发布的报告中指出,DeepSeek AI的设计虽面临诸多限制,但这些限制却激发了机器学习计算能力上的创新。DeepSeek由一家位于中国的初创公司开发,而该公司因贸易禁运无法获取美国Nvidia公司生产的高质量半导体芯片。面对这一困境,DeepSeek的开发团队采用了多种人工智能优化技术,使得他们的机器学习平台在性价比上实现了显著提升。
据斯坦福大学2024年人工智能指数报告显示,DeepSeek的开发团队声称,其最新版本的AI训练成本仅为560万美元,相比之下,ChatGPT 4的训练成本高达7800万美元,而谷歌的Gemini Ultra更是达到了1.91亿美元。这一数据无疑彰显了DeepSeek在降低训练成本方面的显著成就。
华盛顿大学圣路易斯分校的科学家和消费者也将从这一成本降低中受益。计算机科学与工程助理教授乌马尔·伊克巴尔表示,他的实验室在使用这些平台时需要花费数万美元,而中国初创公司的竞争有望降低这一价格。
Stratechery的文章中提到,DeepSeek降低训练成本的一个关键方法是蒸馏。他们利用像ChatGPT这样的成熟生成式AI系统来“教导”自己的系统如何完成工作。McKelvey Engineering的博士生也尝试了这种方法来改进大型语言模型,且无需额外的训练。
“要让技术得到大规模采用,它们必须价格低廉。”伊克巴尔强调,“这表明使用模型可以变得非常便宜。”他还表示,这将使得他们能够进行更多大规模的实验。
然而,伊克巴尔也指出了DeepSeek等人工智能平台存在的潜在问题。他主要研究的课题是互联网安全和隐私,他警告说,运行这些模型需要访问大型硬件,而数据在传输到云端的人工智能机器上时,用户可能会失去对数据的控制。这是一个非常严重的问题。
伊克巴尔进一步指出,人工智能系统可以构建庞大的监控基础设施,其中一些已经以搜索引擎的形式存在,追踪来自整个网络的用户数据,以促进电子商务。所有这些数据都会被发送给不同的人工智能供应商,他们可以利用这些信息来分析用户、推断兴趣、监视甚至影响用户。
另一个令人担忧的趋势是人工智能语言模型越来越多地融入移动应用。例如,人工智能在规划假期方面的应用越来越广泛。当人工智能使用各种应用程序来完成这项任务时,如果存在恶意软件,它就有可能从用户那里收集更多的数据并操纵人工智能寻求的结果。
“当这些技术具有巨大潜力时,它们会发展得非常快。”伊克巴尔说,“你需要在设计中埋设护栏和保护措施。而当前的人工智能系统却没有做到这一点。”