随着2025年的到来,AI技术已深入社会各个层面,引领着前所未有的变革。在这场技术浪潮中,DeepSeek作为一颗耀眼的新星,不仅唤醒了国人对AI的重新认识,更如同一条鲇鱼,激活了国内科技企业的创新活力。在AI技术突破与产业智能化转型的交汇点上,DeepSeek正以其独特的创新力和实践成果,向世界展示中国AI领域的加速度。
近日,由腾讯云TVP主办的“TVP AI创变研讨会——DeepSeek探技术创新与未来风向”在上海成功举办。此次活动汇聚了NLP、知识图谱、AIOps、AI办公应用等领域的顶尖学者和企业高管,通过主题演讲和模拟路演,共同探讨DeepSeek等生成式AI技术的落地应用与未来发展趋势。
活动由vivo高级专家、腾讯云TVP邵浩主持。他介绍,DeepSeek在过去三个月内以惊人的速度发展,代码提交增速达到每周240%,吸引了众多企业接入,其技术迭代正迅速转化为生产力提升。邵浩表示,此次研讨会旨在汇聚各方智慧,探讨DeepSeek在AGI技术突破与产业智能化转型中的落地场景,以及AI浪潮对行业的长远影响。
腾讯云TVP王文广发表了题为《DeepSeek开始的中国式全球化机遇》的演讲。他指出,DeepSeek通过算法、模型架构、数据和计算机工程的垂直整合创新,验证了“极致优化现有技术链”的可行路径。其开源策略不仅打破了技术黑箱,还推动了全球生态的建立,使国产大模型跻身全球顶尖行列,为中国带来了全球化的新机遇。
在算法创新方面,DeepSeek提出了R1-ZERO强化学习算法,将围棋AI Alphago Zero的纯强化学习机制应用于大语言模型领域,通过设计GRPO实现推理过程的奖励机制,将复杂推理任务分解为可量化的多步决策过程,持续优化推理路径选择。这使得DeepSeek-R1在复杂推理任务中表现出色,尤其在数学问题求解方面,成为首个具备国际竞争力的大模型。
模型架构上,DeepSeek结合了多头潜在注意力(MLA)技术和混合专家(MoE)框架,采用微型专家网络,通过动态路由激活机制大幅降低激活参数量,仅为模型参数的1/18,从而在同等算力下获得更高吞吐量,降低推理成本。同时,DeepSeek首创专家参数共享方案,提升了通用知识复用效率。
在工程实践上,DeepSeek开发了FlashMLA框架优化专家网络并行计算,结合GEMM算子重构提升了2.7倍性能,采用DualPipe双流水线加速训练吞吐,并构建了自动化数据合成管道,解决了数据碎片化、标注成本高的问题,支撑了DeepSeek-R1版本低成本强复杂推理能力的突破。
同济大学特聘研究员、博导、腾讯云TVP王昊奋带来了《Agentic RAG时代:DeepSeek引领推理模型升级下的知识检索增强》的主题演讲。他介绍了RAG(检索增强生成)作为大模型落地的核心手段,从朴素RAG到模块化RAG的演进过程。DeepSeek通过推理专用模型,克服了模型幻觉、信息时效性不足等挑战,为Agentic RAG提供了关键基座能力。
王昊奋还提出了推理模型与RAG的三重协同优化方法论,包括推理主体分层、检索策略动态化和知识原子化重构。他通过金融和医疗场景的例子,说明了推理模型与RAG的结合,使大模型更加胜任复杂的真实场景。
腾讯云顾问产品总监刘庆兴在演讲中介绍了腾讯云顾问平台如何基于DeepSeek构建“智能体协同治理”体系,推动云上治理从规则驱动向AI原生演进。他提到,随着DeepSeek等AI大模型技术的发展,云顾问平台迎来了“AI原生”大升级,以大模型的强大推理能力解决了传统运维无法解决的复杂场景问题。
金山办公高级产品总监赵九州分享了基于DeepSeek的WPS AI办公应用实践。他介绍,金山办公通过“大模型生成+工程化函数调用+场景化应用切片”的应用路径,将DeepSeek能力与办公工具深度耦合,验证了Agent框架在复杂任务调度、格式保留等场景的技术可行性。赵九州还强调了AI办公应用需以用户体验为锚点,通过工程化能力弥补大模型短板,实现技术价值与商业价值的闭环。
在分组讨论和模拟路演环节,与会者针对DeepSeek的多个热点话题展开了激烈辩论,并就看好的应用场景进行了模拟路演。话题包括DeepSeek是否会加速人才流动还是形成大厂垄断,以及企业是否应考虑建设AI中台等。项目路演涵盖了教育、寺庙文化、数据库和软件智能化等多个领域,展示了DeepSeek技术成果转化为生产力的不同可能性。
活动的最后,邵浩总结道:“DeepSeek的成功源于技术理想主义者对边界的无畏突破,以科技重塑世界的信念。在TVP AI创变研讨会的牵引下,与会嘉宾们无论来自大厂还是创业公司,只要坚守对AI技术的理想与热忱,持续探索创新,必将创造更美好的未来。”