滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

知乎技术新突破：ZhiLight大模型推理框架正式开源，引领AI新风向

时间：2024-12-09 17:31:22 来源：ITBEAR编辑：瑞雪 发表评论无障碍通道

在科技领域的一次重要聚会中，知乎携手DataFun共同呈现了一场聚焦大模型应用工程化实践的深度技术沙龙。此次活动汇聚了来自15个行业、130家企业的专业人士，共同探讨了大模型技术从实验室迈向千万级用户产品的路径。

知乎CTO孙斌在活动现场带来了一个振奋人心的消息：知乎自研的轻量高效大模型推理框架ZhiLight正式开源。这一消息标志着知乎在大模型工程化实践上的又一重要进展。

知乎在2024年持续推进大模型技术的落地应用，先后推出了知乎直答和专业搜索功能。这些功能不仅聚焦于专业人士的生产力场景，更是将AI搜索推向了更具专业性和实用性的深度搜索阶段。在沙龙上，知乎AI算法负责人王界武详细介绍了知乎直答的搭建过程和技术方案选型。

王界武指出，在构建AI问答系统时，知乎直答团队对比了LLM持续pretrain+posttrain与检索增强生成（RAG）两种方案，最终选择了RAG方案。RAG系统通过从知识库检索相关信息作为上下文，再由大语言模型生成回答，显著降低了AI的幻觉问题，提高了答案的准确性和权威度。团队在Query理解、召回、大模型生成等多个环节进行了深入优化。

在专业搜索功能方面，知乎直答团队采用了多种前沿技术，实现了多智能体的协同工作，并支持信息查询、内容分析、数学计算等多种功能。同时，结合大语言模型的强大推理能力，对用户的上下文和提问进行深入分析，从多角度、多层次召回高质量的内容。

王界武还透露，知乎直答团队计划将产品与社区深度融合，满足更多场景下用户找答案的需求，并在准确性、时效性、交互模式等领域实现更多升级。同时，将进一步提升模型的推理能力，使知乎直答具备更强的解决复杂问题能力和使用体验。

在沙龙上，知乎自研的大模型推理框架ZhiLight也正式亮相。知乎机器学习平台负责人王新介绍了ZhiLight的设计目标和优化重点。ZhiLight旨在快速部署与实践LLaMa-like模型，并兼容OpenAI chat/completions接口，便于日常使用及与开源引擎的性能与稳定性对比。

ZhiLight在PCIe卡间通讯优化、内存管理以及并发请求管理等方面进行了深入优化，并集成了FlashAttention、Marlin、TensorRT、exllama等开源项目。通过计算与通讯overlap和低精度通讯等手段，单层Transformer计算时间降低了40%以上。在模型规模达到70B时，ZhiLight在TTFT指标上明显优于主流开源推理引擎。

百川智能大语言模型资深算法专家王宇龙在沙龙上分享了对Agent技术的探索。他认为，基于LLM驱动的智能体相较于传统Agent，能够利用大型语言模型的强大能力，彻底改变智能体的工作方式。这类智能体能够在不同的任务之间切换，并通过理解自然语言来解决问题。

王宇龙还介绍了当前Agent面临的主要问题，并探讨了Agent和LLM的底层细节。他认为，人工智能有可能以新的方式发现并利用计算简化的区域，从而做出近似和“大致正确”的预测。但AI在进行精确、详细的预测时会遇到困难，特别是在面对计算不可约性时。

在交流会上，“提示词布道师”李继刚也分享了关于Prompt的深刻见解。他提出“Prompt=表达”，并阐述了“表达=本意+文意+解意”以及“本意=经验+词汇+知识”的概念。他认为，与大模型实现“共振”是Prompt设计的核心，即用最清晰、简洁的表达指向核心本质。

李继刚还分享了Prompt的实战经验，认为Prompt工程师应具备人文和技术两项基本素质，既要能写编程、具备理性数学的思维，又要会写作、拥有感性表达的思维。

此次大模型技术沙龙不仅为与会者带来了前沿的技术分享和深度交流，也展示了知乎在大模型应用工程化实践上的坚实步伐。知乎将继续加强与科技行业、技术从业者的交流联动，为互联网行业前沿技术研发和应用贡献力量。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

具身风暴获超千万天使轮融资，AI理疗机器人“智”领健康新风尚

12-11

字节反思AI对话产品局限，押注剪映即梦探索AI新形态

12-11

谷歌向FTC喊话：要求打破微软对OpenAI技术的云托管独家权

12-11

Soul车斌：将与AI沟通视为一种社交练习

AI如何推动社交的革新和进步?12月6日，在2024T-EDGE创新大会暨钛媒体财经年会圆桌论坛上，Soul App副总裁及产品负责人车斌分享了Soul在AI领域的最新进展和未来展望。本次圆桌论坛以“AI来了，全球青年流行文化的新范式”为主题，来自Soul App、科大讯飞、大宇无限、映宇

12-11

LG推出EXAONE 3.5 AI模型，单次可处理百页文本，能力再升级

12-11

AI领域新词汇来袭！第十六批外语词中文译名正式公布

12-11

商汤集团配股筹资28亿港元，打造AI云与提升大装置规模

三言科技 12月11日消息，商汤集团在香港交易所公告称，与配售代理订立协议，以每股1.5港元的价格配售18.65亿股股份。配售价较周二收盘价1.6港元折让约6.3%。配售所得款项将用于打造行业领先的AI云…

12-11

OpenAI Canvas震撼上线：重塑写作与编码协作新体验！

12-11

苹果Apple Music上线三大全球电台，免费畅听无门槛！

12-11

2024Q3全球半导体市场回暖，三星领跑收入榜单，英伟达SK海力士大增

12-11

苹果AI高管：通用AI不现实，苹果专注技术突破而非奇点

三言科技12月10日消息，据报道，日前，苹果公司机器学习和人工智能战略高级副总裁约翰 · 詹南德雷亚（JohnGiannandrea）在一档节目中表示，苹果对开发 AGI（通用人工智能）并不感兴趣，公司认为…

12-11

AI赋能“开口说英语”，OpenAI投资初创企业估值跃升至10亿美元

12-11

广汽新智能机器人惊艳亮相明珠湾：AI大模型赋能，远程操控不是梦

12-11

小米人车家全生态大会启幕在即，12月27日共探科技与商业新未来

12-10

英伟达反垄断调查风波，市值一夜蒸发超6400亿，国产GPU能否借机崛起？

由于英伟达和迈络思均在全球具有垄断地位，该并购案对全球市场有潜在影响，因此这一交易随后经过了美国、欧盟、中国等国家和地区市场监管部门的批准。这些措施不仅阻碍了英伟达对中国市场的供应，也与其在中国的经营承诺产生…

12-10

点击查看更多 +

全站最新

月球变红，是自然现象还是古老传说的再现？

短剧热度榜揭晓：《重生宠妾进阶录》登顶，大盘热度值近六千万

小米MIX Flip迎来澎湃OS2内测更新，多项BUG得到修复

理想汽车迎战寒冬：三大招破解电动车冬季使用痛点

Stellantis携手宁德时代，41亿欧元打造西班牙磷酸铁锂电池巨头！

新能源汽车市场风向突变，混动技术成新宠？

热门内容

本栏最新

LG推出EXAONE 3.5 AI模型，单次可处理百页文本，能力再升级

商汤集团配股筹资28亿港元，打造AI云与提升大装置规模

OpenAI Canvas震撼上线：重塑写作与编码协作新体验！

苹果Apple Music上线三大全球电台，免费畅听无门槛！

AI赋能“开口说英语”，OpenAI投资初创企业估值跃升至10亿美元

广汽新智能机器人惊艳亮相明珠湾：AI大模型赋能，远程操控不是梦

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区 · 齐鲁软件园鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.