ITBear旗下自媒体矩阵:

百度文心大模型X1实测:深度思考,自主调工具,解题逻辑强

   时间:2025-03-16 14:09:26 来源:ITBEAR编辑:快讯团队 发表评论无障碍通道

百度在文心一言发布两周年之际,再度掀起技术风暴,宣布文心大模型家族迎来两位新成员——文心大模型4.5与文心大模型X1。这两款大模型已提前于官方预定的4月1日,在文心一言官网上线并免费开放使用。

文心大模型X1作为首个自主运用工具的深度思考模型,展现了其在理解、规划、反思及进化能力上的卓越表现。在中文知识问答、文学创作、文稿写作、日常对话、逻辑推理、复杂计算及工具调用等多个领域,X1均表现出色。用户上传一张风景图询问地点,X1能迅速调用图片理解工具,准确识别并回答为杭州西湖,展现了其强大的图像识别与处理能力。

文心X1图片理解示例

文心大模型4.5则是百度自研的新一代原生多模态基础大模型,其在多个测试集上的表现已经超越了GPT-4。该模型能力全面,图片理解覆盖多种形态,包括照片、电影截图、网络梗图等,且能理解音视频中的场景、画面、人物特征,生成内容真实性高。文心4.5在文本、图像、音视频等多模态数据的原生级融合上实现了突破,为迈向通用人工智能(AGI)迈出了重要一步。

百度创始人李彦宏此前在文章中提到,原生多模态大模型打破了先训练单模态模型再拼接的传统方式,通过统一架构实现对复杂世界的统一理解。目前,文心大模型4.5已面向企业用户和开发者开放,登录百度智能云千帆大模型平台即可调用API。同时,文心大模型4.5与X1也将陆续上线百度搜索、文小言APP等产品,文心大模型4.5将于6月30日起开源。

在价格方面,文心大模型4.5的输入价格为0.004元/千tokens,输出价格为0.016元/千tokens;文心大模型X1也即将在千帆平台上线,输入价格为0.002元/千tokens,输出价格为0.008元/千tokens。这一价格策略无疑将进一步降低企业用户和开发者使用大模型的门槛。

文心X1减肥计划生成示例

文心X1在实战中展现了其强大的能力。面对经典的电车难题,X1能够给出全面的答案,思考过程清晰,展现了其深度理解与逻辑推理能力。同时,在面对多轮复杂交互时,X1也能准确理解用户需求,给出符合特定条件的生成结果。例如,用户请求生成一个为期三个月的减肥计划,并给出工作忙、周末时间宽松、对部分食物过敏等限定条件,X1给出的生成结果中包含了符合特定需求的食谱及运动计划。

文心4.5同样表现出色。在图片理解能力上,用户上传一张照片,文心4.5能准确识别出场景特征、电影名称、相关人物及场景意义等。在文本生成方面,文心4.5还能针对不同平台特点生成相应文案,如短视频平台的一句话概括、小红书文案的文字与emoji配合等。文心4.5还能生成包含镜头切换、旁白台词、语气等元素的视频脚本,展现了其跨模态理解能力与细节捕捉能力的全面提升。

文心4.5视频脚本生成示例

两大模型性能升级的背后,是百度在核心技术方面的深耕与突破。文心X1背后有递进式强化学习训练方法、基于思维链和行动链的端到端训练、多元统一的奖励系统三大核心技术支撑。而文心4.5则依托FlashMask动态注意力掩码、多模态异构专家扩展技术、时空维度表征压缩技术等四大技术,全方位提升大模型的多模态理解能力与降低幻觉能力。

百度文心大模型的发展历程见证了国产大模型的茁壮成长。从2023年3月16日文心一言正式发布并开启邀请测试,到如今文心大模型家族的持续壮大,百度已经基于大模型构建起了全栈技术布局。在芯片层、框架层、模型层及应用层四个关键层级上均有所布局,成为全球范围内鲜少的在这四层都有所布局的公司之一。

文心X1计算难题解答示例

百度近十年来的累计研发投入超过1800亿元,全球AI专利申请超过2.5万件,国内AI专利申请量近1.9万件,展现出其在AI领域的深厚积累与强劲实力。这些研发与积累已经转化为百度大模型研发的养料,助推国内大模型产业发展在全球竞争态势中飞速前进。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version