【ITBEAR科技资讯】4月26日消息,商汤科技近日发布的日日新5.0版本引起了业界的广泛关注。该版本在语言、知识、推理、数学、代码等多个领域展现出了显著提升,据ITBEAR科技资讯了解,其在主流客观评测上已达到或超越了GPT-4 Turbo的水平。
作为文科生,日日新5.0在开放问答场景进行了重点优化,无论是聊天、多轮对话、信息提取还是写作等场景,都达到了业内领先水平。而对于理科生而言,该版本在知识、数学、推理、代码能力方面同样表现出色,与GPT-4 Turbo不相上下。
商汤日日新多模态5.0不仅具备文本理解能力,还能处理文档、图表、截图和照片中的内容,成为了一个真正的“懂事”的日常助手。它能够提供穿搭建议、食品分析、文案创作、烹饪建议等多种服务,展现出其在多个日常场景下的实用价值。
此外,商汤日日新5.0的文生图和文生视频功能也备受瞩目。在文生大象的示例中,商汤秒画生成的老象效果更为自然,而在视频生成方面,商汤也展现出了出色的能力,能够生成逼真且连贯的视频内容。
商汤之所以能够在多模态大模型上取得如此显著的进步,背后离不开强大的算力供应、算法和数据支持。商汤从2017年起就在AI基础设施上进行了大量投入,使其AI大装置SenseCore成为业内稀缺的大模型专用基础设施,总算力规模达12000P。此外,商汤还在算法模型设计上下足了功夫,通过巧妙的预训练模型设计,让模型能够挖掘不同模态之间的关联,实现图文、音频、视觉抽取理解的能力提升。
在数据方面,商汤积累了大量的多模态数据,并在数据质量上进行了保障,采用超过10T的Tokens,使得高质量数据的完备性得以保持。此外,商汤还合成构造了思维链数据,这是保障模型能力提升的关键。
商汤的多模态大模型5.0不仅具备强大的感知能力,还在服务方面进行了完善。新增的知识融合接口可以基于知识库能力优化,大幅降低模型幻觉的出现。同时,商汤还提供了完善的服务流程,支持多种格式输入和知识融合服务,为用户提供更加便捷的使用体验。
展望未来,商汤将继续在通用AI和生成式AI领域进行探索和创新,为用户提供更加智能化、便捷化的服务。随着多模态大模型技术的不断发展,我们有理由相信,未来的生活将会因为AI而变得更加美好。