近日,北京市商汤科技开发有限公司发布了一则重要通知,宣布其企业客户与开发者能够通过商汤大装置万象平台迅速部署DeepSeek-V3、DeepSeek-R1等一系列先进模型。这些用户还将享受到一项特别福利:在三个月内,他们将获得高达1000万tokens的免费使用权。
商汤大装置此次的升级服务尤为引人注目。该公司依托其强大的技术平台和专家资源,构建了一个从“场景定义”到“训练”、“部署”再到“迭代”的全方位闭环服务体系。这一体系旨在更好地满足企业客户的多样化需求。
对于追求轻量化模型定制的企业而言,商汤大装置提供了基于场景强化学习的解决方案。这一方案能够在特定场景下对基模型进行提升,并支持将其蒸馏到小模型中,从而实现高效推理。这无疑为企业带来了更加灵活和高效的模型应用选择。
对于有私有化需求的企业,商汤大装置同样提供了全面的综合解决方案。该方案涵盖了模型定制、模型开发平台以及Agent应用开发平台三大核心模块,能够适配多种国产化硬件,并提供从开发到部署的全链路支持。这为企业客户在数据安全与自主可控方面提供了强有力的保障。
在部署方式上,商汤大装置同样展现出了极高的灵活性和兼容性。它支持公有云、私有化以及一体机等多种部署方式,能够满足不同企业的实际需求。在硬件层面,商汤大装置兼容英伟达与国产异构芯片,通过软硬件的深度协同优化,实现了多种芯片的高效混合部署和流量智能分发。
在推理层面,商汤大装置支持多款主流推理引擎,并对缓存进行了针对性的加速优化。官方还计划在未来推出PD(Prefill-Decode)分离式推理架构。这一架构将计算任务智能拆分,并分别调度至最适合的算力单元执行,从而进一步提升能效比。
商汤大装置还支持包括商汤“日日新”融合大模型SenseNova、DeepSeek、Qwen、Llama等在内的多款大模型。这一举措将为企业客户提供更加丰富和多样的模型选择,助力他们在各自领域取得更加卓越的成绩。