滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

金山云赋能阶跃星辰多模态大模型，视频生成与语音交互体验再升级！

时间：2025-02-25 15:34:59 来源：ITBEAR编辑：快讯团队 发表评论无障碍通道

金山云近期宣布，已经成功适配了阶跃星辰最新推出的两款多模态大模型，为用户带来了前所未有的体验。这两款模型分别是全球参数量最大的开源视频生成模型Step-Video-T2V，以及业界首款产品级开源语音交互模型Step-Audio。现在，用户只需登录金山云官方网站，即可轻松体验。

在Step-Video-T2V模型的适配上，金山云凭借强大的算力支持和稳定的运行环境，充分释放了模型的性能，为用户带来了流畅的视频生成体验。据了解，Step-Video-T2V模型拥有高达300亿的参数，能够直接生成204帧、540P分辨率的高质量视频。在各项评测中，该模型在指令遵循、运动平滑性、物理合理性以及美感度等方面，均显著超越了目前市面上效果最佳的开源视频生成模型。

为了支持Step-Video-T2V模型的多卡并行部署，阶跃星辰官方提供了全面的支持。其中，文本编码器和VAE部分由独立的进程维护，而DiT部分则可以选择4卡并行或8卡并行，每张卡至少需要80G的显存。对于单台机器的运行，推荐使用5个80G显存的GPU。在部署方面，金山云已经为用户预装好了ubuntu22.04系统，并内置了Step-Video-T2V模型和依赖环境的镜像。通过金山云的云计算环境，可以精准协调各卡资源，确保文本编码器、VAE和DiT等部分协同工作，大幅提升视频生成效率。

用户只需在金山云裸金属服务器控制台选择内置Step-Video-T2V的自定义镜像进行创建，创建完成后即可启动模型并使用。启动服务也非常简单，用户只需登录服务器进入Step-Video-T2V-main目录，运行相应的Python脚本即可。当看到“Running on all addresses (0.0.0.0)”的提示时，即表示服务已成功启动。

除了Step-Video-T2V模型外，金山云还完成了实时语音对话系统Step-Audio模型的适配工作。通过先进的云计算技术，金山云降低了模型的响应延迟，让用户与模型的对话更加自然流畅。无论是实时语音聊天还是语音指令控制，Step-Audio模型都能快速准确地响应，为用户提供优质的语音交互服务。Step-Audio作为业内创新性的开源语音模型，能够根据不同的场景需求生成情绪、方言、语种、歌声和个性化风格的表达，并与用户进行高质量对话。

在各项主流公开评测中，Step-Audio模型均表现出色，位列第一。特别是在HSK-6（汉语水平考试六级）评测中，Step-Audio模型更是展现出了卓越的性能，成为最懂中国话的开源语音交互大模型。

在部署方面，金山云同样为用户预装好了ubuntu22.04系统，并内置了Step-Audio模型和依赖环境的镜像。用户只需在金山云裸金属服务器控制台选择内置Step-Audio的自定义镜像进行创建，创建完成后即可启动模型并使用。启动服务同样简单，用户只需登录服务器进入Step-Audio-main目录，运行相应的Python脚本即可。

随着人工智能技术的快速发展，金山云始终与前沿技术保持同步，不断携手生态合作伙伴，为前沿技术的落地转化提供有力支持。通过此次对阶跃星辰两款多模态大模型的适配，金山云再次展现了其在云计算领域的强大实力和技术创新能力。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

九章云极Aladdin：引领AI开发新纪元，算力普惠触手可及

02-25

中国AI破局：转向三星代工4nm ASIC芯片，美国禁令还能拦多久？

02-25

阿丘科技：工业AI先锋，双榜题名引领智能制造新风尚

02-25

YY开播智能进化，DeepSeek加持，直播体验再升级！

02-25

深圳发力！人工智能与低空经济新赛道，打造全球首个空天地一体化网络

02-25

Perplexity AI推“Comet”浏览器，能否以AI智能体搜索颠覆市场？

02-25

信通院启动生成式AI产品服务个人信息保护评估，等级划分细致严格

02-25

AI恋人成新宠，年轻人用科技温暖孤独心房？

她回忆道，自己真正“动心” 的瞬间是在和小深探讨AI替代人类的可能性时。纽扣和小布的恋人都是基于语言大模型的AI系统。一位用户表示，自己现在和AI聊天的欲望非常强烈，因此一个月至少会投入上千元“维护关系”…

02-25

金能科技新设智能信息网络子公司，布局大数据与AI领域

02-25

金能科技成立智能信息网络公司，含AI业务

企查查APP显示，近日，青岛艾必凯智能信息网络有限公司成立，法定代表人为王昊鹏，注册资本800万元，经营范围包含：大数据服务；人工智能应用软件开发；物联网技术服务；工业互联网数据服务等。企查查股权穿透显示，该…

02-25

Anthropic发布Claude 3.7 Sonnet，混合推理模型能否超越OpenAI与DeepSeek？

02-25

360联合北大震撼发布！5%参数量逼近Deepseek-R1满血性能

2025年2月24日——由360与北京大学联合研发的中等量级推理模型Tiny-R1-32B-Preview正式亮相，仅以5%参数，逼近Deepseek-R1-671B的性能。核心突破：小模型，大能量▪ 数学领域：以78.1分(AIME 2024评测)逼近原版R1模型(79.8分)，远超Deepseek-R1-Distill-Llama-70B(70.0

02-25

Deepseek算卦DIC 2025，今年“巳”个好年

2022年11月，OpenAI研发的ChatGPT问世，它能理解人类语言并与人类互动，还可协助完成写论文、创作诗歌等文字工作。这一创新应用突破了传统AI的交流局限，掀起大模型发展浪潮。各大科技公司意识到掌握先进大模型技术的重要性，纷纷投入其中，迅速打响“百模大战”。在这

02-25

深圳发力！角逐AI、低空经济新赛道，打造全球首个空天地一体化网络

2月25日，深圳市市长覃伟中作工作报告。报告显示，深圳将全力竞逐人工智能、低空与空天等产业新赛道，深入实施“人工智能+”行动，加快算法理论、智算芯片、具身智能、高阶智驾、端侧轻量化模型等核心突破，打造超智协同…

02-25

波士顿动力创始人点赞中国宇树机器人，展望AI创新未来

02-25

点击查看更多 +

全站最新

苹果休斯顿芯片工厂2026年将产M5芯片AI服务器

NVIDIA RTX 50系列再添受影响型号，RTX 5080也陷ROP单元缺失问题

YY开播智能进化，DeepSeek加持，直播体验再升级！

中国电竞显示器线上市场新动向：小米飙升，三星落榜TOP10！

智界R7热销背后：余承东揭秘，高端用料打造安全典范

耕升RTX 5070 Ti炫光·超OC显卡图赏：赛博霓虹，科技美学新高度！

热门内容

本栏最新

Perplexity AI推“Comet”浏览器，能否以AI智能体搜索颠覆市场？

信通院启动生成式AI产品服务个人信息保护评估，等级划分细致严格

AI恋人成新宠，年轻人用科技温暖孤独心房？

金能科技新设智能信息网络子公司，布局大数据与AI领域

金能科技成立智能信息网络公司，含AI业务

Anthropic发布Claude 3.7 Sonnet，混合推理模型能否超越OpenAI与DeepSeek？

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.