滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

阿里云百炼上线音视频实时互动功能，人人都能创建专属多模态应用

时间：2024-12-19 16:16:16 来源：互联网编辑：茹茹 发表评论无障碍通道

近日，阿里云百炼上线了全新音视频实时互动功能，用户可在百炼上自由选择文本、语音和视觉理解等200多款模型，无需代码，数分钟即可搭建一个能听、能看、会说的专属AI助手。阿里云百炼还支持以sdk的形式集成到Web、ioS和安卓应用，可应用于AI虚拟助手、虚拟陪伴和AI老师等场景。

用户在百炼上几分钟即可搭建一个能听、能看、会说的专属AI助手

过去一年，大模型正在从纯文本模态向语音和视觉等多模态演进，极大地拓宽了大模型应用的想象空间。然而现有单一模型仍旧无法处理复杂的任务，为了进一步加速单一大模型构建成像人一样自然交互的复杂AI应用，阿里云百炼提供了200多款语言模型Qwen、视觉语言模型Qwen2-VL、语音合成模型CosyVoice等全模态全尺寸大模型，同时联合阿里云AI实时互动方案，在国内率先为用户提供了便捷的工作流应用和智能体编排应用，例如支持构建RAG知识库、Prompt调优、sdk集成等。

据介绍，在视觉理解模型方面，阿里云Qwen2-VL具备强大的视觉智能体能力，例如采用多模态旋转位置嵌入(M-ROPE)方法，能够同时捕捉和整合一维文本序列、二维视觉图像以及三维视频的位置信息，模型具备更好地理解和建模复杂的多模态数据，该模型一经推出就成为开源社区最受欢迎的多模态大模型;在音频方面，阿里云语音合成模型CosyVoice，通过对生成语音的情感、韵律进行细粒度的控制，情感表现力上得到明显提升，阿里云AI实时互动方案还可提供化智能降噪、智能打断、智能断句等超拟人对话能力。

以搭建一个视觉能力的AI应用为例，用户进入百炼应用控制台后，仅需上传图片知识库、编写提示词、设置音频、调优这四步，数分钟内就能创建一个能完成专属视频交互的AI应用，基于Qwen-VL强大的视觉推理能力，它不仅能识别物体的种类，还能准确描述物体的风格、特点、位置以及物体上的文字等关键信息。此外搭建好的应用还支持以音视频sdk集成到用户的Web、ioS或者安卓应用中，帮助企业快速实现业务创新。

据介绍，阿里云百炼上的通义API每百万tokens价格已降至0.3元，一汽、金山、哈啰集团、国家天文台等超30万企业和机构在使用阿里云百炼。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

锐龙7 9800X3D内部揭秘：核心厚度仅40微米，九成竟为填充物？

12-19

上汽携手晶科科技，新能源领域再布局，注册资本高达2.26亿

12-19

德施曼智能锁携手云南省博物馆，共启珍宝守护新篇章！

12-19

京东三棵树2025战略合作：共推健康环保乳胶漆，引领行业新风尚

12-19

智界R7增程版上市，起售价24.98万，余承东透露卖车亏损万元

12-19

诺兰夫妇获英国爵士头衔，《奥本海默》再获奥斯卡七奖荣耀

12-19

《新蝙蝠侠》续集来袭！马特·里夫斯确认2025年开拍第二部

12-19

日本京都大学联手鹿岛建设，探索月球人造重力，打造宜居月面设施

12-19

绿源“品质中国行暖冬服务季”再启航，引领冬季电动车服务新风尚

随着冬季的脚步悄然而至，全国多地迎来了寒潮与冷空气的双重夹击，电动车用户不仅面临着车辆性能与续航能力的严峻考验，同时，冬季也成为电动车起火事故的高发期，给用户的生命财产安全带来了极大威胁。因此，电动车的冬季养护显得尤为重要。绿源电动车，作为行业内的佼

12-19

3DMakerpro携手南洋理工，共探3D数字化教育新未来

12-19

特斯拉上海工厂新动向：改款Model Y及6座版即将量产，性能再升级！

12-19

力纳克荣膺运动控制大奖，技术创新助力制造业转型升级

12-19

圣奥科技闪耀浙江省高企创新能力榜单，位列89强引领办公家具新风尚

12-19

何师烧烤领跑川味烧烤赛道，获CIC灼识双认证彰显品牌实力

12-19

喜茶2025新策略：激励合伙人，打造更优门店，业绩逆势增长

12-19

点击查看更多 +

全站最新

OPPO Find X8新功能：实况照片可编辑，微信分享何时来？

荣耀Magic 7全系升级“大王影像”，下周一揭晓AIGC赋能新惊喜？

理想汽车12月订单破3万，免息政策助力冲刺6万大关？

天猫双旦礼遇季，攀升游戏台式机劲爆优惠，错过等一年！

荣耀Magic 7 Lite来袭：骁龙6 Gen 1加持，6600mAh大电池续航如何？

极越汽车员工维权新进展：“N+1”补偿方案能否挽回市场信心？

热门内容

本栏最新

3DMakerpro携手南洋理工，共探3D数字化教育新未来

特斯拉上海工厂新动向：改款Model Y及6座版即将量产，性能再升级！

力纳克荣膺运动控制大奖，技术创新助力制造业转型升级

何师烧烤领跑川味烧烤赛道，获CIC灼识双认证彰显品牌实力

公立医院数字化转型，网络安全建设如何迎接新挑战？

智京未来亮相2024通信产业大会，共话AI赋能通信业变革新篇章

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区 · 齐鲁软件园鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.