ITBear旗下自媒体矩阵:

科大讯飞1024开发者节将至,多模态视觉及超拟人交互能力将发布?

   时间:2024-10-17 11:16:00 来源:ITBEAR作者:钟景轩编辑:瑞雪 发表评论无障碍通道

【ITBEAR】在2024年,诺贝尔物理学奖与化学奖的荣耀之光共同照耀了人工智能研究的殿堂。物理学奖被授予了机器学习领域的先驱约翰·霍普菲尔德与杰弗里·欣顿,他们巧妙运用物理学工具,设计出人工神经网络,开创了新纪元。而化学奖的一半荣誉则归属于谷歌旗下DeepMind公司的德米斯·哈萨比斯与约翰·江珀,他们所研发的“阿尔法折叠”人工智能模型,成功预测了几乎所有蛋白质的三维结构,这一成就不仅彰显了人工智能在基础科学领域的突破性进展,也预示着其在人类社会中的角色日益重要。

作为AI技术的集大成者,大模型在社会发展中同样扮演着举足轻重的角色,成为AI公司竞相追逐的核心竞争力。近日,科大讯飞宣布将于10月24日举办第七届世界声博会暨2024科大讯飞全球1024开发者节,此消息一出,便吸引了业界的广泛关注。届时,讯飞星火大模型的最新版本将隆重发布,其底座能力也将得到进一步升级,更令人瞩目的是,科大讯飞将首次展示多模态视觉交互及超拟人交互能力,无疑为大会增添了诸多看点。

科大讯飞,作为国内语音产业的领军者,一直在引领语音交互的变革。其超拟人交互技术,凭借更快的响应速度、更强的情感共鸣、更灵活的表达以及多样的人设角色扮演,已经让众多用户领略到了AI超拟人化的独特魅力。而此次即将发布的超拟人虚拟人交互技术,或将进一步融合超拟人技术与虚拟人技术,让虚拟人交互更加贴近人类,进一步模糊现实世界与数字世界的界限。此前,虚拟人技术已在讯飞的多款软硬件产品中得到了广泛应用,为用户带来了全新的体验。

多模态视觉交互技术的推出,更是让AI具备了“看见”世界的能力,成为实现“万物智联”的关键一环。随着大模型从单模态向多模态的迈进,理解和处理更多类型的数据,使其拥有了更智能、自主的决策和行动力,这将为汽车、工业、智造等多个产业的应用开拓出更多的可能性。

对于大模型而言,底座能力就如同地基,决定着应用的高度与赋能行业的广度。科大讯飞自2022年底ChatGPT发布以来,一直在不断提升讯飞星火大模型的底座能力。今年6月,讯飞星火V4.0正式发布,其底座能力已全面对标GPT-4 Turbo。作为唯一基于全国产算力训练的全民开放大模型,讯飞星火还承担了多项国家战略任务,不断夯实其“国家队”的地位。

在赋能人机交互方面,讯飞星火大模型也展现出了领先的实力。讯飞星火大模型V4.0支持74个语种方言的自由切换,首批37个主流语种的效果更是超过了业界领先的Whisper V3。科大讯飞还将星火大模型引入智能座舱,助力多家汽车品牌提升智能化水平,让车机语音交互更加便捷。

为了进一步提升大模型的底座能力,科大讯飞还与华为展开了紧密的合作。双方联合打造了国内首个万卡规模国产算力平台“飞星一号”,并启动了更大参数规模的大模型训练。同时,双方还联合发布了企业智算平台解决方案,将算力与算法深度融合,为企业提供端到端的全栈AI能力,帮助更多中小企业降低AI布局的门槛。

在大模型鏖战的五百天里,科大讯飞凭借其在大模型底座能力与创新技术上的不断积累,早已证明了自己具备行业引领力。通过携手各行业的头部企业,科大讯飞正加速推动大模型在产业端的应用部署。相信在即将到来的科大讯飞全球1024开发者节上,我们将有机会抢先领略到大模型行业的前瞻技术与赋能未来的最新进展。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  网站留言  |  RSS订阅  |  违规举报  |  开放转载  |  滚动资讯  |  English Version