腾讯云ASR基于大模型全新升级：首创多语言、多方言混合识别引擎

时间：2024-01-04 16:37:51 来源：互联网编辑：快讯团队 发表评论无障碍通道

近日，腾讯云语音识别(Automatic Speech Recognition，ASR)方案基于大模型能力全新升级，依托业界领先的自研语音识别技术和海量的语音行业大数据优势，可为不同行业、不同需求的客户提供高质量的语音识别服务，精准、高效助力千行百业持续创造应用价值、繁荣产业生态。

腾讯云ASR是将语音转化成文字的PaaS产品，依托微信智聆实验室自研技术，有效提高复杂场景的识别准确性，极大地改善复杂音频和低信噪比音频识别的效果。通过业界首创的高性能引擎，能够实现23种方言的语音识别，让用户无需事先定义方言，即可让模型进行自动化适应。突破现有ASR引擎的场景局限，腾讯云ASR在线下销售、下沉市场等不同场景都能够灵活、广泛地进行使用。

目前，腾讯云ASR已经在微信、王者荣耀等腾讯内部产品以及外部不同行业持续落地，覆盖录音质检、会议实时转写、语音输入法等多个场景，产品单日调用量达到百亿次，单月服务的内外部企业客户数达到数千个。

自研多模态融合、蒸馏算法，带来更准确的语音识别性能

语音识别(ASR)是AI最早的应用场景之一，业界不少方案目前仅能针对简单场景进行精准识别，一旦音频环境复杂，或者多人交错说话、声音重叠，识别准确率就会大打折扣。为了助力解决上述语音识别应用难题，腾讯云ASR自研多模态融合算法、蒸馏和半监督算法等，强化上下文理解能力，大幅减少语音数据的标记工作，更好地提升复杂识别环境的准确率。

通过自研多模态融合算法，腾讯云在模型预训练阶段加入文本大语言模型(LLM)，增加上下文预测的准确率，对部分通过纯音频识别无法正确识别的场景有了更好的提升作用，在各行业数据集中(尤其是低信噪比数据集)取得更佳效果。同时采用无监督学习，使得模型中加入大量未经标注的低资源数据，在垂类行业音频和方言音频上取得了重大突破。

同时，腾讯云还自研蒸馏和半监督算法，利用有监督数据，可以让ASR的小参数模型同时学习真值数据和知识蒸馏的数据，利用蒸馏算法，让小模型学习更多数据的相似性，从而提升各自的性能水平。

业界首创高性能引擎，支持多语言和多方言的混合识别

随着智能汽车普及、短视频配音、企业出海等趋势的兴起，多语种、多方言的语音识别需求逐渐加大。如何应对不同口音、语言的准确识别，也成为腾讯云发力ASR大模型创新的焦点。

腾讯云通过采用自研的高新技术，打造多项业界首创的高性能引擎，进一步增强ASR混合识别能力。依托业界首创的支持多种语言和多方言的混合识别引擎，腾讯云成功构建了中文方言大模型能力。提升23个方言语种的平均识别准确率(平均提升指标在7%以上)，识别过程无需事先定义方言种类，实现对“普通话+方言”识别场景的自动化适应，为不同语种用户提供更全面的服务，有效满足了跨省市的语音识别需求。

混合识别引擎之外，腾讯云ASR还支持热词增强版、ASR情绪识别等多项业界首创功能，极大地改善复杂音频和低信噪比音频识别的效果，提升高达20%。通过高准确率、业界首创的语音识别功能创新，腾讯云ASR解决市场上ASR引擎需求问题的同时，成功构建适配多个领域的语音识别大模型，进一步扩展了其在不同场景的应用范围。

灵活、广泛适配多种应用场景，成本可控、性价比更高

将智能客服通话录音转化成文本，可能出现违规用语、危险用语;多数厂商需要依赖有监督数据进行模型的优化，因此在部分对识别要求较高的场景上，客户无法寻求到更合适的解决方案。面对语音识别要求越来越高的现状，如何让客户获取到识别率更好、覆盖面更广、性价比更高的语音识别服务，成为腾讯云ASR努力的目标。

腾讯云语音识别方案不仅能够更好地解决现有ASR引擎在高并发、高可用性方面的局限，在智能客服、语音输入法、下沉市场等多种应用场景，展现出了强大的灵活性和广泛性，使得各行业、各种特征迥异的音频都能获得相对高性能和更准确地转写服务。

例如在智能客服场景，百应科技通过腾讯云ASR强化电话外呼、智能外呼场景的录音文件识别、实时语音识别，大幅提升呼叫中心工作质量管控能力，完成人力难以完成的超大规模呼叫中心的电话录音质检问题;在语音输入法场景，KK键盘依托腾讯云ASR进一步提升产品的趣味性，满足了客户语弹聊天、游戏键盘、趣聊等核心功能的设计，有效提升了产品的留存和转化，以及品牌商业价值。

当前，腾讯云ASR已经落地在客服质检、外呼中心、智能家居、游戏直播、会议转写、语音输入法、法庭、房地产、教育等多个行业，积累了丰富的行业词库和标杆案例。未来，腾讯云将继续推动语音识别能力创新升级，帮助更多应用场景将大模型的技术力价值转化生产力价值，助力产业发展。

4月17日，贝壳最新公告显示，贝壳董事会主席、首席执行官及控股股东彭永东拟捐赠9,000,000股A类贝壳普通股。在承担相应的纳税义务后，此次捐赠股票将50%税后资金用于居住行业服务者及其家庭成员的医疗健康福利、50%税后资金用于应届毕业生等租客群体的租房帮扶。据悉，

面对厨电行业智能化、品质化升级趋势。4月16日,凯度成功举办了以“心所想·AI所向”为主题的2025凯度品牌日暨春季新品发布会。凯度CEO柯漫、董事长傅平及明星生活家王真儿依次登场,通过理念分享、技术解读、场景演绎,全面诠释“高端新厨电”;重磅推出首个AI数字生命体“

4月17日，Faraday Future(简称“FF”)今日宣布，为捍卫股东价值与信心，公司正式启动五大核心举措，标志着“梦想实现战之潜在非法做空反击战”的正式打响。在公司昨日提交Form D文件后，市场上迅速传播出一系列谣言——包括错误声称Form D表明高管正在出售股份;股价跌破

2024年4月，昆仑万维发布了第一代音乐生成模型Mureka V1（SkyMusic）。2024年8月14日，昆仑万维推出AI音乐商用创作平台Mureka。2025年3月26日，正式发布Mureka O1模型与Mureka V6模型。自Mureka上线以来，在海内外获得了非常好的市场反响，成为全球AI音乐界现象级产品。

4月16日，家庭智慧旗舰SUV鸿蒙智行问界M8正式发布上市，据悉其搭载的鸿蒙座舱重塑家庭出行交互新范式，车载智慧助手小艺能力再升级，展现出卓越的语音交互能力，有问题随时随地都可以问问小艺。全新的小艺搜歌功能，仅需告诉小艺歌词与背景信息，即可“搜”听到想听的歌

2025年4月16日，金山云(NASDAQ:KC，HKEX:3896)宣布，将公开发行18,500,000股美国存托股(ADS)，每ADS代表该公司15股普通股。同时，金山云还授予ADS承销商购买额外美国存托股的30天选择权。并且，为了方便港美股两地投资者认购，投资者可以选择在此次发行中以普通股代替AD

2025年3月28日，北京昂瑞微电子技术股份有限公司(下称“昂瑞微”)科创板IPO申请获受理，成为今年首家未盈利企业申报案例。作为射频前端芯片领域的“国产替代先锋”之一，昂瑞微凭借20.67亿元募资计划、50.88%的营收复合增长率引发市场关注。然而，对于其招股书中客户信

3月28日，北京昂瑞微电子技术股份有限公司(以下简称“昂瑞微”)向上交所递交IPO申请。作为主营射频前端芯片、射频SoC芯片的集成电路设计企业，其招股书披露的财务数据看似亮眼：2022-2024年累计营收47.19亿元，复合增长率达50.88%。但穿透数据表象可见，公司增长动能过

凭借卓越的综合实力与对市场需求的精准洞察，近日，小刀电动车产品再次登上“Ray时尚”电动自行车TOP榜，以及“Ray时尚”可持续时尚企业。这是小刀电动车连续三年（2023-2025年）斩获殊荣。这一成就不仅体现了其产品在设计、性能、品质上的持续突破，更印证了品牌“科技

4月15日，2025京东新品年度盛典在北京举行，正式推出京东新品成长“百千亿”计划，即在2025年加码百亿流量和百亿资金，并围绕营销能力与数字能力全面升级，实现60000款新品年销售破百万、6000款新品年销售破千万、600款新品年销售破亿。在此次盛典活动上，京东宣布“京

近日，元鼎智能旗下清洁机器人品牌Aiper宣布获得全球泳池设备巨头Fluidra的1亿美元战略投资。Fluidra以发行新股方式获得Aiper 27%股权，投后估值3.7亿美元。然而，这一交易因复杂的对赌条款和行业前景争议引发市场关注——创始人选择此时选择离场，究竟是顺势而为，还是

2025年4月14日，身边云发表声明，提示有不法分子冒用其名义，通过伪造资质文件、发布虚假招聘链接、伪造身边云官方App等手段，以“线上招聘”为诱饵引导个人注册、充值，行为涉嫌诈骗。此类行为不仅严重威胁个人财产安全，同时损害企业商誉。身边云已向属地公安机关、国

亚信科技：领先的信息技术产品与服务提供商。阿里云：全球领先的云计算及人工智能科技公司。亚信科技+阿里云=覆盖“需求分析、咨询规划、产品研发、实施交付、运营运维”的云与AI“全栈服务”提供商!人工智能时代，双方携手助力百行千业政企客户“多快好省”用上普惠AI

进入2025年，Depair Life品牌热度高涨。继高调亮相中国供热展，收获广泛关注后，在刚刚结束的2025 WAD豪宅设计建造专业峰上，Depair Life又凭借卓越的品质一举荣获2025WAD豪宅品牌全球TOP100。作为全球顶尖的品牌，DEPAIR致力于通过领先的科技和产品，为全球用户提供极

4月10日至11日，华为云生态大会2025在安徽芜湖隆重举行，大会以“聚力共创，加速行业智能跃迁”为主题，携手伙伴与客户协同创新。4月11日，智能集成与治理产业专题圆桌会议圆满落幕，会议汇聚华为云专家、合作伙伴、企业家等40+业界大咖，通过主题演讲、案例分享、互动

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.