5G商用后,音视频内容生产得到了极大繁荣,网民们的注意力也被各类短视频、直播、音视频社交等平台吸引,这些UGC平台显然已成为了新的流量聚集地。但当流量不再是问题,UGC平台的音视频内容合规性问题变得日益凸显。
音视频内容审核的行业困境
日前,多家互联网应用的音视频业务被曝出涉黄、涉暴、涉政、违禁等不良内容。平台成了间接作恶工具,面临约谈、整顿、关停等违规处理,这给企业造成了难以估量的损失。而对音视频平台来说,针对海量内容逐一审核绝非易事,目前主要面临两大行业难题:
首先,审核效率低下。平台作为网络服务提供者,视频内容大部分来自于用户上传,当用户达到一定基数,每天百万甚至千万的视频内容,客观上给审核带来了极大困难。
其次,有害信息难以发现。对于娇喘呻吟、辱骂语音识别、垃圾广告,以及涉政、暴恐、特殊LOGO等不良内容,不仅量大而且类型不一,从中排查这些危险因素,需要较高的技术手段才能完成。
为解决行业痛点,帮助客户从源头发现并杜绝这类不良信息,互联网通信云厂商融云提供的音视频审核服务,可高效精准地自动识别违规内容,保障平台业务的稳定运营。尤其当平台有对消息及音视频有双重审核需求时,融云可帮助企业一站式审核图、文、音、视“全”内容,有效解决多类型、海量信息难以甄别的问题。同时,也帮客户节省了对接第三方审核公司的商务沟通成本,以及研发适配所耗用的成本,为开发者及各互联网平台构筑起绿色通信的护城河。
多维度音视频审核能力,为不同业务场景提供安全保障
目前,融云提供的音视频审核功能主要应用在 1v1、1v多通话场景,会议场景以及直播场景。融云的客户在使用 CallLib SDK 或 RTCLib SDK 实现音视频通话、线上会议或直播等类型应用后,可以把每个参与人的音频、视频数据发送至审核服务,进行内容审核。
当企业开通审核功能后,融云支持音视频流自动审核,审核结果会通过融云的回调服务发送到开发者的应用服务器。具体来说,融云媒体服务器(RTC Server)会把收到的音视频流转码成审核服务需要的格式(RTMP)来送审,不需要开发者转码或者截帧再去送审。在启动审核任务后,融云会按照一定的周期或在命中拦击事件时把审核结果回调给用户,帮助用户方便地解析出审核结果,开发者可以根据审核结果决策是否需要断开直播间主播推流,比如可以踢出主播或封禁主播。
图1:融云音视频审核服务架构
在音频审核功能方面,融云提供涉政语音识别、娇喘语音识别、国歌识别、色情语音识别、辱骂语音识别、垃圾广告识别六大审核维度。基于Bi-GRU、Attention模型、NAR模型,构建混合深度神经网络模型等多个先进手段,精准识别各类场景中涉政人物、政治事件、反动分裂、恐怖主义等百余种类型涉政音频,精准识别声音中含有娇喘、呻吟、耳骚、喊麦等违规音频,对于音频中含有色情、低俗、污秽、语爱等涉黄内容也绝不放过。
在视频审核功能方面,融云提供涉政视频识别、色情视频识别、暴恐视频识别、广告视频识别、垃圾广告识别、LOGO水印识别。尤其可以实时精准识别和拦截各类场景的手机号、微信、QQ、微博、网址、二维码等各种变体垃圾广告内容,并通过高精度LOGO水印检测识别技术,支持竞品LOGO检测、涉政LOGO检测,维护客户品牌形象。
融云音视频审核四大优势:精准、灵活、全面、稳定
根据开发者的使用调查反馈,融云的音视频审核服务最大的特点是精准,除了审核能力精准,还能迅速精准地定位问题源头,缩短了问题排查的时间;同时,审核模式灵活,支持灵活筛选审核对象,比如对指定房间,甚至指定用户的送审,可添加个性化的审核维度,最重要的是产品功能性能稳定,可用性99.9%,可应对高并发的使用场景。此外,支持长达半个月的测试时间,让客户有充分的时间熟悉、了解相关功能,让使用无后顾之忧。
具体来说,融云音视频审核服务具备四大技术优势:第一,从服务架构上看,深度融合CNN、RNN、GAN、TDNN、LSTM等模型,违规识别准确率高;第二,违规态势实时追踪,可实时监测舆情趋势,动态追踪违规态势,增量模型小时级更新,帮助产品快速迭代升级;第三,全方位识别数百种涉政暴恐图片、数十种色情图片、各式各样的变体广告图片等违规内容,极大降低平台监管风险;第四,超强弹性服务,全球多集群部署,可秒极弹性扩容,因此每日可承载数亿级的海量音视频审核请求。
复合的审核服务,打造一站式“全”内容审核能力
在实际应用中,融云针对图、文、音、视的“全”内容,提供双重审核服务,将IM即时通讯审核与音视频审核功能叠加,构成“联防联控”的一站式内容审核云服务产品,结合融云反垃圾与内容安全经验,构筑体系化、专业化的审核系统,全面保障客户通信云业务安全运行。
图2:融云IM 内容审核服务
融云的IM内容审核服务主要包括文本过滤、图片过滤、音视频文件过滤三类功能。其中,融云的文本过滤具有多语种识别能力,支持中文(简繁体)、维语、藏语、英语、日语等。拥有毫秒级的响应速度,通过机器学习、智能算法、语义分析等多维度对数据解析,识别准确率可达 95% 以上。
融云的图片过滤能力基于融云海量样本库,识别准确率达90%以上,并且支持水印,倾斜,扭曲,异体等多种变形文字的提取识别,从而提高垃圾图片过滤的准确率。同时还可承受单日千万级图片数据的处理,支持数据高峰时段弹性扩容,检测结果毫秒级返回。
融云的音视频文件过滤能力可承载日均千万级数据处理,检测结果秒速返回;并支持场景化定制,多种模型组合训练,供手机号画像、IP画像等多并提维度判定,识别准确率可达98%。
综上,融云能够精准过滤文本、图片、音视频消息及音视频流中的不良信息,帮助客户有效规避运营风险,保证内容平台的健康安全,并且该服务提供机器审核和人工审核的双重保障,用户可根据自身情况同时使用,也可任选其一。
结语
由于各行各业通信云应用对绿色通信都存在迫切的需求,融云的音视频审核专门针对在音视频通信中,对内容有安全过滤和设防需求的客户而设。同时,音视频审核功能与其图文审核功能叠加复核,可全面过滤以及精准识别所有通信形式中的内容,构成了一个审核闭环的防护体系,在解决企业对通信内容安全痛点的同时,让业务运行省心、省力,省成本。