据国外媒体报道,美国电信运营商AT&T宣布,公司正打算推出语音识别和转录应用程序接口(API),开发商可以将之用于智能手机、平板电脑、电视或其他设备的应用程序。这些应用程序接口利用该公司的语音识别服务,统称为沃森(Watson)。
AT&T公司的Watson与IBM的超级计算机“沃森”并不相同,AT&T公司的这一产品主要侧重于七个不同的领域,包括网络搜索、商业搜索、语音邮件转换为文本、短信、问答、电视以及使用包含600项专利技术的通用能力。
应用程序接口(最初在4月份宣布)已经用于AT&T专为安卓和iOS平台设计的翻译应用程序,该程序可以将口语或书面语言翻译成另一种语言。其他语言应用程序接口也在研制过程中,主要用于游戏和社交媒体应用。
在这其中能力中,网络搜索能力旨在识别数百万种移动查询;商业搜索可以搜索数以百万计的本地业务条目;语音邮件转换为文本功能基于客户服务中心提供的大批数据;问答能力则基于约1000万个问题与回答;电视功能可以让用户搜索节目标题、电影或演员,所使用的是AT&T的U-verse节目指南;而通用能力则可以识别和处理英语或西班牙语。
AT&T的Watson还可以识别不同的口音、扬声器的变化、背景环境、平台的变化、方言和语音模式等,并随着时间的推移不断改善。公司正计划发布语音软件开发工具包(SDK)和本地HTML5应用程序。