滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

Wit.ai：通过众包帮助创业公司开发自己的Siri

时间：2014-10-16 16:12:18 来源：网易科技编辑：星辉 发表评论无障碍通道

国外媒体近日撰文称，对于资源有限的普通开发者来说，给自己的应用程序引入语音识别技术极其困难。创业公司Wit.ai想要给他们带来帮助。它希望利用类似于代码托管网站GitHub的众包模式来打造强大的语音识别技术，帮助创业公司开发出自己的Siri。

以下是文章主要内容：

做语音识别技术并非易事，对于世界上规模最大的科技公司来说也是如此。苹果和谷歌利用所收集的海量真实语音模式录音来调整它们的语音识别算法，以驱动各自的语音助手——Siri和Google Now。虽然那些工具的表现令人印象深刻，但苹果和谷歌仍得耗费大量的时间去处理你的语音指令。

而对于那些资源远没有苹果和谷歌丰富的小公司来说，开发语音驱动的应用程序则是难上加难。简单来说，它们不能够像大公司那样利用海量的真实语音指令数据。“如果你只是个体开发者，那你永远都无法获得足够的样本来完善你的算法。”亚历山大·勒布伦(Alexandre Lebrun)说道。

这就是他为什么创立Wit.ai的原因。该服务旨在帮助开发者汇集他们的语音样本来驱动一个语音与自然语言识别系统，勒布伦希望该系统不久之后将能够在深度和宽度上媲美苹果和谷歌提供的工具。未来，该类技术会非常重要，因为开发者打造的下一波技术往往需要语音控制界面，如没有屏幕的智能联网设备和可穿戴设备。

Wit.ai成立不久，但已经吸引了数千名开发者使用它的测试服务。周三，该公司也宣布它刚刚完成了300万美元的种子融资，投资方是知名风投公司Andreessen Horowitz。

“房间里的大象”

Wit.ai的诞生，源起勒布伦在他的前一家公司VirtuOz的沮丧经历。VirtuOz致力于为AT&T等公司开发语音识别系统。它的问题在于，每建立一个新系统，VirtuOz团队都得重新进行开发——几乎是从头做起。

每开发一个系统，他们都得收集新的语音样本集来训练该系统。很多情况下，不同的客户想要能够识别的语音指令集之间都存在重合，但是VirtuOz并不能将一个客户项目中的语音样本再用于另一个客户的项目。

“不管我们有多么地努力，‘房间里的大象’(注：指人们很忌讳的麻烦)都还是存在——语音识别永远都做不到完美的地步。”他今天在博文中写道，“事实上，终端用户体验有时候非常糟糕。雪上加霜的是，由于将语音整合成系统的设置成本高昂，没有提供商能够真正解决小企业和开发者的需求。”

去年，勒布伦将VirtuOz卖给了帮助驱动Siri的语音识别公司Nuance，然后创立了Wit.ai。

运作模式

通常来说，语音算法开发者需要先创建“语法”——你希望计算机能够识别的单词和词组集合，然后“训练”计算机识别那个语法，具体是通过针对那些单词和短语为它提供尽可能多的不同表达方式的样本。由于不同的用户会用不同的方式来表述他们的指令，语法需要尽可能地具有弹性，需要能够识别尽可能多的相同意图不同的表达方式。

而Wit.ai实质上所做的就是，让企业能够共享语法和训练数据，就像软件开发者在GitHub等网站上共享代码那样。开发者能够复制那些语法来随意调整自己的应用程序，就像他们复制GitHub上托管的代码后进行调整那样。

商业模式方面，Wit.ai也类似于GitHub。正如GitHub对公开分享自己的代码的人免费，Wit.ai免费推向共享数据的人。出于隐私原因和实用性的考虑，用于训练语音系统的实际语音样本不在分享范围内。不愿分享自己的语法或数据的公司如想使用Wit.ai的服务，就需要付费。

价值主张

目前，越来越多的公司与项目跟Wit.ai一样想要帮助开发者将语音识别技术引入他们的应用程序。当中还有像Julius、CMU Sphinx这样的开源项目，也有诸如谷歌语音转文本的托管服务。它能够理解语音，尝试判断用户的确切意图。

通过提供一项免费服务，勒布伦希望能够吸引各种各样的语法和训练数据，进而提供可比肩苹果Siri和谷歌Google Now的语音识别功能。

这种模式的不好之处在于，所有的音频都必须经过互联网传送到公司的服务器。这意味着可能会出现延迟、可用性和隐私方面的问题。但勒布伦指出，针对这一问题，Wit.ai 正在开发一个主要基于客户端与服务器传输信息的“混合”版本。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

张一鸣私募新动作，重心已悄然转向大模型与AI战略？

12-19

算力硬件引领市场热潮，豆包概念股能否持续走强？

12-19

市场分化算力硬件爆发，抖音微信小店概念股活跃，后市如何演绎？

12-19

北证50深V反转，AI硬件与微信小店成市场新宠？

12-19

OpenAI Canvas大升级：React渲染与文本格式化新工具来袭

12-19

OpenAI新招！ChatGPT热线电话服务上线，老年机座机也能聊

12-19

AMD苏姿丰领投，Liquid AI崛起：机器人之母带队，AI赛道再掀狂澜

12-19

AI创业热潮下，清北复交毕业生都偏爱在哪座城市扎根？

12-19

小红书搜索量激增，百度MEG能否避免重蹈极越覆辙？

12-19

苹果在华大模型合作再添一员，智谱加入谈判行列

12-19

苹果寻国内AI盟友，腾讯字节谁将入驻iPhone中国市场？

12-19

苹果AI中国落地新动向：腾讯字节在谈，百度还能否入局？

智东西12月19日消息，据路透社报道，苹果正在和腾讯、字节跳动洽谈，商讨将其AI大模型整合到苹果在中国销售的iPhone手机中。路透社报道认为，成为苹果在中国的AI大模型合作伙伴，对于所合作的厂商来说十分…

12-19

MiniMax热门AI产品Talkie疑遭美区下架，原因待解！

据ZFinance，AI独角兽企业MiniMax旗下的明星产品Talkie疑似在美国服务器下架。目前，在美区苹果商店已无法搜索到Talkie应用，而安卓版本则暂未受到影响。公开信息显示，Talkie已火…

12-19

阿里“通义”团队大调整，分拆并入智能信息事业群谋新局？

据悉，通义团队中负责To C方向的产品经理和工程团队，将调整至阿里智能信息事业群，与智能搜索产品“夸克”处于平级。这一调整反映了阿里云在基础技术研发和应用开发领域的分工，类似于其他大厂的做法，例如字节跳动…

12-19

抖音副总裁：大模型低价非价格战，技术创新促成本降低

三言科技12月19日消息，针对“字节跳动掀起大模型价格战”一事，抖音集团副总裁李亮发微博回应称，这不是价格战。他表示豆包大模型通过技术创新降低成本，在算法、软件工程和硬件方案上做了优化，3厘/千tokens…

12-19

点击查看更多 +

全站最新

《女神异闻录》总监谈主角设定：高中生最适合成长故事，女性主角同样欢迎

《星空》加载慢竟因策划“加戏”？前开发者揭秘真相

《剑星》圣诞更新上线，发布冬日音乐EP营造节日氛围

小米Buds 5 Pro曝光：或将搭载5.1GHz WiFi技术，音质再升级？

vivo X200系列海外上市，天玑9400加持，顶配售价破八千元大关

暴雪年终总结：国服回归玩家众多，游戏力量再聚首！

热门内容

本栏最新

算力硬件引领市场热潮，豆包概念股能否持续走强？

市场分化算力硬件爆发，抖音微信小店概念股活跃，后市如何演绎？

OpenAI Canvas大升级：React渲染与文本格式化新工具来袭

OpenAI新招！ChatGPT热线电话服务上线，老年机座机也能聊

AI创业热潮下，清北复交毕业生都偏爱在哪座城市扎根？

苹果寻国内AI盟友，腾讯字节谁将入驻iPhone中国市场？

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区 · 齐鲁软件园鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.