今年5月9日,深圳湾体育中心“春茧”体育馆。
当夜幕降临,一场盛大的锤子手机发布会在这座滨海建筑举行:罗永浩现场演示科大讯飞的语音输入,一字不差的识别结果惊艳全场。站在中国人工智能产业迈入“成年礼”的时间节点,中文智能语音产业正发生微妙变化:由国外IT巨头垄断的格局被彻底扭转。
数据显示,截至今年,科大讯飞占有中文语音市场70%以上份额。这家名字之中同时标识着技术背景和企业愿景的科技公司,是如何做到的呢?
2008年,科大讯飞在深圳A股上市
没想到源头创新这么难
1990年,中国民营企业开始长袖善舞。
财经作家吴晓波在《激荡三十年》书中梳理这一年的大事记,“长虹成最大彩电企业”位列商业事件第一位,乡镇企业利润首次超过国营企业。
那一年,17岁的刘庆峰放弃保荐清华大学汽车工程专业,选择中国科技大学电子工程系。
上世纪90年代,国内语音分为“南北二王”,“南”指的是中国科技大学的王仁华教授;“北”则是清华大学的王作英教授。
作为中国语音界泰斗级老教授,在王仁华教授语音实验室里,一排计算机已经可以初步合成简单的人声。
开明的王仁华打破惯例,让年轻的刘庆峰牵头做一个语音合成系统。结果不负众望,在当年的国家“863计划”成果比赛中,刘庆峰开发的语音合成系统不但保证了音质,还具备了优良的语音自然度,合成出来的语句近乎“人声”。这成了当年比赛中最为轰动的科研成果。1998年,在国家“863计划”语音合成比赛中,刘庆峰带领的中科大团队击败清华、北大等对手,夺得冠军。这个大奖,让刘庆峰深受鼓舞,萌生把这项技术产业化的想法。
1999年,李开复作为负责人,代表微软在中国创建中国研究院。看到刘庆峰夺冠后,李开复表示愿意提供微软奖学金,但条件是刘庆峰要到微软工作一个月。
1998年IBM发布了语音系统,首次靠说话就能让电脑完成指令,被评为当年科技界十件大事之一。
面对庞大的中国语音市场,IBM、微软、英特尔、摩托罗拉等加紧在中国布局,纷纷在中国设立研究院,把中文语音作为重要方向。中国语音技术与国际竞争形势严峻。
科大讯飞创业早期的办公场所
在此背景下,心系国家利益、忠于理想的刘庆峰考虑再三选择放弃微软奖学金,并放弃了出国深造的机会。
1999年6月,响应“大学生创业”的号召,刘庆峰一边攻读博士学位,一边与一批中科大校友,创立了“安徽硅谷天音信息科技有限公司”(科大讯飞的前身),立志要将中文语音技术在中国人手里全面产业化。
凭“中文语音技术要由中国人做到全球最好”的信念,从2006年至今,刘庆峰创办的科大讯飞在国际语音合成大赛中打败IBM研究院、微软研究院等对手,连续11次取得国际第一的成绩。
10余年后,在讯飞语音云的开发者大会上,李开复感慨道:“庆峰是这么多年来,唯一拒绝过微软奖学金的人。”
科大讯飞执行总裁胡郁,比刘庆峰小5岁,也是他的同乡。
1995年,胡郁参加高考填报志愿时,当时在中科大电子工程系读书的刘庆峰对他说:“中科大不错,来我们这儿吧!”
就这样,宣城市高考状元胡郁成了刘庆峰的同门师弟。
科大讯飞执行总裁胡郁在演讲
创业之初一度非常痛苦,整整一年几乎颗粒无收。胡郁回忆,公司最困难时,刘庆峰自己借钱给大家发了工资。“那时自己还在学校读书,觉得有工资拿就挺好”。
科大讯飞流传着这么一个段子:2000年“联想创投”投资科大讯飞后,其投资人员参加了科大讯飞的第一次月度会回去就哭了:“没想到核心技术这么难赚钱!”
账户一度只剩十几万元,柳传志为何仍看好它?
在市场上碰壁之后,科大讯飞账户一度只剩下十几万元,企业陷入生死存亡之间。
是去是留,人心惶惶。2001年,科大讯飞为此专门在巢湖半汤召开会议。
经中科大联合创始人团队的坚持,大家最终坚定初心,科大讯飞要做中国乃至全球语音产业的龙头,并对未来达成3个共识:
1.人工智能产业未来有100亿的空间;
2.我们能成为这个领域的No.1;
3.我喜欢。
2001年,科大讯飞召开“半汤会议”
这种一锤定音的格局和视野,也奠定了科大讯飞壮大的基石。
“现在很多人都说自己在做人工智能。但对科大讯飞来说,人工智能是我们唯一可以做的事情”。胡郁表示。
获悉刘庆峰的创业故事,联想集团创始人柳传志就很看好科大讯飞。2001年,科大讯飞获得联想集团800万投资。柳传志和刘庆峰有过一次长谈。对于刘庆峰“科学家式创业”,柳传志告诉刘庆峰:“既要有理想,又不能理想化”。
一个更为值得关注的细节:这是联想投资成立后“按照正规流程”投资的第一家企业。
多年后回忆往事,柳传志不忘夸赞刘庆峰:“有理想、有胸怀、有能力,有强烈地把科技成果转化为产品的意愿。”
回顾技术突破与公司存活过程,科大讯飞团队也走了不少弯路。
很多产品在实验室运行良好,但拿到市面上却被指不接地气。直到2003年,成立4年多的科大讯飞一直没盈利。
社会舆论纷纷,公司内部也出现许多不同的声音:做语音,有前途吗?
刘庆峰依然故我,笃定自己的选择。对于质疑,他回应道:如果不看好语音的人可以离开。不久,英特尔宣布退出,外界说这是因为迟迟没有盈利,刘庆峰被投资者抛弃了。
源头创新之路,难道真的走不通吗?
在艰苦的创新实践中,科大讯飞团队深深感受到,要靠技术赚钱,并非一朝一夕的事。但是以刘庆峰为主的科大讯飞管理团队坚持存在的唯一理由,就是要用源头技术,去创造一个全新的市场和产品。
经历长期亏损、副业诱惑、股东质疑等之后,2004年,在语音市场上咬牙坚持了5年的科大讯飞,终于实现扭亏为盈,进入发展快车道。
2005年,科大讯飞语音产品实现销售收入1.5亿元,利税2500万元,带动相关产业10亿元以上,并且推动语音产业进入全面爆发阶段。
2007年完成股份制改造,一年后,2008年5月12日在深圳中小板上市,成为中国在校大学生创业的第一家上市公司。
国家繁荣富强,科大讯飞也一步步发展壮大。伴随新的创新大潮,科大讯飞进入快速发展期。
2010年,随着苹果Siri发布,市场掀起一阵语音热潮,深耕语音领域的科大讯飞,迎来全面收获季节,开始慢慢走入普通人视野。
成功,当然不是天上掉下的馅饼!
在受到大众关注之前,科大讯飞已经做出“讯飞语音输入法”这样大众化的App产品。“讯飞输入法”可实时将21种方言转换成文字,截至目前已拥有4.4亿用户;“灵犀语音助手”的中英文翻译连老外都惊叹;新加坡94%的中小学在用讯飞教育教学生态体系进行学习。
在与苹果语音合作没有突破的情况下,中国移动的目光落向了科大讯飞。
2012年8月24日,中国移动宣布,与科大讯飞签订认购协议,以13.63亿元认购科大讯飞7027.39万股新股,成为科大讯飞的第二大股东。
科大讯飞逐渐进入消费者领域,先后推出灵犀语音助手、讯飞输入法、智能音箱、智能语音机顶盒等产品。
一名出租车司机使用灵犀语音助手后,惊奇地点赞道:“开车时需要找路、听音乐、听新闻,手动输入很麻烦,用了语音直接说说就搞定,真是太方便了。”
科大讯飞多个产品共同特点,都是不需手动操作,直接通过语音实现人机交互。
移动互联像是一扇窗,打开了科大讯飞的新世界,市场的热烈回应更让科大讯飞大步向前。
100亿元、200亿元、300亿元、400亿元,科大讯飞的市值不断冲关,技术方面更是捷报频传:面对百度、腾讯、搜狗等后来者追赶的脚步,科大讯飞毫不示弱。
“美国《纽约时报》的一篇描述中美人工智能竞赛的报道中,科大讯飞是国内唯一被提到的企业。”科大讯飞轮值总裁吴晓如自豪地介绍。
科大讯飞轮值总裁吴晓如
2008年至今,科大讯飞连续在国际说话人、语种识别评测大赛中名列前茅。
2014年,科大讯飞首次参加国际口语机器翻译评测比赛即在中英和英中互译方向中以显著优势荣获第一。
2016年,国际语音识别大赛科大讯飞取得全部指标第一;在认知智能领域,相继获得国际认知智能测试全球第一、国际知识图谱构建大赛核心任务全球第一。
“去玩儿的事业,一定要跟你喜欢的人一起去做;玩耍的过程比结果更重要,谋事在人成事在天,改变你能改变的,接受你不能改变的”。面对为何能有如此骄人成绩的提问,胡郁这样分析。
致敬安迪•格鲁夫, 科大讯飞inside雏形初现
刘庆峰很欣赏英特尔的创始人安迪•格鲁夫,并认同intel inside的理念(现在几乎每一台电脑里面的CPU都由Intel公司出品)。刘庆峰把这一理念复制,将科大讯飞的技术植入各领域并拓展行业用户市场。
最初,科大讯飞做了一套畅言软件,但卖不出去。也尝试过有声Email和电话听网,用电话访问移动互联网。但是有声Email基本没有人用。最终,B2B业务救了科大讯飞。
之后科大讯飞的战略目标逐渐清晰:从全球最大的中文语音技术和语言技术提供商,发展到全球最出色的多语种技术提供商。
如今,科大讯飞有3个愿景,近期是语音产业领导者和人工智能产业先行者,实现百亿收入、千亿市值;中期则是中国人工智能产业领导者和产业生态构建者,联接十亿用户,实现千亿收入;长期来看,科大讯飞要成长为全球人工智能产业领导者、用人工智能改变世界的伟大企业。
“现在看来,如果没有做这些疯狂的傻事,没有留下这些火种,科大讯飞也发展不到今天。”科大讯飞高级副总裁江涛说。
科大讯飞高级副总裁江涛在一场会议上演讲
有些人说科大讯飞是“一夜爆红”,却不知背后藏着多少“泰山压顶,不为所动”的坚持。
“任何新技术,都有一个基本的趋势,从概念导入到成功的商业模式探索需要一个长期过程。很多创业者在这个过程中失败了,而能坚持下来的人,慢慢地进入到真正的产业成长和发展期。假如要做源头技术,心中一定要有这样一个曲线。能扛住就可以走到真正美好的未来。”刘庆峰感慨。
“不知道营销渠道怎么建。客户不信我们,信华为、联想,那我们就把技术卖给他们,才获得了科大讯飞的第一桶金。”刘庆峰追忆。
科大讯飞的成长史,是典型的中国技术创业故事。从技术到商业,从实验室到市场。站在人工智能产业风口,科大讯飞也在向人工智能领导者加速飞奔。
目前,科大讯飞正在进行的“讯飞超脑计划”,是科大讯飞从“让计算机能听会说”成功的基础上,向“让计算机能理解会思考”的目标迈进的关键支撑项目:研发实现具有深层语言理解、全面知识表示、逻辑推理联想、自主学习进化等高级人工智能的智能系统,并将在教育、客服、人机交互、医疗等领域实现推广应用。
过去信息化在教育中的应用,普遍用作一种简单的辅助手段。未来将大不一样。科大讯飞高级副总裁吴晓判断:“中国的教育信息化正在从硬件走向软件。把教育实践活动和IT技术更多融合起来,是教育细分领域的突破口。”
当前,面对“人工智能产业是泡沫”的声音,刘庆峰坚信:只要做出实实在在的应用,对建设美好世界有用,人工智能就是刚需。
缺少来自一线市场的信息,科大讯飞就把移动互联网事业部前移到北京,“让靠近市场的一线人员来做决策”。
在攀登技术高峰征程中,科大讯飞深知板凳要坐十年冷。
当前正处于人工智能第三次浪潮,人工智能技术和创新创业将互相促进共同发展,逐渐以产业和产品的形式深入到生活的方方面面。与华为相似,科大讯飞也是一家登山型企业,始终在自己认定并且热爱的道路上努力坚持。
2014年,科大讯飞发布“讯飞超脑”计划,目前已经取得阶段性成果,2015年,全球首款智能语音机器人“小柔”问世,可以像人一样“理解”问题,会“思考”,善“学习”。
全球技术只有一个第一。Google、Facebook、IBM、微软等全球巨头,无不把人工智能看成未来20年,能够深刻改变人们生活的产业机会,科大讯飞也展开产业发展蓝图。
“在整个人工智能的产业链里,中国企业的基础能力和欧美比还有距离,但在数据和算法上并没有落下。我们要抓紧利用人工智能快速发展,加快与基础行业的结合,抓住这个千载难逢的机会。”科大讯飞执行总裁陈涛深有感触。
科大讯飞执行总裁陈涛在演讲
如今,科大讯飞开始为腾讯、高德地图、滴滴、携程、大众点评、新浪微博、奔驰、宝马、华为等著名企业提供语音技术。
18年前实验室里的“智能语音idea”应用已经遍布大江南北,成功地进入新加坡、日本、欧洲、北美等市场,并被奥运会组委会和“863计划”专家组确定为“面向奥运的多语言信息服务系统”中的语音技术提供单位,有了“IFLY Inside”的雏形。
在刘庆峰看来,一个伟大的公司,要比科学界更知道这个技术未来能达到什么程度,要比消费者更能准确地预知未来需要什么,这是科大讯飞追求的创新目标。