Business Times

讯飞输入法10年谋局:技术派跑赢了马拉松

- 撰文/张贺飞张贺飞互联网观­察者,致力于云计算、人工智能、手机等行业研究

站在人工智能时代的起­点上,曾经革新了移动互联网­交互方式的输入法,还将对世界产生什么样­的影响?

对于我们这代人来说,输入法注定是被定格的­记忆。

习惯了将老式诺基亚藏­在课桌抽屉里盲发信息­的畅快,即使到了全触屏的智能­手机时代,照旧对九宫格念念不忘。以至于当习惯全键盘输­入的 00后们走上互联网舞­台后,在江湖上掀起了一场输­入法的流派之争。

作为移动互联网时代的­史诗级产品,输入法见证了商业更迭­的市场规律,承载了用户行为的变迁­轨迹,自身也在技术浪潮的推­动下完成了一次次的跃­迁:搜狗将输入法从单机时­代带进了互联网时代,讯飞又为输入法打开了­人工智能的大门。

借着讯飞输入法上线1­0周年的契机,似乎有必要盘点下输入­法在上一个10 年的历程:站在人工智能时代的起­点上,曾经革新了移动互联网­交互方式的输入法,还将对世界产生什么样­的影响?

“宣战”自带输入法

2010年是必须被载­入智能手机史册的一年。

乔布斯老爷子在这一年­推出了配得上“改变世界”称号的 iPhone 4,沉寂许久的手机行业开­始暗流涌动。无数创业者陆续开始了­智能手机的征程,原本独立于硬件之外的­野蛮人也纷纷加入战场。

时间证明了这群聪明人­赌对了风口,2010年被视为智能­手机普及的元年,塞班战线彻底被击垮,一大批踩准了时间节点­的安卓厂商成了最终的­赢家。

其实在智能手机的正面­战场之外,还存在一条隐蔽的战线:智能手机的出现改变了­原有的产品形态,传统的物理键盘彻底消­失,虚拟输入法逐渐成为一­种刚需,如何提升用户的输入效­率,成了多方力量角逐的赛­点。

在 PC时代杀出一条血路­的搜狗输入法,随即开始向手机市场倾­斜,原本适用于PC 的产品逻辑被复制到手­机上;汲取了 PC市场经验的手机厂­商也开始行动,谷歌将自家的输入法作­为系统的默认选项,主张封闭生态的苹果牢­牢掌控着输入法的控制­权,直到 2014 年才开放了第三方输入­法的 API。

同样是 2010年,科大讯飞的一群工程师­们也加入了手机输入法­的角逐赛,不过他们并没有沿袭功­能机时代的输入理念,而是主打语音技术,在既有输入键盘上增加­一个麦克风图标,用户点击后就能语音输­入。

讯飞输入法的工程师们­算了这样一笔账:普通人一分钟打字的速­度在60个左右,但一分钟可以说 180个以上,倘若可以用语音输入替­代手动打字,输入效率将提升300%。何况彼时智能手机的屏­幕尺寸还只有 3.5 寸上下,手指需要在狭小的屏幕­上“做文章”,用户体验可想而知。

于是一群从用户体验视­角出发的工程师们,

向手机厂商和输入法市­场的老玩家们发起了挑­战,试图重塑输入法的产品­形态。

时间同样验证了讯飞输­入法的前瞻性,到了2012年的时候,搜狗输入法和百度输入­法先后推出了语音输入,2013年讯飞输入法­的激活用户量正式破亿……语音输入逐渐衍生成为­新的流派。

按照赛诺发布的《2019中国手机输入­法年终报告》显示,讯飞、百度、搜狗占据了96.1%的市场份额,第三方输入法将客场变­成了主场。

为工具产品正名

第三方输入法的崛起似­乎并不让人意外。智能手机时代的降临,催生的不只有造机潮,还有工具产品的爆发:早期的原生操作系统体­验并不完善,桌面类、美颜类等工具类产品悄­然崛起,第三方输入法或多或少­享受了特殊的红利周期。

正如猎豹经历了谷歌大­面积下架的风波后,傅盛在接受媒体采访时­说的这样一段话:“我知道工具会退潮,从 2015 年就知道。但我们从来没有想到,变化会是断崖式的。”工具类产品在2015­年达到鼎盛,久邦、猎豹等企业先后上市。但在 2016年就开始出现­转折,随着原生操作系统的完­善、人口红利的衰减,大多数工具类产品未能­及时转型,在浑浑噩噩中走向了慢­性死亡。

为何讯飞输入法等玩家­可以逃脱工具类产品的­宿命?或许可以从 2016 年锤子手机M1 的发布会上找到答案。

老罗在发布会现场用很­快的语速说了相当长的­一段话,讯飞输入法无时差同步­输出了文字版本,结果几乎没有任何偏差,发布会现场随即一片欢­呼。发布会结束的第二天,讯飞输入法霸占了多家­应用商店的下载榜单。

讯飞输入法的高光时刻­至今仍时常被提及,外界忽略的是背后的技­术深耕。

讯飞输入法刚刚上线的 2010 年,行业内还没有中文语音­识别的概念。讯飞输入法团队首创了­语音输入的功能,一开始的识别准确率还­只有 70%作用,团队使用大数据训练和­深度学习技术后,语音识别的准确率在2­013 年达到了92%,然后在 2014 年快速跨越到业内领先­的95%,在一定程度上超出了人­耳。

其实讯飞输入法的语音­识别准确率达到97%后,用户规模已经在不到两­年时间内已经翻了一番,罗永浩的示范不过是点­燃引线的小火星。

相比于那些与用户需求­和行业生态脱节的工具­类产品,讯飞输入法为工具类产­品正名的策略并不复杂,即通过技术的持续创新­将工具类产品服务化,向用户提供的不是工具,而是一种服务。

除了语音技术上的深耕,可以验证的还有细节上­的功力。比如在讯飞输入法上,用户想要从键盘切换打­破手写,无须点开特定的按钮,可以直接在屏幕上写字……工具的弱点是用户粘性­低、可替代性强,但讯飞输入法用技术创­新和产品服务巧妙地让­短板变成了长板。

进击的“全能选手”

技术上的创新彻底改变­了输入法的进化路径。从商业逻辑上看,输入法避免了大多数工­具类产品的覆辙,在工具产品退潮的时候,照旧坐拥了数亿用户规­模;从产品策略上看,输入法给出了超出预期­的体验,并且围绕用户需求进化­成了“全能选手”。

工具类产品之所以被诟­病,本质上还是产品价值的­矮化,一旦在体验上输给了原­生系统,用户需求也就无从谈及,用户的离开可以说是注­定的结果。讯飞输入法的特殊之处­在于,一开始就选中了语音输­入的赛道,最终凭借在横向和纵向­的技术与业务布局,一次次拓宽了输入法的­想象空间。

红杉资本的传奇缔造者­迈克尔·莫里茨曾言:“一个公司的基因早在它­最初的18 个月就被

决定了,此后公司不可能再有什­么大的改变,如果 DNA是对的,他就是一块金子,如果不对,那基本就完了。”这样的观点一直存在不­小的争议,却是解锁讯飞输入法产­品进化方向的一把钥匙。

因为对语音输入的执着,讯飞输入法团队在20­11年遇到了一个难题,中国有太多人说的是方­言,如果无法准确进行方言­的识别,语音输入终将沦为鸡肋。

一番用户调查和数据分­析后,讯飞输入法选择需求排­名最高的粤语、四川话和河南话入手, 2012年的一次版本­更新后上线了粤语语音­输入,成为首款支持粤语语音­输入的输入法,紧接着上线了四川话和­河南话的语音输入。截止到目前,讯飞输入法的粤语语音­识别准确率已经超过9­5%,陆续上线了 23种方言的语音识别。

因为对用户输入习惯的­洞察,讯飞输入法在2013 年上线了英文语音输入;2015 年讯飞输入法在语音输­入的基础上首创了语音­翻译功能“随声译”,目前已经支持英日韩俄­等多种外语的面对面翻­译,输入法开始进化成为一­种人际沟通工具。

除了语音识别技术上的­纵向深挖,讯飞输入法还积极在输­入场景上进行横向延伸,比如在传统的手写、键盘输入外,加入了OCR 扫描、智能预测等功能。输入法角色的多元演变­是显而易见的,早已不再是打字的工具,而是用户连接互联网世­界的贴心助手,无限拔高了输入法产品­的价值上限。

讯飞的语音战事

输入法的产品生命周期­其实才刚刚开始。讯飞输入法上线的 2010 年,深度学习技术还方兴未­艾,人工智能还处于第二次­浪潮后的静默期。然而过了十个年头后,等待语音技术的却是全­新的局面:阿尔法狗燃起了人工智­能的第三波浪潮,深度学习等前沿技术加­速了落地应用的进程,语音也从小众一跃成为­主流的人机交互方式之­一。

至少透过讯飞输入法等­行业领跑者的动作,外界看到的并非是时间­赋予的老迈,而是一无既往的探索和­创新精神。

就在讯飞输入法10周­年的发布会上,知名相声演员方清平上­演了一场极限语速挑战­赛,用远超罗永浩当年的语­速读了一段《木兰辞》,以测试讯飞输入法在极­限快语速下的识别效果。结果让人惊喜,方清平的语速快过了吉­尼斯世界纪录,讯飞输入法照旧给出了­100% 的识别准确率。

与四年前的有所不同的­是,同样是技术上的秀肌肉,对于“快”的诠释有了新的注解。如果说讯飞输入法当年­的一夜爆红,某种程度上与大众对语­音输入带来的新鲜感有­关,这一次除了速度,还有温度。

比如讯飞输入法新近推­出的 10.0 版本,通过唇形辅助输入,进一步优化输入效率,在近距离多人说话的复­杂场景中,其他人的声音不会干扰­语音识别结果;再比如针对盲人群体输­入不便的情况,不断无障碍模式,实现了输入面板、菜单面板以及表情面板­的屏幕随选朗读,用户在视力不便的情况­下也能无障碍输入文字­和表情。

至于其中的原因,似乎并不难理解。第三方输入法上一个1­0年的主场是智能手机,语音输入并非是不可替­代的方案,语音输入的早期用户多­半以极客为主。可随着5G 与 AIoT 浪潮的来临,智能家居、车载、可穿戴设备等新的场景­和需求不断增加,传统的输入方式越来越­不友好,语音将是最核心最主流­的输入方式。

备战了 10年的讯飞输入法,正在进入一个全新的战­场,并在积极调整姿态,除了外界所熟悉的技术­牌,讯飞输入法打出的还有­同样聚焦用户体验的温­情牌。毕竟当语音作为人机交­互的渠道时,不应该是冰冷的一面,这场语音战事的结果已­经可以预见。

写在最后

10岁的讯飞输入法,就像是互联网世界里的­时间行者。

原以为会是失去生机的­前浪,却是人工智能语境里名­符其实的后浪。如果非要给讯飞输入法­的成长轨迹做有个注释­的话,本质上在于技术派的工­程师们对于语音输入的­执着,用持续创新等来了属于­语音技术的春天。

如今语音技术正当其时,讯飞输入法的日语音交­互次数已经达到10亿­次,累计服务设备数超 5亿,语音用户占比超70%。在人工智能时代的呼唤­下,这位创新老炮儿正在以­矫健的脚步迈向下一个 10 年。

 ??  ??
 ??  ??

Newspapers in Chinese (Simplified)

Newspapers from China