作為移動互聯網時代的史詩級產品,輸入法見證了商業更迭的市場規律,承載了用戶行為的變遷軌跡,自身也在技術浪潮的推動下完成了一次次的躍遷:搜狗將輸入法從單機時代帶進了互聯網時代,訊飛又為輸入法打開了人工智能的大門。 ? ? ? 借著訊飛輸入法上線10周年的契機,似乎有必要盤點下輸入法在上一個10年的歷程:站在人工智能時代的起點上,曾經革新了移動互聯網交互方式的輸入法,還將對世界產生什么樣的影響? ? ? ? ?隨著智能手機的出現,改變了原有的產品形態,傳統的物理鍵盤徹底消失,虛擬輸入法逐漸成為一種剛需,如何提升用戶的輸入效率,成了多方力量角逐的賽點。在PC時代殺出一條血路的搜狗輸入法,隨即開始向手機市場傾斜,原本適用于PC的產品邏輯被復制到手機上;汲取了PC市場經驗的手機廠商也開始行動,谷歌將自家的輸入法作為系統的默認選項,主張封閉生態的蘋果牢牢掌控著輸入法的控制權,直到2014年才開放了第三方輸入法的 API。 ![]() ? ? ? 同樣是2010年,科大訊飛的一群工程師們也加入了手機輸入法的角逐賽,不過他們并沒有沿襲功能機時代的輸入理念,而是主打語音技術,在既有輸入鍵盤上增加一個麥克風圖標,用戶點擊后就能語音輸入。時間同樣驗證了訊飛輸入法的前瞻性,到了2012年的時候,搜狗輸入法和百度輸入法先后推出了語音輸入,2013年訊飛輸入法的激活用戶量正式破億……語音輸入逐漸衍生成為新的流派。 ? ? ? ?智能手機時代的降臨,催生的不只有造機潮,還有工具產品的爆發:早期的原生操作系統體驗并不完善,桌面類、美顏類等工具類產品悄然崛起,第三方輸入法或多或少享受了特殊的紅利周期。作為工具屬性的產品,是不是都只是用過就“丟”一邊的產品呢?隨著技術革新,讓工具類產品有了新答案。老羅在2016年錘子手機M1的發布會上用很快的語速說了相當長的一段話,訊飛輸入法無時差同步輸出了文字版本,結果幾乎沒有任何偏差,發布會現場隨即一片歡呼。發布會結束的第二天,訊飛輸入法霸占了多家應用商店的下載榜單。 ? ? ? 訊飛輸入法的高光時刻至今仍時常被提及,外界忽略的是背后的技術深耕。訊飛輸入法剛剛上線的2010年,行業內還沒有中文語音識別的概念。訊飛輸入法團隊首創了語音輸入的功能,一開始的識別準確率還只有70%作用,團隊使用大數據訓練和深度學習技術后,語音識別的準確率在2013年達到了92%,然后在2014年快速跨越到業內領先的95%,在一定程度上超出了人耳。 ? ? ? 其實當訊飛輸入法的語音識別準確率達到97%后,用戶規模已經在不到兩年時間內已經翻了一番,羅永浩的示范不過是點燃引線的小火星。相比于那些與用戶需求和行業生態脫節的工具類產品,訊飛輸入法為工具類產品正名的策略并不復雜,即通過技術的持續創新將工具類產品服務化,向用戶提供的不是工具,而是一種服務。工具的弱點是用戶粘性低、可替代性強,但訊飛輸入法用技術創新和產品服務巧妙地讓短板變成了長板。 ? ? ? “直面用戶需求就能得到用戶的歡心。”訊飛輸入法選擇需求排名最高的粵語、四川話和河南話入手,2012年的一次版本更新后上線了粵語語音輸入,成為首款支持粵語語音輸入的輸入法,緊接著上線了四川話和河南話的語音輸入。截止到目前,訊飛輸入法的粵語語音識別準確率已經超過95%,陸續上線了23種方言的語音識別。 ? ? ? ?因對用戶輸入習慣的洞察,訊飛輸入法在2013年上線了英文語音輸入;2015年訊飛輸入法在語音輸入的基礎上首創了語音翻譯功能 “隨聲譯”,目前已經支持英日韓俄等多種外語的面對面翻譯,輸入法開始進化成為一種人際溝通工具。 ? ? 除了語音識別技術上的縱向深挖,訊飛輸入法還積極在輸入場景上進行橫向延伸,比如在傳統的手寫、鍵盤輸入外,加入了OCR掃描、智能預測等功能。 ? ? ? ?“輸入法的產品生命周期,其實才剛剛開始。”訊飛輸入法上線的2010年,深度學習技術還方興未艾,人工智能還處于第二次浪潮后的靜默期。然而過了十個年頭后,等待語音技術的卻是全新的局面:阿爾法狗燃起了人工智能的第三波浪潮,深度學習等前沿技術加速了落地應用的進程,語音也從小眾一躍成為主流的人機交互方式之一。 ? ? 至少透過訊飛輸入法等行業領跑者的動作,外界看到的并非是時間賦予的老邁,而是一無既往的探索和創新精神。 ? ? 就在訊飛輸入法10周年發布會上,知名相聲演員方清平上演了一場極限語速挑戰賽,用遠超羅永浩當年的語速讀了一段《木蘭辭》,以測試訊飛輸入法在極限快語速下的識別效果。結果讓人驚喜,方清平的語速快過了吉尼斯世界紀錄,訊飛輸入法照舊給出了100%的識別準確率。 ? ? ? 與四年前的有所不同的是,同樣是技術上的秀肌肉,對于“快”的詮釋有了新的注解。如果說訊飛輸入法當年的一夜爆紅,某種程度上與大眾對語音輸入帶來的新鮮感有關,這一次除了速度,還有溫度。 ? ? ? 比如訊飛輸入法新近推出的10.0版本,通過唇形輔助輸入,進一步優化輸入效率,在近距離多人說話的復雜場景中,其他人的聲音不會干擾語音識別結果;再比如針對盲人群體輸入不便的情況,不斷無障礙模式,實現了輸入面板、菜單面板以及表情面板的屏幕隨選朗讀,用戶在視力不便的情況下也能無障礙輸入文字和表情。 ? ? ? 這些年人工智能(A.I.)技術發展非常快,將人們對于智能生活的想象呈現在眼前。我們常用的訊飛輸入法,通過A.I.賦能將語音輸入效率一次又一次提升,甚至突破想象。 |