當前位置: 主頁 > 國內 >

        搜狗王硯峰:未來人人都會需要AI錄音筆

        時間:2020-02-21來源:互聯網 作者:編輯 點擊:
        “搜狗公司的使命是讓表達和獲取信息更簡單,而信息表達和獲取的核心載體是語言,我們在AI上也是圍繞語言這個核心去展開”。搜狗AI交互事業部總經理王硯峰向艾瑞網介紹了搜狗對

        “搜狗公司的使命是讓表達和獲取信息更簡單,而信息表達和獲取的核心載體是語言,我們在AI上也是圍繞語言這個核心去展開”。搜狗AI交互事業部總經理王硯峰向艾瑞網介紹了搜狗對于人工智能的定位。

        作為一家起家于搜索業務的互聯網公司,在原有核心業務保持快速增長的同時,搜狗公司AI技術也在不斷突破:語音識別技術升級,搜狗目前可支持識別英日韓法西俄等十余種外語和粵語、四川話等多種方言識別,語音識別準確率達到98%,準確率和響應速度均為行業領頭者,在語音輸入與語音轉寫、會場同傳、語音采訪等多個場景可取得良好的落地效果;多模態識別技術領跑業內,通過對用戶唇形、語音、表情的多維輸入視頻即可將視頻內的語音更準確地轉寫為文字,極大地提升了噪聲環境下語音識別效果;語音合成技術持續加碼,基于多目標學習、表現力遷移的AI分身、用戶“變聲”、個性化TTS等都在業界具有先發優勢,表現搶眼。

        談到未來搜狗對AI交互的發展規劃,王硯峰認為,語音輸入法還是要做好,鞏固輸入法產品的地位;會圍繞AI交互這個賽道,推出更多自有品牌的智能硬件,而在終端賦能方面,要讓硬件與搜狗輸入法、C端數據打通,讓搜狗走出提供技術來提供服務。

        王硯峰,搜狗AI交互事業部總經理。負責搜狗語音、視覺、NLP等技術的研發及應用,以及基于AI技術的產品創新和行業服務。

        從輸入法進軍智能語音

        艾瑞網:首先請您介紹一下,搜狗AI交互的起點是什么產品?

        王硯峰:搜狗的AI交互起源于輸入法,語音輸入是輸入法的一個核心功能,搜狗智能語音發展也受益于輸入法的大量用戶數據與行為數據。

        搜狗輸入法語音輸入功能于11年開始研發,12年面世,13年上線了深度神經網絡。

        談及搜狗輸入法“刷新”AI交互技能的原因,核心有三點:(1)語音輸入提升了用戶傳遞信息的效率,相比打字輸入體驗更好、更快捷;(2)語音轉化場景如翻譯場景下,智能語音為用戶提供了一個提供方便的入口,當用戶說完一條語音信息,相應的譯文就已經準備好可以直接發送了,減少了反復的手動操作,搜狗現在已經做到了中英日韓四種對話語音隨心譯;(3)語言除了是傳遞信息的工具,也是人們表達自我的一種手段,AI能夠幫助輸入法產品去做用戶個性化的表達。

        搜狗輸入法作為頭部的輸入法產品,在這三個方向上都跑得很快。語音輸入,傳統上是非個性、面向所有用戶都一樣的語音轉文字,2019年我們上線了跟用戶詞庫和語音識別引擎打通的“個性化語音識別”,使用戶常用語識別錯誤率相對下降近40%,比如用戶工作場景相關的內容識別率會更高,免去了手動修改的麻煩,這個功能的使用頻率很高,甚至使我們搜狗輸入法產品的賬戶登錄比例提高10%以上。在語言個性化表達方面,我們2019年推出了變聲功能,能夠將用戶的聲音轉換成特定人的聲音,語速、停頓、情感等說話習慣均可被轉換為超高逼真度的指定角色聲音;而除了語音類的個性化表達,AI助手“智能汪仔”能夠在各種聊天場景中理解用戶輸入的文字信息,從而為用戶推薦豐富多樣的表情包和回復的“妙語替換”。

        搜狗輸入法個性化語音識別

        艾瑞網:AI交互是否已經成為了輸入法用戶的常用功能?AI本身,又能夠為輸入法產品的商業化提供什么樣的想象呢?

        王硯峰:沒錯,用戶的使用已經非常高頻。截至2019年9月底,搜狗輸入法日均語音請求較一年前增長67%,峰值達8.3億次。目前輸入法都是免費產品,未來會做一些增值服務,例如可能在變聲上結合大IP來進行增值服務收費。

        智能語音的賽道里,不做終端設備是很難出頭的

        艾瑞網:現階段智能語音相關的生態當中,有設備、開發平臺、標準化的SaaS服務平臺、音頻內容等等,您怎樣看待智能語音的開放性開發平臺,這會是一種在技術落地應用和商業變現上能夠跑通的模式嗎?

        王硯峰:搜狗也很早就布局了開放平臺,2015年至2016年的時候我們開始通過平臺向外輸出AI能力,也積累了很多很多的開發者和合作伙伴。不過,對于開放平臺而言,找商業模式其實是一個重點。當時,搜狗合作了小米、創維、魅族等頭部廠商,但沒有基于“開放”探索出好的商業模式。而目前看開放平臺只是會相對更容易的降低和行業合作的門檻,更容易的把行業用戶引過來,但是建立好的商業模式,還是需要進一步針對行業深耕,尤其是針對傳統行業,不僅需要領先的技術,同時也需要針對這個行業下客戶的痛點,推出他們更需要的SaaS產品或解決方案,做到更好的服務行業客戶,才能形成好的商業落地。

        艾瑞網:搜狗目前定位在哪類智能設備?從互聯網企業開始投入做硬件,有什么基礎,攻堅了哪些問題?

        王硯峰:自有品牌的硬件大體上是選便攜、隨身的品類。目前,我們已經發布了翻譯機、錄音筆等,未來會做耳機,以解決人在商務生活方面的一些問題。在這些產品上搜狗主打AI能力,幫用戶通過AI能力做之前自己無法做到的事情或者需要耗費大量精力的事情。2019年我們的搜狗AI錄音筆C1上市,首發當日銷量就突破了2萬臺,說明這件事情是有價值、有市場的,未來人人都會需要一個錄音筆,用AI能力做信息的記錄。通過搜狗自己的硬件,用戶的反饋可以被深度優化打磨,這也為我們在錄音轉文字這個方向下,沉淀出了行業最領先的核心技術和服務。

        過去搜狗研發的糖貓兒童手表為搜狗的AI硬件積累了一些硬件研發、供應鏈和產品設計的基礎,而我們為了現在的翻譯機、錄音筆在實際場景中的應用,又打磨了從聲學信號處理到識別算法的一系列技術。2019年,搜狗自研的Smart Voice麥克風陣列算法更進一步,可對噪聲和混響進行多重深度優化,確保人聲的高保真還原;我們還把語音轉寫中切分說話人的技術做進產品,這在業內是首家,雙人識別已有90%準確率;同時我們通過研發和數據解決了遠場語音轉寫中聲源遠近、連讀、發音模糊等問題,使錄音筆離線轉寫效果明顯高于競品,在真實場景中達到了可用。通過這些針對場景的技術打磨,你會發現搜狗目前在錄音筆行業上,無論是核心的語音轉文字能力,還是圍繞語音本身的功能創新,都是行業中最領先的。近期,我們還將通過深度學習跨越過去通過陣列技術+傳感器優化的方式進一步做好降噪,即上線AI去背景聲、人耳聽感優化,這會使錄音筆在高頻場景——采訪中的使用效果更好。

        聽寫服務中臺化,增值服務模式相對跑通

        艾瑞網:對于互聯網公司和AI公司來說,終端硬件的銷售都不是最終的目的。但我們關注到,類似于智能音箱等聊天交互設備還沒能跑通增值服務這件事,在搜狗扎根的便攜式功能性設備上,是否有所不同?

        王硯峰:搜狗目前基于語音轉寫在構建C端增值服務能力,錄音筆產品+增值服務這種模式已經相對跑通。2019年8月,基于在錄音筆產品背后構建的AI服務體系,我們推出了搜狗聽寫服務,并已經與索尼、愛國者合作,探索 “技術輸出-終端產品-用戶增值服務付費”這種打法。在這種模式中,合作伙伴只需要做硬件,不需要考慮軟件和用戶體系,搜狗會面向最終使用者提供完整服務,搜狗開放的不光是背后的AI技術,而是完整的服務,用戶是搜狗和設備商共有的。例如愛國者的錄音筆用戶安裝的是搜狗錄音助手的App,如果用戶在App中進行增值服務付費,合作伙伴也能得到收益分成。現在搜狗錄音筆的轉寫服務可以免費提供,但例如轉寫速度加快、存儲增容等等都可能變成增值服務變現的方式,現在也已經有用戶會付費。

        To B的開拓一定要充分結合搜狗在行業上的技術優勢

        艾瑞網:目前搜狗的AI業務矩陣是否覆蓋了G端、B端的傳統行業?

        王硯峰:對于搜狗來說,我們在非消費級市場希望著眼的領域也是搜狗有充分的競爭能力能搞定痛點、有充分技術優勢的行業。

        比如我們當前在非消費級市場推出的搜狗分身和搜狗同傳服務。

        在AI虛擬人這個領域,搜狗通過推出“搜狗分身”技術,有很大的先發優勢。拿廣電行業來說,廣電的本質是做內容的生產,通過AI分身,新聞稿件可以直接生成語音,由虛擬的合成主播進行播報。我們和新華社合作的AI合成主播目前已播報新聞6500余條,累積時長超過15000分鐘,可以24小時不間斷的待命,以應對突發的新聞需求,這就可以節省很多人力。搜狗AI合成主播是2018年發布的,2019年已經升級到第四次迭代,基于AI分身技術的突破能夠實現站播,姿態和動作都更自然。AI分身還可以應用于金融領域,成為虛擬柜員;應用于司法領域,成為引導用戶完成線上司法訴求的虛擬法官,既權威又形象;還可用于峰會主持、培訓講座等等……

        搜狗公司與新華社新媒體中心聯合發布的全球首個站立式AI合成主播

        搜狗的AI同傳服務始于2016年第三屆世界互聯網大會,當時第一次把已有的語音技術和基于神經網絡的實時機器翻譯技術結合在一起,進行現場AI同傳,至今AI同傳已服務數百場會議。

        艾瑞網:非消費級領域的業務,會以行業解決方案形式還是以SaaS形式提供服務?

        王硯峰:在提供服務的方式上,我們會提供標準化SaaS形式提供AI分身等應用,中小客戶,能直接利用搜狗的SaaS平臺獲取服務。而面向行業中的大客戶,我們也會提供整套行業解決方案。

        自2012年AI語音功能登錄輸入法至今,搜狗的AI交互已經走過了八年,形成了主打語言AI的鮮明特色。從自身最熟悉的互聯網領域,到以產品+模式創新者姿態加入的硬件終端,和以引領者身份領路前行的AI分身,持續的自我刷新也使科技真正成為了搜狗企業活力延伸拓展、生生不息的導體。

        頂一下
        (0)
        0%
        踩一下
        (0)
        0%
        ------分隔線----------------------------
        發表評論
        請自覺遵守互聯網相關的政策法規,嚴禁發布色情、暴力、反動的言論。
        評價:
        文章導航
        推薦內容
        主站蜘蛛池模板: 西西人体www44rt大胆高清 | 青青操在线视频| 在线观看网站污| 久久久久亚洲AV成人无码| 欧美日韩亚洲电影| 农民工嫖妓50岁老熟女| 久久精品老司机| 在线播放一区二区| 东北大坑第二部txt| 日韩日韩日韩日韩日韩| 亚洲欧美日韩综合一区久久| 精品日韩欧美一区二区三区| 国产成A人亚洲精V品无码性色| 8x国产在线观看| 小兔子救了蛇被蛇两根进去| 久久人人爽人人爽人人av东京热| 欧美呜巴又大粗又长| 人人妻人人澡人人爽超污| 翁熄性放纵交换高清视频| 国产成人久久精品二区三区| 91进入蜜桃臀在线播放| 性欧美大战久久久久久久| 久久大香伊人中文字幕| 欧美人善交videosg| 交性大片欧美网| 美女被免费网站在线视| 国产啪亚洲国产精品无码| 草草影院www色欧美极品| 天天做天天摸天天爽天天爱| 中文字幕免费在线视频| 日韩一区二区在线视频| 亚洲免费观看视频| 波多野结衣大战三个黑鬼| 制服丝袜第六页| 色噜噜亚洲男人的天堂| 国产婷婷成人久久av免费高清| 香蕉国产综合久久猫咪| 国模大胆一区二区三区| tube美国xxxx69| 怡红院精品视频| 中文字幕无码日韩专区免费|