圖片來源:視覺中國 毫無疑問,人臉識(shí)別已經(jīng)成為手機(jī)廠商日益重視的功能模塊。 不論是vivo今年發(fā)布的旗艦機(jī)X21,還是OPPO的主打款 Find X,更不用提 iPhone X 在2017年問世時(shí)基于3D視覺感知的 Face ID ,與人臉識(shí)別相關(guān)的應(yīng)用模塊已明顯成為趨勢。 從具體的應(yīng)用來說,諸如屏幕解鎖、人臉支付、人像捕捉、美顏修圖等功能背后,均由 3D 的視覺方案來支撐。 什么是 3D 的視覺方案? 如鈦媒體作者 Kiwi_s在介紹 OPPO的3D 視覺方案中談到的:如果我們把手機(jī)比喻為眼睛,那么在傳統(tǒng)識(shí)別技術(shù)中,手機(jī)這雙“眼睛”看到的都是一個(gè)平面的世界,而3D視覺技術(shù),則讓手機(jī)從平面視覺升級(jí)為立體視覺,從而對(duì)人臉識(shí)別的速度、精度實(shí)現(xiàn)質(zhì)的提升。 目前行業(yè)中三種主流的3D視覺方案為:雙目立體視覺方案、3D結(jié)構(gòu)光方案、TOF方案。 在三種不同的3D視覺方案中,它們各自都有鮮明的優(yōu)缺點(diǎn)和不同的使用場景。其中,雙目方案屬于被動(dòng)采集,而3D結(jié)構(gòu)光和TOF技術(shù)則為主動(dòng)采集方案,滿足了3D視覺上拍攝距離不同的應(yīng)用場景細(xì)分。 被稱為國內(nèi)“視覺識(shí)別 AI 四小龍”之一的曠視科技,就是為這些手機(jī)廠商提供人臉識(shí)別方案的幕后關(guān)鍵角色。 今年6月,曠視率先為OPPO、vivo提供基于安卓系統(tǒng)的3D視覺感知技術(shù)支持,并于近期發(fā)布業(yè)內(nèi)首個(gè)“軟硬一體”的移動(dòng)端3D感知全棧解決方案。 根據(jù)曠視的官方披露,所謂全棧方案,就是從算法創(chuàng)新、應(yīng)用開發(fā)、設(shè)備制造到解決方案,形成完整的產(chǎn)業(yè)閉環(huán),具體來說,在曠視發(fā)布的軟硬一體移動(dòng)端智能3D產(chǎn)品解決方案中,最上面一層是3D應(yīng)用層,往下依次至AI算法、解決方案,最后到攝像、傳感等硬件設(shè)備制造上。 “手機(jī)3D視覺領(lǐng)域雖然已有多種類型的應(yīng)用案例出來,但該領(lǐng)域包含算法和模組的軟硬一體整體解決方案仍是缺位的,曠視科技正在嘗試一種從上往下的整合方案。”曠視科技云事業(yè)部高級(jí)副總裁吳文昊介紹稱。 曠視科技云事業(yè)部高級(jí)副總裁吳文昊 把一個(gè)全新的生態(tài)通過整合形成更具效率的角色分配,這件事并不容易,不過,曠視之所以成為這條產(chǎn)業(yè)鏈的“攢局者”,當(dāng)中的深層原因一方面來自手機(jī) AI 落地本身的難度;另一方面是來自行業(yè)客戶的需求。 從行業(yè)總體來說,在手機(jī)人臉識(shí)別背后的視覺感知技術(shù)方案,目前仍屬于起步階段。 蘋果就曾在人臉識(shí)別方案的落地遭遇過巨大挑戰(zhàn),蘋果原本計(jì)劃在2016年便推出Face ID技術(shù),并在當(dāng)時(shí)已量產(chǎn)了4萬臺(tái) iPhone X 用以驗(yàn)證方案。但鮮為人知的是,由于蘋果并不是一家做算法的公司,相關(guān)的底層技術(shù)、算法并不完善,出于對(duì)用戶體驗(yàn)的考量,蘋果不得不推遲一年用以測試,到2017年才發(fā)布搭載Face ID的新一代iPhone。 產(chǎn)業(yè)鏈角色的分散,是手機(jī)端 AI 方案落地面臨的第一個(gè)難點(diǎn)。吳文昊談到了曠視與手機(jī)客戶討論項(xiàng)目的場景:開會(huì)時(shí)有十多家廠商參與,他們既來自世界各地,又分屬產(chǎn)業(yè)內(nèi)傳感器、模組、光電等不同環(huán)節(jié),每一家都如同一個(gè)孤立的零部件,整個(gè)產(chǎn)業(yè)無法得到串聯(lián)。 “大家相互分散,很多做硬件的不懂軟件,做軟件的對(duì)硬件把控也不足,而最后的落地又需要應(yīng)用去驅(qū)動(dòng)。”吳文昊對(duì)鈦媒體說,他以刷臉支付舉例,當(dāng)中識(shí)別人臉的精度、支付安全標(biāo)準(zhǔn)、對(duì)活體工攻擊的能力防范,這些問題都需要應(yīng)用場景來反推驗(yàn)證,并由產(chǎn)業(yè)鏈上的各個(gè)角色配合完成。 按照人臉識(shí)別在手機(jī)落地需要的 AI 方案,曠視也聯(lián)合多家合作伙伴,搭建了軟硬一體的移動(dòng)端產(chǎn)品矩陣,具體為:
曠視最新推出的3D 視覺全棧方案,即從算法創(chuàng)新、應(yīng)用開發(fā)、設(shè)備制造到解決方案,形成完整產(chǎn)業(yè)閉環(huán)。 可以看出,曠視在全棧方案的四層中主要涉及3D 應(yīng)用層與算法,而在曠視不太擅長的硬件及解決方案中,則采取了與三維技術(shù)集成商珠科創(chuàng)新、光場應(yīng)用服務(wù)商疊鏡數(shù)字、傳感器服務(wù)商艾邁斯半導(dǎo)體等合作伙伴共同開發(fā)的方式;此外,曠視還宣布將聯(lián)合主要芯片廠商合作研發(fā)算法適配性更強(qiáng)的芯片,進(jìn)一步優(yōu)化手機(jī)3D應(yīng)用能力。 隨著手機(jī)廠商對(duì) 3D 視覺識(shí)別技術(shù)的青睞,曠視在產(chǎn)業(yè)鏈上明顯的抱團(tuán)動(dòng)作,實(shí)則也是用“生態(tài)”形成壁壘的一種方式。而在AI 服務(wù)手機(jī)場景的戰(zhàn)場上,曠視的另一位競爭對(duì)手商湯科技也同樣動(dòng)作頻頻。 今年5月,商湯實(shí)現(xiàn)了從2D人臉識(shí)別向3D結(jié)構(gòu)光人臉識(shí)別的升級(jí),這一技術(shù)已搭載于最新發(fā)布的小米8透明探索版,商湯科技聯(lián)合創(chuàng)始人、研究院院長王曉剛在接受界面新聞采訪時(shí),也談到了對(duì)生態(tài)鏈的看法。
而在具體的合作方面,商湯科技的做法是,在頭部廠商落地方案之后,再把相關(guān)的技術(shù)標(biāo)準(zhǔn)化,形成類似SDK的整合,然后提供給更加長尾的客戶。之后,商湯科技還會(huì)逐漸形成一個(gè)平臺(tái),來提供更加綜合性的服務(wù)。 這樣來看,商湯主打技術(shù)產(chǎn)品化形成的“平臺(tái)”,曠視則專注于搭建“生態(tài)”后成為軟硬一體的服務(wù)商。對(duì)于如何構(gòu)建自己的門檻,曠視科技云事業(yè)部高級(jí)副總裁吳文昊表示:“沒有哪一種策略是不能通過時(shí)間與金錢完成的。但重要的是,首先愿不愿意做改變,這是一個(gè)定位的問題;其次才是改變的決心和能力。”(本文首發(fā)鈦媒體,作者/蘇建勛) |