雷鋒網按:2018 全球人工智能與機器人峰會(CCF-GAIR)在深圳召開,峰會由中國計算機學會(CCF)主辦,雷鋒網、香港中文大學(深圳)承辦,得到了深圳市政府的大力指導,是國內人工智能和機器人學術界、工業界及投資界三大領域的頂級交流盛會,旨在打造國內人工智能領域最具實力的跨界交流合作平臺。 在CCF-GAIR 2018第三天的峰會現場,地平線智能解決方案與芯片事業部總經理,中國半導體行業資深商業專家張永謙在AI芯片專場分享了他的行業觀點和地平線公司的最新進展。 張永謙表示,AI目前趨勢分為三點:第一,計算從中央到邊緣;第二,智能終端成長潛力;第三,智能是個性化趨勢。基于這樣的判斷,張永謙認為,AI碎片化需求對創業公司有好處,傳統行業的大公司想用規模、人海戰術、資金實力、渠道能力在AI時代碾壓創新創業公司,幾乎不太可能。 此外,張永謙還介紹了目前地平線的第一代芯片和即將推出的第二代芯片,他表示,第一代芯片系列是成熟、量產化的系列解決方案,好處有兩點,一是快,一周集成, 三個月量產;二是高度平臺化,能快速讓廣大行業客戶和產品客戶直接使用的方案。 旭日系列第二代芯片是基于伯努利架構,內核已經設計完畢。從現在開始到今年年底,地平線將著力做流片并同步適配算法解決方案。 以下是張永謙在現場的演講,雷鋒網做了不改變原意的編輯整理。 張永謙:大家好,非常高興今天下午為大家介紹地平線的思考和落地的情況。 我今天的演講主題是“AI芯片,千萬行業智能化的發動機”,聽魏少軍所長和英特爾的同事說了非常多的渠道,今天我說得更加接地氣。作為創業AI公司,特別是在AI目前的階段,最重要的是AI能落地,今天主要談談我們AI落地的工作以及我們在這方面做的事情。 我認為現在最大的趨勢是AI,分為幾點: 第一,計算從中央到邊緣。 在過去幾十年,從2000年開始,PC時代到智能手機,現在到Internet of Smart things,AI越來越跟著人走。云端從過去的大計算率、大功耗完成任務,慢慢向端上擴展。我們認為人工智能是端+云,構成整個系統的平衡,讓整個功耗、性價比變得最優。端上的智能和云上的智能都是需要的。地平線必須解決端上智能的問題。 第二,智能終端成長潛力。 中國可能是全球最大智能攝像頭生產國和使用地, 每年生產上億個智能攝像頭。考慮家用、嵌入式 攝像頭場景,每年會有10億個終端需要智能。目前可以看到終端的智能滲透 率只有1%,從現在開始,我覺得大概在兩三年內,大家會看到所有的攝像頭智能滲透率達到百分百。大家問產品視覺公司明年的產品會 不會涉及AI,偏人臉相關也是實際AI,答案是百分百。 我判斷2020年,所有跟智能攝像頭的產品百分百標配現在所謂的人工智能,只是處理的強弱 。現在處理不到1%到兩三年后的百分百,可想而知 這個市場多么大,這個窗口多么大。行業中做芯片和AI的公司一定要抓住這個窗口,錯過這個窗口便難以有發展前途。 第三,智能是個性化趨勢。 這是百花齊放的情況,行業會重構。我們看到整個AI和互聯網一樣,它都是一個非常基本的底層技術,這個技術會重構整個行業,甚至重構整個社會 。互聯網在過去20年里是最火的行業,大家可以看到它顛覆 了多認知和行業,AI技術也是如此。AI技術對人產生很大的影響 ,它是更加本質的顛覆 。所有的AI是智能,它一定是個性化的,在后面很長一段時間內,大家對AI訴求非常個性化、碎片化的。 得到幾個推論:1,對創業公司有好處,傳統行業的大公司想用規模、人海戰術、資金實力、渠道能力在AI時代碾壓創新創業公司,幾乎不太可能。因為AI的需求非常碎片化; 2,AI是底層技術,行業要用AI就像行業要用互聯網,不是你坐在空調房敲幾行代碼就能重構的,必須是公司的業務體系架構、業務軟件甚至是整個行業都會被重構。AI對整個行業的顛覆只是剛剛開始,未來它會讓整個行業重構。過程中一 定會冒出非常多的黑馬,這對地平線來說是非常好的機會。 簡單介紹地平線目前做的事情,希望今天我們介紹的東西可以幫助合作伙伴和行業客戶。地平線成立于2015年7月,至今將近三年時間。正式員工500多人,60%以上是碩士和博士學位,是一家比較偏重底層AI技術的公司。 魏少軍所長談到軟件定義硬件,這是地平線成立以來一直秉承的思想,現在尚未達到強人工智能的AI,軟件定義硬件。但我們確實往這個方向走,2015年我們提出地平線AI芯片想法,先由算法解決實際問題, 根據算法架構做芯片,這是軟件定義硬件。谷歌2016年推出TPU,用在云端AI服務器。魏少軍所長談到傳統處理器架構在AI時代一定會被淘汰,因為他們無法在端上使用。 地平線公司成立三年時間,去年年底完成A+輪融資。這是我們推出的BPU,2015年7月首次提出,2017年首次發布BPU處理器及整體解決方案,歷時兩年多,過程非常辛苦。 今天重點談談Edge AI在IoT領域側的應用 ,目前智能樓宇 、智慧社區、自動駕駛 、智能安防 、智慧商 業,Edge AI處理器是我們目標應用市場。芯片解決方案,我們希望完成智能開放的生態,生態的合作伙伴中有行業客戶,原來應用處理器的廠商可以和我們智能處理器匹配,做一個完整的智能解決方案,包括OEM、ODM和IDH。 現在包括智能安防、智慧社區、智慧零售、智能樓宇等各個方向,我們會提供一套完整的解決方案,包括底層芯片。重點我們有針對場景做的網絡模型、上層簡單應用SDK,目的是希望幫助行業用戶快速使用AI。 核心點是我們希望AI變成平民化的東西,現在真正想把AI用起來,需要很大的算法團隊,這是非常不親民 的。我們希望行業客戶、合作伙伴可以站在我們的肩膀之上,我們會針對重大場景,把AI軟件算法結構固化到我們的芯片中。我們的合作伙伴可以直接使用我們整套解決方案,也可以利用他們的大數據在我們芯片架構中做訓練,訓練出他們自己的模型。他所需投入的資源、時間都會非常少,讓AI在行業中快速落地,這是我們公司的核心產品和市場思考、策略。 這同時會帶來其他的好處,很多芯片公司、算法公司可以共同形成解決方案,我拜訪客戶時,客戶使用這個模式時比較糾結 。芯片公司和算法公司,算法和芯片不是最早期互相適配設計,中間會遇到各種各樣適配問題。芯片公司和算法公司同時支持客戶做產品的公司,中間會遇到各種各樣的問題。如何定義是誰的問題,如何快速解決,如何分配利益,這都是比較麻煩的問題。我說得比較直接, 但確實是現實中大家面臨的問題。我們的客戶現在不需要有任何算法團隊,使用我們整體解決方案,從第一次拿到我們的方案到推出他們智能化的產品只需要三個月。我們會提供一整套工具鏈,簡單易用,四步可以訓練出自己的模型 。 針對重要的場景,智慧社會、智慧商業場景、智能安防場景,我們提供基礎算法模型和算法模板。如果我們的客戶具有一定的算法能力和大數據,可以快速開發出自有個性化的算法模型,解決他面臨的豐富多彩的行業AI所需解決的問題。我們的交付層次不一 樣,不管你是怎樣的行業客戶和合作伙伴,都可以使用我們東西,快速完成AI落地。 這是訓練模型的流程,整個訓練工具,UI做得非常友好,我們有一個非常好的界面,用戶可以快速簡單的使用它。簡單介紹旭日X系列,第一代、第二代和第三代的整體規劃,以及我們所需要解決的問題。 旭日系列有三代體系架構,高斯架構、伯努利架構和貝葉斯架構。高 斯架構,可以支持1080p的圖像數據處理, 檢測200個目 標,支持多達8個類別的目標檢測。具體看應用路標,第一代芯片系列是去年11月份布,目前基于第一代系列的芯片解決方案用戶,三季度在市場上會發布他們的產品。面向的應用主要是前端智能攝像頭、大規模人臉抓拍、高精度人臉識別、商業客流分析,這是主要的場景,下面我就這幾個場景為大家介紹我們目前的主要工作。 第一代芯片系列,我們和NVDIA TX1做對比,其功耗是我們的10倍,我們只需要2瓦,每幀處理30個目標,1080P/12fps,我們針對重大場景做優化,量身定做AI處理器,功耗和性價比做得非常好,快速為客戶提供完整的解決方案。 第一代芯片處理層次針對目標進行處理,現在看到在復雜的場景下,我們對車、人、路上標識牌做目標處理。實際落地的案例和解決方案:第一,大規模 、全場景人臉抓拍,主要面對智慧城市和智慧商業兩個場景。這是在北京故宮門檻,現在國內公安要做開放式場景布控,在廣場、車站、碼頭、樓宇和園區里,上下班、吃飯、高峰期都會面臨大規模人流,這時候布控需要很大的挑戰。 現在整體抓拍解決方案,從人臉檢測 、跟蹤、優選、去重等一系列做了深度的優化,加上年齡和屬性,可以很好的應對這種場景。即便是人臉抓拍這個小事情,行業內的人知道這非常不容易。除了要在非常復雜的情況下,把最好的人臉抓出來,最大的挑戰是光線,有逆光、低照、側臉,地平線整體解決方案經過非常多實際場景中做的經驗,不停的迭代優化。 我們拿到采用旭日第一代芯片人臉抓拍解決方案的相機,我們選擇業界一款采用TX1的人臉識別相機做對比。我們列出正常光線、晚上弱光、陰陽臉、逆光、弱光+復雜光線、正常光線+密集通道等,人臉抓拍是重要指標,我們的抓拍率和TX1在同一水平。在高峰期吃飯 時,人數一旦上來,我們仍然保持很高的抓拍率,TX1性能開始下降,出現誤抓和漏抓。我們可以讓這個解決方案做得更實用 、更好。現在我們的人臉抓拍解決方案做得非常成熟,目前市場上有十幾家客戶都在使用我們的解決方案,下個月可以推出產品。 第二,前端、高性能人臉識別,大家知道最早由公安使用,接下來向民用滲透。公安行業更多的需要前端抓拍、后端 識別,主要由于犯罪庫比較大, 監察庫至少30萬,大家知道日常生活中,尤其是民用場景,我們的前端可以把識別小庫做好,高性價比和低功耗方案非常實用,適用于城市安防、智慧社區、智能樓宇和智慧商業,我們已經開始在市場上做推廣。 這是我們在辦公室錄的視頻錄像,現在性能在1080P30幀處理的情況下,我們準確率高于95%。這是門禁級別,不是簡單的布控,用在用戶體驗最苛刻的場景中。 第三,商業客流分析解決方案,可以廣泛應用在商業地產、零售門店和智能貨柜 。由于新零售比較火,我們希望通過AI解決方案,讓線下商業場景數字化,讓行業客戶對它進行數字化管理和運營,對人、貨、場進行分析。除了人臉識別、屬性、客流統計以及動線跟蹤,我們在第一代芯片上做的是單攝像頭。第二代芯片會做多攝像頭融合以及商品識別。 現在第一代芯片系列是成熟、量產化的系列解決方案,我認為它帶來最大的好處,一是快,一周集成, 三個月量產;二是高度平臺化的,它可以同時做人臉抓拍、識別、商業客流分析,如果你需求足夠大,可以拿我們的開發工具和你的數據做更加個性化的場景處理。我認為這個方案是目前情況下最接地氣,最能快速讓廣大行業客戶和產品客戶直接使用的方案。 旭日第二代芯片系列是基于伯努利架構,內核設計完畢。從現在開始到今年年底,一是做流片,二是同步適配算法解決方案。當明年1月份和3月份,大家 拿到我們芯片時,會同時拿到我們整體基于算法+AI的解決方案。這是4K乘2K的30fps處理,不僅可以做前端,還可以做邊緣計算產品。大庫容人臉識別,基于像素級語義、動作行為分析、多路視頻流結構化、全面升級、開放性做得更好。 第二代芯片是基于像素級的語義分割和理解,三維物體檢測,這個應用更加多樣化。我們跟NVDIA TX2做了分類任務比較,早期我們可以做到2倍,現在我們可以做到TX2的10倍,我們的功耗在2瓦左右。語義分割任務的性能,我們對標對象不是TX2,這種情況下我們的IoU對目標進行語義級、像素級分割時,分割區域和 原始區域的重合率。業界可以看論文,70%是業界比較好的水平,在這個水平之下可以做到每秒處理16幀,我們的功耗只有2瓦。這里有很多好玩的應用 ,原來做智能家電的朋友說你的電視做熱劇 ,我能否把時尚時裝、包摳出來做檢測、識別、分類,實時推送到用戶終端中。基于第二代芯片的架構,做這件事非常有意思、非常好玩,把它變成現實。 第二代芯片幾個大方向:一是大庫容 ,在2瓦過程中做50萬人動態比對,公共安防行業以后不需要GPU服務器,在實時布控場景中也不需要GPU服務器。全國30萬的抓逃庫可以布置在2瓦多芯片中,可以做成便攜式盒子,隨時隨地布控。智慧商業場景也是如此,現在很多智慧商業無法落地,你不可能把服務器部署在一個門店中,從功耗、可部署性和成本上都無法接受。當我們推出第二代芯片時,這個問題迎刃而解,我們把它 做在小盒子里,做大規模VRP、黑名單、 白名單處理。 二是復雜場景,視頻結構化,這個事情出來很久了,業界老大哥公司做智能安防,他們推出基于GPU服務做了很多,但至今沒有大規模商用,我認為性價比是很重要的原因。在推出第二代芯片解決方案時,可以把獵鷹、臉譜等服務器上做好。 三是基于像素級的語義分割和理解,行為分析和多攝像頭融合。更多的用于安防、智慧社區、教育、智 慧零售、醫療等各個場所可以做越來越多有意思的AI應用,讓它真正落地。這是我們公司做的基于像素級 的Python功能。現在它在服務器上,利用第二代芯片的架構進行模擬,等第二代芯片出來后,直接在2瓦的芯片上實現。 地平線的目標是通過AI芯片和核心算法,打造一整套解決方案,幫助我們行業客戶。我們的行業客戶并不需要建立龐大的算法團隊,甚至他們不需要有硬件團隊,現在有非常多的行業客戶,他們原來和硬件、行業設備不沾邊,他們做硬件也會跟我們交流,他們懂行業和需求,國內資源非常多,我們希望通過AI賦能行業,讓AI真正和行業結合,幫助大家解決一些問題。 地平線,中國芯。AI的路剛剛開始,如果您是行業客戶,我們非常歡迎您跟我們交流,現在各行各業的客戶都來找我們。如果你是智能設備廠商 ,我們可以幫助您三個月達到智能設備量產, 投入的資源非常少,可能只需要一個硬件工程師和一個軟件工程師就夠了。如果您是AP、Sensor廠商 ,我們可以聯合打造解決方案。這是我的聯系方式,我們是創業公司,如果大家有合作需求可以直接聯系我。謝謝大家! |