近日,在2018年騰訊伙伴大會的前夕,馬化騰提出了騰訊聚焦構建“兩張網”的戰略舉措:一方面深耕消費互聯網,另一方面積極擁抱產業互聯網。這一戰略的背后實質其實是騰訊一以貫之的連接人與人、人與物、物與物的"人聯網"、"物聯網"和"智聯網"的“三聯”之路。 在人工智能領域,騰訊的目標是攻克AI終極難題-通用人工智能。那么通用人工智能是什么呢?“人工智能之父”圖靈認為,當機器擁有人類智慧時,就成為了通用人工智能。 在第一天論壇上,騰訊副總裁姚星表示:“騰訊將立足腳下,利用好人工智能(AI)、大數據(Big Data)和云計算(Cloud Computing),即ABC科技,構建新型基礎設施,做‘數字化助手’的標配,形成科技創新與產業應用相互促進的良性循環,這在醫療、安防、零售、交通與娛樂行業已經有所體現。” 四大實驗室加碼AI研究,開源新項目助力AI發展 目前騰訊共有四大人工智能實驗室,分別為騰訊深圳AI Lab、騰訊西雅圖AI Lab、騰訊優圖實驗室和微信人工智能實驗室。其中,騰訊深圳AI Lab主要關注四大研究+四大應用;騰訊西雅圖AI Lab主要關注語音與NLP;騰訊優圖實驗室主要關注計算機視覺、AI+行業應用;微信人工智能實驗室則主要研究AI語音。 在論壇上,姚星重點介紹了騰訊在AI賦能醫療和安防領域的研究:
此外,騰訊AI實驗室還在三大前沿技術領域進行了探索:AI驅動的Siren虛擬人、在虛擬世界中訓練仿真成真實世界的TRobot機械臂、以及用AI打星際爭霸。 論壇當天,騰訊AI實驗室正式宣布開源“PocketFlow”項目。 該項目是一個自動化深度學習模型壓縮與加速框架,可以整合多種模型壓縮與加速算法并利用強化學習自動搜索合適壓縮參數,解決傳統深度學習模型由于模型體積太大,計算資源消耗高而難以在移動設備上部署的痛點,同時極大程度的降低了模型壓縮的技術門檻,賦能移動端AI應用開發。 這次大會上騰訊宣布開源的PocketFlow框架項目,在騰訊內部正在為多項移動端業務提供模型壓縮與加速的技術支持。例如,在手機拍照APP中,人臉關鍵點定位模型是一個常用的預處理模塊,通過對臉部的百余個特征點進行識別與定位,可以為后續的人臉識別、智能美顏等多個應用提供必要的特征數據。 騰訊基于PocketFlow框架,對人臉關鍵點定位模型進行壓縮,在保持定位精度不變的同時,大幅度地降低了計算開銷,在本身已經十分精簡的網絡上取得了1.3 ~ 2倍不等的加速效果,壓縮后的模型也已經在實際產品中得到部署。這對于其他科技企業而言,是一個不錯的值得借鑒的框架。 各大科技企業入局,開源魅力何在? 在所有騰訊的項目中,最感興趣的是其開源項目。比爾蓋茨在1976年就表示過對自由軟件的反對,在《致愛好者的公開信》一文中,他說道:“有誰會在沒有任何報酬的情況下來做這些專業的工作?怎樣的愛好者才會投入三年的時間開發,發現所有的錯誤、編寫文檔并且免費發布產品?事實上,只有我們大量投資來為個人電腦做軟件”。 或許在很多人眼里,開源項目很難賺錢。明明是自己以及團隊辛辛苦苦研究出的成果卻要免費分享出來,這無疑是件愚蠢的行為。這么一想,你就錯了。我先來舉兩個例子: 上周,IBM以334億美元的價格收購開源的企業軟件制造商紅帽公司(Red Hat),Red Hat也即將成為IBM混合云部門的一部分。對于Red Hat 的收購是IBM公司迄今為止規模最大的一筆交易,也是美國科技史上最大的一筆交易。IBM則希望這筆交易能幫助其在全球迅猛增長的云業務中趕上亞馬遜、谷歌等巨頭。 在今年國慶期間,基于彭博社一篇關于中國“黑客芯片”的報道,中美兩國科技股板塊一片哀嚎,相關個股大幅下跌。在科技股下跌的形式下,以Elastic之名進行交易的開源的數據搜索軟件初創公司Elastic search在上市當日,股價一路走高,漲幅超過90%,達到約70美元,并在收盤時繼續保持了這樣的勢頭。 今天依托開源賺錢的產品已經很普遍了,況且開源一詞的誕生就是為了拒絕免費。如今的企業已經不僅僅只是靠賣產品盈利了,它需要提供的更多是服務。這從側面或許也可以展現開源軟件擁有的巨大的分銷優勢。 據資料顯示,自2016年騰訊首次在GitHub上發布開源項目,目前已累積開源覆蓋人工智能、移動開發、小程序等領域的57個項目。此外,為進一步貢獻開源社區,騰訊相繼加入了Hyperledger、LF Networking和開放網絡基金會,并成為LF深度學習基金會首要創始成員及Linux基金會白金會員,這一系列的開源行為恰好與騰訊此次的大會主題“開放,共生”相契合。 在AI的圈子里,各大科技公司都能深深意識到數據的重要性,都紛紛建立了僅面向其內部的大型數據集,例如谷歌的JFT-300M和Facebook的Instagram數據集。但這些數據集及其訓練得到的模型都沒有公開,對于一般的科研機構和中小企業來說,這些人工智能基礎能力有著很高的門檻。 實際上,今年9月份,騰訊AI Lab便宣布開源了另一個與AI相關的項目-Tencent ML-Images,該項目由多標簽圖像數據集ML-Images,以及業內目前同類深度學習模型中精度最高的深度殘差網絡ResNet-101構成,包括了1800萬訓練圖像和1.1萬多常見物體類別。這自然為人工智能領域的科研人員和工程師提供了充足的高質量訓練數據,從另一方面促進人工智能行業的發展。 雖然騰訊的技術積累比較深厚,然而騰訊開源的起步卻是十分艱難。 因為騰訊由業務和產品驅動的研發模式,使得它在開源之路上走得并不平坦,從業務和產品,到 KPI,再到部門之間的壁壘,這些因素都構成了騰訊開源路上的“攔路虎”。 姚星在本次會議結束后,接受媒體采訪時表示,目前騰訊內部正在推動多個技術團隊去構建公用的技術模塊,去做更多開源的貢獻,進行優化上云,把更多內部組件與框架開放給云上的客戶。 小結 各大科技公司對開源項目其實貢獻不少,如百度、阿里、谷歌,甚至連一度摒棄開源的微軟也愿意放棄Windows時代的絕對控制,轉而投身到開源社區的貢獻中,并于一周前以75億美元收購GitHub。 關于人工智能的的開源項目其實也不少,如貪吃蛇游戲的人工智能、教AI打游戲的框架、為線稿上色的AI項目等。 正是這些開源項目的公布,才讓越來越多的人有機會在前人的研究基礎上探索出更多有趣的AI。曾經采訪過新西蘭理工學院的教授,他表示,從技術層面上來講,目前國內外的AI水平其實差不多。但是從出發點來看,國外的企業研究AI大多抱著探索未知的目的,而國內的企業更多的是由利益驅動。 引述上述嘉賓的觀點,筆者只是想表達,這種開源共享的行為,實質上更能促進AI這項技術的進步。一方面,它讓后來者能站在巨人的肩膀上進一步的深入研究,從中獲取靈感,探索出更多的應用;另一方面,在開源的同時,貢獻者本身也能得到更多可以完善該項目的反饋。 |