當前位置: 主頁 > 科技 >

        解密AI算法賦能平臺核心技術 ——特斯聯半監督CV自訓練學習算法

        時間:2021-08-30來源:互聯網 作者:編輯 點擊:
        7月,特斯聯“九章人工智能算法賦能平臺”計算機視覺基礎模型核心算法,在國際頂尖智能實驗室、中國移動研究院、日本最大移動通信運營商NNT DOCOMO,以及清華大學、武漢大學、中

        7月,特斯聯“九章人工智能算法賦能平臺”計算機視覺基礎模型核心算法,在國際頂尖智能實驗室、中國移動研究院、日本最大移動通信運營商NNT DOCOMO,以及清華大學、武漢大學、中國科技大學、墨爾本大學等69家國際大型企業、頂尖高校及研究機構。

        堅持深耕、不斷開拓人工智能最前沿算法,是特斯聯斬落豪強,載譽而歸的秘笈。本期“先鋒科技場”將首次揭秘該行業領先算法。

        大勢所趨

        隨著全球人工智能產業高速發展, 人工智能AI近年被抽象成多種算法應用于不同領域。AI已全面進入機器學習時代。AI未來發展將是關鍵技術與產業的深入結合——單純算法已無法滿足更細分領域及行業對AI的需求,尤其在萬物互聯的AIoT人工智能+物聯網時代,越來越多的訂制化AI需求亟需解決。

        原有開發模式實際已成為新形勢下AI發展的瓶頸。當前,用戶AI訂制通常遵循“找公司-對需求-交付研究-算法產品化編碼-上線使用”流程。這往往導致研發周期長、研發成本高,難以滿足AIoT時代各行業用戶AI產品開發需求。

        對此,AI開放平臺應運而生。其能集成AI算法、算力與開發工具,通過接口調用,使企業、個人或開發者高效使用平臺AI能力,實現AI產品開發及賦能。隨著大量AI廠商高速崛起,中國在技術平臺領域已逐漸擺脫對海外廠商的依賴,涌現出多家AI開放平臺。

        雖然我國目前AI開放平臺發展勢頭良好,但現有平臺在用戶規模、使用場景、用戶技術基礎等多個方面,仍然受限。這些平臺均主要針對專業AI開發者設計,對AI零基礎用戶開發人工智能產品不甚友好

        此背景下,特斯聯核心算法研究團隊開發出普適性AI算法開放平臺——九章AI算法賦能平臺。它力克半監督、標簽內容以及“聯邦學習”Federated Learning等方面的核心技術難點,實現了CV計算機視覺、NLP自然語言處理、推薦預測、知識圖譜算法的自訓練。

        九章平臺可針對多場景及各規模用戶(尤其可針對AI零基礎用戶),進行零代碼、低代碼自有算法孵化,顛覆已有AI研發人員開發模式,顯著降低AI研發成本及周期。

        在業界備受矚目的校企合作方面,近年來各方努力已獲成效,但仍有較大提升空間。目前,企業對高校研究成果頗感興趣,需求較大;高校亦希望其研究能夠解決實際行業問題,故十分渴望行業課題導入。但是,高校研究成果進行行業落地時,往往水土不服;高校產學研課題亦往往隨著學生畢業被迫中斷,持續性堪憂。

        特斯聯九章AI算法賦能平臺可在弱監督體系下,能夠實現平臺和訓練模型算法有效對接。使基于訓練算法模式的校企需求對接,取代“向企業提供推理算法代碼”這一傳統模式。不僅如此,該平臺可實現算法積累與深化。

        本期“先鋒科技場”就將揭秘九章AI算法賦能平臺的核心技術之一——基于半監督的CV自訓練學習算法。

        甄選模型

        監督學習技術通過學習大量訓練樣本,構建預測模型。其中每一訓練樣本均被貼上明確標簽,顯示其真值輸出。盡管當前技術已取得巨大成功,高數據標注成本常導致諸多任務無法獲得強監督信息如“全部真值標簽”等。因此,采用半監督學習,通常是執行實際任務的更佳方案。

        半監督分為三類——不完全監督、不確切監督、不準確監督。特斯聯九章AI賦能平臺致力于讓AI能力偏弱或“貧乏”用戶,也能擁有AI算法孵化服務能力。因此,弱化人工參與算法訓練尤為重要。

        但不同半監督類型亦存在自身短板。不完全監督若只擁有少量被標注數據,不足以訓練出優秀模型。不確切監督僅能滿足已給定監督信息、但信息不夠精確的場景。不準確監督在監督過程中,會出現被標注數據存在錯誤監督信息的情形。三類半監督模式人工干預較大,無法形成自訓練學習算法體系,無法達到普適性AI算法開放平臺需求。

        為構建基于半監督的自訓練學習算法,特斯聯核心算法研究團隊主要采用基于Transformer模型的Swin Transformer作為骨干模型,以此搭建特征學習基礎算法,進而構建自訓練體系。此外,團隊通過參加國際計算機視覺大會ICCV等國際頂尖會議,有效驗證了基于半監督的CV自訓練學習算法在實際產業應用中的貼合度,并載譽而歸。

        深耕算法

        特斯聯核心算法團隊針對上述三大半監督類型難題,將主動學習、半監督學習、多示例學習、帶噪學習等技術引入自訓練體系,最大限度從已知標簽樣本特征中,挖掘潛在內嵌信息,反哺至未知標簽數據,從而減少人工干預。

        特斯聯以Swin Transformer為骨干模型,針對半監督,設計可學習樣本全局及局部“特征學習模塊”。

        而選用Transformer為骨干網絡,則可使輸出的全局特征信息更為豐富,使“全局特征相似度學習模塊”從樣本特征中挖掘出更多信息。此外,“局部特征細粒度學習模塊”聚焦樣本局部特征,可與Transformer形成互補,統一對外提供基準骨干網絡。

        特征學習模塊方面,特斯聯基于BNNeck,采用“全局+局部”模式展開研究。全局層面,通過度量學習Circle Loss + Center Loss提取全局特征。局部細粒度特征學習層面,則首先計算每一局部模型間相關性,隨后交叉融合局部模塊相關性較高的特征,輸入至各局部細粒度分類器,學習相應局部細粒度特征。如圖所示,交叉融合可分為如下四種:

        接下來的重點,為構建自訓練體系。其主要分為兩個階段。第一階段——強監督訓練:利用少部分數據,對以上特征學習算法作初步強監督訓練,降低后期自訓練難度,提高自訓練性能。第二階段——標簽內容生成:通過主動學習、半監督學習、帶噪學習等技術,充分利用余下的大部分數據。

        在此,將不再贅述強監督訓練。標簽內容生成工作,則會從主動學習/無監督學習、半監督學習兩個方面展開。

        主動學習/無監督學習分為四個步驟。旨在通過挖掘小部分數據,帶動大部分數據,解決半監督下不完全監督短板。在有限的平臺資源上,令大部分未標注數據高效得到相應標簽。

        半監督學習方面,通過以上無監督學習能夠獲得可靠性強,且具有標簽的Query子集和Gallery子集G。但兩者均僅有缺少局部細粒度標簽的弱標簽信息。通過半監督學習實現L、G,以及帶有局部細粒度標簽的訓練集數據T,可對特征學習模型作全量調優。隨后,在S=[L,G,T]上尋找更優局部細粒度學習器;并利用訓練集數據分布上的局部細粒度子模型,建立多個局部細粒度學習器,對未標簽樣例加注標簽。局部細粒度學習器可基于其未更新前對L、G所生成的局部細粒度標簽,以及更新后所預測的結果,計算損失值進行學習。這一方面使L、G在某種層面上,補充了T可能缺失的潛在信息;另一方面可通過學習器,幫助模型在L、G上挖掘局部特征。

        多輪、細致的實驗結果證明:主動學習、半監督學習在解決半監督下的不完全監督問題中,表現穩定;多示例學習方法在不確切監督問題中表現穩定;帶噪學習方法在不精確監督問題中表現穩定。

        頂一下
        (0)
        0%
        踩一下
        (0)
        0%
        ------分隔線----------------------------
        發表評論
        請自覺遵守互聯網相關的政策法規,嚴禁發布色情、暴力、反動的言論。
        評價:
        文章導航
        推薦內容
        主站蜘蛛池模板: 女人腿张开让男人桶爽| 欧洲亚洲国产精华液| 国产主播精品福利19禁vip| 99re热视频这里只精品| 无码人妻精品一区二区| 亚洲另类自拍丝袜第五页| 精品一区二区三人妻视频| 国产噜噜在线视频观看| 777亚洲精品乱码久久久久久| 幻女free牲2020交| 久久午夜无码免费| 欧美午夜成年片在线观看| 伊人青青草视频| 老司机永久免费视频| 国产成人综合亚洲AV第一页| 97热久久免费频精品99| 少妇挑战三个黑人惨叫4p国语| 久久国产午夜一区二区福利| 欧美性xxxx极品高清| 人妻少妇一区二区三区| 美女扒开屁股让男人桶爽免费| 国产成人无码区免费内射一片色欲| 91成人免费观看| 好男人在线社区www在线视频一 | 激情综合色综合久久综合| 国产69精品久久久久777| 国产喷水在线观看| 国产老师的丝袜在线看| 一区二区在线免费观看| 无码人妻av一区二区三区蜜臀| 乱人伦中文视频在线| 欧美末成年video水多| 偷炮少妇宾馆半推半就激情| 老公和他朋友一块上我可以吗| 国产在线19禁免费观看国产| 先锋影音男人资源| 国模冰冰双人炮gogo| taoju.tv| 成人免费乱码大片a毛片| 久久丫精品国产亚洲av| 日韩在线视频导航|