傳統(tǒng)深度學(xué)習(xí)實(shí)驗(yàn)室現(xiàn)狀與面臨的困境 現(xiàn)階段,人工智能猶如雨后春筍一般蓬勃發(fā)展,有預(yù)測在2018 年百分之八十的企業(yè)將部署人工智能產(chǎn)業(yè)鏈。然而不幸的是,作為人工智能的基礎(chǔ)支撐平臺----深度學(xué)習(xí)卻面臨著各種各樣的問題。 ⑴用戶通常單臺AI主機(jī)采購使用,每臺主機(jī)配置多個(gè)GPU卡片,計(jì)算任務(wù)與GPU卡片不能進(jìn)行綁定,GPU資源使用效率低下; ⑵使用環(huán)境相對復(fù)雜,AI團(tuán)隊(duì)人數(shù)較多,主機(jī)較少,無法有效分配計(jì)算資源; ⑶目前各個(gè)硬件廠商僅僅提供服務(wù)器硬件,用戶在使用過程中面臨應(yīng)用安裝,用戶認(rèn)證,作業(yè)排隊(duì)等一系列問題; ⑷傳統(tǒng)AI服務(wù)器無法解決計(jì)算規(guī)模不斷增加,AI主機(jī)不斷增加,帶來的管理及計(jì)算資源整合的問題。 可見,如何有效的組織與管理深度學(xué)習(xí)平臺,讓其更加高效地為AI從業(yè)人員服務(wù)已成為當(dāng)務(wù)之急。為此,北京科卓推出了3D新勢力AI深度學(xué)習(xí)解決方案來專門解決目前深度學(xué)習(xí)遇到的問題。 3D新勢力AI深度學(xué)習(xí)解決方案 3D新勢力AI深度學(xué)習(xí)解決方案由AI一體機(jī)、AI計(jì)算框架與統(tǒng)一資源調(diào)度與管理系統(tǒng)共同組成,其可對AI主機(jī)、用戶、作業(yè)任務(wù)進(jìn)行統(tǒng)一管理,從而更方便為用戶提供計(jì)算服務(wù)。 (3D新勢力AI深度學(xué)習(xí)邏輯架構(gòu)圖) 3D新勢力AI深度學(xué)習(xí)解決方案特性: ⑴搭載GV100、P100、TITAN、1080Ti等GPU,同時(shí)支持多CPU、GPU;單臺機(jī)器提供更高的計(jì)算密度,為用戶提供最佳性價(jià)比 ⑵支持多臺AI主機(jī)集群,實(shí)現(xiàn)統(tǒng)一管理,可以更方便的為用戶提供計(jì)算服務(wù) ⑶預(yù)裝tensorflow\caffe\caffe2多種機(jī)器學(xué)習(xí)框架,R語言環(huán)境及相關(guān)機(jī)器學(xué)習(xí)、數(shù)值處理、圖形處理庫 ⑷預(yù)裝資源調(diào)度系統(tǒng),支持任務(wù)排隊(duì)、查看、處理等功能,支持多GPU調(diào)度、GPU綁定功能,支持記賬、分析功能,預(yù)裝并配置用戶認(rèn)證系統(tǒng),實(shí)現(xiàn)用戶管理。 3D新勢力AI深度學(xué)習(xí)解決方案解析 整個(gè)AI解決方案配置多塊GPU計(jì)算卡,AI集群可根據(jù)用戶數(shù)量的變化,隨時(shí)增加與減少計(jì)算平臺。 ? (3D新勢力AI深度學(xué)習(xí)硬件平臺構(gòu)架圖) (3D新勢力AI深度學(xué)習(xí)任務(wù)執(zhí)行過程) 3D新勢力AI深度學(xué)習(xí)解決方案優(yōu)勢 集AI一體機(jī)、AI計(jì)算框架與統(tǒng)一資源調(diào)度與管理系統(tǒng)為一體的3D新勢力AI深度學(xué)習(xí)解決方案綜合具備如下優(yōu)勢。 ⑴簡單易用:預(yù)裝主流機(jī)器學(xué)習(xí)軟件及各種科學(xué)計(jì)算數(shù)學(xué)庫,開機(jī)即用 ⑵內(nèi)置作業(yè)調(diào)度: 3D新勢力AI解決方案內(nèi)置作業(yè)調(diào)度系統(tǒng),支持作業(yè)自動排隊(duì)、查看、處理等 ⑶內(nèi)置集群調(diào)度:用戶可以根據(jù)需要購買多臺AI主機(jī),輕松組建自己的AI集群 ⑷內(nèi)置用戶認(rèn)證系統(tǒng):用戶可以根據(jù)需要建立并管理自己的用戶,支持Windows系統(tǒng) ⑸支持記賬、分析功能:內(nèi)置記賬文件,可以輕松實(shí)現(xiàn)工作量統(tǒng)計(jì) ⑹支持GPU綁定:用戶可以根據(jù)需要更加精確的控制計(jì)算任務(wù)與GPU的關(guān)系,提高計(jì)算效率 3D新勢力AI深度學(xué)習(xí)解決方案硬件配置建議 ⑴初級規(guī)模 ? ----建議配置一臺AI主機(jī),配置多個(gè)GPU卡,內(nèi)置作業(yè)排隊(duì)及用戶管理系統(tǒng)。 ⑵中等規(guī)模 ? ----建議用戶配置多臺AI主機(jī)及一臺管理主機(jī),內(nèi)置調(diào)度系統(tǒng)及用戶管理系統(tǒng),用戶通過內(nèi)置集群管理系統(tǒng)建立自己的AI計(jì)算集群。 ⑶大型規(guī)模 ??----建議用戶多臺AI主機(jī),兩臺管理主機(jī)及并行存儲系統(tǒng)。用戶通過內(nèi)置集群管理系統(tǒng)可以實(shí)現(xiàn)大規(guī)模AI計(jì)算的需求及集群管理。 AI主機(jī):建議配置兩顆CPU,64GB內(nèi)存,多塊GPU卡,4塊1.2T以上 管理節(jié)點(diǎn):建議配置4114CPU,64GB以上內(nèi)存,2塊600GB SAS硬盤 AI主機(jī)機(jī)型建議:清華同方深度學(xué)習(xí)平臺TF Pro V 雙冗余電源工作站 |