原標題:昨夜,微軟甩出10項硬核新品!28.5萬個核心的AI超算機,最大語言模型開源 智東西(公眾號:zhidxcom) 文|韋世瑋董溫淑 智東西5月20日消息,昨晚,一年一度的微軟Build開發者大會拉開序幕。與往常不一樣的是,大會的舞臺從往年的美國西雅圖搬到了線上,同時發布的新產品和新升級也幾乎面向開發者,成為開發者們的“獨家盛宴”。 毫不意外,今晚大會仍以微軟現任CEO薩蒂亞·納德拉(SatyaNadella)的主題演講作為開場。在短短的20多分鐘演講中,“開發者”、“Azure”、“Microsoft365”和“Windows”等關鍵詞貫穿全場,尤其是“開發者”。 他談到,目前GitHub上的開發者已超過5000萬人,PowerPlatform上的開發者也超過了350萬人。而微軟也將為開發者提供一系列提高工作效率的開發工具和解決方案,進一步提升生產力。 圍繞開發者,本次微軟Build大會的核心亮點如下: 1、宣布與OpenAI合作開發的AI超級計算機,專門用于訓練大規模分布式AI模型。 2、推出面向醫療行業的MicrosoftCloudforHealthcare,提升醫療護理團隊的協作、決策和操作效率。 3、推出針對工業系統的AI開發平臺ProjectBonsai,以及ProjectMoab實驗平臺。 4、推出Windows開發者平臺ProjectReunion,統一UWP和Win32的現有API。 5、升級DeepSpeed庫,主要面向深度學習領域,并開源史上最大語言模型——微軟圖靈模型。 6、發布AzureSynapseLink,可對實時運營數據進行分析。 7、WSL2新增特性,包括對GPU、LinuxGUI應用程序的支持,以及簡化安裝體驗。 8、推出MicrosoftTeams平臺功能更新,包括為開發人員提供流線型體驗。 9、開源并升級FluidFramework,提供Fluid組件和Fluid工作區。 10、提供負責任的機器學習工具,以減少不公平性。 除此之外,微軟推出命令行界面WindowsPackageManager,幫助開發者快速搜索、查看和安裝各類管理工具。同時,微軟Chromic內核的瀏覽器Edge也新增了側邊欄搜索、同步等新功能。 值得一提的是,微軟還宣布收購機器人流程自動化(RPA)創企Softomotive,以將RPA技術引入PowerAutomate。 一、AI超級計算機亮相,針對大規模分布式AI模型訓練 2019年7月,微軟宣布向人工智能研究實驗室OpenAI投資10億美元,以共同構建一個新的AzureAI超算平臺,將主要用于訓練和運行更加先進的AI模型,其中包括基于微軟AzureAI超算技術。同時,這筆投資也將進一步幫助OpenAI開發AGI(通用人工智能)技術。 歷時一年,這臺超級計算機終于在今晚亮相,主要用于大規模分布式AI模型訓練。 微軟聲稱,這臺超級計算機的性能位列全球前五,共包含28.5萬個CPU核心和1萬個GPU,每個GPU網絡帶寬為400Gb/s。 由于在Azure中托管,這臺超級計算機已經能夠實現一系列現代云基礎架構的功能,包括快速部署、可持續的數據中心,以及對所有Azure服務進行訪問。 經研究人員實驗,該超級計算機已經能夠實現大規模AI模型訓練,可深入了解語言語法、知識概念和上下文內容的細微差別。同時,它還可以總結冗長的對話、在實時游戲中進行適度對話、解析復雜的法律文件,甚至通過搜索GitHub生成代碼。 目前,微軟已使用圖靈模型來改善Bing、Office、Dynamics和其他生產力產品的語言理解功能。例如,在Bing中,該模型生成文字和回答問題的速度提高了125%。 微軟表示,其將通過AzureAI服務和GitHub,進一步將大規模AI模型、訓練優化工具和超級計算機資源釋放出來,讓開發者、數據科學家和商業客戶都能輕松利用AI的力量。 二、MicrosoftCloudforHealthcare:提升醫療護理效率 在微軟看來,今年新型冠狀病毒疫情的大流行幾乎影響了人們生活的方方面面,同時也阻礙了醫療保健業務的正常運行,大大降低了患者治療和護理的效率。 針對這一問題,推出了其首個針對特定行業的云產品——MicrosoftCloudforHealthcare,支持微軟Teams中的新Bookings應用程序,護理人員能夠在Teams中安排、管理和進行患者的虛擬就診,并提供相應服務,進一步增強患者溝通、護理團隊的協作和管理效率。 與此同時,用戶還可以使用MicrosoftCloudforHealthcare來擴展MicrosoftDynamics365Marketing、Dynamics365客戶服務和AzureIoT價值,以進行患者體驗、醫生轉診管理、患者檢測等部署。 其中,基于MicrosoftCloudforHealthcare擴展的MicrosoftHealthcareBot服務,自今年3月以來已有超1600個COVID-19機器人實例投入使用,服務了23個國家的3100萬人,進一步減輕相關疾病預防控制中心的緊急熱線壓力。 三、工業系統AI開發平臺ProjectBonsai 簡單地說,ProjectBonsai是一個用于構建自主工業控制系統的AI平臺,也是一項“機器教學”服務,它結合機器學習、校準和優化功能,能夠為制造、化工、建筑、能源和采礦等行業機械的核心控制系統提自主化,以更好地管理各類工業設備。 ProjectBonsai通用強化學習平臺能夠協調AI模型的開發,為AI模型的部署和訓練提供了針對算法和基礎設施的訪問,允許模型在本地、設備或云上部署,并支持MATLABSimulink、Transys、Gazebo和AnyLogic等模擬器。 此外,用戶能夠在ProjectBonsai的儀表盤上查看所有工作和訓練狀態,對模型進行調試、檢查和改進。同時,ProjectBonsai還支持多用戶協作構建和部署新模型。 與此同時,針對想要嘗試ProjectBonsai的工程師和開發者,微軟還開發了一款名為ProjectMoab的硬件設備。 它是一個具有三個手臂、一個操縱桿控制器的機器人,能夠讓一顆小球在頂部的透明板上保持平衡。該工具為用戶提供了一個模擬環境,讓用戶借助模擬器進行實驗。 四、ProjectReunion:統一Windows應用生態平臺 微軟此次推出Windows開發者平臺ProjectReunion,主要目的就是在于統一Windows的應用生態平臺,通過融合UniversalWindowsPlatform(UWP)和Win32的現有API,讓開發者能夠擺脫不同操作系統之間的限制,輕松實現跨平臺開發。 微軟將在兩者間添加更多通用的API和可互操作代碼。這將為應用程序提供一個通用平臺,幫助用戶使用最新功能更新,以及現代化現有應用程序,無論是C++、.NET(包括WPF、WindowsForms、UWP),還是ReactNative。 此外,微軟還面向企業用戶推出了WindowsTerminal1.0,能夠讓用戶在多個選項卡和窗格中運行任何命令行可執行文件,包括WSL發行版和AzureCloudShell。 五、DeepSpeed庫升級,微軟圖靈模型開源 早在今年2月,微軟發布了DeepSpeed的開源版本,并同步推出了ZeRO(零冗余優化器)。 DeepSpeed主要為跨多臺服務器進行分布式模型訓練而設計,ZeRO是一種將大型模型擬合到內存中的技術,通過減少數據并行中的內存冗余以實現結果。 ZeRO-1包含模型狀態內存優化,ZeRO-2則提供了激活內存和碎片內存的優化。同時,ZeRO-2還針對單個GPU上的訓練模型進行了改進。據悉,ZeRO-2訓練模型的速度比谷歌BERT提升30%。 微軟表示,ZeRO的內存優化技術能夠訓練具有170億個參數的機器學習模型,如擁有170個參數的微軟圖靈模型,它是目前世界上最大的語言AI模型,主要用于自然語言生成(NLG)。 值得一提的是,微軟宣布將在短期內開源微軟圖靈模型,以及在Azure機器學習中訓練它們的方法。DeepSpeed庫的升級,也將讓開發者能夠使用ZeRO-2來訓練大型神經網絡。 六、AzureSynapseLink:可對實時運營數據進行分析 AzureSynapseLink能夠讓用戶通過AzureSynapseAnalytics中的實時操作數據,直接獲得分析結果,無需進行提取、轉換或加載步驟。同時,它還能將實時數據與現有的分析存儲庫結合,以獲得相關業務的整體視圖。 此外,AzureSynapseLink可以在SQL行的指導下以“PB級”速度查詢數據,具有智能工作負載管理和并發功能,可以實時優化查詢性能。 在安全性方面,AzureSynapseLink具有自動威脅檢測和始終在線數據加密功能,具備動態數據屏蔽、細粒度訪問控制和列級/行級安全性。 據悉,AzureSynapseLink最初將在AzureCosmosDB中發布,但很快就會應用到所有的操作系統中,進一步幫助開發者降低成本并減少時間。 七、WSL2新增對GPU、LinuxGUI應用程序的支持 WSL2新增幾項特性,包括對GPU、LinuxGUI應用程序的支持,以及簡化安裝體驗。 一方面,WSL2支持GPU計算工作流,使Linux工具能夠利用GPU為一系列開發場景進行硬件加速,例如并行計算、訓練AI和機器學習模型。該功能將在今年下半年正式更新。 另一方面,WSL2將支持LinuxGUI應用程序,允許用戶在打開一個WSL實例時直接運行LinuxGUI應用程序,無需第三方服務器。 今年晚些時候,WSL2將支持簡化安裝體驗。屆時,開發者能夠簡單地運行“wsl.exe-install”命令并重新啟動。 八、MicrosoftTeams平臺功能 在疫情期間,Microsoft365核心組件MicrosoftTeam智能會議平臺的使用量出現了大幅度的增長。 今年4月,SatyaNadella談到,MicrosoftTeam的單日參會量已超過2億,產生了超過41億分鐘的會議記錄。此外,目前Teams每天有超過7500萬活躍用戶,其中有三分之二的用戶在Teams上進行文件共享、協作或交互。 因此,微軟針對線上會議的龐大需求,對MicrosoftTeams進行一系列功能更新,其中包括擴展VisualStudio和VisualStudioCode,讓開發者能使用自己熟悉的工具對Teams應用進行開發;提供PowerVirtualAgentsbot,消除在Teams中使用PowerVirtualAgentsbot時,用戶重復登錄的需要等。 九、開源并升級FluidFramework 2019年,微軟推出了協作平臺FluidFramework,它能幫助用戶更好地進行協作,并增強共享互動體驗。 在今晚的大會上,微軟宣布將開源FluidFramework,同時還針對其協作形式進行一系列升級,主要體現在Outlook和Office.com中。 一方面,用戶可以在網頁版Outlook中插入圖表、任務列表等,使用戶的銷售數據、項目任務和研究報道等資料保持實時更新; 另一方面,用戶可創建和管理Fluid工作區,如文檔活動源和推薦列表,或在office.com中進行搜索。由于FluidFramework組建是輕量級的,因此用戶可即時編輯。 十、提供負責任的機器學習工具 微軟人工智能平臺副總裁埃里克·博伊德(EricBoyd)曾指出,如今越來越多的開發人員都被要求構建一個易于解釋,且符合非歧視和隱私法規的AI系統。 基于此,微軟決定在Azure機器學習和OSS工具包中發布負責任的機器學習工具,通過改善模型的可解釋性來減少不公平性,并確保數據隱私和機密性,進一步幫助開發者更負責任地部署AI模型。 一方面,它通過將Fairlearn與Azure機器學習結合使用,讓開發者和數據科學家可利用專門的算法來確保每個人都擁有更公平的結果。 另一方面,它通過將新的WhiteNoise差異隱私工具包與Azure機器學習結合,讓數據科學團隊能夠構建機器學習解決方案,在保護隱私的同時防止個人數據的重新標識。 此外,為了實現安全的模型訓練和部署,Azure機器學習還提供數據和網絡保護功能。其中,包括對Azure虛擬網絡的支持、用于連接機器學習工作區的專用鏈接,以及客戶管理密鑰等。 結語:一場面向開發者的技術盛宴 從今晚微軟Build大會的發布看,微軟越來越重視開發者的體驗,在為開發者提供越來越便捷和豐富的開發工具時,也更強調他們身上所擔起的責任和義務。 其中,微軟與OpenAI合作開發的AI超級計算機面世、首次面向專業領域推出的Azure服務、針對工業系統的AI開發平臺ProjectBonsai、UWP和Win32的統一,以及微軟圖靈模型等重磅產品推出和升級,無疑展現了微軟與開發者之間的彼此依賴、彼此賦能。 隨著全球各行各業的數字化轉型熱潮鋪開,微軟又將如何在這個過程中進一步探索自己與開發者、與AI技術、與產業之間的合作與未來?時間會告訴我們答案。 |