心肺復蘇模型

新聞分類

百度萬億級圖檢索引擎!四大預訓練模型開源,還“發(fā)糖”15億元!

百度萬億級圖檢索引擎!四大預訓練模型開源,還“發(fā)糖”15億元!

發(fā)布日期:2022-03-11 作者:WLT 點擊:

雷錦·陳夢發(fā)自奧菲神廟qubit報道|微信官方賬號QbitAI

又是一年520,又是一年愛情...

停下來。這不是打開它的方法。

看~也是為了“節(jié)”,卻吸引了五湖四海的開發(fā)者聚集于此。


1.jpg


這就是深度學習開發(fā)者的“既定”活動——Wave Summit 2021。

百度Feipaddle作為國內最大的深度學習平臺,也在520這樣的日子里為開發(fā)者帶來了不少“糖”:發(fā)布Feipaddle開源框架新版本2.1,發(fā)布全新大型地圖檢索引擎開源文心厄尼四大預訓練模型,發(fā)布全新推理部署導航地圖...

此外,還有15億資金,其中10億將“分配”給10萬家企業(yè)和百萬產(chǎn)業(yè)AI人才。

與以往不同的是,本次峰會透露出一種全新的基調——大融合、大創(chuàng)新。

百度首席技術官王海峰表示:

從技術角度看,多技術融合創(chuàng)新,知識與深度學習的結合,突破了知識增強的深層語義理解,在相同參數(shù)尺度條件下,效果大幅提升,可解釋性更強。

從平臺上看,深度學習平臺與芯片軟硬件融合創(chuàng)新,面對各種不同硬件配置的生產(chǎn)環(huán)境,滿足不同計算能力、功耗、時延等多樣化需求。,實現(xiàn)AI應用的最佳效果。

從產(chǎn)業(yè)角度來看,人工智能技術越來越深入地與產(chǎn)業(yè)結合,在產(chǎn)業(yè)需求的驅動下,不斷打磨AI技術和平臺能力,與應用場景融合創(chuàng)新。


2.jpg


△百度首席技術官王海峰

此外,降低AI門檻是本次峰會的另一個重點,這是加速多元化和產(chǎn)業(yè)化進程的核心。

至于整合創(chuàng)新,降低AI門檻,如何將AI價值帶入行業(yè),實現(xiàn)高效率、高質量的量產(chǎn),百度集團副總裁吳添認為:

AI工業(yè)量產(chǎn)首先是在企業(yè)的生產(chǎn)活動中一步步實現(xiàn)的。進一步發(fā)展,將從企業(yè)內部的多人多任務分工走向全社會的AI量產(chǎn)協(xié)同。


3.jpg


△百度集團副總裁吳添

接下來,我們來看看WAVE SUMMIT 2021。六個新版本

飛槳開源框架2.1版

作為國內最大的深度學習平臺,本次峰會再次迎來升級——2.1版本。

專注!

四大功能重點優(yōu)化:設置自動混音精度優(yōu)化:以ResNet50和BERT為例,啟動該功能后,訓練速度可提高3倍。動態(tài)圖形功能增強:新增原地操作功能,內存占用減少17%;優(yōu)化Python/C++交互開銷,訓練速度提升10%。高級API:新支持GPU預處理、混合精度和模型共享機制。尤其是自定義運算符功能的升級,大大降低了學習和開發(fā)自定義運算符的成本,大大提高了開發(fā)的靈活性。

于是,一張2.1版本升級后的百度飛槳全景圖上線了。


4.jpg


在這張全景圖中,除了上面提到的核心框架開發(fā)功能的優(yōu)化,百度Feipaddle這次的升級遠不止于此。

大規(guī)模圖形檢索引擎

分布式訓練中百度飛槳2.1的發(fā)布,是一個大規(guī)模的地圖檢索引擎,核心亮點如下:

支持萬億邊分布式圖的存儲和檢索,支持線性擴展。

比如在與網(wǎng)易云音樂的合作過程中,“主播推薦”就使用了這個功能。

支持億邊圖模型的訓練,有效解決冷啟動問題,提高主播推薦場景的有效播放率。


5.jpg


不難看出,大規(guī)模地圖檢索引擎的發(fā)布,讓百度Feipaddle具備了更強的工業(yè)場景應用特性。

文厄尼的四個前期訓練模型都是開源的

在框架層之后,是模型套件層方面。

介紹了開源文新ERNIE的四個預訓練模型:ERNIE-Gram:提出了一個顯式n-gram掩碼語言模型。通過引入多粒度語言知識,增強了預訓練模型的效果,領先于五個典型的中文文本任務。ERNIE-Doc:針對長文本建模不足的問題,提出了回溯建模技術和增強記憶模型的機制,并在13個長文本理解任務中取得了領先效果。ERNIE-ViL:針對跨模態(tài)理解問題,基于知識增強的思想,實現(xiàn)場景知識融合的跨模態(tài)預訓練,在5個跨模態(tài)理解任務中成績領先ERNIE-UNIMO:進一步增強不同模態(tài)間的知識融合,通過跨模態(tài)比較學習同步提升跨模態(tài)語義理解和生成、文本理解和生成的效果,在13個跨模態(tài)和文本任務中成績領先。


6.jpg


但在復雜的語義理解需求下,這四種預訓練模型都能發(fā)揮各自的長處。

同時也可以實現(xiàn)技術融合,達到“1 > 2”的創(chuàng)新效果。

不僅能理解語言,還能理解圖像,實現(xiàn)統(tǒng)一的跨模態(tài)語義理解。

推進器推理部署工具鏈和導航圖

除了開發(fā)、訓練和套件,推理部署工具鏈的節(jié)點也進行了升級:PaddleSlim:進一步優(yōu)化剪枝和壓縮技術,增加非結構化稀疏工具;率先支持OFA壓縮模式,保證壓縮后的精度。Paddle Lite:面向移動開發(fā)者的開箱即用工具集LiteKit發(fā)布,大幅降低了端側AI開發(fā)者的開發(fā)成本。Paddle Serving:增加一個完全異步的流水線模式,更好的支持真實業(yè)務中模型組合的問題。Paddle.js: New支持多種后端和主流的圖像分割和分類模型,兼容性強,性能高。

除了升級現(xiàn)有的推理部署工具鏈,飛槳還提供了推理部署導航圖。

據(jù)了解,目前已經(jīng)覆蓋了300多條完全驗證的部署路徑,從而形成了如下圖所示的導航地圖。


7.jpg


在這棵樹中,從根到每個分支的路徑都是完整的路徑,可以幫助開發(fā)者成功實現(xiàn)AI部署。

而之所以這么做,百度Feioar給出了他的理由:

每一次“成功”都有跡可循,每一次“失敗”都可以追根溯源。

硬件生態(tài)成就

除了“軟”的一面,發(fā)布部署也有“硬”的一面。

據(jù)了解,飛槳已與百度昆侖等22家國內外硬件廠商合作,開展適配和聯(lián)合優(yōu)化工作,31款芯片或IP已經(jīng)完成或正在適配。

這包括英特爾、英偉達、華為、廣海、瑞芯微、安霸等芯片公司。


8.jpg


更具體地說,有超過50個模型的螺旋槳適應廣海DCU。

可見,在部署環(huán)節(jié)的硬件生態(tài)方面,百度Feipaddle已經(jīng)全面覆蓋國內外硬件廠商。

云原生機器學習核心PaddleFlow

隨著人工智能技術向行業(yè)應用發(fā)展,出現(xiàn)了更廣泛的AI開發(fā)場景,對平臺提出了更多樣化的需求:針對更廣泛的垂直行業(yè)AI應用開發(fā)需求,針對深度定制的AI開發(fā)平臺需求,有AI原生容器服務。

基于此,百度AI產(chǎn)品R&D部總監(jiān)新舟宣布正式啟用——PaddleFlow,即paddle企業(yè)版的“核心”。


9.jpg


△百度AI產(chǎn)品R&D部總監(jiān),新洲

簡而言之,這是一個專為AI平臺開發(fā)者設計的云原生機器學習核心系統(tǒng),易于集成。

它的特點也非常明顯,就是云原生、性能優(yōu)秀、輕量易用等。

可以幫助AI平臺開發(fā)者高效構建更加細分的場景和深度定制的AI平臺。

……

除了以上六大版本,還有一些重大升級。

去年正式發(fā)布了propeller PaddleHelix,但今天正式升級到了1.0版本,增加了復合預訓練模型ChemRL,并將ChemRL模型應用于更多的下游任務。

憑借propeller的能力,百度于今年3月在國際權威的圖形神經(jīng)網(wǎng)絡OGB上獲得了HIV和PCBA兩個涉毒數(shù)據(jù)集上的雙冠軍。


10.jpg


作為國內首款支持量子機器學習的測槳,與飛槳框架2.0及以后版本同步更新,整體運行速度大幅提升,平均提升21.9%,核心應用場景最高提升40.5%。

同時在測槳中加入了量子核方法等特征提取方法。

針對難度較大的糾纏純化任務,測槳增加了優(yōu)化的量子糾纏處理框架,給出了目前業(yè)界最佳的可實施的純化方案。還“送糖”15億元。

除了上面提到的“六大發(fā)布”,在本次浪潮峰會2021上,百度飛槳的“分糖”還在繼續(xù)。

而且是很實在的一種“糖”——給錢,15億。

在百度飛槳的“大航海”計劃中,除了去年年底上線的高校AI人才培養(yǎng)“啟航”,還包括:“大航?!弊o航計劃和“大航?!鳖I航計劃。

“大航?!弊o航計劃

10億元,這是護航計劃未來三年的資金投入。

對誰?

10萬家企業(yè),百萬工業(yè)AI人才。

怎么會?

整體上分為技術、人才、生態(tài)三個方面。


11.jpg


為企業(yè)保駕護航,就要實現(xiàn)智能化升級,通過技術賦能、市場營銷、資源引入等方式,縮短從技術創(chuàng)新到商業(yè)落地的路徑,包括:飛槳技術合伙人計劃、飛槳企業(yè)版(Gravity)、飛槳中國行。

為人才保駕護航的是AI私人俱樂部、AI快速通道、AICA首席AI架構師培養(yǎng)計劃。


12.jpg


△百度AI技術生態(tài)部總經(jīng)理劉謙

“大航?!痹圏c計劃

這個計劃是針對核心開發(fā)者的,目標是與社區(qū)開發(fā)者一起構建開源生態(tài)系統(tǒng),探索前沿技術。

包括PPDE(飛螺開發(fā)者技術專家計劃)、PPSIG(飛螺社區(qū)特殊興趣小組)、飛螺飛行員小組、博士協(xié)會等組織形式。


13.jpg


與行業(yè)內優(yōu)秀開源社區(qū)和開源項目合作,系統(tǒng)設置研發(fā)方向,包括探索生物計算、量子計算等前沿方向。

據(jù)了解,目前已有120個PPDE獲得認證,飛槳城市/高校試點群體已覆蓋150個城市。

AI人才產(chǎn)教融合培養(yǎng)計劃正式發(fā)布。

事實上,在《領航》和《護航》發(fā)布之前,百度飛槳早在去年年底的WAVE SUMMIT+2020就已經(jīng)啟動了《大航?!废盗械暮叫杏媱?

未來三年,飛槳將投入價值5億元的資金和資源,支持全國500所高校,重點培養(yǎng)5000名高校AI教師,聯(lián)合培養(yǎng)50萬名AI學生。

時隔近半年,這個計劃取得了什么成果?

基于豐富的行業(yè)實踐,飛槳在高校人工智能實踐課程開發(fā)中,開設了包括人工智能全技術層面在內的50多個實戰(zhàn)案例,到7月底將積累100多個案例。

高校教師深度學習師資培訓,目前Feipaddle已舉辦14期,為570所高校培訓200醫(yī)學教師,幫助226所高校開設學分課程。

承辦過中國大學生計算機大賽等多項比賽,為大學生提供實習項目和就業(yè)指導,培養(yǎng)適應行業(yè)需求的復合型人才。

會上還舉行了飛槳與三所高校創(chuàng)新創(chuàng)業(yè)實驗室合作簽約儀式。

包括清華大學基礎產(chǎn)業(yè)實訓中心、吉林大學創(chuàng)新創(chuàng)業(yè)實驗室、鄭州大學人工智能工程應用實驗室。

他們將與飛槳一起,共同推動產(chǎn)學研融合發(fā)展,打造智能產(chǎn)業(yè)后備軍,開啟產(chǎn)教融合新時代。

最后,除了六大發(fā)布和三大生態(tài)計劃,浪潮峰會還聯(lián)合信通院發(fā)布了《飛櫓開源生態(tài)報告》(后臺對話框回復“信通院”獲取)。

報告指出,人工智能行業(yè)已經(jīng)進入工程應用爆發(fā)的窗口期。開源框架可以降低整個行業(yè)智能化升級的難度,提高其廣度和深度。

飛櫓以區(qū)域化、特色化、規(guī)?;l(fā)展,開啟國內開源新生態(tài),加速產(chǎn)業(yè)鏈跨界協(xié)同創(chuàng)新,構建人才培養(yǎng)體系。

該網(wǎng)站還正式宣布了開源框架前沿模型再現(xiàn)比賽。


14.jpg


這是由傳播學院主辦的人工智能創(chuàng)新與應用大賽的子賽道,將由百度承辦,希望挖掘和培養(yǎng)更多人才,沉淀更多前沿模型,推動整個人工智能的發(fā)展。整合是為了更好的創(chuàng)新。

融合,這是貫穿常態(tài)峰會始終的一個“主旋律”。

那么百度Feioar力推“集成創(chuàng)新”的背后是一種怎樣的邏輯呢?

首先,集成創(chuàng)新是時代的需求。

不同于以往的算法優(yōu)先,人工智能進入工業(yè)量產(chǎn)階段,需要算法、數(shù)據(jù)、計算力的合力發(fā)揮,碰撞出更多創(chuàng)新的新價值。

這一次,在開發(fā)、培訓、部署等環(huán)節(jié),百度飛槳的細節(jié)技術升級都是基于這樣一個原則。

比如文心厄尼開源的四種前期訓練模式,在技術上不是“單線程”,而是“1 > 2”,產(chǎn)生更多的創(chuàng)新價值。

其次,企業(yè)發(fā)展到一定程度后,面對激烈的行業(yè)競爭,單靠技術的發(fā)展是無法突破固有瓶頸的。

只有跨界融合,模式創(chuàng)新,才能適應日益嚴峻的競爭。

但除了技術和跨界的融合,還有一點很重要,不可或缺。

那就是深度學習平臺開源生態(tài)的整合與創(chuàng)新,包括行業(yè)、開發(fā)者社區(qū)、人才培養(yǎng)。

這對應了百度飛槳的“大航?!毕盗杏媱?。

截至目前,飛槳已聚集320萬開發(fā)者,服務12萬家企業(yè),創(chuàng)造36萬個模型,涉足醫(yī)療、金融、娛樂、環(huán)境、能源、工業(yè)制造等多個領域。

之所以能達到這樣的規(guī)模,正是因為技術、模式、人才、跨界等諸多方面的融合創(chuàng)新,大大降低了AI開發(fā)的門檻,豐富了產(chǎn)生的價值。

既能創(chuàng)建靈活全面的建模方法,又能滿足定制場景的需求。

那么,集成創(chuàng)新下的AI價值應該以什么樣的路線帶入工業(yè)生產(chǎn)活動?

對此,百度集團副總裁吳添總結了一條三段式路線:為了支持開拓者在尋路階段的快速驗證落地,F(xiàn)eioar為行業(yè)引入AI驗證提供了真實場景打磨的工業(yè)模型庫,通過便捷的多終端、多平臺部署推理機,解決AI落地的“最后一公里”問題。為了幫助工場應用階段的團隊應用AI創(chuàng)新,百度飛槳降低了門檻,讓小團隊不用重復做輪子,從移植重用到針對性重寫再到完成自研的全流程提供支持。為了支持工業(yè)量產(chǎn)階段的多人多任務協(xié)作,通過對計算能力資源的高效管理和開發(fā)者的集成開發(fā)環(huán)境,提高整個過程的效率。開源并支持多種硬件,可以實現(xiàn)多個企業(yè)間的社會化協(xié)同生產(chǎn)。

可見,飛槳已經(jīng)走過了AI產(chǎn)業(yè)化應用的整個階段,為大家找到了一條可借鑒、可實現(xiàn)的道路。

你覺得這個百度飛槳和這個520夠誠意嗎?

結束-

量子QBITAI頭條號簽約

關注我們,第一時間了解前沿科技動態(tài)。



本文網(wǎng)址:http://www.sem136.com/news/949.html

相關標簽:醫(yī)學教師

最近瀏覽:

相關產(chǎn)品:

相關新聞:

在線客服
分享