11 月 5 日,「WAVE SUMMIT+」2019 深度學(xué)習(xí)開(kāi)發(fā)者秋季峰會(huì)在北京召開(kāi)。在本次峰會(huì)上,飛槳(PaddlePaddle)全新發(fā)布和重要升級(jí) 21 個(gè)產(chǎn)品方向,包括:面向產(chǎn)業(yè)應(yīng)用場(chǎng)景的四大端到端開(kāi)發(fā)套件、融合數(shù)據(jù)和知識(shí)的預(yù)訓(xùn)練結(jié)合遷移學(xué)習(xí)的飛槳 Master 模式等。
本次更新不僅僅是飛槳功能易用性的提升,也是飛槳由開(kāi)發(fā)者邁向產(chǎn)業(yè)應(yīng)用的開(kāi)端。在此,雷鋒網(wǎng) AI 開(kāi)發(fā)者將其更新內(nèi)容整理編輯如下。
1+1+4+3+12
本屆峰會(huì)上,百度深度學(xué)習(xí)技術(shù)平臺(tái)部總監(jiān)馬艷軍向參會(huì)者們介紹了飛槳產(chǎn)業(yè)級(jí)深度學(xué)習(xí)開(kāi)源開(kāi)放平臺(tái)全景圖,帶來(lái)了基于產(chǎn)業(yè)化困難的洞察,飛槳全新發(fā)布和重要升級(jí)的 21 個(gè)產(chǎn)品方向,包括 9 項(xiàng)全新發(fā)布和 12 項(xiàng)新版升級(jí)。
9 項(xiàng)全新發(fā)布
其中,全新發(fā)布 1 個(gè)模式、1 端側(cè)推理引擎、4 大產(chǎn)品開(kāi)發(fā)套件、3 個(gè)工具組件。
1 個(gè)模式,指的是 Master(大師)模式,即算力+數(shù)據(jù)和知識(shí)+算法=產(chǎn)業(yè)級(jí)預(yù)訓(xùn)練模型,產(chǎn)業(yè)級(jí)預(yù)訓(xùn)練模型+遷移學(xué)習(xí)工具平臺(tái)構(gòu)成 Master 的核心,可以用于多種行業(yè)場(chǎng)景。
1 個(gè)端側(cè)推理引擎,則是 Paddle Lite 2.0 版本。這是一個(gè)輕量級(jí)深度學(xué)習(xí)推理框架,提供了預(yù)測(cè)到部署完整工具鏈,旨在打通端到端部署全流程。
4 大面向應(yīng)用任務(wù)的產(chǎn)業(yè)級(jí)開(kāi)發(fā)套件,則專用于實(shí)現(xiàn)四大應(yīng)用任務(wù)的全流程開(kāi)發(fā)、訓(xùn)練和部署,包括:
- NLP 領(lǐng)域的 ERNIE 語(yǔ)義理解——一個(gè)基于持續(xù)學(xué)習(xí)的語(yǔ)義理解預(yù)訓(xùn)練框架;
- CV 方向的 PaddleDetection——目標(biāo)檢測(cè) 已集成 60+預(yù)訓(xùn)練模型,提供易使用的目標(biāo)檢測(cè)模型;
- PaddleSeg 圖像分割——幫助用戶完成從訓(xùn)練到部署的全流程圖像分割應(yīng)用;
- 推薦方向的 ElasticCTR 點(diǎn)擊率預(yù)估——可實(shí)現(xiàn)分布式訓(xùn)練 CTR 預(yù)估任務(wù)和 Serving 流程一鍵部署;
3 項(xiàng)深度學(xué)習(xí)前沿技術(shù)工具組件,包括:
- 聯(lián)邦學(xué)習(xí) PaddleFL——其能力在于復(fù)制和比較不同的聯(lián)邦學(xué)習(xí)算法;
- 圖神經(jīng)網(wǎng)絡(luò)框架 PGL——提供了一系列的Python接口用于存儲(chǔ)/讀取/查詢圖數(shù)據(jù)結(jié)構(gòu),并且提供基于游走(Walk Based)以及消息傳遞(Message Passing)兩種計(jì)算范式的計(jì)算接口;
- 多任務(wù)學(xué)習(xí)框架 PALM——內(nèi)置了模型 backbone(BERT、ERNIE 等)、常見(jiàn)的任務(wù)范式(分類、匹配、序列標(biāo)注、機(jī)器閱讀理解等)和數(shù)據(jù)集讀取與處理工具;
現(xiàn)場(chǎng),還全新發(fā)布 EasyDL 專業(yè)版,為算法工程師提供一站式 AI 開(kāi)發(fā)平臺(tái)。
12 項(xiàng)重要升級(jí)
除了 9 大全新發(fā)布外,新版飛槳 1.6 還有 12 項(xiàng)產(chǎn)品重要升級(jí)。包括:
- 提供更多的算子庫(kù)、簡(jiǎn)單高效的 API 接口、完善的文檔內(nèi)容;
- 升級(jí)輕量級(jí)模型結(jié)構(gòu)自動(dòng)搜索 PaddleSlim,增加了基于硬件搜索等能力,打通訓(xùn)練、壓縮和部署全流程;
- NLP、CV、推薦系統(tǒng)、語(yǔ)音等各大基礎(chǔ)模型庫(kù)的模型,從原來(lái)的 60+到了 100+(這其中包含多個(gè)在 AI 競(jìng)賽中奪冠的算法模型);
- Paddle Hub,新增了超參優(yōu)化 Auto Fine-tune 功能,預(yù)訓(xùn)練模型數(shù)量大幅增加,支持飛槳 Master 模式;
- 深度強(qiáng)化學(xué)習(xí)框架 PARL 并行能力升級(jí),支持進(jìn)化算法;
- Paddle2ONNX 和 X2Paddle 升級(jí),飛槳和其他框架的模型互轉(zhuǎn)更加方便;
其它開(kāi)源
除了全新發(fā)布與升級(jí)外,本次峰會(huì)上百度還新開(kāi)源了 4 個(gè)國(guó)際競(jìng)賽冠軍模型,希望進(jìn)一步引領(lǐng)深度學(xué)習(xí)技術(shù)發(fā)展方向。這 4 個(gè)模型包括:
- Activitynet Challenge 2019 冠軍模型 BMN;
- Detection In the Wild Challenge 2019 Objects365 Full Track 冠軍模型 CACascade R-CNN;
- CVPR LIP Challenge 2019 冠軍模型 ACE2P;
- MRQA: EMNLP2019 Machine Reading Comprehension Challenge 冠軍模型 D-NET ;
更新后的飛槳性能如何?
據(jù)官方介紹,全新升級(jí)后的飛槳,易用性大幅提升,動(dòng)態(tài)圖全新升級(jí)、新增大量算子庫(kù)、優(yōu)化 API 接口,技術(shù)文檔更加完善。
其中,在大規(guī)模分布式訓(xùn)練性能方面,分布式 GPU 訓(xùn)練相比其他主流實(shí)現(xiàn)可以獲得 20%-100% 的速度提升,分布式 CPU 訓(xùn)練最大吞吐量可達(dá)競(jìng)品的 6 倍以上。
目前,官方支持模型庫(kù)極大豐富,官方模型從 60 多個(gè)增加到了 100 多個(gè),提供下載的預(yù)訓(xùn)練模型已經(jīng)超過(guò) 200 個(gè)。
在峰會(huì)發(fā)布最后,飛槳也發(fā)布了最新生態(tài)激勵(lì)計(jì)劃,包括:
- 免費(fèi)開(kāi)放10多個(gè)AI課程;
- 支持100多所重點(diǎn)高校教學(xué)培訓(xùn);
- 為1000多個(gè)企業(yè)轉(zhuǎn)型提供助力計(jì)劃;
- 還有百萬(wàn)級(jí)的AI競(jìng)賽獎(jiǎng)金和億元級(jí)GPU算力資源支持。
百度飛槳官網(wǎng):
https://www.paddlepaddle.org.cn/
開(kāi)源地址:
https://github.com/paddlepaddle/paddle
來(lái)源 | 雷鋒網(wǎng)
作者 | 楊鯉萍