
近年來,在深度學(xué)習(xí)領(lǐng)域里,出現(xiàn)了一種「新式學(xué)習(xí)法」,很多人視它改變了設(shè)計(jì)復(fù)雜的深度學(xué)習(xí)網(wǎng)絡(luò),把看似高不可攀的深度學(xué)習(xí),「拉」到了人人觸手可及的程度。這個(gè)新方式,就是 AutoML。
2017 年 5 月,谷歌在 I/O 大會(huì)上發(fā)布了 AutoML,他們將 AutoML 應(yīng)用到了深度學(xué)習(xí)的圖像識(shí)別和語言建模的兩大數(shù)據(jù)集中,他們提供的 Cloud AutoML 和 Google NAS 算法結(jié)合,把完整的機(jī)器學(xué)習(xí)工作做成了云端產(chǎn)品,用戶只需要提供數(shù)據(jù),Cloud AutoML 將自動(dòng)構(gòu)建深度學(xué)習(xí)模型。換言之,AutoML想要做到的,正如其名:自動(dòng)化機(jī)器學(xué)習(xí)。
傳統(tǒng)的AI模型訓(xùn)練往往要經(jīng)歷特征分析、模型選擇、調(diào)參、評(píng)估等步驟,這些步驟需要經(jīng)歷數(shù)月的時(shí)間,如果完全沒經(jīng)驗(yàn),時(shí)間會(huì)更長(zhǎng)。AutoML雖然也需要經(jīng)歷這些步驟,但是通過自動(dòng)化的方式,可以減少這些步驟的時(shí)間。
選擇怎樣的參數(shù),被選擇的參數(shù)是否有價(jià)值或者模型有沒有問題,如何優(yōu)化模型,這些步驟在從前是需要依靠個(gè)人的經(jīng)驗(yàn)、知識(shí)或者數(shù)學(xué)方法來判斷的。
而AutoML可以完全不用依賴經(jīng)驗(yàn),而是靠數(shù)學(xué)方法,由完整的數(shù)學(xué)推理的方式來證明。通過數(shù)據(jù)的分布和模型的性能,AutoML會(huì)不斷評(píng)估最優(yōu)解的分布區(qū)間并對(duì)這個(gè)區(qū)間再次采樣。所以可以在整個(gè)模型訓(xùn)練的過程中縮短時(shí)間,提升模型訓(xùn)練過程的效率。
如何促進(jìn)技術(shù)公平,降低技術(shù)應(yīng)用門檻,讓不懂技術(shù)的用戶也可以使用人工智能;如何優(yōu)化機(jī)器學(xué)習(xí)的流程和結(jié)果,輔佐數(shù)據(jù)科學(xué)家們投入更有價(jià)值的工作,正是 AutoML 以及人工智能領(lǐng)域未來希望攻克的難題之一。
在2018年谷歌云全球NEXT大會(huì)上,李飛飛宣布,谷歌AutoML Vision進(jìn)入公共測(cè)試版,并推出了兩款新的AutoML產(chǎn)品:AutoML Natural Language和AutoML Translation。

其實(shí)在谷歌發(fā)布AutoML前后,機(jī)器學(xué)習(xí)自動(dòng)化的產(chǎn)品風(fēng)潮已經(jīng)吹起:2017年底,微軟發(fā)布CustomVision.AI,涵蓋圖像、視頻、文本和語音等各個(gè)領(lǐng)域。2018年 1 月,他們又推出了完全自動(dòng)化的平臺(tái) Microsoft Custom Vision Services(微軟定制視覺服務(wù))。同年,國(guó)內(nèi)也出現(xiàn)了不少相關(guān)產(chǎn)品,稱能夠解放算法工程師,讓AI自動(dòng)化,其中的代表即是百度的EasyDL
EasyDL 在 2017 年 11 月初上線了定制化圖像識(shí)別服務(wù),并在業(yè)內(nèi)展開公開測(cè)試。在 2018 年 4 月、5 月和 7 月陸續(xù)發(fā)布了定制化物體檢測(cè)服務(wù)、定制化模型設(shè)備端計(jì)算和定制化聲音識(shí)別等多個(gè)定制化能力方向,并形成了從訓(xùn)練數(shù)據(jù)到最終定制化服務(wù)的一站式端云一體平臺(tái)。
目前 EasyDL 的各項(xiàng)定制能力在業(yè)內(nèi)廣泛應(yīng)用,累計(jì)過萬用戶,在包括零售、安防、互聯(lián)網(wǎng)內(nèi)容審核、工業(yè)質(zhì)檢等等數(shù)十個(gè)行業(yè)都有應(yīng)用落地,并提升了這些行業(yè)的智能化水平和生產(chǎn)效率。
此外,曠視原創(chuàng)自研的人工智能算法平臺(tái)Brain++也集成了行業(yè)領(lǐng)先的AutoML技術(shù),對(duì)深度學(xué)習(xí)算法的各個(gè)關(guān)鍵環(huán)節(jié)進(jìn)行自動(dòng)化的設(shè)計(jì)、搜索和優(yōu)化。

相比于市場(chǎng)上的AutoML技術(shù),曠視的AutoML技術(shù)有以下優(yōu)勢(shì):
1. 計(jì)算代價(jià)小。傳統(tǒng)的AutoML技術(shù)常常需要多次訓(xùn)練模型甚至?xí)闅v部分模型空間,計(jì)算代價(jià)巨大。曠視的AutoML技術(shù)以one-shot方法為核心,只需訓(xùn)練一次即可得到整個(gè)模型空間的刻畫,大大減小了計(jì)算代價(jià),只是平常訓(xùn)練代價(jià)的1-3倍。
2. 應(yīng)用范圍廣。曠視的AutoML技術(shù)提供了一套完整的解決方案,覆蓋了大部分業(yè)務(wù),包括活體檢測(cè)、人臉識(shí)別、物體檢測(cè)、語義分割等。
3. 部署方便。曠視的AutoML技術(shù)涵蓋了數(shù)據(jù)處理、模型訓(xùn)練、模型壓縮、模型量化等流程,自動(dòng)處理從數(shù)據(jù)到落地。
4. 精度高。曠視的AutoML技術(shù)在諸多視覺任務(wù)上,超過人類手工設(shè)計(jì),達(dá)到了業(yè)界最優(yōu)。
來源 | 億歐網(wǎng)