2019人工智能最新前沿技術(shù)——自動(dòng)化機(jī)器學(xué)習(xí)(AutoML)

近年來,在深度學(xué)習(xí)領(lǐng)域里,出現(xiàn)了一種「新式學(xué)習(xí)法」,很多人視它改變了設(shè)計(jì)復(fù)雜的深度學(xué)習(xí)網(wǎng)絡(luò),把看似高不可攀的深度學(xué)習(xí),「拉」到了人人觸手可及的程度。這個(gè)新方式,就是 AutoML。
 
曠視,圖片來自“特定授權(quán)”
 
隨著概念的普及,科技公司對(duì)人工智能的要求越來越高,成本、準(zhǔn)確度、效率都影響著人工智能能否落地融入日常的使用中。對(duì)人工智能應(yīng)用的快速增長(zhǎng)也進(jìn)而催生了對(duì)影響人工智能水平的關(guān)鍵要素——機(jī)器學(xué)習(xí)方法的需求。自動(dòng)化機(jī)器學(xué)習(xí)方法AutoML應(yīng)運(yùn)而生。

近年來,在深度學(xué)習(xí)領(lǐng)域里,出現(xiàn)了一種「新式學(xué)習(xí)法」,很多人視它改變了設(shè)計(jì)復(fù)雜的深度學(xué)習(xí)網(wǎng)絡(luò),把看似高不可攀的深度學(xué)習(xí),「拉」到了人人觸手可及的程度。這個(gè)新方式,就是 AutoML。


2017 年 5 月,谷歌在 I/O 大會(huì)上發(fā)布了 AutoML,他們將 AutoML 應(yīng)用到了深度學(xué)習(xí)的圖像識(shí)別和語言建模的兩大數(shù)據(jù)集中,他們提供的 Cloud AutoML 和 Google NAS 算法結(jié)合,把完整的機(jī)器學(xué)習(xí)工作做成了云端產(chǎn)品,用戶只需要提供數(shù)據(jù),Cloud AutoML 將自動(dòng)構(gòu)建深度學(xué)習(xí)模型。換言之,AutoML想要做到的,正如其名:自動(dòng)化機(jī)器學(xué)習(xí)。

傳統(tǒng)的AI模型訓(xùn)練往往要經(jīng)歷特征分析、模型選擇、調(diào)參、評(píng)估等步驟,這些步驟需要經(jīng)歷數(shù)月的時(shí)間,如果完全沒經(jīng)驗(yàn),時(shí)間會(huì)更長(zhǎng)。AutoML雖然也需要經(jīng)歷這些步驟,但是通過自動(dòng)化的方式,可以減少這些步驟的時(shí)間。
選擇怎樣的參數(shù),被選擇的參數(shù)是否有價(jià)值或者模型有沒有問題,如何優(yōu)化模型,這些步驟在從前是需要依靠個(gè)人的經(jīng)驗(yàn)、知識(shí)或者數(shù)學(xué)方法來判斷的。

而AutoML可以完全不用依賴經(jīng)驗(yàn),而是靠數(shù)學(xué)方法,由完整的數(shù)學(xué)推理的方式來證明。通過數(shù)據(jù)的分布和模型的性能,AutoML會(huì)不斷評(píng)估最優(yōu)解的分布區(qū)間并對(duì)這個(gè)區(qū)間再次采樣。所以可以在整個(gè)模型訓(xùn)練的過程中縮短時(shí)間,提升模型訓(xùn)練過程的效率。

如何促進(jìn)技術(shù)公平,降低技術(shù)應(yīng)用門檻,讓不懂技術(shù)的用戶也可以使用人工智能;如何優(yōu)化機(jī)器學(xué)習(xí)的流程和結(jié)果,輔佐數(shù)據(jù)科學(xué)家們投入更有價(jià)值的工作,正是 AutoML 以及人工智能領(lǐng)域未來希望攻克的難題之一。
在2018年谷歌云全球NEXT大會(huì)上,李飛飛宣布,谷歌AutoML Vision進(jìn)入公共測(cè)試版,并推出了兩款新的AutoML產(chǎn)品:AutoML Natural Language和AutoML Translation。
 

這個(gè)名為Cloud AutoML的宏大項(xiàng)目浮出水面之時(shí),被業(yè)內(nèi)稱為“Google Cloud發(fā)展的戰(zhàn)略轉(zhuǎn)型”——一直以來面向機(jī)器學(xué)習(xí)人工智能開發(fā)者的Google Cloud,這次將服務(wù)對(duì)象轉(zhuǎn)向了普羅大眾。你只需在改系統(tǒng)中上傳自己的標(biāo)簽數(shù)據(jù),大能得到一個(gè)訓(xùn)練好的機(jī)器學(xué)習(xí)模型。整個(gè)過程,從導(dǎo)入數(shù)據(jù)到標(biāo)記到模型訓(xùn)練,都可以通過拖放界面完成。
其實(shí)在谷歌發(fā)布AutoML前后,機(jī)器學(xué)習(xí)自動(dòng)化的產(chǎn)品風(fēng)潮已經(jīng)吹起:2017年底,微軟發(fā)布CustomVision.AI,涵蓋圖像、視頻、文本和語音等各個(gè)領(lǐng)域。2018年 1 月,他們又推出了完全自動(dòng)化的平臺(tái) Microsoft Custom Vision Services(微軟定制視覺服務(wù))。同年,國(guó)內(nèi)也出現(xiàn)了不少相關(guān)產(chǎn)品,稱能夠解放算法工程師,讓AI自動(dòng)化,其中的代表即是百度的EasyDL

EasyDL 在 2017 年 11 月初上線了定制化圖像識(shí)別服務(wù),并在業(yè)內(nèi)展開公開測(cè)試。在 2018 年 4 月、5 月和 7 月陸續(xù)發(fā)布了定制化物體檢測(cè)服務(wù)、定制化模型設(shè)備端計(jì)算和定制化聲音識(shí)別等多個(gè)定制化能力方向,并形成了從訓(xùn)練數(shù)據(jù)到最終定制化服務(wù)的一站式端云一體平臺(tái)。

目前 EasyDL 的各項(xiàng)定制能力在業(yè)內(nèi)廣泛應(yīng)用,累計(jì)過萬用戶,在包括零售、安防、互聯(lián)網(wǎng)內(nèi)容審核、工業(yè)質(zhì)檢等等數(shù)十個(gè)行業(yè)都有應(yīng)用落地,并提升了這些行業(yè)的智能化水平和生產(chǎn)效率。

此外,曠視原創(chuàng)自研的人工智能算法平臺(tái)Brain++也集成了行業(yè)領(lǐng)先的AutoML技術(shù),對(duì)深度學(xué)習(xí)算法的各個(gè)關(guān)鍵環(huán)節(jié)進(jìn)行自動(dòng)化的設(shè)計(jì)、搜索和優(yōu)化。
 

曠視Brain++ AutoML技術(shù)以O(shè)ne-Shot方法為核心,力圖一次訓(xùn)練即可完成自動(dòng)化過程,將計(jì)算代價(jià)減小至傳統(tǒng)AutoML方法的萬分之一,在可控的時(shí)間內(nèi)搜索出高性能、易部署的模型結(jié)構(gòu)。

相比于市場(chǎng)上的AutoML技術(shù),曠視的AutoML技術(shù)有以下優(yōu)勢(shì):

1.     計(jì)算代價(jià)小。傳統(tǒng)的AutoML技術(shù)常常需要多次訓(xùn)練模型甚至?xí)闅v部分模型空間,計(jì)算代價(jià)巨大。曠視的AutoML技術(shù)以one-shot方法為核心,只需訓(xùn)練一次即可得到整個(gè)模型空間的刻畫,大大減小了計(jì)算代價(jià),只是平常訓(xùn)練代價(jià)的1-3倍。
2.     應(yīng)用范圍廣。曠視的AutoML技術(shù)提供了一套完整的解決方案,覆蓋了大部分業(yè)務(wù),包括活體檢測(cè)、人臉識(shí)別、物體檢測(cè)、語義分割等。
3.     部署方便。曠視的AutoML技術(shù)涵蓋了數(shù)據(jù)處理、模型訓(xùn)練、模型壓縮、模型量化等流程,自動(dòng)處理從數(shù)據(jù)到落地。
4.     精度高。曠視的AutoML技術(shù)在諸多視覺任務(wù)上,超過人類手工設(shè)計(jì),達(dá)到了業(yè)界最優(yōu)。

來源 | 億歐網(wǎng)

Share this article:

Facebook
Twitter
LinkedIn
WhatsApp

More articles