近年來,隨著深度學(xué)習(xí)和云計算的不斷發(fā)展,AI開源逐漸成為眾多開發(fā)者談?wù)摰暮诵模渲匾燥@著提升。AI開源引領(lǐng)著各項技術(shù)應(yīng)用向前,而技術(shù)應(yīng)用又進一步促進AI開源的發(fā)展。
4月11日,OpenI啟智社區(qū)特邀本社區(qū)技術(shù)委員會委員、華為昇騰開源生態(tài)總監(jiān)黃之鵬老師作客由OpenI和InfoQ聯(lián)合推出的《人工智能開源錄》直播訪談欄目,解碼“AI開源的技術(shù)應(yīng)用與未來趨勢”。
一、個人經(jīng)歷及對開發(fā)者的建議
黃之鵬老師介紹自己接觸過很多開源社區(qū),初入華為公司時接觸的是云計算開源的相關(guān)社區(qū),比如OpenStack,OpenDaylight,OpenVswitch,以及云原生Kubernetes社區(qū)。從2019年下半年開始,便開始負責(zé)MindSpore整個開源社區(qū)的建設(shè)。
陰錯陽差與AI結(jié)緣
做通信出身的黃老師介紹自己一開始接觸的是比如快速傅里葉變換的這些領(lǐng)域,本應(yīng)該是去到華為的無線部門,卻陰差陽錯與云計算結(jié)緣。
黃老師說數(shù)學(xué)是他與AI之間的一個連接點。早在他讀碩士期間,他接觸過一個無線傳感網(wǎng)的項目,為了設(shè)計一套比較好的預(yù)測網(wǎng)絡(luò)擁塞的協(xié)議,當(dāng)時在用卡爾曼濾波器(Kalman Filter)的工具去實現(xiàn)算法過程中,黃老師發(fā)現(xiàn)它與深度學(xué)習(xí)的很多原理有著類似。四五年前的AI熱潮下,黃老師開始正式接觸AI。由于曾經(jīng)深入地看過一系列AI相關(guān)的論文,黃老師發(fā)現(xiàn),人工智能研究涉及的很多關(guān)于數(shù)學(xué)的推導(dǎo)、演算,與做通信出身的他所接受到的數(shù)學(xué)的訓(xùn)練非常類似。這些經(jīng)歷促使黃老師比較快速的從一個門外漢入門AI。
開源初心不能忘
黃老師認為,目前國內(nèi)很多企業(yè)沒有特別處理好的一個問題是做開源社區(qū)的初心和期望不夠明確。大家普遍認為做開源社區(qū)是通過四處宣講布道來得到影響力,然而,在與開源社區(qū)真實參與過開發(fā)的人進行交流時,會發(fā)現(xiàn)做開源的初心最終還是會回到“人”這個命題上。
相比有些公司為開源設(shè)定的商業(yè)KPI這冷冰冰的數(shù)字而言,黃老師通過分享社區(qū)一個身處東北的開發(fā)者在東北去年初雪時,為從未見過雪的社區(qū)運營助手“小貓子”在雪地上寫上她名字的有趣故事,來表達自身更關(guān)注開源的人情溫度,也讓他感覺這是2021年成就感最強的事情。
同時,黃老師也認為,開源最主要的在于動作,一定要發(fā)自內(nèi)心地做對很多事,目標自會水到渠成。黃老師回憶他接觸開源社區(qū)初期,在北美曾發(fā)生過一件讓他印象深刻的事情,為了打造一個全球化的社區(qū),需要大家克服時差導(dǎo)致的晚睡早起、精力有限的困難。然而,美國開發(fā)者們在面對來自有著時差的日本、英國和印度等國用戶的提問時,卻響應(yīng)非常快。大家在開源時的忘我拼搏精神顛覆了對“美國人習(xí)慣懶惰,華人非常刻苦”的慣有刻板偏見。
開發(fā)者建議 | 新手小白如何選擇適合自己的開源項目
黃老師結(jié)合他本人的個人經(jīng)歷,建議大家選擇一個自己最熟悉或擅長的領(lǐng)域,去嘗試做第一個開源項目。而他當(dāng)時雖然踏進了全然不懂的云計算行業(yè)中,但也是選擇他最熟悉的協(xié)議設(shè)計作為他第一個開源項目的切入點,然后查看相關(guān)的論文,跟隨項目開例會,慢慢熟悉和參加進去。
開發(fā)者建議 | 人工智能能量補給站
關(guān)于人工智能,黃老師推薦了一本由作者侯世達寫的新書《我是個怪圈》,以及他之前最有名的、非常集大成的一本書《GEB》(集異壁),介紹三個看似不太關(guān)聯(lián)的藝術(shù)家,通過一系列問答故事,將很多關(guān)于人工智能的理解傳承到了《GEB》書中,可以很好的幫助大家補充一些關(guān)于人工智能的人文周邊背景。
二、人工智能開源生態(tài)
淺談深度學(xué)習(xí)領(lǐng)域的技術(shù)應(yīng)用與突破
深度學(xué)習(xí)框架是推動AI應(yīng)用大規(guī)模落地的關(guān)鍵力量,在人工智能技術(shù)體系中占據(jù)非常重要的地位。那么,如何選擇一個得心應(yīng)手的深度學(xué)習(xí)框架,以及目前主流的開源開源的深度學(xué)習(xí)框架有哪些?
黃老師基于個人角度淺談了框架的發(fā)展簡史,比如,最初的框架為淺層框架,由于大家最始接觸到的是類似Theano、Caffe這一代的框架,然而它們更多屬于工具類而非如今的框架。
從2016年開始,大家就迎來了第二代浪潮即通用框架或較深層框架時代里的熟悉框架,比如Tensorflow, PyTorch, 和李沐老師的Apache MXnet,這一批的框架可以提供一套完整的語義描述,基于這些框架可以寫出某一類任務(wù)的若干模型。
第三次浪潮便是以昇思MindSpore、谷歌的Jax為代表,而第三代框架有幾個特點,首先是AI+科學(xué)計算的強能力,未來框架必備的一個能力便是能支撐深度學(xué)習(xí)和科學(xué)計算的結(jié)合。其次是基礎(chǔ)模型的研發(fā),作為新一代的框架,它需要能支持訓(xùn)練基礎(chǔ)模型,且是面對某一領(lǐng)域具備很強泛化性和基礎(chǔ)能力的模型。第三個是全場景,由于整個AI應(yīng)用的范疇在多個場景都會出現(xiàn),新一代的框架需要在很多個不同的場景下,基于一套框架便可以支持開發(fā)AI應(yīng)用。
總的來說,就是經(jīng)過三波浪潮,目前,深度學(xué)習(xí)框架的已經(jīng)發(fā)展到了能夠與科技深度結(jié)合,支持基礎(chǔ)模型的研發(fā),支持全場景,面對不同場景具備生成能力。
支持全場景覆蓋的MindSpore版本迭代經(jīng)歷
MindSpore目前已經(jīng)到了1.6版本,黃老師介紹版本迭代的時間比較固定,大致有兩個階段,而在開源的第一年,也就是2020年是最瘋狂的時候,基本一個月就發(fā)布一個可商用的版本。在發(fā)布了1.0這個對用戶而言可以放心使用的版本之后,從2021年開始,MindSpore基本上保持穩(wěn)定的一個季度發(fā)布一個版本的節(jié)奏。
目前,MindSpore可以說是國產(chǎn)開源項目的代表性案例。在這兩年的發(fā)展過程中,MindSpore都是從完全原創(chuàng)的角度為每一個版本不斷添加新的功能特性,比如圖學(xué)習(xí)、聯(lián)邦學(xué)習(xí)、增量學(xué)習(xí)等。MindSpore在過去的2年里,以盡可能最短的時間迅速夯實基礎(chǔ),同時也在不斷推出非常有競爭力的東西。
MindSpore開源治理經(jīng)驗分享
根據(jù)最新報道,昇思MindSpore今年將融入鴻蒙和歐拉生態(tài),成為內(nèi)置的 AI 引擎。昇思MindSpore 到目前,已突破140萬用戶下載量,服務(wù)了5000+ 企業(yè),短短2年取得了傲人的成績,這都跟MindSpore開源社區(qū)的運作與管理分不開。
黃老師分享治理社區(qū)經(jīng)驗時,指出治理是一個非常專業(yè)的領(lǐng)域,并介紹了它的三個維度。
最重要的維度是開放性,而MindSpore算是企業(yè)推動開源AI框架里,第一個采用開放治理模式的社區(qū)。比如,社區(qū)不僅有大家都能看到的指導(dǎo)各機構(gòu)運作的章程,還有14名橫跨中國、歐洲、英美等代表組成的全球性的技術(shù)委員會,而MindSpore版本特性模塊的開發(fā)是通過SIG(Special Interest Group)組織,所有需要跨模塊合作以解決場景性問題的是通過WG(Working Group)來承載,同時也會通過大量的投票活動收集大家的意見。
第二個維度是多樣性。MindSpore的多樣性體現(xiàn)在很多方面,比如,面向國內(nèi)外不同城市、不同企業(yè)、不同高校的MSG(MindSpore Study Group)這一類的開發(fā)者社群,把開發(fā)者都組織起來參加社區(qū)的活動。多樣性也體現(xiàn)在社區(qū)很多的專題活動,比如,科技從業(yè)女性主題的自由分享和交流經(jīng)驗的Women In Tech。
第三個維度是可信,企業(yè)對很多開源軟件的使用是基于一定信任的,所以MindSpore也跟國內(nèi)很多標準組織、產(chǎn)業(yè)組織進行了合作。通過社區(qū)治理推動開源項目和開源社區(qū)更值得信賴。
為OpenI啟智社區(qū)深度打Call
提到OpenI啟智社區(qū),黃老師在線為它打Call。MindSpore與OpenI啟智社區(qū)有著非常緊密的合作,共同舉辦過諸如集結(jié)號這樣的開發(fā)者活動,邀請來自各個高校的學(xué)生利用假期的時間集中在一起進行MindSpore相關(guān)模型的開發(fā)活動。
黃老師說他跟啟智的淵源其實要比MindSpore還要久,并介紹OpenI啟智是以鵬城實驗室等科研機構(gòu)進行支撐和推動建設(shè)的國內(nèi)第一個專注人工智能開源的非常好的社區(qū)。這對于推動科研工作者們進行開源是非常難能可貴的,同時,OpenI啟智社區(qū)的章程設(shè)計也有這很高的完備度,歡迎大家通過訪問官網(wǎng)(www.hualongw.cn)進行查看。
社區(qū)也經(jīng)常邀請人工智能開源相關(guān)的專家學(xué)者進行開源與知識產(chǎn)權(quán)結(jié)合的講座分享,這在國內(nèi)目前依舊是非常小眾的領(lǐng)域,而它對科研院校和企業(yè)的開源應(yīng)用非常重要。為了保護知識產(chǎn)權(quán),啟智社區(qū)在初期還建立了自己的開源許可證,希望能探索更多符合我國國情的開源知識產(chǎn)權(quán)管理方法。同時,啟智社區(qū)有著非常多種類且名字非常有趣的開源項目,比如啟智章魚、啟智珊瑚等很有深圳特色的項目名稱,對人工智能感興趣的人,可以在啟智社區(qū)里找到自己非常喜歡或者感興趣的項目。另外,OpenI啟智社區(qū)也經(jīng)常舉辦各種跟開源相關(guān)的活動,除了集結(jié)號,還有校園行系列分享活動、開發(fā)者大會、全國人工智能大賽等多樣化活動,推動我國人工智能開源發(fā)展。
三、人工智能開源的未來發(fā)展
開源越趨年輕化之象
目前,MindSpore社區(qū)中的布道師以及開發(fā)者,普遍存在年輕化的趨勢,且很多來自在校大學(xué)生,對于這種年輕化趨勢的現(xiàn)象,黃老師非常贊同,認為開源本就應(yīng)該為年輕人提供一個更廣闊的舞臺,讓他們更愿意去講述分享自己的故事,讓開源更具朝氣。同時,也因為目前人工智能是處于起飛狀態(tài)的朝陽產(chǎn)業(yè),越來越多的高校開設(shè)人工智能的專業(yè)以及人工智能學(xué)院,吸引了更多年輕人踏入到人工智能學(xué)科與行業(yè)。
同時,黃老師也指出其中的挑戰(zhàn),即在跟商業(yè)接軌這塊,需要他們更加認真、嚴肅對待開源。尤其在打造專業(yè)的開源社區(qū)時,日常涉及的工作雖然枯燥,但為開發(fā)者和企業(yè)提供的每一項服務(wù)都類似于在精心打造一款產(chǎn)品,需要嚴肅認真交付和不斷迭代、復(fù)盤,希望更多年輕人關(guān)注開源是一件很專業(yè)也很嚴肅的事情。
四、直播互動精選問答
自動駕駛的全面發(fā)展
直播間有小伙伴提問關(guān)于“AI駕駛是否會全產(chǎn)業(yè)鏈發(fā)展”的問題,黃老師認為,對于跟人工智能或者深度學(xué)習(xí)的結(jié)合來說,自動駕駛算得上是最全面的一個場景。因為它要涉及深度學(xué)習(xí)幾大類任務(wù),比如對圖像做大量處理的cv類的任務(wù),以及nlp類的任務(wù)去做很多跟自動駕駛相關(guān)的功能,還有類似交規(guī)遵從這類強化學(xué)習(xí)方面的任務(wù)。由于自動駕駛本身是一個會把很多領(lǐng)域的深度學(xué)習(xí)技能都集合到一起的領(lǐng)域,所以自動駕駛將來會形成一種全面的發(fā)展。
CV和NLP模型最終將實現(xiàn)統(tǒng)一
有小伙伴提問黃老師如何看待CV和NLP模型統(tǒng)一的發(fā)展方向,黃老師提到最近比較火的、業(yè)界也有不少專家很看好的transformer,認為它非常有希望能提供一套把cv類的任務(wù)和nlp類任務(wù)最終實現(xiàn)統(tǒng)一的架構(gòu)。黃老師還回憶他們之前在做有關(guān)論文的分享時,發(fā)現(xiàn)如果transformer作為大一統(tǒng)架構(gòu),則意味著語義可以作為描述包括視覺、自然語言處理等一系列廣泛任務(wù)的基礎(chǔ),將很多此前只在書本上的哲學(xué)討論,一下子拉進了現(xiàn)實,它也將帶來更深遠的影響。不過基于其他研究,除了transformer,也將有其他的方式來實現(xiàn)統(tǒng)一。
開源是否能幫助國產(chǎn)深度學(xué)習(xí)框架在通往主流道路上實現(xiàn)跨越式發(fā)展
黃老師談起了他在InfoQ發(fā)布的第一篇關(guān)于“對開源的作用應(yīng)該如何認知”的文章,他認為無論是深度學(xué)習(xí)框架還是人工智能,能植根于中國的依然是技術(shù)創(chuàng)新,但它還要依靠大量的科學(xué)家、工程師踏踏實實的不斷研究算法、做工程實現(xiàn),來彌補當(dāng)前國產(chǎn)技術(shù)的不足,推動國產(chǎn)深度學(xué)習(xí)框架不斷迭代發(fā)展。而開源是目前能夠看到的幫助創(chuàng)新的最佳方式,雖然它并不能幫助跨越式發(fā)展,但它能加速整個生態(tài)的成長。如果用開源的方式去幫助核心技術(shù)發(fā)展生態(tài),它帶來的最大好處就是不確定性,通過不斷引入這些規(guī)劃之外的不確定性,才能不斷加速技術(shù)創(chuàng)新和生態(tài)的成長。
MindSpore的一些優(yōu)勢及差異點
黃老師以Jax為例與MindSpore做對比,指出Jax的主要目的是為了讓NumPy在GPU和谷歌的TPU上跑得更好,而MindSpore的優(yōu)化對象則是昇騰,這個國產(chǎn)自主研發(fā)的AI硬件。MindSpore本身支持主流的CPU、GPU,以及昇騰,尤其對昇騰有深度的優(yōu)化。它與Jax的區(qū)別在于,MindSpore優(yōu)先支持自主生產(chǎn)的AI硬件平臺性能,而MindSpore也是昇騰平臺上跑同類任務(wù)最優(yōu)的框架。其次,MindSpore是一個比較通用的支持全場景的框架,JAX從它的定位出發(fā),在全場景相關(guān)支持上目前尚未有很成熟的思路。
黃老師心得總結(jié)
黃老師結(jié)合自身從門外漢攻入人工智能領(lǐng)域的經(jīng)驗,建議想從事人工智能開源相關(guān)的非AI專業(yè)的小伙伴們,在掌握人工智能基礎(chǔ)必備的數(shù)學(xué)技能、讀Paper的能力、找到好的工具(比如昇思MindSpore社區(qū)團隊開發(fā)的TinyMS)的同時,排除對未知的恐懼,選擇一個像MindSpore這樣的開源社區(qū)參與進去,與社區(qū)專家多交流多學(xué)習(xí),從而加速自身入門人工智能的速度。