當(dāng)前位置:首頁 > 啟夢行動(dòng) > 大咖分享 > 人工智能開源錄 > 直播視頻 >
近年來,AI 開源逐漸成為眾多開發(fā)者談?wù)摰暮诵模渤霈F(xiàn)了不少“AI 不適合開源”的聲音,那么,AI 項(xiàng)目到底適不適合開源呢?
為了解答這個(gè)專業(yè)問題,9 月 19 日,OpenI 啟智社區(qū)特邀聯(lián)通研究院教授級(jí)高級(jí)工程師、OpenI 啟智社區(qū)精品開源項(xiàng)目“CubeAI 智立方”負(fù)責(zé)人霍龍社博士做客 OpenI 啟智社區(qū)與 InfoQ 聯(lián)合打造的《人工智能開源錄》直播欄目,深度解讀“AI 項(xiàng)目到底適不適合開源”。
本場直播訪談?dòng)?InfoQ 資深編輯魯冬雪擔(dān)任主持,與霍博士就“人工智能技術(shù)到底適不適合開源”、“開源 AI 算能服務(wù)平臺(tái) CubeAI 智立方的開源歷程”、“人工智能行業(yè)未來的發(fā)展”等 AI 開源相關(guān)話題展開訪談。直播在線觀看用戶量達(dá)到了近 7000 人,用戶對(duì)霍博士的 AI 見解表示受益匪淺,更對(duì) OpenI 特邀的每期嘉賓表示非常期待。
無關(guān)適不適合,更是愿不愿意
針對(duì) AI 到底適不適合開源這個(gè)話題,霍博士認(rèn)為它沒有一概而論的標(biāo)準(zhǔn)答案,需要根據(jù)項(xiàng)目的實(shí)際情況而定。而且,開源無關(guān)適不適合,更是愿不愿意的問題。
對(duì)于開發(fā)者來說,開源能讓他們?cè)陂_發(fā)過程中快速的給一個(gè)項(xiàng)目打好基礎(chǔ),提高代碼質(zhì)量和開發(fā)效率。從公司的角度來說,開源更是一把雙刃劍。公司代碼是否選擇開源,要從公司的經(jīng)營利益以及市場競爭方面考慮正面和負(fù)面的影響,開源是否影響到公司的技術(shù)生態(tài)環(huán)境,又或者是否會(huì)讓競爭對(duì)手漁翁得利,都需要站在公司的角度去考慮。
而“開源不適合 AI”的聲?是一種以偏概全的觀點(diǎn)。比如,超大模型的開源對(duì)模型本身和開發(fā)者其實(shí)都是相互成就的過程,開發(fā)者可以從模型代碼的思路、框架汲取優(yōu)秀的想法,同時(shí),也能激發(fā)開發(fā)者們給開源項(xiàng)目提供更好的建議。另外,借助開源算法,AI 技術(shù)在落地方面可以得到更高效的推動(dòng),開發(fā)效率能夠達(dá)到事半功倍的提高。對(duì)于實(shí)際生產(chǎn)運(yùn)營的 AI 項(xiàng)目,在開源代碼上進(jìn)行二次開發(fā),能夠更高效的促進(jìn) AI 技術(shù)落地。
源于開源,回饋開源
1、CubeAI 源于開源,回饋開源
2019 年,中國聯(lián)通為推動(dòng) 5G 與 AI 融合創(chuàng)新,發(fā)布了 CubeAI 智??平臺(tái)。而 CubeAI 選擇開源的原因,霍博士概括為“源于開源,回饋開源”。
因?yàn)樵陧?xiàng)目初期,團(tuán)隊(duì)通過學(xué)習(xí)借鑒美國 AT&T 的開源代碼思路而開發(fā)出 CubeAI 的框架。所以團(tuán)隊(duì)希望將 CubeAI 智立方平臺(tái)開源,也能夠給業(yè)界生態(tài)帶來積極正向的影響。
2、CubeAI 為打破模型開發(fā)與實(shí)際應(yīng)用壁壘而生
從??智能?業(yè)發(fā)展來看,AI 模型開發(fā)與實(shí)際?產(chǎn)應(yīng)?之間存在不少壁壘。比如,大部分模型項(xiàng)目方的精力都集中在模型的訓(xùn)練開發(fā)上面,對(duì)模型的交付和用戶使用體驗(yàn)卻并未投入太多關(guān)注,以至于用戶在模型使用上的體驗(yàn)非常糟糕。
而作為開源 AI 算能服務(wù)平臺(tái)的 CubeAI 智立方卻很好地解決了這些問題。據(jù)霍博士介紹,CubeAI 平臺(tái)不需要使用者了解任何服務(wù)器云端封裝的基本原理和編程知識(shí),只要通過平臺(tái)提供的模版,就能把模型一鍵部署到云端,以服務(wù)化 API 的方式對(duì)用戶提供服務(wù)。
CubeAI 不僅實(shí)現(xiàn)了與市場上一些優(yōu)秀的建模平臺(tái)的對(duì)接功能,其 AI 模型共享還能很好幫助用戶收藏部署模型。相比 Github 必須先下載才能后修改的靜態(tài)代碼,CubeAI 的 AI 模型共享是能夠?qū)⒋a直接部署到云端的活體程序。同時(shí),它的 AI 能力開放平臺(tái)能夠讓用戶對(duì)模型進(jìn)行更好的管理,交互可視化。
而關(guān)于 CubeAI 后續(xù)的規(guī)劃,霍博士認(rèn)為作為平臺(tái)型的開源軟件,要想真正發(fā)揮作用,還需要做好面向公眾互聯(lián)網(wǎng)的運(yùn)營。目前,CubeAI 正處于開源孵化的階段,用戶群體主要面向個(gè)體 AI 開發(fā)者和中小型開發(fā)團(tuán)隊(duì),并沒有在互聯(lián)網(wǎng)上得到實(shí)際的應(yīng)用。后續(xù),團(tuán)隊(duì)將根據(jù)實(shí)際的運(yùn)營需求,把 CubeAI 打造成一款能夠真正投入實(shí)用的產(chǎn)品。
3、CubeAI 在 OpenI 開源孵化后的經(jīng)驗(yàn)與感受
在談到進(jìn)入 OpenI 啟智社區(qū)孵化的 CubeAI 時(shí),霍博士認(rèn)為啟智社區(qū)為項(xiàng)目提供了一個(gè)非常好的代碼托管平臺(tái),之前 CubeAI 的代碼一直托管在 github,但團(tuán)隊(duì)在使用了一段時(shí)間啟智的 AI 協(xié)作平臺(tái)后,很快就都喜歡上了這個(gè)平臺(tái),仿佛發(fā)現(xiàn)了新大陸,從此,CubaAI 項(xiàng)目的所有代碼全部被切換到了啟智平臺(tái)。
提到 OpenI 啟智社區(qū),霍博士對(duì)啟智的平臺(tái)性能、用戶體驗(yàn)和社區(qū)活動(dòng)都大為贊嘆:第一,啟智 AI 協(xié)作平臺(tái)速度快,代碼提交很流暢。第二,用戶界面很友好,所有的交互都非常清晰明了。第三,平臺(tái)本身也是迭代開源項(xiàng)目,兩個(gè)禮拜會(huì)有一次更新,每次更新都會(huì)有更好的體驗(yàn)。另外,啟智社區(qū)對(duì) CubeAI 項(xiàng)目等孵化項(xiàng)目也提供了很多展示和宣傳的機(jī)會(huì)。同時(shí),霍博士還開心地提到前一段時(shí)間在 OpenI 啟智社區(qū)無意中參與“我為開源打榜狂”活動(dòng)并獲獎(jiǎng)的經(jīng)歷,只要提交代碼達(dá)到一定次數(shù)就能拿獎(jiǎng)金。總之,霍博士安利 OpenI 是一個(gè)對(duì) AI 開發(fā)者非常友好的平臺(tái)。
除了開源,更要多措并舉
1、人人如何可以都做 AI 開發(fā)
如今開源 AI 平臺(tái)越來越多,AI 技術(shù)應(yīng)用門檻不斷降低,出現(xiàn)了一種“人人都可以做 AI 開發(fā)”的趨勢。霍博士從 AI 應(yīng)用開發(fā)的層面分析了形成這種趨勢的幾方面因素。
第一,是因?yàn)槿斯ぶ悄芗夹g(shù)本身的發(fā)展。跟傳統(tǒng)的機(jī)器學(xué)習(xí)相比,基于神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)有一個(gè)最大的優(yōu)勢是不需引進(jìn)人工特征提取,就可以進(jìn)行端到端的學(xué)習(xí)。在模型設(shè)計(jì)和算法研究層面不需要開發(fā)者和專家的參與,降低了技術(shù)層面。
第二,是因?yàn)楦黝愰_源框架的出現(xiàn)普及讓復(fù)雜的操作和重復(fù)的計(jì)算可以被代碼封裝起來,制作成通用的 API 接口來構(gòu)建模型訓(xùn)練和推理操作,大大降低了模型開發(fā)的難度和技術(shù)門檻。
第三,在開源框架的基礎(chǔ)上,誕生了利用通用數(shù)據(jù)集訓(xùn)練的預(yù)訓(xùn)練模型。不同應(yīng)用領(lǐng)域的開發(fā)者能夠使用自己的數(shù)據(jù)集來進(jìn)行增強(qiáng)或者優(yōu)化預(yù)訓(xùn)練,得到更適合自己領(lǐng)域的模型參數(shù)。這樣就降低了應(yīng)用型模型開發(fā)的技術(shù)門檻。
第四,各類 AI 開源平臺(tái)的出現(xiàn)。這些平臺(tái)面向各類應(yīng)用開發(fā)者直接提供訓(xùn)練好的模型。開發(fā)者只要進(jìn)行簡單的參數(shù)配置或者編排組裝后就可以調(diào)用。對(duì)于應(yīng)用開發(fā)者的話,他們甚至不需要學(xué)習(xí)和掌握 AI 的基礎(chǔ)理論就可以進(jìn)行開發(fā)應(yīng)用了。
總的來說,霍博士認(rèn)為想要得到良好的發(fā)展,還必須借助開源的應(yīng)用生態(tài)環(huán)境,吸引大量的人來參與開發(fā)建設(shè),而降低技術(shù)門檻是吸引開發(fā)者的必要條件。同時(shí),降低門檻可以讓大家站在巨人的肩膀上,助力 AI 行業(yè)發(fā)展得更好。
2、國產(chǎn) AI 開源框架現(xiàn)狀與未來
近幾年,國內(nèi)不少廠商都開源了自己的 AI 框架,但能做到在業(yè)界有名氣的開源項(xiàng)目并不多或影響力不夠大。霍博士認(rèn)為這其中有幾點(diǎn)主要原因:一是跟用戶的使用習(xí)慣和學(xué)術(shù)生態(tài)有關(guān)。讓習(xí)慣了使用國外的 TensorFlow 或者 PyTorch 框架的 AI 研究者轉(zhuǎn)向使用國內(nèi)新興的 AI 開源框架不僅有很高的學(xué)習(xí)成本,且基于新的框架很難在國際學(xué)術(shù)環(huán)境上別人交流。二是因?yàn)?AI 開源不是一件輕松的事情,除了大量的持續(xù)創(chuàng)新開發(fā)人才,還要宣傳運(yùn)營團(tuán)隊(duì),以及有強(qiáng)大的算力支持。長期以往的消耗,很多公司的項(xiàng)目無法持續(xù)下去。三是 AI 科學(xué)項(xiàng)目需要一個(gè)持續(xù)的創(chuàng)新。如果技術(shù)缺乏持續(xù)創(chuàng)新,項(xiàng)目將逐漸失去人們的關(guān)注,從而失去信心,也就無法堅(jiān)持下去了。
盡管很難成功,霍博士認(rèn)為國內(nèi)廠商爭相構(gòu)建開源框架也能帶來不同的創(chuàng)新和進(jìn)步,大家互相學(xué)習(xí)借鑒,取長補(bǔ)短,能形成一種百花齊放的局面。在相應(yīng)政策和市場的影響下,國內(nèi)不少優(yōu)秀的機(jī)構(gòu)和項(xiàng)目都在友好合作,朝著帶動(dòng)國產(chǎn) AI 開源走向行業(yè)領(lǐng)頭的方向努力。
3、開源是促進(jìn)人工智能發(fā)展的一種舉措
提到行業(yè)里存在哪些技術(shù)挑戰(zhàn)時(shí),霍博士以 CubeAI 為例,介紹項(xiàng)目的重心主要是解決模型的發(fā)布和部署,但對(duì)于將來的部署和運(yùn)營具體以什么形態(tài)呈現(xiàn)、如何讓開發(fā)者、運(yùn)營者和使用者都能得到最大的實(shí)惠和便利這些方面的技術(shù)挑戰(zhàn)仍舊在探索。希望將來能做到技術(shù)與算法解耦合,讓開發(fā)者更好的專注算法研發(fā),而不用擔(dān)心技術(shù)和硬件層面的問題。至于開源,霍博士認(rèn)為它只是解決這些技術(shù)挑戰(zhàn)中需要借助和依賴的一個(gè)機(jī)制和手段,是解決這些問題其中的一環(huán),光靠開源遠(yuǎn)遠(yuǎn)不行,更要多措并舉。
以上就是霍博士在“AI 項(xiàng)目到底適不適合開源”為主題的訪談中分享的主要觀點(diǎn)。在直播過程中,霍博士也熱心與觀眾互動(dòng)并解答相關(guān)問題。