人工智能連續(xù)3年進入政府報告、“智能+”成為時代新命題,這些信息都顯示2019年會是AI產業(yè)全面加速落地的一年。AI行業(yè)的發(fā)展,離不開千萬開發(fā)者的助力。
3月20日,首場百度大腦開放日全新登場,介紹了全新開放的24種全新AI能力,AI賦能市政、物流、教育等行業(yè)的20個案例,也為向開發(fā)者、行業(yè)人士展現(xiàn)了如何搭上AI開放生態(tài)的高速列車。
百度大腦開放日來襲
作為百度在人工智能領域多年研究成果的集大成者,百度大腦正在飛速進步著。自2016年啟動開放以來,百度大腦目前已經是服務規(guī)模最大的AI開放平臺,開放了158項AI能力,24小時快速集成,開發(fā)者數(shù)量超過100萬,面向廣泛的企業(yè)和開發(fā)者提供最先進、最全面的AI能力,不斷降低AI應用落地的門檻。
百度AI技術生態(tài)部總經理喻友平談到,“在百度大腦的開放生態(tài)中,開發(fā)者一直是最為重要的一環(huán)。百度大腦開放能力不斷加速,有很多有價值的技術難以被開發(fā)者了解。2019年百度大腦開放日全新登場,希望為AI開發(fā)者提供及時、全面、近距離地了解百度大腦最新AI產品和案例,且能深度、持續(xù)交流的平臺。”

首期開放日,喻友平介紹了百度大腦開源深度學習平臺PaddlePaddle以及通用AI能力兩方面的技術和產品更新,以及百度大腦在市政、物流、教育等行業(yè)的落地案例,與開發(fā)者們進行深度交流。
更廣、更快、更精的AI技術
深度學習是AI發(fā)展的燃料。百度在深度學習領域深耕已久,2016年,百度開源了深度學習框架PaddlePaddle。此次,PaddlePaddle迎來兩方面重大更新,核心框架Paddle Fluid v1.3新增發(fā)布業(yè)界首個視頻分類模型庫,新增支持NLP語義表示BERT模型,分布式訓練性能大幅提升,大規(guī)模稀疏參數(shù)服務器Benchmark發(fā)布;同時,基于PaddlePaddle的深度強化學習框架PARL,奪冠NeurIPS 2018。具有高靈活性和可擴展性,支持可定制的并行擴展,覆蓋DQN、DDPG、PPO、A3C等主流強化學習算法.
目前,百度PaddlePaddle已對外開放超過50種經過工業(yè)場景驗證的官方模型,例如,領邦利用PaddlePaddle,通過ICNet語義分割模型識別精密零件瑕疵,實現(xiàn)零件自動分揀。
在深度學習基礎之上,百度大腦通用AI能力開放涵蓋語音、視覺、自然語言處理、知識圖譜等全面AI技術。語音方面推出了語音識別極速版,首次對外開放在百度輸入法產品上采用的最領先語音技術(在線語音領域全球首創(chuàng)的流式多級截斷注意力模型SMLTA),擁有更快的響應速度,相對識別準確度提升15%,為開發(fā)者帶來更極致的識別體驗。此外,語音識別預置語義解析全新升級,預置場景由35個升級為51個,從影視娛樂到外賣打車,語義解析效果全面提升。另外,還預告了即將推出的幾款新產品,包括語音識別自訓練平臺、遠場語音開發(fā)套件和語音離線合成等產品。
視覺方向上,OCR、車輛分析、人臉人體、圖像識別都有重磅升級。比如卡證OCR新增了戶口本、出生醫(yī)學證明、港澳通行證和臺灣通行證四類新能力,可識別卡證總數(shù)達到9種。只需對著你的戶口本拍一張照片,系統(tǒng)就能字段進行結構化識別,然后反饋出信息頁的出生地、出生日期、姓名、民族、與戶主關系、性別、身份證號碼。而票據OCR和汽車場景OCR也分別新增了行程單、保單、通用機打發(fā)票、定額發(fā)票、車輛VIN碼、機動車銷售發(fā)票、車輛合格證等識別能力。目前,百度大腦OCR產品全系列可以識別類型多達34款,實現(xiàn)卡證、票據、文檔、汽車全場景覆蓋。
人臉人體識別方向,百度大腦此次發(fā)布了新能力——人臉情緒識別,同時升級了人臉關鍵點檢測和手勢識別,人臉檢測關鍵點由72個增至150個,常見手勢能識別種數(shù)也達到了24種。圖像識別方向,百度大腦更新了紅酒和地標識別兩個新能力。無論是盧浮宮還是82年的拉菲,只要上傳1張照片,就能獲得文字解析。車輛分析方面上線了車輛檢測和車流統(tǒng)計。喻友平透露,不久后,百度大腦還會陸續(xù)上線車輛屬性識別、車輛外觀損傷識別、人臉融合、手部關鍵點識別、更高精度的人像分割以及錢幣識別等有趣有用的應用場景。

同時,百度大腦語言及知識技術也進一步開放。在語言處理應用技術方面,百度大腦新增文本糾錯、新聞摘要、智能寫詩、智能春聯(lián)和對話情緒識別等能力,在知識理解方面,百度大腦推出了作文檢索和知識問答兩個新能力,讓學習和娛樂兩不誤,分分鐘化身“十萬個都知道”。同時,智能寫作平臺將在4月全面上線,從素材上為創(chuàng)作者提供工具、幫助找到靈感,提升創(chuàng)作者的寫作效率和產出質量,降低寫作成本。
在強勁的AI技術支持下,百度大腦也在重點發(fā)力智能硬件和設備。1月16日,百度大腦在深圳召開“在端上思考”百度大腦AI硬件平臺及產品發(fā)布會,發(fā)布13項端側新品,備受行業(yè)關注。在現(xiàn)場,喻友平介紹到,目前已有4款新品正式上架AI市場。

在AI能力廣度、速度、精度不斷提升的基礎下,百度大腦充分利用自己在AI領域內的成功經驗不斷雕琢著自身的核心技術,開始在產業(yè)界呈現(xiàn)“乘法效應”展現(xiàn)出產業(yè)智能化“頭雁”的速度。
AI落地的乘法效應
AI技術的發(fā)展,最終還是要落實到我們的生活中。在我們觸手可及的各個角落中都有百度大腦加持的智能產品。首期開放日著重介紹了近期開發(fā)者詢問較多的市政、物流、教育三個領域的落地案例。

比如百度EasyDL與分形科技打造的智能垃圾桶已成功地落地海淀公園,可以對7種常見垃圾自動分類,后期還可以通過增加訓練數(shù)據識別更多種類;在和德邦物流的合作中,為用戶免去了自行填寫信息的麻煩,使用定制詞法分析快遞申請,一秒拆分姓名、電話、住址等信息;更具科研意義的還有百度EasyDL與中科院在珍稀鳥類識別項目上展開的合作,在傳統(tǒng)分類學日漸沒落的今天,百度EasyDL可以利用強大的圖像識別技術協(xié)助專家們對動植物標本、照片進行快速鑒定,目前中科院使用EasyDL訓練對超過12萬幅圖片進行分析,目前在700多種鳥類模top5上的識別準確率達到93.89%,非雀形目鳥類模型top5準確率達到95.79%,滿足上線服務要求。
與卓繁信息的合作,百度大腦還打造了“AI便民”的新型無人值守受理站。通過UNIT、OCR、人臉識別等AI技術,“無人值守”的政務服務新模式為社會公眾提供全年無休的24小時自助辦事服務,提升了政府為民服務的能力。
開放日當天,網紅智能貓窩的設計者百度大腦工程師晚兮也在現(xiàn)場為大家講述了智能貓窩設計者們的初心。為了讓流浪喵過上幸福的生活,程序員出身的他用百度大腦動物識別技術和百度EasyDL打造出 “貓臉門禁”、“病貓識別”、“絕育識別”三大智能功能,給流浪貓一個溫暖的住所的同時幫助救助志愿者發(fā)現(xiàn)生病和未絕育的流浪貓。晚兮提到,憑借百度大腦的開放技術,他只用半天就設計出了智能貓窩的三項主要AI功能,看似高冷的AI技術最終化為貓咪們的守護神,讓現(xiàn)場的小伙伴們感到暖心又感動。

2018年百度大腦走進6大城市舉辦7場行業(yè)創(chuàng)新論壇,發(fā)布了企業(yè)服務、信息服務、地產物業(yè)、智能零售、智能工廠、智能校園、智能政務7大行業(yè)解決方案,推動AI與不同行業(yè)、具體場景相結合,AI技術滲透到產業(yè)的毛細血管。百度大腦目前已經落地20+行業(yè),生態(tài)賦能已成燎原之勢。
百度大腦新品體驗師計劃
如果只是技術“閱兵”會讓你覺得意猶未盡,為了進一步激勵開發(fā)者學習應用百度大腦開源能力,百度大腦提出了“百度大腦新品體驗師計劃”,希望與開發(fā)者一起推動百度大腦進化,幫助他人一起成長,探索AI前沿應用。針對開放日介紹過的任意一款產品,開發(fā)者提出改進建議、使用技巧/攻略或者有價值有意思的案例并發(fā)表在AI社區(qū),將會獲得社區(qū)積分、百度大腦定制禮品、現(xiàn)金禮品卡等多重獎勵。
技術更新、新品上線、開發(fā)者現(xiàn)身說法、行業(yè)案例詳細解讀、交流互動社區(qū)、培養(yǎng)激勵措施……首期百度大腦開放日可謂干貨滿滿。 “人工智能應用的領域可以說無處不在,只要企業(yè)、開發(fā)者、合作伙伴們能有發(fā)現(xiàn)問題的眼睛,就有創(chuàng)新創(chuàng)業(yè)的機會。百度大腦把平臺和AI能力開放出來,希望幫助大家快速地實現(xiàn)各自領域的業(yè)務解決方案,創(chuàng)造全新商業(yè)模式,帶來更多機遇。”喻友平在現(xiàn)場如是說。
來源:砍柴網