這兩年來(lái),雖然人工智能技術(shù)已經(jīng)令人們變得興奮不已,但實(shí)際上目前它的發(fā)展所需要的技術(shù)、工具與流程還沒(méi)有完全成形,研究人員正積極解決各類最為棘手的現(xiàn)實(shí)問(wèn)題,作為企業(yè),現(xiàn)在應(yīng)該做的就是抓緊時(shí)間了解AI前沿所發(fā)生的一切,并以此為基礎(chǔ)定位組織與學(xué)習(xí)思路,最終利用甚至推動(dòng)由此帶來(lái)的一切可能性。
人工智能就像個(gè)不斷移動(dòng)的標(biāo)靶,而企業(yè)要做的就是努力“正中靶心”。
當(dāng)然,當(dāng)我們看到Alexa、Siri以及AlphaGO不斷占據(jù)新聞?lì)^條的同時(shí),不得不承認(rèn)的另一個(gè)現(xiàn)實(shí)情況是——包括機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等在內(nèi)的諸多人工智能技術(shù)仍然存在非常多的局限性,這還需要我們投入巨大的精力和時(shí)間去克服。
為此,在今天的文章中,我們將全面探討人工智能技術(shù)目前面臨的障礙以及對(duì)應(yīng)的解決方法。
據(jù)麥肯錫全球研究院在最近的研究報(bào)告(相關(guān)文章《麥肯錫在全球調(diào)研分析了160個(gè)案例,給出5個(gè)行業(yè)的34個(gè)AI應(yīng)用場(chǎng)景》)中指出,行業(yè)中的領(lǐng)導(dǎo)企業(yè)往往更青睞于對(duì)人工智能技術(shù)的投資和應(yīng)用。
因此,要提升企業(yè)在未來(lái)的競(jìng)爭(zhēng)力,就必須要有能力掌握更為充分的信息以應(yīng)對(duì)人工智能難題。換句話來(lái)說(shuō),我們不僅需要理解AI在促進(jìn)創(chuàng)新、洞察力以及決策、推動(dòng)營(yíng)收增長(zhǎng)乃至改進(jìn)效率水平等層面的現(xiàn)實(shí)意義,同時(shí)也有必要深入了解人工智能還無(wú)法實(shí)現(xiàn)價(jià)值的領(lǐng)域。
挑戰(zhàn)、局限與機(jī)遇:從深度學(xué)習(xí)技術(shù)談起
可以說(shuō),深度學(xué)習(xí)是人工智能領(lǐng)域目前最受關(guān)注的發(fā)展成果,利用包含數(shù)百萬(wàn)個(gè)分層構(gòu)建的模擬“神經(jīng)元”的大型神經(jīng)網(wǎng)絡(luò),它正在幫助我們提升分類與預(yù)測(cè)的準(zhǔn)確性。其中,最常見的網(wǎng)絡(luò)被稱為卷積神經(jīng)網(wǎng)絡(luò)(簡(jiǎn)稱CNN)與遞歸神經(jīng)網(wǎng)絡(luò)(簡(jiǎn)稱RNN)。這些神經(jīng)網(wǎng)絡(luò)能夠通過(guò)數(shù)據(jù)訓(xùn)練,并配合反向傳播算法實(shí)現(xiàn)“學(xué)習(xí)”。
雖然這一技術(shù)已經(jīng)取得了一系列進(jìn)展,但需要注意的是,其中還有最關(guān)鍵的一步,就是如何將人工智能方法與問(wèn)題和可用數(shù)據(jù)匹配起來(lái)。由于這些系統(tǒng)是“訓(xùn)練”而來(lái),而非編程而來(lái)的,因此其學(xué)習(xí)過(guò)程往往需要大量標(biāo)記數(shù)據(jù)才能準(zhǔn)確執(zhí)行復(fù)雜的任務(wù)。然而,獲取大規(guī)模數(shù)據(jù)集往往相當(dāng)困難,即使能夠?qū)崿F(xiàn),標(biāo)記工作也需要巨大的人力投入。
此外,我們很難判斷深度學(xué)習(xí)訓(xùn)練所使用的數(shù)學(xué)模型要如何才能達(dá)成特定的預(yù)測(cè)、推薦或決策要求。這就是“黑匣子”問(wèn)題,即使模型能夠支持實(shí)現(xiàn)既定的目標(biāo),但效用恐怕也將十分有限??紤]到這一點(diǎn),用戶有時(shí)候的確需要了解這背后的運(yùn)作原理,以及為何在特定情況下某些因素的權(quán)重要比其它因素更高等等。然而,這并不容易。
基于此,我們列舉了人工智能技術(shù)及其應(yīng)用目前存在的五大局限,以及與之對(duì)應(yīng)的解決方案:
1- 需要大量的數(shù)據(jù)標(biāo)記
大多數(shù)現(xiàn)有的AI模型都是通過(guò)“監(jiān)督學(xué)習(xí)”訓(xùn)練而成的。這意味著人類必須對(duì)樣本數(shù)據(jù)進(jìn)行標(biāo)記與分類,但這一過(guò)程很可能存在一些難以察覺的錯(cuò)誤。強(qiáng)化學(xué)習(xí)與生成式對(duì)抗網(wǎng)絡(luò)(GAN)是解決這一問(wèn)題的兩個(gè)重要手段。
強(qiáng)化學(xué)習(xí)。強(qiáng)化學(xué)習(xí)是一種無(wú)監(jiān)督學(xué)習(xí)的方法,它允許算法通過(guò)反復(fù)試驗(yàn)完成學(xué)習(xí)任務(wù)。有點(diǎn)像是“胡蘿卜加大棒”的簡(jiǎn)單訓(xùn)練方式:即對(duì)于算法在執(zhí)行任務(wù)時(shí)所做出的每一次嘗試,如果其行為獲得成功,則給予“報(bào)酬”(例如更高的分?jǐn)?shù)); 如果不成功,則給予“懲罰”。經(jīng)過(guò)不斷重復(fù),使得學(xué)習(xí)環(huán)境能夠準(zhǔn)確反映現(xiàn)實(shí)情況,從而提升模型的效能。
目前這一方法已經(jīng)廣泛應(yīng)用于游戲領(lǐng)域,AlphaGo就是一個(gè)典型例子。此外,強(qiáng)化學(xué)習(xí)還擁有在商業(yè)領(lǐng)域應(yīng)用的巨大潛力,比如,通過(guò)構(gòu)建一套人工智能驅(qū)動(dòng)型交易組合,從而在盈利與虧損之間學(xué)習(xí)發(fā)現(xiàn)正確的交易規(guī)律; 比如,打造產(chǎn)品推薦引擎,以積分方式為銷售活動(dòng)提供決策建議; 甚至以按時(shí)交付或減少燃油消耗作為報(bào)酬指標(biāo),開發(fā)運(yùn)輸路線選擇的軟件等等。
生成式對(duì)抗網(wǎng)絡(luò)。生成式對(duì)抗網(wǎng)絡(luò)是一種半監(jiān)督學(xué)習(xí)的方法,通過(guò)兩套相互對(duì)抗的神經(jīng)網(wǎng)絡(luò),不斷完善各自對(duì)同一概念的理解。以識(shí)別鳥類圖像為例,一套網(wǎng)絡(luò)負(fù)責(zé)正確分辨鳥類圖像,而另一套網(wǎng)絡(luò)則負(fù)責(zé)生成與鳥類非常相似的其它圖像對(duì)前者進(jìn)行迷惑。當(dāng)兩套網(wǎng)絡(luò)的表現(xiàn)最終趨于穩(wěn)定時(shí),其各自對(duì)鳥類圖像也擁有了更為準(zhǔn)確的認(rèn)知。
生成式對(duì)抗網(wǎng)絡(luò)能夠在一定程度上降低對(duì)數(shù)據(jù)集數(shù)量的要求。舉例來(lái)說(shuō),通過(guò)訓(xùn)練算法從醫(yī)學(xué)圖像當(dāng)中識(shí)別不同類型的腫瘤時(shí),以往科學(xué)家們往往需要從人類標(biāo)記的數(shù)百萬(wàn)張包含特定腫瘤類型或階段的圖像當(dāng)中提取信息并創(chuàng)建數(shù)據(jù)集。但經(jīng)過(guò)訓(xùn)練的生成式對(duì)抗網(wǎng)絡(luò)就可以通過(guò)繪制逼真的腫瘤圖像,從而訓(xùn)練腫瘤檢測(cè)算法,在此基礎(chǔ)上將小型人類標(biāo)記數(shù)據(jù)集與生成對(duì)抗網(wǎng)絡(luò)的輸出結(jié)果相結(jié)合,快速完成學(xué)習(xí)。
2- 需要海量的數(shù)據(jù)集
目前,機(jī)器學(xué)習(xí)技術(shù)要求訓(xùn)練數(shù)據(jù)集不僅包含人工注釋信息,同時(shí)在體量上也需要夠大、夠全面。而深度學(xué)習(xí)也要求模型能夠?qū)Τ汕先f(wàn)條的數(shù)據(jù)記錄進(jìn)行學(xué)習(xí),才能獲得相對(duì)理想的分類能力; 甚至在某些情況下,其需要學(xué)習(xí)的數(shù)據(jù)要達(dá)到數(shù)百萬(wàn)條才能實(shí)現(xiàn)與人類相近的判斷準(zhǔn)確率。舉例來(lái)說(shuō),如果希望讓自動(dòng)駕駛車輛學(xué)會(huì)如何在多種天氣條件下行駛,就需要在數(shù)據(jù)集當(dāng)中輸入可能遇到的各類不同環(huán)境條件。
然而,在現(xiàn)實(shí)應(yīng)用中大量數(shù)據(jù)集往往很難獲取。對(duì)此,一次性學(xué)習(xí)(One-shot learning)是一種能夠減少對(duì)大型數(shù)據(jù)集需求的技術(shù),只需要利用少量現(xiàn)實(shí)的演示或示例(在某些情況下甚至只需要單一示例)就可以完成學(xué)習(xí),快速掌握新技能。如此一來(lái),人工智能的決策行為將更接近于人類,即只需要單一的樣本就可以精確識(shí)別出同一類別的其它多種實(shí)例。
具體而言,數(shù)據(jù)科學(xué)家們首先會(huì)在變化的虛擬環(huán)境中預(yù)先訓(xùn)練出一套模型,使其能夠利用自身的知識(shí)順利找到正確的解決方案。一次性學(xué)習(xí)通常被認(rèn)為是計(jì)算機(jī)視覺中的對(duì)象分類問(wèn)題,旨在從一個(gè)或僅少數(shù)幾個(gè)訓(xùn)練圖像中學(xué)習(xí)關(guān)于對(duì)象類別的信息,并且已經(jīng)成功應(yīng)用到包括計(jì)算機(jī)視覺和藥物研發(fā)在內(nèi)的具有高維數(shù)據(jù)的領(lǐng)域。
3- “黑匣子”問(wèn)題
可解釋性對(duì)于人工智能系統(tǒng)絕不是什么新問(wèn)題。隨著深度學(xué)習(xí)的逐步普及,其應(yīng)用范圍將不斷擴(kuò)大。但這也意味著,更為多樣化以及更前沿的應(yīng)用往往存在著更嚴(yán)重的不透明問(wèn)題。
規(guī)模更大、復(fù)雜度更高的模型使得人們很難解釋計(jì)算機(jī)作出某項(xiàng)決策的原因。然而,隨著人工智能應(yīng)用范圍的擴(kuò)大,監(jiān)管機(jī)構(gòu)將對(duì)人工智能模型的可解釋性作出嚴(yán)格規(guī)定。
對(duì)此,目前有兩種新的方法用以提高模型的透明度,分別為與模型無(wú)關(guān)的解釋技術(shù)(Local Interpretable Model-Agnostic Explanations,簡(jiǎn)稱LIME)與關(guān)注技術(shù)(attention techniques)
LIME方法是在一套經(jīng)過(guò)訓(xùn)練的模型當(dāng)中,確定其作出某個(gè)決策過(guò)程中更多依賴的那部分輸入數(shù)據(jù),并利用可解釋代理模型對(duì)此進(jìn)行預(yù)測(cè)。這種方法通過(guò)對(duì)特定的數(shù)據(jù)區(qū)段進(jìn)行分析,并觀察預(yù)測(cè)結(jié)果的變化,從而對(duì)模型進(jìn)行微調(diào),最終形成更為精確的解釋。
關(guān)注技術(shù)(attention techniques)則是對(duì)模型認(rèn)為最重要的輸入數(shù)據(jù)進(jìn)行可視化處理,并分析這部分?jǐn)?shù)據(jù)與所作出決策之間的關(guān)系。
除此之外,還有另一種方法——廣義相加模型(簡(jiǎn)稱GAM)(簡(jiǎn)稱GAM)。線性模型簡(jiǎn)單、直觀、便于理解,但是,在現(xiàn)實(shí)生活中,變量的作用通常不是線性的,線性假設(shè)很可能不能滿足實(shí)際需求,甚至直接違背實(shí)際情況。廣義加性模型是一種自由靈活的統(tǒng)計(jì)模型,它可以用來(lái)探測(cè)到非線性回歸的影響。通過(guò)對(duì)單特征模型的利用,它能夠限制不同變量的相互作用,從而確保每項(xiàng)特征的輸出更容易被加以解釋。
通過(guò)這些方法,我們正在慢慢揭開人工智能決策的“神秘面紗”,這一點(diǎn)對(duì)于增強(qiáng)人工智能的采用范圍具有極為重要的現(xiàn)實(shí)意義。
4- 學(xué)習(xí)模型的“通用性”
與人類的學(xué)習(xí)方式不同,人工智能模型很難將其學(xué)習(xí)到的經(jīng)驗(yàn)舉一反三。因此,即使在相似度很高的案例中,企業(yè)也必須多次投入資源來(lái)訓(xùn)練新的模型,而這就意味著新的成本。
解決這個(gè)問(wèn)題其中的一種的有效方式是遷移學(xué)習(xí)。即把一個(gè)領(lǐng)域(即源領(lǐng)域)的知識(shí),遷移到另外一個(gè)領(lǐng)域(即目標(biāo)領(lǐng)域),使得目標(biāo)領(lǐng)域能夠取得更好的學(xué)習(xí)效果。在人工智能領(lǐng)域,就是通過(guò)訓(xùn)練人工智能模型完成某項(xiàng)任務(wù),并將其迅速遷移至另一項(xiàng)類似但有所不同的任務(wù)環(huán)境中來(lái)實(shí)現(xiàn)“舉一反三”。
隨著遷移學(xué)習(xí)的逐步成熟,其將能夠幫助企業(yè)更快構(gòu)建起新型的應(yīng)用程序,并為現(xiàn)有的應(yīng)用程序提供更多功能。
舉例來(lái)說(shuō),在創(chuàng)建虛擬助理時(shí),遷移學(xué)習(xí)能夠?qū)⒂脩粼谀骋活I(lǐng)域(例如音樂(lè))的偏好推廣到其它領(lǐng)域(例如書籍)。再比如,遷移學(xué)習(xí)還能幫助石油天然氣生產(chǎn)商,擴(kuò)大AI算法訓(xùn)練規(guī)模,從而對(duì)管道及鉆井平臺(tái)等設(shè)備進(jìn)行預(yù)測(cè)性維護(hù)。
另一種方法,是利用能夠在多個(gè)問(wèn)題當(dāng)中應(yīng)用的廣義性架構(gòu)。譬如DeepMind在AlphaZero當(dāng)中就設(shè)計(jì)了一套對(duì)應(yīng)三種不同游戲的架構(gòu)模型。
5- 數(shù)據(jù)與算法中的“偏見”
如果輸入的數(shù)據(jù)摻雜了人的偏好或者某些數(shù)據(jù)被忽略、某些數(shù)據(jù)被偏重,那么就有可能使得算法結(jié)果存在“偏見”。在具體的應(yīng)用中,有可能造成錯(cuò)誤的招聘決策、不當(dāng)?shù)目茖W(xué)或醫(yī)療預(yù)測(cè)、不合理的金融模式或刑事司法決策,甚至在法律層面引發(fā)濫用問(wèn)題。但是,在大多數(shù)情況下,這些“偏見”往往難以被察覺。
目前,業(yè)界正在進(jìn)行多項(xiàng)研究工作,從而建立最佳實(shí)踐以解決學(xué)術(shù)、非營(yíng)利與私營(yíng)部門所面臨的這一實(shí)際問(wèn)題。
企業(yè)應(yīng)該如何擊中“移動(dòng)中的標(biāo)靶”
要解決上面提到的這些局限性難題,我們還有很長(zhǎng)的路要走。然而,事實(shí)上,人工智能面臨的最大局限可能在于我們的想象力。麥肯錫為希望利用人工智能技術(shù)實(shí)現(xiàn)飛躍的企業(yè)領(lǐng)導(dǎo)者提出了一些建議:
做好功課,緊盯目標(biāo),并隨時(shí)跟進(jìn)。雖然大多數(shù)高管并不需要了解卷積神經(jīng)網(wǎng)絡(luò)與遞歸神經(jīng)網(wǎng)絡(luò)之間的區(qū)別,但也要對(duì)目前它們所能實(shí)現(xiàn)的功能有大致了解,在掌握其短期發(fā)展的可能性的同時(shí)著眼未來(lái)。
了解數(shù)據(jù)科學(xué)與機(jī)器學(xué)習(xí)專家提出的專業(yè)知識(shí),同時(shí)與AI先行者們進(jìn)行交流,補(bǔ)齊自己的短板。
采用精準(zhǔn)的數(shù)據(jù)策略。人工智能算法需要人為的幫助與引導(dǎo),為此,企業(yè)可以提前制定全面的數(shù)據(jù)策略。該策略不僅需要關(guān)注對(duì)來(lái)自不同系統(tǒng)的數(shù)據(jù)進(jìn)行匯總的技術(shù),同時(shí)還應(yīng)關(guān)注數(shù)據(jù)可用性,以及數(shù)據(jù)的獲取、標(biāo)記、治理等任務(wù)。
雖然如上文所說(shuō),一些方法可以減少AI算法訓(xùn)練所需要的數(shù)據(jù)量,但監(jiān)督式學(xué)習(xí)仍然是目前的主流。同時(shí),減少對(duì)數(shù)據(jù)的需求并不意味著不需要數(shù)據(jù)。因此,企業(yè)最關(guān)鍵的還是要了解并掌握自己的數(shù)據(jù),并考慮如何對(duì)其加以利用。
打通數(shù)據(jù),橫向思考。遷移學(xué)習(xí)技術(shù)目前仍處于起步階段。因此,如果您需要解決大型倉(cāng)儲(chǔ)體系的預(yù)測(cè)性維護(hù)問(wèn)題,您是否能夠利用相同的解決方案支持消費(fèi)產(chǎn)品?面對(duì)多種銷售渠道,適用于其中之一的解決方案是否也能夠作用于其它渠道?因此,要讓算法能夠“舉一反三”,還應(yīng)該鼓勵(lì)業(yè)務(wù)部門進(jìn)行數(shù)據(jù)共享,這對(duì)于未來(lái)人工智能的應(yīng)用將具有非常重要的意義。
主動(dòng)當(dāng)一個(gè)先行者。當(dāng)然,只是單純跟上當(dāng)前的人工智能技術(shù)還不足以保持企業(yè)長(zhǎng)期的競(jìng)爭(zhēng)優(yōu)勢(shì)。企業(yè)領(lǐng)導(dǎo)者需要鼓勵(lì)自己的數(shù)據(jù)科學(xué)工作人員或合作伙伴與外部專家合作,利用新興技術(shù)來(lái)解決應(yīng)用問(wèn)題。
此外,要隨時(shí)了解技術(shù)的可行性與可用性。目前各類機(jī)器學(xué)習(xí)工具、數(shù)據(jù)集以及標(biāo)準(zhǔn)應(yīng)用(包括語(yǔ)音、視覺與情緒檢測(cè))類訓(xùn)練模型正得到廣泛應(yīng)用。隨時(shí)關(guān)注相關(guān)項(xiàng)目,并對(duì)其加以利用,將有效提升企業(yè)的先發(fā)優(yōu)勢(shì)。
這兩年來(lái),雖然人工智能技術(shù)已經(jīng)令人們變得興奮不已,但實(shí)際上目前它的發(fā)展所需要的技術(shù)、工具與流程還沒(méi)有完全成形,研究人員正積極解決各類最為棘手的現(xiàn)實(shí)問(wèn)題,作為企業(yè),現(xiàn)在應(yīng)該做的就是抓緊時(shí)間了解AI前沿所發(fā)生的一切,并以此為基礎(chǔ)定位組織與學(xué)習(xí)思路,最終利用甚至推動(dòng)由此帶來(lái)的一切可能性。
文章編輯:CobiNet(寧波)
本公司專注于電訊配件,銅纜綜合布線系列領(lǐng)域產(chǎn)品研發(fā)生產(chǎn)超五類,六類,七類線,屏蔽模塊,配線架及相關(guān)模塊配件的研發(fā)和生產(chǎn)。
?2016-2019寧波科博通信技術(shù)有限公司版權(quán)所有浙ICP備16026074號(hào)