本文摘要:人工智能的演化形成了符號主義與聯(lián)結(jié)主義人工智能兩條代表性進(jìn)路。符號主義人工智能的優(yōu)點在于推理過程透明、可解釋,但存在不完備、框架問題和知識接收瓶頸等問題。聯(lián)結(jié)主義人工智能的泛化能力和可移植能力強(qiáng),但缺陷是算法不可解釋性、過擬合等問題。符號主義與聯(lián)結(jié)
人工智能的演化形成了符號主義與聯(lián)結(jié)主義人工智能兩條代表性進(jìn)路。符號主義人工智能的優(yōu)點在于推理過程透明、可解釋,但存在不完備、框架問題和知識接收瓶頸等問題。聯(lián)結(jié)主義人工智能的泛化能力和可移植能力強(qiáng),但缺陷是算法不可解釋性、過擬合等問題。符號主義與聯(lián)結(jié)主義人工智能有著顯著的融合可能性,在新一代人工智能背景下,兩條進(jìn)路的融合又產(chǎn)生了新的路徑,在基于神經(jīng)網(wǎng)絡(luò)的邏輯推理、符號表示的機(jī)器學(xué)習(xí)、認(rèn)知圖譜及其推理、機(jī)器學(xué)習(xí)與論辯挖掘等交叉領(lǐng)域表現(xiàn)出強(qiáng)勁的融合潛力。
關(guān)鍵詞符號主義;聯(lián)結(jié)主義;人工智能;融合路徑
人工智能在過去六十多年當(dāng)中形成了兩條脈絡(luò)清晰的進(jìn)路———符號主義(symbolism)和聯(lián)結(jié)主義(connectionism),兩條進(jìn)路貫穿于整個人工智能的發(fā)展史,各自都形成了鮮明的特色,表現(xiàn)出不同的理論和應(yīng)用競爭力。符號主義人工智能是第一代人工智能,它主張人類思維的基本單元是符號,人類認(rèn)知的過程是符號運(yùn)算,表現(xiàn)為知識表示和推理,主要通過邏輯進(jìn)路來研究。
聯(lián)結(jié)主義人工智能是第二代人工智能,它源于仿生學(xué),研究上模擬人腦的神經(jīng)系統(tǒng),主要聚焦神經(jīng)網(wǎng)絡(luò)及其連接機(jī)制,由此來探索大數(shù)據(jù)驅(qū)動下的學(xué)習(xí)方法。符號主義人工智能擅長研究人類的邏輯思維活動,學(xué)習(xí)過程是從經(jīng)驗或規(guī)則出發(fā),根據(jù)前提推出結(jié)論的過程,采用從一般到特殊的演繹式推理,是一種“自上而下”的模式。符號主義人工智能的基礎(chǔ)是公理化理論和數(shù)理邏輯,特點在于邏輯推理過程是可解釋和錯誤可追溯的。
與之不同,聯(lián)結(jié)主義人工智能采用的是由特殊到一般的歸納式推理,依賴的是假設(shè)檢驗、相關(guān)性分析、線性預(yù)測、時間序列分析等數(shù)學(xué)方法,學(xué)習(xí)過程是從大數(shù)據(jù)中發(fā)現(xiàn)隱 藏的特征和規(guī)律,擬合反映特征的正面數(shù)據(jù),排除特征異常的反面數(shù)據(jù),這種學(xué)習(xí)方式是一種“自下而上”的模式。一直以來,科學(xué)家都在探索兩種路徑融合的技術(shù)和方法,第三代人工智能的發(fā)展思路是把第一代和第二代人工智能結(jié)合起來,同時利用知識、數(shù)據(jù)、算法和算力要素,構(gòu)造安全、可信賴、可靠和可擴(kuò)展的AI技術(shù)。
〔1〕1285、符號主義與聯(lián)結(jié)主義人工智能之比較符號主義和聯(lián)結(jié)主義之間的路線競爭推動了人工智能的快速發(fā)展,形成了“符號派”和“聯(lián)結(jié)派”兩個陣營,兩個學(xué)派之間經(jīng)常發(fā)生碰撞,甚至一度發(fā)生過激烈的“對抗”。在當(dāng)前新一代人工智能背景下,以深度學(xué)習(xí)為代表的聯(lián)結(jié)派占據(jù)了絕對優(yōu)勢,但聯(lián)結(jié)主義人工智能也存在明顯的缺陷;跈C(jī)器學(xué)習(xí)的方法存在不同程度的不可解釋性問題,因而難以闡明推理的因果關(guān)聯(lián),從而導(dǎo)致解釋能力弱,并且魯棒性較差。
聯(lián)結(jié)主義的方法同樣還缺乏堅實的理論基礎(chǔ),即使在仿生學(xué)和腦科學(xué)理論有所突破,但仍然難以透徹解釋決策的過程。人類的思維過程是綜合演繹思維和歸納思維的過程,人工智能模擬人腦的思維必須綜合兩種思維模式,通過分析兩種路徑的優(yōu)缺點,做到優(yōu)勢互補(bǔ)、協(xié)同融合。
1.符號主義人工智能的優(yōu)缺點
符號主義人工智能的早期探索主要是邏輯推理的研究,即如何使用邏輯符號系統(tǒng)來表達(dá)邏輯思維的過程,因而又被稱為“邏輯主義”。在符號主義看來,計算機(jī)是一個可解釋的自動化形式系統(tǒng),或者說是一個符號操縱的機(jī)器。這種定義包含兩層含義:一是形式系統(tǒng)的參與主體是自動化的,它們是根據(jù)規(guī)則來自動化執(zhí)行的;二是符號是可以被解釋的,這使得其行為是有效且合理的。
〔2〕106符號主義的特點在于推理的過程是可解釋的,如果推理過程出現(xiàn)錯誤,那么是可以追溯和定位的。符號主義還研究知識的表示、推理和應(yīng)用,因為符號化方法對于知識的顯示性和表達(dá)能力強(qiáng),能夠應(yīng)對較復(fù)雜的知識推理,被廣泛地運(yùn)用于自動定理證明和專家系統(tǒng)的構(gòu)建。然而,符號主義人工智能也面臨困境,首先,符號系統(tǒng)是不完備的,希爾伯特綱領(lǐng)(Hilbertprogramme)提出構(gòu)造一個滿足完備性、協(xié)調(diào)性和可判定性的數(shù)學(xué)系統(tǒng),哥德爾不完全性定理(Godel’sincompletetheorems)證明了對于任何一個公理化系統(tǒng),都存在此公理體系所無法判定真?zhèn)蔚拿}。這表明符號系統(tǒng)構(gòu)建的邏輯形式系統(tǒng)不可能是無所不包的,它無法保證在完備的形式系統(tǒng)中推出所有為真的結(jié)論,即不可能同時滿足“完備性”和“無矛盾性”兩個特征。
因而,不存在一個無所不能的符號化人工智能系統(tǒng),這也顯示了符號化方法的局限性。符號主義人工智能的第二個局限是知識獲取瓶頸。知識引導(dǎo)的人工智能之所以能展示知識推理等智能化行為,是因為它運(yùn)用了常識或?qū)<抑R。人工智能根據(jù)專家知識來執(zhí)行專家的任務(wù),其推理引擎高度依賴專家知識獲取,但這些知識庫是封閉的,并且需要由領(lǐng)域?qū)<襾順?gòu)建專家知識,因而,符號主義人工智能無法自主獲取知識,這也是專家系統(tǒng)難以維持的主要原因。除了專家知識,人工智能同樣難以理解常識,甚至包含一些兒童都能辨別的常識,這是由于人類學(xué)習(xí)常識往往是通過生活實踐來學(xué)習(xí)的,而機(jī)器難以從實踐中去學(xué)習(xí)知識。
符號主義人工智能的第三個問題是框架問題(frameproblem),該問題最初是由麥卡錫(J.McCarthy)和哈耶斯(P.J.Hayes)提出的〔3〕463,當(dāng)人工智能試圖模擬人類適應(yīng)環(huán)境中相關(guān)變化的能力時,就會出現(xiàn)框架問題。通常來說,人類很容易掌握周圍發(fā)生的事情,這從他們快速預(yù)測、反應(yīng)或調(diào)整特定事件的重要后果的能力中可以明顯看出!4〕161然而,人工智能卻難以用符號來刻畫人類周圍環(huán)境中的知識。換言之,經(jīng)典人工智能直接可用的顯性符號表征由于難以實時、自動地更新,也無法捕捉大量的隱性知識,從而無力表征現(xiàn)實世界,面臨框架問題的困擾!5〕3例如,符號主義人工智能就很難用符號去表征圖片、語音或視頻等感知數(shù)據(jù),而這恰是聯(lián)結(jié)主義人工智能所擅長的。
2.聯(lián)結(jié)主義人工智能的優(yōu)缺點
由數(shù)據(jù)驅(qū)動的聯(lián)結(jié)主義人工智能以機(jī)器學(xué)習(xí)為主要驅(qū)動技術(shù),以深度學(xué)習(xí)為代表的算法和模型通過組織和擬合參數(shù),學(xué)習(xí)特征表示,有著良好的泛化能力和可移植性。然而,機(jī)器學(xué)習(xí)運(yùn)用于大數(shù)據(jù)分析還存在著若干缺陷:第一,機(jī)器學(xué)習(xí)對大數(shù)據(jù)的容量和質(zhì)量有較高的要求,數(shù)據(jù)的質(zhì)量直接決定了模型訓(xùn)練的效果,“垃圾數(shù)據(jù)”輸入必然會造成“垃圾結(jié)果”輸出。
第二,數(shù)據(jù)來源不明確、不完整、可靠性不高、缺乏針對性和準(zhǔn)確性,甚至出現(xiàn)數(shù)據(jù)之間的沖突和矛盾,這些都導(dǎo)致數(shù)據(jù)的可實用性不高。第三,數(shù)據(jù)通常要求是滿足獨立同分布,這在諸多實踐應(yīng)用中難以得到滿足。第四,在監(jiān)督學(xué)習(xí)當(dāng)中,數(shù)據(jù)還需要被精確標(biāo)注,機(jī)器學(xué)習(xí)模型表現(xiàn)力很大程度上取決于數(shù)據(jù)標(biāo)記質(zhì)量的好壞。聯(lián)結(jié)主義人工智能還面臨難以克服的技術(shù)困難。一方面,聯(lián)結(jié)主義人工智能構(gòu)建“特征工程”困難,如果設(shè)置的特征與數(shù)據(jù)樣本真實的特征出入過大,那么機(jī)器所習(xí)得的特征與人所設(shè)置的特征將相差甚遠(yuǎn)。另一方面,聯(lián)結(jié)主義人工智能所采用的深度學(xué)習(xí)容易造成過擬合(overfitting)的問題。
直觀上,過擬合指的是模型學(xué)習(xí)能力過于強(qiáng)大,將訓(xùn)練數(shù)據(jù)集的特點看作是所有數(shù)據(jù)集的屬性,從而導(dǎo)致模型的泛化能力下降。隨著模型訓(xùn)練復(fù)雜度不斷增強(qiáng),模型在驗證數(shù)據(jù)集上的誤差會隨之增大,導(dǎo)致模型不能很好地擬合訓(xùn)練集之外的其他數(shù)據(jù),由此便發(fā)生了過擬合問題,導(dǎo)致降低了預(yù)測的準(zhǔn)確性。聯(lián)結(jié)主義人工智能的算法還面臨不可解釋性問題,尤其是基于多隱層神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)算法會造成“黑箱算法”,算法的不透明成為深度學(xué)習(xí)飽受詬病的問題。原因在于深度學(xué)習(xí)高度依賴數(shù)學(xué)和統(tǒng)計學(xué),機(jī)器學(xué)習(xí)本質(zhì)上不能解決語義理解的問題。最典型的表現(xiàn)是人工智能本身不能夠理解因果關(guān)聯(lián),因為所學(xué)習(xí)到的統(tǒng)計頻率上的相關(guān)性不能夠代表因果關(guān)聯(lián),而表達(dá)因果關(guān)聯(lián)恰是符號主義人工智能所擅長的。
因而,深度學(xué)習(xí)雖然有強(qiáng)勁的結(jié)果表現(xiàn)能力,但存在的問題仍不足以獨立應(yīng)對所有的學(xué)習(xí)和決策。此外,從目前深度學(xué)習(xí)應(yīng)用的落地場景來看,大量還是采用監(jiān)督學(xué)習(xí)的方式,仍然在數(shù)據(jù)標(biāo)記等工作上還高度依賴于人的參與,因而,深度學(xué)習(xí)看似是“機(jī)器的學(xué)習(xí)”,但在實踐中并非完全依靠機(jī)器,大量的應(yīng)用仍然停留在“有多少人工就有多少智能”的狀態(tài)。從模擬人類思維的過程來看,符號主義與聯(lián)結(jié)主義人工智能的融合具備現(xiàn)實可行性。在推理方向上,符號主義人工智能采用的是“演繹式”的推理模式,它是由前提根據(jù)推論規(guī)則得到結(jié)論的模式。
反之,聯(lián)結(jié)主義人工智能采用的是“歸納式”的推理模式,它是從已經(jīng)具有某種特征或規(guī)律的數(shù)據(jù)當(dāng)中歸納或類比推出相似的新數(shù)據(jù)也具有某種特征的推理模式。人類的思維往往是綜合了演繹思維和歸納思維,推理過程也往往混合兩種思維,不存在絕對的分野。比較而言,聯(lián)結(jié)主義人工智能受到極大的認(rèn)可和關(guān)注,但因此就推崇聯(lián)結(jié)主義而否定符號主義顯得過于片面,美國俄亥俄大學(xué)的詹德拉(G.Chandrasekaran)就指出:“最近幾年,人工智能在很大程度上集中于統(tǒng)計學(xué)和大數(shù)據(jù)。我同意由于計算能力的大幅度提高,這些技術(shù)曾經(jīng)取得過某些令人印象深刻的成果。但是我們完全有理由相信,雖然這些技術(shù)還會繼續(xù)改進(jìn)、提高,總有一天這個領(lǐng)域會對它們說再見,并轉(zhuǎn)向更加基本的認(rèn)知科學(xué)研究。盡管擺鐘擺回去還需要一段時間,我相信定有必要把統(tǒng)計技術(shù)和對認(rèn)知結(jié)構(gòu)的深刻理解結(jié)合起來。”〔6〕
i-ii融合的路徑已經(jīng)成為人工智能領(lǐng)域的共識,也逐漸成為人工智能的研究熱點。符號主義進(jìn)路和聯(lián)結(jié)主義進(jìn)路的人工智能沒有絕對的優(yōu)劣,只是兩者適用的科學(xué)和社會領(lǐng)域不同,它們對應(yīng)的是人類理性思維活動的不同向度,擅長解決不同類型的問題。有些領(lǐng)域適用符號主義進(jìn)路的人工智能,它更加側(cè)重算法的透明性和可解釋性,對算法黑箱和不可解釋性的容忍度較低。
有些領(lǐng)域則適用聯(lián)結(jié)主義的人工智能,這類領(lǐng)域往往要求能夠滿足較強(qiáng)的算法表現(xiàn)力,能夠為決策的結(jié)果提供直接和有效的建議,但卻對算法的可解釋性沒有強(qiáng)制或過高的要求,這意味著這些領(lǐng)域?qū)︼L(fēng)險和錯誤的容忍程度較高,允許算法存在一定的風(fēng)險。符號主義進(jìn)路和聯(lián)結(jié)主義進(jìn)路的人工智能都存在局限性,不可能存在一種在任何問題和領(lǐng)域當(dāng)中都統(tǒng)一適用的人工智能方法,盡管“深度學(xué)習(xí)+大數(shù)據(jù)”已經(jīng)在較大范圍的科學(xué)和社會活動中發(fā)揮了重要作用,但是在其他很多問題當(dāng)中仍然作用有限。
人工智能技術(shù)的優(yōu)劣是相對于具體的問題和領(lǐng)域而言的,就某個問題適用何種人工智能,有的人工智能在可解釋性和表現(xiàn)力方面能夠達(dá)到符合既定目標(biāo)和要求的某種平衡,那么它就是相對更優(yōu)的方法,人工智能科學(xué)家一直在這樣的研究方向上發(fā)展更優(yōu)的人工智能算法。兩種路徑融合的優(yōu)勢在于兩者能夠優(yōu)勢互補(bǔ),符號主義的可解釋性可以彌補(bǔ)聯(lián)結(jié)主義的算法可解釋性和推理能力弱等問題,聯(lián)結(jié)主義可以避免符號主義的知識接收瓶頸困境等。融合的觀點越來越受到人工智能科學(xué)家的認(rèn)同,融合神經(jīng)網(wǎng)絡(luò)和符號過程的混合系統(tǒng)(hybridsystem)、“神經(jīng)-符號機(jī)”等理論相繼被提出,常見的一階邏輯、多值邏輯、模態(tài)邏輯都被嘗試嵌入到神經(jīng)網(wǎng)絡(luò)當(dāng)中。
隨著新一代人工智能的發(fā)展,符號主義與聯(lián)結(jié)主義人工智能又各自取得了新進(jìn)展,使得兩種路徑的融合又出現(xiàn)了新的生命力。符號主義與聯(lián)結(jié)主義人工智能的融合產(chǎn)生了兩種融合的思路,第一種是非對稱的單向融合模型,這又包含兩種方法,其一是將符號主義方法融入到聯(lián)結(jié)主義人工智能,利用邏輯符號來表達(dá)神經(jīng)網(wǎng)絡(luò)等研究;其二是將聯(lián)結(jié)主義方法融入到符號主義人工智能,利用機(jī)器學(xué)習(xí)的特點加深因果關(guān)系及其推理等研究。
第二種是雙向模型,即結(jié)合雙方的特征產(chǎn)生新的應(yīng)用場景,如認(rèn)知圖譜及其推理的研究。神經(jīng)網(wǎng)絡(luò)能夠與邏輯結(jié)合的原因在于,它能夠構(gòu)建神經(jīng)網(wǎng)絡(luò)中不同隱層之間的關(guān)聯(lián)結(jié)構(gòu)與邏輯推理的規(guī)則結(jié)構(gòu)之間的映射。換言之,神經(jīng)網(wǎng)絡(luò)中原本難以解釋神經(jīng)網(wǎng)絡(luò)之間的關(guān)聯(lián)性,可以用可解釋的邏輯規(guī)則來加以說明。張鈸院士還提出了第三代AI的三空間融合模型,即融合雙空間和單空間兩種模型,其中,單空間模型是以深度學(xué)習(xí)為基礎(chǔ),將所有的處理都放在亞符號(向量)空間,雙空間模型模仿了大腦的工作機(jī)制,但對其工作機(jī)制知之甚少!1〕1290
1.基于神經(jīng)網(wǎng)絡(luò)的邏輯推理
在符號主義與聯(lián)結(jié)主義融合的早期,科學(xué)家嘗試借助神經(jīng)網(wǎng)絡(luò)的優(yōu)點來提升邏輯推理能力。明斯基(M.Minsky)總結(jié)到:符號知識和聯(lián)結(jié)主義各有優(yōu)缺點,我們需要一個系統(tǒng)能夠?qū)⑺鼈兊膬?yōu)點集成起來!7〕34自1980年以來,人工智能科學(xué)家就通過各種方法將神經(jīng)網(wǎng)絡(luò)和符號學(xué)相結(jié)合,形成了神經(jīng)符號主義(neural-symbolism)。平卡斯(G.Pinkas)就提出了一個能夠表示和學(xué)習(xí)命題知識的聯(lián)結(jié)主義框架,開發(fā)了命題演算的擴(kuò)展版本,并且證明了可用于非單調(diào)推理、處理相互沖突的信念和知識。新框架能夠?qū)崿F(xiàn)快速學(xué)習(xí),擴(kuò)展邏輯可用作聯(lián)結(jié)主義網(wǎng)絡(luò)的高級規(guī)范語言,能夠映射主要的符號系統(tǒng)!8〕20320世紀(jì)90年代初期,托維爾(G.Towell)和沙弗里克(J.Shavlik)給出了一種基于知識的人工神經(jīng)網(wǎng)絡(luò)(KBANN),這種模型研究如何從神經(jīng)網(wǎng)絡(luò)中插入和提取規(guī)則,為使用反向傳播訓(xùn)練的基于知識的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法提供了一種學(xué)習(xí)背景知識的有效方法。
〔9〕119人工神經(jīng)網(wǎng)絡(luò)后來還啟發(fā)了聯(lián)結(jié)主 義歸納學(xué)習(xí)和邏輯程序(CILP),這種模型使用邏輯程序作為知識表示語言,在神經(jīng)網(wǎng)絡(luò)中進(jìn)行知識精煉,從受過訓(xùn)練的網(wǎng)絡(luò)中提取知識,并從例子中歸納得到新的知識。加爾塞斯(A.Garcez)等提出了一種在已訓(xùn)練后的神經(jīng)網(wǎng)絡(luò)中抽取邏輯知識的方法,幫助增強(qiáng)神經(jīng)網(wǎng)絡(luò)的可解釋性!10〕155理查德森(M.Richardson)等以一階符號邏輯和概率圖模型結(jié)合的方式進(jìn)行了探索,提出了馬爾科夫邏輯網(wǎng)絡(luò)〔11〕107,該網(wǎng)絡(luò)是一階符號邏輯的知識庫,其中每一個公式都有對應(yīng)的權(quán)重。受限于當(dāng)時機(jī)器學(xué)習(xí)技術(shù)和自然語言處理技術(shù)的制約,這些探索并不能充分利用神經(jīng)網(wǎng)絡(luò)的優(yōu)勢,因而沒有取得更進(jìn)一步的成功。未來的研究將推動以深度學(xué)習(xí)為代表的神經(jīng)網(wǎng)絡(luò)在模態(tài)邏輯、直覺主義邏輯等更多邏輯分支中發(fā)揮作用。
2.基于符號表示的機(jī)器學(xué)習(xí)
聯(lián)結(jié)主義人工智能所采用的深度學(xué)習(xí)算法不可解釋的原因在于,神經(jīng)網(wǎng)絡(luò)包含了多層難以被表達(dá)的隱藏層,導(dǎo)致無法解釋輸出是如何由輸入所得到的。解決這個問題的一種思路是利用邏輯符號來建立神經(jīng)網(wǎng)絡(luò)中隱藏層之間的映射關(guān)系。
早在1990年,深度學(xué)習(xí)技術(shù)的代表人物辛頓(G.E.Hinton)就提出了將一種“部分-整體”層次結(jié)構(gòu)映射到聯(lián)結(jié)主義網(wǎng)絡(luò)的方法,用符號來表達(dá)整體結(jié)構(gòu)中的最小單元,并使用符號來解釋數(shù)據(jù)結(jié)構(gòu)的類型,實現(xiàn)局部和整體的一致性表示!12〕47BoltzCONS是一種表達(dá)動態(tài)符號結(jié)構(gòu)的聯(lián)結(jié)主義模型,能夠動態(tài)創(chuàng)建和操作復(fù)合符號結(jié)構(gòu)。這些結(jié)構(gòu)是使用鏈表的功能模擬來實現(xiàn)的,但BoltzCONS使用分布式表示和關(guān)聯(lián)檢索來代替?zhèn)鹘y(tǒng)的內(nèi)存組織!13〕
5符號邏輯的作用是幫助神經(jīng)網(wǎng)絡(luò)訓(xùn)練、學(xué)習(xí)和推理,通過將符號規(guī)則轉(zhuǎn)化為神經(jīng)網(wǎng)絡(luò)可以理解的向量。有學(xué)者提出了一種知識蒸餾的師生(teacher-student)網(wǎng)絡(luò),使神經(jīng)網(wǎng)絡(luò)擬合符號規(guī)則的結(jié)果,在規(guī)則的指導(dǎo)下訓(xùn)練學(xué)習(xí)。有研究將深度神經(jīng)網(wǎng)絡(luò)與結(jié)構(gòu)化邏輯規(guī)則相結(jié)合,比較直接的方法是將一階邏輯規(guī)則用于增強(qiáng)各種類型的神經(jīng)網(wǎng)絡(luò)(CNN和RNN等),思路是將邏輯規(guī)則的結(jié)構(gòu)化信息轉(zhuǎn)換為神經(jīng)網(wǎng)絡(luò)的權(quán)重!14〕
2410聯(lián)結(jié)主義和符號主義結(jié)合的困難在于,深度神經(jīng)網(wǎng)絡(luò)中隱結(jié)點上發(fā)生的事情是不可言傳的,因為隱結(jié)點可能并不表達(dá)我們使用的任何概念或概念組合,可能只有把認(rèn)知過程分解成遠(yuǎn)比我們的概念體系細(xì)得多的碎片,再按另一種方式重新組合才能得到一點語義的蛛絲馬跡。〔15〕49第三代人工智能的研究動向之一是可解釋的人工智能,其中一個方向是通過因果關(guān)系來解釋推理的過程。
在最新的研究中,“圖靈獎”得主本吉奧(Y.Bengio)研究了因果表示的機(jī)器學(xué)習(xí),他將因果推理與機(jī)器學(xué)習(xí)遷移與泛化聯(lián)系起來,進(jìn)而分析因果推理可能對機(jī)器學(xué)習(xí)的價值,魯棒性和泛化性,以及現(xiàn)有的共性比如半監(jiān)督學(xué)習(xí)、自我監(jiān)督學(xué)習(xí)、數(shù)據(jù)增強(qiáng)和預(yù)訓(xùn)練!16〕612周志華結(jié)合機(jī)器學(xué)習(xí)和邏輯編程實現(xiàn)了溯因?qū)W習(xí),提出了一種新的方法來聯(lián)合優(yōu)化機(jī)器學(xué)習(xí)模型和邏輯推理模型,其中邏輯推理利用符號域知識和糾正錯誤感知的事實來改進(jìn)機(jī)器學(xué)習(xí)模型,通過溯因?qū)W習(xí)使機(jī)器同時學(xué)習(xí)識別手寫數(shù)字和求解數(shù)學(xué)運(yùn)算!17〕220-222機(jī)器學(xué)習(xí)借助符號主義路徑的思路是利用邏輯推理的簡潔性和可解釋性來彌補(bǔ)機(jī)器學(xué)習(xí)的不可解釋性,但如何充分地使邏輯與機(jī)器學(xué)習(xí)算法相融合,還需要深度挖掘邏輯的推理機(jī)制與機(jī)器學(xué)習(xí)的預(yù)測功能相耦合的新路徑。
3.認(rèn)知圖譜與推理研究
知識工程在語義網(wǎng)絡(luò)之后進(jìn)入了知識圖譜的時代,谷歌于2012年正式提出了知識圖譜這一新概念,其最初的目的是為了提高搜索引擎檢索的效率,通過知識圖譜可以將相關(guān)聯(lián)的信息共同提供給使用者。谷歌的知識圖譜不僅基于Freebase、維基百科等知識圖譜,而且還致力于全面和深入的知識圖譜建構(gòu)。該知識圖譜包含超過5億個對象,超過35億個這個對象之間的關(guān)系。
①除了構(gòu)建和應(yīng)用知識圖譜的技術(shù)之外,知識圖譜研究還包含融合認(rèn)知計算、自然語言處理、語義網(wǎng)絡(luò)技術(shù)和機(jī)器學(xué)習(xí)等人工智能技術(shù)。近些年,隨著知識圖譜推理和圖神經(jīng)網(wǎng)絡(luò)技術(shù)的應(yīng)用,知識圖譜研究開始走向認(rèn)知圖譜。認(rèn)知圖譜是以實現(xiàn)知識引導(dǎo)和數(shù)據(jù)驅(qū)動相結(jié)合的知識表示和推理的認(rèn)知引擎為目標(biāo),研究支持魯棒可解釋人工智能的大規(guī)模知識的表示、獲取、推理與計算的基礎(chǔ)理論和方法!18〕9現(xiàn)有的認(rèn)知圖譜的研究方法主要是基于知識圖譜結(jié)合邏輯推理的方法來實現(xiàn)認(rèn)知層面上的圖譜推理。在知識圖譜推理方面,主要是基于邏輯推理的方法,常見的方法包括基于一階邏輯、模態(tài)邏輯、描述邏輯、分布式表示推理、神經(jīng)網(wǎng)絡(luò)推理等方法。另一方面,在知識圖譜的邏輯表達(dá)方面,主要的研究方法是基于自然語言生成(NLG),常見的模型包括Tranformer模型和Bert模型等。然而,神經(jīng)網(wǎng)絡(luò)模型難以解釋的問題仍然存在,還需要從認(rèn)知層面來尋找解釋神經(jīng)網(wǎng)絡(luò)推理過程的新方案。
認(rèn)知圖譜研究不能只停留在“知識圖譜+邏輯推理”的層面,而應(yīng)當(dāng)深入發(fā)掘知識圖譜和認(rèn)知科學(xué)的結(jié)合。這需要交叉可解釋性理論、反事實因果推理、持續(xù)學(xué)習(xí)等方法,建立高效且穩(wěn)定的知識獲取、表達(dá)和推理機(jī)制,讓知識能夠被機(jī)器理解和運(yùn)用,進(jìn)而進(jìn)行可解釋的推理。最新的研究動態(tài)指向多種路徑:一是知識圖譜與圖神經(jīng)網(wǎng)絡(luò)的結(jié)合,利用循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)和注意力機(jī)制(attention)等來構(gòu)建知識圖譜。二是大規(guī)模知識圖譜和知識計算研究,這需要從海量、多源、異構(gòu)、碎片化的大數(shù)據(jù)當(dāng)中大規(guī)模自動化地獲取知識,并進(jìn)行動態(tài)融合。三是從人機(jī)知識交互的角度,研究人機(jī)交互的知識表征體系,實現(xiàn)高效的智能交互。四是從高階認(rèn)知的視角來研究,這需要從形式認(rèn)識論、認(rèn)知心理學(xué)、腦機(jī)融合等學(xué)科進(jìn)行交叉性探索。
4.基于機(jī)器學(xué)習(xí)的論辯研究
符號主義人工智能的最新研究進(jìn)展是可計算論辯模型與機(jī)器學(xué)習(xí)的結(jié)合,實現(xiàn)了自動化辯論。2018年IBM的人工智能辯論機(jī)器人(ProjectDebater)在與人類專業(yè)辯手對局的國際辯論比賽中表現(xiàn)出色。2020年《自然》雜志發(fā)表了人工智能論辯機(jī)器的工作原理,辯論機(jī)器人結(jié)合了計算辯論理論和論辯的數(shù)據(jù)挖掘等多種技術(shù),使得機(jī)器人具備了從海量文本數(shù)據(jù)中獲取知識來構(gòu)建論證以支持論點,反駁對方論點等多種論辯能力。辯論機(jī)器人由四個主要模塊組成:
(1)論證挖掘,機(jī)器通過處理LexisNexis語料庫中的大約4億篇報紙文章來檢索與論點相關(guān)的主張和證據(jù)。(2)論證知識庫(AKB),機(jī)器獲取不同辯論之間的共性,通過特征的分離器來判定哪些與論點相關(guān),從而獲取與論點相關(guān)的知識。(3)論證反駁,機(jī)器通過論證挖掘來編譯可能被對手提及的線索,AKB同樣也可以挖掘反駁的論點。(4)論證構(gòu)建,機(jī)器通過聚類分析構(gòu)建一個基于規(guī)則的論辯系統(tǒng),該系統(tǒng)根據(jù)與論證的語義相似性來聚類論證,獲取一組能夠反映聚類主體的高質(zhì)量論證集,以供系統(tǒng)選擇論辯的素材!19〕380-381基于機(jī)器學(xué)習(xí)的方法,人工智能已經(jīng)實現(xiàn)了論辯挖掘和論辯文本的自動化生成。論辯挖掘是在海量文本大數(shù)據(jù)當(dāng)中根據(jù)機(jī)器學(xué)習(xí)算法來預(yù)測文本中所包含的不同類型的論證。
首先,論辯挖掘需要構(gòu)建特征工程,這要先定義完全的論證類型,明確論證的組成要素。其次,論辯要根據(jù)這些要素組成不同論證類型的方式,采用有監(jiān)督學(xué)習(xí)的方式來進(jìn)行人工標(biāo)注,構(gòu)建相對應(yīng)的特征工程。
第三,再根據(jù)特征工程,采用深度學(xué)習(xí)、樸素貝葉斯分類器、統(tǒng)計學(xué)習(xí)等算法來訓(xùn)練模型,通過不斷調(diào)整模型參數(shù),使模型獲得良好的泛化能力。第四,采用模型檢驗論辯挖掘的準(zhǔn)確率,對目標(biāo)文本進(jìn)行預(yù)測,準(zhǔn)確挖掘文本中所包含的論證,而后再采用論辯語義的高效求解方法來進(jìn)行評估。盡管論辯研究為兩種路徑的融合提供了巨大的推動力,它不僅提供了從海量文本大數(shù)據(jù)中挖掘和生成論辯文本的技術(shù),還推動了論辯本體論的研究和語料庫的開發(fā)。
然而,基于機(jī)器學(xué)習(xí)的論辯研究還有待進(jìn)一步完善,其一,最突出的問題在于人工智能挖掘和生成論辯并不能像人類一樣理解上下文的含義,也就無法理解論證文本的語義,生成的文本也無法保證論點在語義上是有意義的,甚至論證當(dāng)中的簡單因果關(guān)系都難以識別。其二,論辯研究目前只限于辯論賽式的說服型對話,沒有涵蓋日常生活中其他類型的辯論,比如信息尋求、科學(xué)探索、談判等對話類型。其三,論辯研究難以獲得人類在辯論中的修辭技巧,這往往和語用情境相關(guān),人類理解觀點是需要在具體的論辯情境中去理解其含義,脫離情境極可能導(dǎo)致含混。符號主義人工智能的新趨勢之一是研究非形式邏輯和新修辭學(xué)的形式化〔20〕,融合路徑下的論辯研究蘊(yùn)含著無窮的潛力。
人工智能是在不斷向人類學(xué)習(xí)的過程中發(fā)展起來的,符號主義人工智能的思維對應(yīng)于人類的演繹式思維,而聯(lián)結(jié)主義人工智能的思維則對應(yīng)于人類的歸納式思維。演繹式思維注重從人類的經(jīng)驗當(dāng)中提煉和獲取知識,歸納式思維則傾向于從個案當(dāng)中總結(jié)和歸納知識,人類的思維活動往往是融合兩種思維模式。
本吉奧就指出人工智能研究應(yīng)當(dāng)從直覺的、快速的、無意識的、非語言的系統(tǒng)(system1),轉(zhuǎn)向有意識的、邏輯性的、有規(guī)劃的、推理性以及可以用語言表達(dá)的認(rèn)知系統(tǒng)(system2)。①符號主義和聯(lián)結(jié)主義路徑的融合不能只停留在以一方的技術(shù)優(yōu)勢來彌補(bǔ)另一方的缺陷,而是應(yīng)當(dāng)真正理解對方的技術(shù)邏輯,找到最契合的融合點,探索新的理論和技術(shù)增長點,創(chuàng)造具備協(xié)作(collaborative)能力、自適應(yīng)(adaptive)能力、負(fù)責(zé)任和可解釋的人工智能。
參考文獻(xiàn):
〔1〕張鈸,朱軍,蘇航.邁向第三代人工智能[J].中國科學(xué):信息科學(xué),2020,50(9):1281-1302.
〔2〕HaugelandJ.AI:TheVeryIdea[M].MITPress,1985.
〔3〕McCarthyJ,HayesPJ.SomePhilosophicalProblemsfromtheStandpointofArtificialIntelligence[C]//MeltzerB,MichieD.(eds.)MachineIntelligence.Edinburgh:EdinburghUniversityPress,1969:463-502.
〔4〕HaselagerW,RappardJ.Connectionism,SystematicityandtheFrameProblem[J].MindsandMachines,1998,8(2):161-179.
〔5〕夏永紅,李建會.人工智能的框架問題及其解決策略[J].自然辯證法研究,2018,34(5):3-9.
〔6〕周志華.機(jī)器學(xué)習(xí)[M].北京:清華大學(xué)出版社,2016.
〔7〕MinskyM.LogicalversusAnalogicalorSymbolicversusConnectionistorNeatversusScruffy[J].AImagazine,1991,12(2):34-51.
〔8〕PinkasG.Reasoning,NonmonotonicityandLearninginConnectionistNetworksthatCapturePropositionalKnowledge[J].ArtificialIntelligence,1995,77(2):203-247.
〔9〕TowellG,ShavlikJ.Knowledge-basedArtificialNeuralNetworks[J].ArtificialIntelligence,1994,70(1):119-165.
〔10〕GarcezA,KrysiaB,GabbayD.SymbolicKnowledgeExtractionfromTrainedNeuralNetworks:ASoundApproach[J].ArtificialIntelligence,2001,125(1-2):155-207.
作者:魏斌
轉(zhuǎn)載請注明來自發(fā)表學(xué)術(shù)論文網(wǎng):http:///dzlw/29598.html