本文摘要:摘要:闡述了人工智能的原理及智能信息檢索系統(tǒng)的基本概念,分析了智能信息檢索系統(tǒng)的結(jié)構(gòu)及其研究中遇到的難題,并從人工智能的研究成果來探討解決問題的思路。 關(guān)鍵詞:人工智能 智能信息檢索系統(tǒng) 信息檢索 期刊文章發(fā)表 人工智能是當(dāng)前科學(xué)技術(shù)發(fā)展中的一
摘要:闡述了人工智能的原理及智能信息檢索系統(tǒng)的基本概念,分析了智能信息檢索系統(tǒng)的結(jié)構(gòu)及其研究中遇到的難題,并從人工智能的研究成果來探討解決問題的思路。
關(guān)鍵詞:人工智能 智能信息檢索系統(tǒng) 信息檢索 期刊文章發(fā)表
人工智能是當(dāng)前科學(xué)技術(shù)發(fā)展中的一門前沿學(xué)科,是在計(jì)算機(jī)科學(xué)、控制論、信息論、神經(jīng)心理學(xué)、哲學(xué)、語言學(xué)等多種學(xué)科研究的基礎(chǔ)上發(fā)展起來的,是一門綜合性很強(qiáng)的邊緣學(xué)科?偟膩碚f,人工智能是一門研究如何構(gòu)造智能機(jī)器或智能系統(tǒng),使它能模擬、延伸擴(kuò)展人類智能的學(xué)科。
目前,人工智能的研究更多的是結(jié)合具體領(lǐng)域進(jìn)行的,主要研究領(lǐng)域有專家系統(tǒng)、機(jī)器學(xué)習(xí)、模式識別和自然語言理解等。自從人工智能技術(shù)問世以來,它的研究已經(jīng)有了顯著的成果。人工智能應(yīng)用于信息檢索系統(tǒng)的成果——智能信息檢索系統(tǒng)給信息檢索領(lǐng)域帶來了革命性的變化。
1 智能信息檢索系統(tǒng)概述
智能信息檢索系統(tǒng)是一種智能化的計(jì)算機(jī)信息檢索系統(tǒng),它模擬人類關(guān)于信息處理的思維過程和智能活動,實(shí)現(xiàn)信息知識的存儲,檢索和推理,并向用戶提供智能輔助。
由于人工智能的引入,智能信息檢索系統(tǒng)的優(yōu)勢明顯:強(qiáng)大的自然語言理解能力,使用戶可以用自然語言更確切地表達(dá)自己的信息需求;模擬專家的檢索方法,把用戶所表達(dá)的信息需求,制定解決策略以及分析結(jié)果的工作轉(zhuǎn)移到智能信息檢索系統(tǒng)來處理;具有強(qiáng)大的學(xué)習(xí)能力,能自動地獲取知識,能直接向書本學(xué)習(xí),并在實(shí)踐中實(shí)現(xiàn)自我完善。
2 智能信息檢索系統(tǒng)的結(jié)構(gòu)
智能信息檢索系統(tǒng)與專家系統(tǒng)有很大的相似性,其基本結(jié)構(gòu)(見圖1)和工作原理是基本相同的。
2.1 人機(jī)接口部分 人機(jī)接口是信息檢索系統(tǒng)和用戶交流的界面,它能理解、分析用戶的自然語言提問,并產(chǎn)生適合用戶的結(jié)果,還具有解釋功能。它由一組程序相應(yīng)的硬件組成,用于完成輸入輸出工作。系統(tǒng)通過它輸入知識更新完善知識庫,一般用戶通過它輸入信息需求。
圖1 智能信息檢索系統(tǒng)的基本結(jié)構(gòu)2.2 知識庫及其管理系統(tǒng) 知識庫是知識存儲機(jī)構(gòu),用于存儲解決用戶信息需求所需的原理性知識、專家的經(jīng)驗(yàn)性知識以及有關(guān)的事實(shí)等。知識庫中的知識來源于知識獲取機(jī)構(gòu),同時它又為推理機(jī)提供求解問題所需的知識,與兩者都有密切關(guān)系。
2.3 數(shù)據(jù)庫及其管理系統(tǒng) 它存放用戶提供的初始事實(shí)、問題描述以及系統(tǒng)運(yùn)行過程中得到的中間結(jié)果、最終結(jié)果、運(yùn)行信息(如推出結(jié)果的知識鏈)等。
2.4 檢索推理機(jī)構(gòu) 它綜合應(yīng)用各種信息檢索策略與推理技術(shù),利用知識庫中的知識,按一定的推理策略解決用戶的問題。
2.5 知識獲取 這是獲取知識的機(jī)構(gòu),由一組程序組成。其基本任務(wù)是把知識輸入到知識庫中,并負(fù)責(zé)維護(hù)知識的完整性與一致性,建立起性能良好的知識庫。
2.6 解釋機(jī)構(gòu) 它能夠?qū)ψ约旱男袨樽鞒鼋忉,回答用戶提出?ldquo;為什么?”、“結(jié)論是怎么出來的?”等問題,是信息檢索系統(tǒng)取信于用戶的一個重要措施。
3 智能信息檢索面臨的問題
智能信息檢索系統(tǒng)的研究經(jīng)歷了幾十年的發(fā)展,到目前為止,已經(jīng)研究出了一些實(shí)用性的智能信息檢索系統(tǒng)。但是,人工智能信息檢索在下列領(lǐng)域依然無法得到根本性的突破。
3.1 自然語言理解 自然語言理解是智能信息檢索系統(tǒng)的基礎(chǔ)。自然語言是極其復(fù)雜的!ξ覀兠總人來說,是以我們的全部知識來理解語言的。機(jī)器理解自然語言需要把每個人腦都擁有的高度相似的、有關(guān)的“背景知識”存入計(jì)算機(jī)中,利用這種上下文相關(guān)知識進(jìn)行推理,但這是難以做到的。
3.2 知識的表示 人類的智能活動主要是一個獲得并運(yùn)用知識的過程,知識是智能的基礎(chǔ)。為了讓計(jì)算機(jī)具有智能,就必須使它具有知識。但知識是需要用適當(dāng)?shù)哪J奖硎境鰜聿拍艽鎯Φ接?jì)算機(jī)中去的,因此知識表示是長期以來人工智能研究的一個重要問題,在智能信息檢索系統(tǒng)設(shè)計(jì)中,知識表示則成為一個核心部分。
在人工智能中,知識表示就是要把問題求解中所需要的對象、前提條件、算法等知識構(gòu)造為計(jì)算機(jī)可處理的數(shù)據(jù)結(jié)構(gòu)以及解釋這種結(jié)構(gòu)的某些過程。在信息檢索中,同一條知識對不同的用戶有著不同的重要性。因此,在信息檢索中,知識的表示與利用是一個很大的難題。例如,如何從詢問中獲得領(lǐng)域知識,信息表示要達(dá)到怎樣的深度等。
3.3 知識的獲取 擁有知識是智能信息檢索系統(tǒng)區(qū)別于一般信息檢索系統(tǒng)的重要標(biāo)志,而知識的質(zhì)量與數(shù)量又是決定其性能的關(guān)鍵因素。如何使智能信息檢索系統(tǒng)獲得高質(zhì)量的知識,這正是知識獲取要解決的問題。
由于各方面的原因,知識獲取至今仍是一件相當(dāng)困難的工作,雖然已有許多人工智能學(xué)者在開展這方面的研究工作,希望實(shí)現(xiàn)知識的自動獲取,即由信息檢索系統(tǒng)自動完成對知識的獲取,并且也取得了一些成果,但離知識的完全自動獲取這一目標(biāo)相距甚遠(yuǎn),還需要走一段漫長的道路,解決許多理論及技術(shù)上的問題。
4 從人工智能研究的成果來探討解決問題的思路
4.1 自然語言理解 在人工智能領(lǐng)域,自然語言理解就是研究如何讓計(jì)算機(jī)理解人類自然語言的一個研究領(lǐng)域。具體的說他要達(dá)到如下三個目標(biāo):(1)計(jì)算機(jī)能理解人們用自然語言輸入的信息,并能正確回答輸入信息中的有關(guān)問題。(2)對輸入信息,計(jì)算機(jī)能產(chǎn)生相應(yīng)的摘要,能用不同詞語復(fù)述輸入的內(nèi)容。(3)計(jì)算機(jī)能把某一種自然語言表示的信息自動的翻譯為另一種自然語言。對于智能信息檢索系統(tǒng)來說,主要是要達(dá)到前面兩個目標(biāo)。關(guān)于自然語言理解的研究可以追溯到20世紀(jì)50年代。但大多集中在將一種自然語言翻譯成另一種自然語言的研究上。進(jìn)入20世紀(jì)70年代,一批采用句法—一語義分析技術(shù)的自然語言理解系統(tǒng)脫穎而出,在語言分析的深度和難度方面都比早期的系統(tǒng)有了長足的進(jìn)步。進(jìn)入20世紀(jì)80年代后,更強(qiáng)調(diào)知識在自然語言理解中的重要作用。近十年來在自然語言理解的研究中一個值得注意的是語料庫語言學(xué)的崛起,它認(rèn)為語言學(xué)知識來自語料,人們只有從大規(guī)模語料庫中獲取理解語言的知識,才能真正實(shí)現(xiàn)對語言的理解。目前,雖然基于語料庫的自然語言理解方法還不成熟,正處于研究之中,但它是一個值得注意的研究方向。而且我們可以將已經(jīng)取得的成果用于智能信息檢索系統(tǒng)的自然語言處理上。
4.2 知識的表示 在人工智能中,知識表示實(shí)際上就是對知識的一種描述,或者說是一組約定,一種計(jì)算機(jī)可以接受的用于描述知識的數(shù)據(jù)結(jié)構(gòu)。對知識進(jìn)行表示的過程就是把知識編碼成某種數(shù)據(jù)結(jié)構(gòu)的過程。
對于知識表示方法的研究,離不開對知識的研究與認(rèn)識。由于目前對人類知識的結(jié)構(gòu)及機(jī)制還沒完全搞清楚,因此關(guān)于知識表示的理論及規(guī)范尚未建立起來。盡管如此,人們在對智能信息系統(tǒng)的研究及建立過程中,還是結(jié)合具體研究提出了一些知識表示方法。概括起來,這些表示方法可分為兩大類:符號表示法,連接機(jī)制表示法。
對同一知識,一般都可以用多種方法進(jìn)行表示,但其效果卻不相同。因?yàn)椴煌I(lǐng)域中的知識一般都有不同的特點(diǎn),而每一種表示方法也各有自己的長處與不足。因而,有些領(lǐng)域的知識可能采用這種表示模式比較合適,而有些領(lǐng)域的知識可能采用另一種表示模式更好。有時還可能把幾種表示模式結(jié)合起來,作為一個整體來表示領(lǐng)域知識,以取得取長補(bǔ)短的效果。另外,上述各種知識表示方法大都是在進(jìn)行某項(xiàng)具體研究或者建立某個智能系統(tǒng)時提出來的,有一定的針對性和局限性,應(yīng)用時需根據(jù)實(shí)際情況作適當(dāng)?shù)母淖。在建立一個具體的智能系統(tǒng)時,究竟采用哪種表示模式,目前還沒有統(tǒng)一的標(biāo)準(zhǔn),也不存在一個萬能的知識表示模式。但一般來說,在選擇知識表示方法時,應(yīng)從以下幾個方面進(jìn)行考慮:要充分表示領(lǐng)域知識,即在確定一個知識表示模式時,首先應(yīng)該考慮的是它能否充分地表示領(lǐng)域知識;要考慮是否有利于對知識的利用;是否便于對知識的組織、維護(hù)與管理;是否便于理解和實(shí)現(xiàn)。
4.3 知識的獲取 目前,知識獲取通常是由知識工程師與系統(tǒng)中的知識獲取機(jī)構(gòu)共同完成的。知識工程師負(fù)責(zé)從領(lǐng)域?qū)<夷抢锍槿≈R,并用適當(dāng)?shù)哪J桨阎R表示出來,而系統(tǒng)中的知識獲取機(jī)構(gòu)負(fù)責(zé)把知識轉(zhuǎn)換為計(jì)算機(jī)可存儲的內(nèi)部形式,然后把他們存入知識庫。在存儲的過程中,要對知識進(jìn)行一致性、完整性的檢測。
知識獲取的任務(wù)是為信息系統(tǒng)或者專家系統(tǒng)獲取知識,建立起健全、完善、有效的知識庫,以滿足求解領(lǐng)域的問題的需要。對智能信息檢索系統(tǒng)來說,就是要滿足信息檢索這一具體領(lǐng)域的需要。為了完成這個任務(wù),知識獲取必須做到:(1)抽取知識:即把蘊(yùn)含于知識源(領(lǐng)域?qū)<,書本,相關(guān)論文及系統(tǒng)的運(yùn)行實(shí)踐等)中的知識經(jīng)識別,理解,篩選,歸納等抽取出來,以便建立知識庫。(2)知識轉(zhuǎn)換:即把知識由一種表示形式變換為另一種表示形式。(3)知識的輸入:即把用適當(dāng)模式表示的知識經(jīng)編輯、編譯送入知識庫的過程;(4)知識的檢測:知識庫的建立是通過對知識進(jìn)行抽取、轉(zhuǎn)換和輸入等環(huán)節(jié)實(shí)現(xiàn)的,這一過程中的任何環(huán)節(jié)上的失誤都會造成知識的錯誤,直接影響系統(tǒng)的性能,因此必須對知識進(jìn)行檢測,以便盡早發(fā)現(xiàn)并糾正可能出現(xiàn)的錯誤。
按知識獲取的自動化程度劃分,可分為非自動知識獲取和自動知識獲取兩種方式。自動知識獲取是知識獲取最終的目標(biāo),它是一種理想的知識獲取方式,但它卻涉及到人工智能的多個領(lǐng)域。例如模式識別、自然語言理解、機(jī)器學(xué)習(xí)等。而這一理論目前尚處在研究階段,由許多技術(shù)上的問題需要作進(jìn)一步的研究,就目前已經(jīng)取得的研究成果而言,尚不足于真正實(shí)現(xiàn)自動知識獲取。因此,知識的完全自動獲取目前還只能作為人們?yōu)橹畩^斗的目標(biāo)。
但是,人工智能的研究畢竟已經(jīng)取得了很大的進(jìn)步,自然語言理解,機(jī)器學(xué)習(xí)等的研究也已取得了較大的進(jìn)展,特別是近年來關(guān)于人工神經(jīng)網(wǎng)絡(luò)的研究提出了多種學(xué)習(xí)算法,這都為知識獲取提供了有利條件。因此,在建造智能信息檢索系統(tǒng)時,應(yīng)充分利用這些成果,逐漸向知識的自動獲取過渡,提高其智能程度。事實(shí)上,在近年來建造的智能信息系統(tǒng)中,也都不同程度的做了這方面的嘗試,在非自動知識獲取的基礎(chǔ)上增加了部分學(xué)習(xí)功能,使系統(tǒng)能從大量事例中歸納出某些知識。
參考文獻(xiàn)
1 王永慶.人工智能原理與方法.西安交通大學(xué)出版社,1998
2 張玉峰.智能情報(bào)系統(tǒng).武漢大學(xué)出版社,1991
3 王娟琴.人工智能與情報(bào)檢索的合壁.圖書情報(bào)工作,1998(3)
4 張孔倚.關(guān)于人工智能技術(shù)在情報(bào)檢索中的應(yīng)用.山西大學(xué)學(xué)報(bào),1995(3)
5 楊新波.智能情報(bào)檢索系統(tǒng)研究.情報(bào)科學(xué),1989(5)
6 劉寧.用于情報(bào)檢索的專家系統(tǒng).現(xiàn)代圖書情報(bào)技術(shù),1990 (1)
7 李明,沈紅君.情報(bào)檢索智能化.情報(bào)理論與實(shí)踐,1996(6)
8 涂序彥.人工智能及其應(yīng)用.北京:清華大學(xué)出版社,1988
轉(zhuǎn)載請注明來自發(fā)表學(xué)術(shù)論文網(wǎng):http:///dzlw/2357.html