本文摘要:在信息數(shù)據(jù)交互量劇增的當(dāng)下,數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)技術(shù)飛速發(fā)展。其中,推薦技術(shù)在高校學(xué)生的學(xué)習(xí)、生活中已成為一種主流的興趣愛好反饋方式。如何在快速建立學(xué)生的綜合成績(jī)與學(xué)習(xí)行為之間的關(guān)聯(lián)度、挖掘?qū)W生學(xué)習(xí)的興趣向量的同時(shí),實(shí)現(xiàn)對(duì)熱門圖書的個(gè)性化推
在信息數(shù)據(jù)交互量劇增的當(dāng)下,數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)技術(shù)飛速發(fā)展。其中,推薦技術(shù)在高校學(xué)生的學(xué)習(xí)、生活中已成為一種主流的興趣愛好反饋方式。如何在快速建立學(xué)生的綜合成績(jī)與學(xué)習(xí)行為之間的關(guān)聯(lián)度、挖掘?qū)W生學(xué)習(xí)的興趣向量的同時(shí),實(shí)現(xiàn)對(duì)熱門圖書的個(gè)性化推薦,已經(jīng)成為高校研究激發(fā)學(xué)生自主學(xué)習(xí)的方向之一。本文提出基于協(xié)同過濾的圖書推薦算法,通過對(duì)我校學(xué)生的學(xué)習(xí)行為進(jìn)行數(shù)據(jù)分析,構(gòu)建協(xié)同過濾的概率矩陣模型,從而發(fā)現(xiàn)學(xué)生學(xué)習(xí)的興趣傾向值,最終實(shí)現(xiàn)向?qū)W生推薦個(gè)性化圖書信息的平臺(tái)的搭建,進(jìn)一步方便學(xué)生選擇個(gè)人感興趣的圖書,進(jìn)行閱讀、學(xué)習(xí)與知識(shí)拓展,提升校園優(yōu)良學(xué)風(fēng)建設(shè)。
相關(guān)研究目前國(guó)內(nèi)對(duì)于推薦算法在學(xué)生課程屬性與情趣偏好中的相關(guān)問題進(jìn)行了較為深入的研究。王仲鈺利用多維屬性間關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘技術(shù),采用協(xié)同過濾算法、關(guān)聯(lián)算法對(duì)不同用戶群體圖書借閱數(shù)據(jù)進(jìn)行分析,探索具有針對(duì)性的圖書推薦服務(wù)策略,提升圖書館服務(wù)能力。
圖書館論文范例:新時(shí)代圖書腰封設(shè)計(jì)的價(jià)值取向探析
王剛計(jì)算用戶之間的相似性并與傳統(tǒng)的協(xié)同過濾推薦方法相結(jié)合,提出了基于用戶興趣序列的改進(jìn)協(xié)同過濾圖書推薦方法。李萍通過實(shí)驗(yàn)測(cè)試,采用數(shù)據(jù)挖掘技術(shù)的圖書推薦系統(tǒng)推薦的書目與實(shí)際借閱的書目基本吻合,判斷準(zhǔn)確性對(duì)比傳統(tǒng)方式大幅提高。張紫嫣也提出一種結(jié)合類別偏好的協(xié)同過濾推薦算法。在原算法計(jì)算用戶相似度的基礎(chǔ)上,結(jié)合用戶類別偏好的相似度來計(jì)算近鄰,從而得到推薦結(jié)果。
現(xiàn)有的國(guó)內(nèi)研究中重點(diǎn)考慮在對(duì)協(xié)同過濾數(shù)據(jù)的關(guān)聯(lián)規(guī)則研究上,而對(duì)挖掘?qū)W生的興趣傾向值矩陣建立研究較少。在國(guó)外研究中,Tewari也闡述了根據(jù)買家的興趣推薦圖書的觀點(diǎn),并提出了一種基于內(nèi)容過濾,協(xié)同過濾和關(guān)聯(lián)規(guī)則挖掘相結(jié)合的圖書推薦系統(tǒng)。Parvatikar通過將基于協(xié)作的過濾和關(guān)聯(lián)規(guī)則挖掘相結(jié)合來解決在線圖書推薦數(shù)據(jù)稀疏性問題,以獲得更好的性能。
Mathew等人提出了一種基于內(nèi)容過濾(CBF),協(xié)作過濾(CF)和關(guān)聯(lián)規(guī)則挖掘的組合特征的書推薦系統(tǒng)(BRS),以產(chǎn)生有效和有效的推薦。本文提出將基于協(xié)同過濾的推薦算法,構(gòu)建基于協(xié)同過濾的概率矩陣模型的學(xué)生興趣傾向挖掘技術(shù),設(shè)計(jì)出一種針對(duì)興趣傾向推薦的個(gè)性化圖書推薦系統(tǒng),以達(dá)到向?qū)W生推薦個(gè)性化圖書信息,為學(xué)生教育信息化提供便利的目的。基于協(xié)同過濾的推薦算法常用的協(xié)同過濾算法分為兩種,基于用戶的協(xié)同過濾算法(user-basedcollaborativefiltering),以及基于物品的協(xié)同過濾算法(item-basedcollaborativefiltering)。
本系統(tǒng)的目標(biāo)是向?qū)W生進(jìn)行個(gè)性化圖書推薦,采用基于用戶的協(xié)同過濾算法,經(jīng)過用戶偏好多維度評(píng)分、相似興趣傾向計(jì)算與關(guān)聯(lián)推薦列表計(jì)算后,得出準(zhǔn)確率和召回率最高的帶權(quán)優(yōu)先興趣傾向計(jì)算結(jié)果。多維度評(píng)分多維度評(píng)分是指進(jìn)行協(xié)同過濾推薦的基礎(chǔ)。本研究采取基于學(xué)生科目成績(jī)、收藏書籍、書籍閱讀速度、書籍評(píng)分與評(píng)價(jià)等行為的數(shù)據(jù)根據(jù)學(xué)習(xí)行為反應(yīng)的用戶興趣傾向?qū)ζ溥M(jìn)行加權(quán),經(jīng)過減噪和歸一化的預(yù)處理后構(gòu)建用戶偏好二維矩陣模型,以用戶列表與物品列表作為緯度尺標(biāo),得出用戶對(duì)物品的偏好值。
興趣傾向計(jì)算興趣傾向計(jì)算是指經(jīng)過矩陣分析得到用戶喜好后,得到用戶興趣偏好向量并計(jì)算用戶之間的相似度。在常用的歐幾里德距離、皮爾遜相關(guān)系數(shù)、Cosine相似度、Tanimoto系數(shù)等興趣傾向算法中,本研究采用Cosine相似度方法,它被廣泛應(yīng)用于計(jì)算文檔數(shù)據(jù)的相似度,其中xi與yi分別代表x用戶與y用戶對(duì)書籍i的評(píng)分,兩個(gè)向量積的數(shù)值越小則相似度越高。
關(guān)聯(lián)推薦列表關(guān)聯(lián)推薦列表用于要求以經(jīng)典Apriori算法挖掘關(guān)聯(lián)規(guī)則,獲取到相鄰用戶與相鄰物品集后,根據(jù)基于用戶的CF思想,生成用戶沒有偏好值的候選項(xiàng)集,再根據(jù)關(guān)鍵詞頻率篩選過濾掉超出最小支持度的頻繁項(xiàng)集,最后提取出強(qiáng)關(guān)聯(lián)的關(guān)聯(lián)推薦列表,抓取相應(yīng)書籍?dāng)?shù)據(jù)并進(jìn)行推薦。
構(gòu)建基于協(xié)同過濾的圖書推薦系統(tǒng)目前,高校圖書館與數(shù)字資源大多僅作為圖書資源庫(kù)而提供信息檢索與文件查詢功能,缺乏有針對(duì)性的信息推薦功能。本研究為提高用戶獲取目標(biāo)書籍的效率,進(jìn)一步方便學(xué)生進(jìn)行閱讀、學(xué)習(xí)、知識(shí)拓展,為了將高校學(xué)生的選修課程進(jìn)行準(zhǔn)確定位,并利用學(xué)生對(duì)于課程的評(píng)價(jià),同時(shí)結(jié)合互聯(lián)網(wǎng)中學(xué)生的瀏覽數(shù)據(jù)構(gòu)建出與本人興趣一致的推薦書籍,在協(xié)同過濾的推薦算法基礎(chǔ)上構(gòu)建設(shè)計(jì)了可視化的個(gè)性化圖書推薦系統(tǒng)。
本系統(tǒng)經(jīng)過對(duì)學(xué)生學(xué)習(xí)行為的預(yù)處理,充分發(fā)揮互聯(lián)網(wǎng)作為學(xué)生獲取圖書信息的主要途徑的特點(diǎn),利用數(shù)據(jù)挖掘技術(shù)獲取到學(xué)生的瀏覽歷史、好評(píng)書籍等數(shù)據(jù)結(jié)合,使用Python語(yǔ)言對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,處理丟失的數(shù)據(jù)與偏離值,建立興趣傾向值與數(shù)據(jù)的關(guān)聯(lián)性分析并抓取學(xué)生個(gè)性化推薦書籍列表,由此完成協(xié)同過濾推薦的過程,并將相應(yīng)圖書信息在系統(tǒng)平臺(tái)上展現(xiàn)。
學(xué)生學(xué)習(xí)行為分析與興趣傾向計(jì)算以高校學(xué)生學(xué)習(xí)行為數(shù)據(jù)為基礎(chǔ),對(duì)學(xué)生大類課程成績(jī)與選修課課程成績(jī)進(jìn)行分析,提取學(xué)生的優(yōu)勢(shì)與弱勢(shì)學(xué)科,進(jìn)行學(xué)生學(xué)科權(quán)值的重點(diǎn)加權(quán)并構(gòu)建協(xié)同過濾投票模型,以實(shí)現(xiàn)學(xué)科類取長(zhǎng)補(bǔ)短的個(gè)性化圖書推薦。其次,對(duì)學(xué)生公選課方向與學(xué)生個(gè)性化選修課程類別等數(shù)據(jù)進(jìn)行分析,構(gòu)建學(xué)生的知識(shí)關(guān)聯(lián)圖譜,以學(xué)生重點(diǎn)優(yōu)勢(shì)類別為中心、專業(yè)與興趣為對(duì)比尺標(biāo),達(dá)到分方向進(jìn)行多維度興趣關(guān)聯(lián)的目的。
同時(shí)系統(tǒng)對(duì)新用戶提供閱讀興趣類傾向選擇與興趣熱門圖書選擇與評(píng)分,將閱讀興趣點(diǎn)信息與知識(shí)關(guān)聯(lián)圖譜結(jié)合進(jìn)行初步篩選,構(gòu)建多維數(shù)據(jù)的評(píng)分體系與基于協(xié)同過濾的概率矩陣模型,最終實(shí)現(xiàn)學(xué)生興趣傾向值的初步計(jì)算。圖書信息動(dòng)態(tài)獲取與數(shù)據(jù)預(yù)處理在圖書信息的動(dòng)態(tài)獲取上,使用基于Python的BeautifulSoup庫(kù)的爬蟲技術(shù)對(duì)熱門的圖書信息網(wǎng)站的數(shù)據(jù)進(jìn)行動(dòng)態(tài)挖掘,對(duì)圖書分類排行以及每日優(yōu)選圖書部分進(jìn)行標(biāo)簽頁(yè)的定時(shí)動(dòng)態(tài)爬取。針對(duì)xpath爬取過程中出現(xiàn)的不規(guī)律爬取結(jié)果采用加上定位映射的方法,最終自定義xpath實(shí)現(xiàn)凍結(jié)頁(yè)面數(shù)據(jù)抓取。
通過對(duì)學(xué)生興趣傾向值的分析,對(duì)抓取的圖書數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗。首先經(jīng)過解析器對(duì)圖書關(guān)鍵詞進(jìn)行獲取,排除學(xué)科關(guān)聯(lián)程度低、可靠性低以及重復(fù)挖掘等問題的數(shù)據(jù)。按特征權(quán)重比篩選出關(guān)鍵性數(shù)據(jù),并反向計(jì)算篩選后數(shù)據(jù)的可靠性與關(guān)聯(lián)度。對(duì)偏差較大的數(shù)據(jù)進(jìn)行排除,處理丟失的數(shù)據(jù)、處理偏離值,為后期數(shù)據(jù)統(tǒng)計(jì)、興趣指標(biāo)的計(jì)算、以及數(shù)據(jù)關(guān)聯(lián)性分析奠定數(shù)據(jù)基礎(chǔ)。
最后完成清洗圖書數(shù)據(jù)的信息存儲(chǔ),確保數(shù)據(jù)轉(zhuǎn)換、標(biāo)準(zhǔn)化、歸一化的準(zhǔn)確性。構(gòu)建基于協(xié)同過濾的圖書推薦系統(tǒng)本系統(tǒng)的可視化平臺(tái)以MVC模式進(jìn)行構(gòu)建,客戶層中圖書推薦系統(tǒng)使用Vue框架、應(yīng)用層則采取SSM框架進(jìn)行開發(fā)。在對(duì)外接入層實(shí)現(xiàn)外部圖書網(wǎng)站接口的獲取與連接,為挖掘?qū)W生興趣可能性,對(duì)實(shí)時(shí)暢銷書籍?dāng)?shù)據(jù)實(shí)現(xiàn)了動(dòng)態(tài)爬取,緊跟熱點(diǎn)、綜合性地帶動(dòng)高校學(xué)生主動(dòng)讀書學(xué)習(xí)的興趣。
服務(wù)層中有爬蟲模塊、數(shù)據(jù)分析模塊與系統(tǒng)展示模塊三部分。具體的,爬蟲模塊,利用用戶關(guān)聯(lián)度和興趣相似度計(jì)算方法,對(duì)k門檻內(nèi)相似用戶的圖書數(shù)據(jù)按照偏好矩陣權(quán)重值大小進(jìn)行獲取,獲取多維度的圖書數(shù)據(jù)源;數(shù)據(jù)分析模塊,在數(shù)據(jù)層中將學(xué)生的學(xué)習(xí)行為數(shù)據(jù)進(jìn)行處理分析,通過協(xié)同過濾算法計(jì)算出學(xué)生學(xué)習(xí)需要獲取圖書的傾向性。
最后,系統(tǒng)展示模塊,對(duì)于經(jīng)過預(yù)處理清洗的圖書信息,結(jié)合學(xué)生的興趣傾向關(guān)鍵詞篩選出爬蟲子系統(tǒng)中存儲(chǔ)的個(gè)性化推薦書籍,將個(gè)人綜合頁(yè)面將學(xué)生行為分析階段的綜合成績(jī)分析情況與興趣傾向以圖形的方式展現(xiàn),便于用戶更加迅速、直觀地查看圖書的相關(guān)信息。本系統(tǒng)在客戶層使用Vue框架進(jìn)行視圖界面開發(fā),將服務(wù)層計(jì)算的圖書推薦結(jié)果通過API接口在個(gè)人推薦頁(yè)面進(jìn)行讀取與展示。最終系統(tǒng)將完成分布式部署、多進(jìn)程、負(fù)載均衡地圖書推薦系統(tǒng)的構(gòu)建與聯(lián)通。
總結(jié)
以激發(fā)學(xué)生自主學(xué)習(xí)內(nèi)容推薦為目標(biāo),本文結(jié)合學(xué)生閱讀興趣傾向,提出基于協(xié)同過濾與關(guān)聯(lián)規(guī)則的個(gè)性化圖書推薦系統(tǒng),根據(jù)興趣傾向值進(jìn)行數(shù)據(jù)爬蟲,并將個(gè)性化協(xié)同過濾推薦算法應(yīng)用到學(xué)生圖書推薦平臺(tái)的建設(shè)中。有助于提高學(xué)生之間書籍的獲取效率與信息共享,幫助學(xué)生深入理解閱讀的重要性并滿足其對(duì)個(gè)性化書籍推薦的需求,從而激發(fā)學(xué)生的閱讀學(xué)習(xí)知識(shí)的興趣。下一步研究中,將進(jìn)一步加強(qiáng)與高校圖書館數(shù)據(jù)資源建設(shè)聯(lián)系,充分利用學(xué)校圖書館對(duì)于學(xué)生的專業(yè)圖書的類別劃分以及學(xué)生在圖書館借閱書籍的記錄,進(jìn)一步完善本文計(jì)算方法,以提供更人性化的圖書館推薦平臺(tái)。
作者:付羽逍;王祎珺;敖明明;楊伊帆
轉(zhuǎn)載請(qǐng)注明來自發(fā)表學(xué)術(shù)論文網(wǎng):http:///jjlw/26829.html