深度學(xué)習(xí)方法在興趣點推薦中的應(yīng)用研究綜述

所屬分類：經(jīng)濟論文閱讀次時間：2021-07-29 10:12

本文摘要：摘要：近年來，基于位置的社交網(wǎng)絡(luò)被廣泛使用，用戶通過在興趣點簽到以記錄他們的行程，并與其他用戶分享他們的感受和評價。興趣點推薦是基于位置的社交網(wǎng)絡(luò)提供的一項重要服務(wù)，一方面它可以幫助用戶快速發(fā)現(xiàn)感興趣的興趣點，另一方面也有利于興趣點提供商

　　摘要：近年來，基于位置的社交網(wǎng)絡(luò)被廣泛使用，用戶通過在興趣點簽到以記錄他們的行程，并與其他用戶分享他們的感受和評價。興趣點推薦是基于位置的社交網(wǎng)絡(luò)提供的一項重要服務(wù)，一方面它可以幫助用戶快速發(fā)現(xiàn)感興趣的興趣點，另一方面也有利于興趣點提供商更全面深入地了解用戶偏好，并有針對性地提高服務(wù)質(zhì)量。興趣點推薦主要基于對用戶歷史簽到數(shù)據(jù)以及內(nèi)容、社交關(guān)系等信息的分析。這篇論文系統(tǒng)歸納了興趣點推薦中需要解決的四個挑戰(zhàn)，即時空序列特征提取、內(nèi)容社交特征提取、多特征整合以及對數(shù)據(jù)稀疏性問題的處理，總結(jié)了使用深度學(xué)習(xí)方法解決這四個挑戰(zhàn)的相關(guān)工作，并指出了它們的不足。最后論文提出了三類在興趣點推薦上還沒有得到充分利用的深度學(xué)習(xí)方法，即使用增量學(xué)習(xí)加速推薦模型更新、使用遷移學(xué)習(xí)緩解冷啟動問題以及使用強化學(xué)習(xí)建模用戶動態(tài)偏好。這篇論文聚焦在深度學(xué)習(xí)方法在興趣點推薦上的應(yīng)用，希望通過分析總結(jié)最新的研究進展，為進一步提升推薦效果提供研究思路。

　　關(guān)鍵詞：興趣點推薦;深度學(xué)習(xí);特征提取;特征整合;數(shù)據(jù)稀疏性

深度學(xué)習(xí)

　　概述

　　智能手機的普及和全球定位系統(tǒng)的支持促進了基于位置的社交網(wǎng)絡(luò)(Location-basedSocialNetwork,LBSN)，如Foursquare、Yelp、Instagram、大眾點評等，的廣泛使用。興趣點(PointofInterest,POI)推薦是LBSN提供的一項重要服務(wù)，一方面可以方便用戶規(guī)劃行程、快速發(fā)現(xiàn)感興趣的興趣點;另一方面，也可以幫助興趣點服務(wù)提供商和廣告商更全面深入地了解用戶偏好，發(fā)掘更準確的市場目標群體，并引入更有針對性的廣告策略吸引用戶。LBSN中包含了大量用戶和興趣點的信息，為挖掘用戶偏好提供了基礎(chǔ)。

　　在一個典型的LBSN中，用戶可以通過在興趣點簽到以記錄行程，一次簽到(Check-in)可以用一個“<>”三元組表示。每個用戶的多次簽到記錄可以根據(jù)時間戳排序構(gòu)成其簽到序列，即用戶軌跡。簽到記錄直接反映了用戶對興趣點的偏好。此外，用戶還可以在LBSN中發(fā)表對興趣點的評價或上傳照片;可以關(guān)注其他用戶并分享他們對于興趣點的感受，與其他用戶之間形成社交好友關(guān)系，上述內(nèi)容信息和社交關(guān)系信息也隱含了用戶的偏好。

　　因此，興趣點推薦服務(wù)的實現(xiàn)可以依托于從LBSN的豐富信息中挖掘出的用戶偏好。傳統(tǒng)推薦系統(tǒng)中的一些經(jīng)典方法可以被運用到興趣點推薦中，其中使用最廣泛的方法之一是基于矩陣分解的方法[1-2]，其原理是通過分解“用戶-興趣點”簽到矩陣(user-POIcheck-inmatrix)獲取表征用戶和興趣點關(guān)聯(lián)的低維隱特征，但這種方法沒有考慮用戶簽到序列的序列特征。另一類方法將簽到序列抽象為Markov鏈[3-5]，僅根據(jù)上一次簽到?jīng)Q定下一次簽到的推薦，沒有考慮更早期的歷史簽到中體現(xiàn)的用戶偏好信息對下一次簽到的影響。

　　此外，這兩類方法都只使用了用戶簽到數(shù)據(jù)，LBSN中的其他信息沒有得到充分有效地利用。隨著人工智能技術(shù)的快速發(fā)展，深度學(xué)習(xí)已被證實可以有效地從大量數(shù)據(jù)中學(xué)習(xí)隱藏信息并預(yù)測未來狀態(tài)。相比于傳統(tǒng)的機器學(xué)習(xí)算法，它可以通過模型自動化從數(shù)據(jù)中提取并處理特征。將深度學(xué)習(xí)應(yīng)用于興趣點推薦系統(tǒng)有助于充分利用系統(tǒng)中豐富的特征并挖掘特征之間的復(fù)雜關(guān)聯(lián)。

　　近年來，興趣點推薦問題已得到了廣泛的研究�，F(xiàn)有的一些有代表性的綜述[6-8]根據(jù)推薦目標將興趣點推薦分為用戶通用興趣點推薦和用戶下一個興趣點推薦;根據(jù)用戶偏好的主要影響因素將其分為地理因素、時間因素、社交因素和內(nèi)容因素主導(dǎo)的興趣點推薦系統(tǒng);根據(jù)使用的數(shù)據(jù)種類將其分為基于用戶位置、軌跡、活動以及以上多種數(shù)據(jù)的興趣點推薦系統(tǒng)。不同于這些綜述對興趣點推薦問題中涉及的要素進行分類，我們聚焦于該問題本身的挑戰(zhàn)以及深度學(xué)習(xí)方法在解決這些挑戰(zhàn)的應(yīng)用上，試圖從方法的角度對興趣點推薦的研究進行總結(jié)并提供未來研究思路。

　　1興趣點推薦問題的挑戰(zhàn)

　　興趣點推薦需要根據(jù)LBSN中的大量相關(guān)信息對用戶偏好進行總結(jié)和刻畫，給出個性化的興趣點推薦，針對興趣點推薦系統(tǒng)的特性，我們將其中的挑戰(zhàn)總結(jié)為以下四個方面：

　　1)如何從簽到數(shù)據(jù)中提取時空序列特征?用戶的歷史簽到序列是LBSN中用戶對興趣點偏好最直觀的體現(xiàn)。與傳統(tǒng)的“用戶-商品”矩陣相比，簽到序列包含了上下文時空信息，充分挖掘其時空序列特征可以有效改善對用戶偏好的建模效果。

　　2)如何充分利用LBSN中的信息?除了用戶簽到序列，LBSN中還包含大量用戶生成內(nèi)容(User-GeneratedContent,UGC)和社交關(guān)系信息，如用戶發(fā)布的關(guān)于某個興趣點的照片評論、用戶之間的關(guān)注關(guān)系等。這些信息能夠反映出用戶的關(guān)注點和興趣偏好，同時也隱含了興趣點的特征，因此可以被用來進一步改善興趣點推薦的效果。

　　3)如何綜合多特征的影響實現(xiàn)興趣點推薦?如上所述，興趣點推薦系統(tǒng)中包含大量體現(xiàn)用戶偏好的特征。從特征對象的角度可以分為用戶特征、興趣點特征和外部環(huán)境特征;從用戶偏好主要影響因素的角度可以分為時空因素、內(nèi)容因素和社交關(guān)系因素等。一個有效且有拓展性的模型需要綜合考慮這些特征的共同影響以實現(xiàn)個性化的興趣點推薦。

　　4)如何處理“用戶-興趣點”簽到矩陣的稀疏性問題?雖然LBSN被廣泛使用，但單個用戶訪問過的興趣點數(shù)量相比于全部興趣點而言是極少的。此外，對于新用戶和新注冊的興趣點，LBSN中關(guān)于它們的歷史簽到信息較少。鑒于以上原因，“用戶-興趣點”簽到矩陣具有較強的稀疏性。怎樣挖掘有限的歷史簽到數(shù)據(jù)、利用沒有歷史簽到的用戶興趣點其本身的特性以在一定程度上緩解數(shù)據(jù)稀疏性問題是許多相關(guān)工作研究的焦點。

　　基于以上對興趣點推薦問題挑戰(zhàn)的總結(jié)，本文將從時空序列特征提取、內(nèi)容社交特征提取、多特征整合和無簽到用戶興趣點處理四方面對使用深度學(xué)習(xí)解決這些挑戰(zhàn)的背景和優(yōu)勢進行分析，對相關(guān)工作中用于解決四個問題的具體深度學(xué)習(xí)方法進行回顧。

　　通過對興趣點推薦中深度學(xué)習(xí)方法的總結(jié)和分類，2時空序列特征提取用戶的歷史簽到數(shù)據(jù)是LBSN中反映用戶對興趣點偏好的最直觀的信息。用戶簽到包括其訪問的興趣點和時間戳，用戶偏好受到時空特征的限制和影響，例如由于營業(yè)時間限制，一些興趣點只會在特定的時間段被訪問;根據(jù)地理學(xué)第一定律[9]，興趣點之間的距離遠近在一定程度上決定了它們之間關(guān)聯(lián)的緊密程度。此外，簽到序列往往具有一些序列特征，如某些興趣點之間訪問的連續(xù)性、用戶偏好的一致性、用戶行為的周期性等。

　　推薦系統(tǒng)傳統(tǒng)的矩陣分解方法沒有考慮到簽到數(shù)據(jù)的時空序列特征，一些相關(guān)工作[11-13]試圖使用傳統(tǒng)統(tǒng)計和概率學(xué)的方法對矩陣分解方法進行改進，如最小化連續(xù)兩次訪問的用戶向量差[11]、最小化候選興趣點向量與用戶歷史訪問過的興趣點向量之間的差[12]等。

　　但是這些改進只能啟發(fā)式地描述簽到序列一些顯式的宏觀特征，用戶簽到數(shù)據(jù)中隱含的特征和聯(lián)系依然很難被充分挖掘和利用。近年來隨著自然語言處理技術(shù)的快速發(fā)展以及處理序列的神經(jīng)網(wǎng)絡(luò)模型的廣泛使用，深度學(xué)習(xí)方法被證實在處理序列數(shù)據(jù)上具有很大優(yōu)勢，通過對循環(huán)神經(jīng)元結(jié)構(gòu)的改造、“門”的設(shè)計以及注意力機制的運用，這類方法可以有效地在序列數(shù)據(jù)中刻畫復(fù)雜的上下文特征并捕捉用戶的長短期偏好，因此可以被應(yīng)用于LBSN中包含時空信息的簽到序列的特征提取。

　　在本章中，我們主要總結(jié)歸納了兩類提取時空序列特征的方法，第一類是使用自然語言處理中獲取詞向量的方法來處理興趣點序列，這類方法更加關(guān)注局部的序列特性，即某些興趣點常在短期內(nèi)被同一用戶訪問的模式，使這些興趣點擁有相近的隱特征向量，在推薦時根據(jù)隱特征向量給出符合用戶歷史偏好的興趣點;第二類方法是使用一些常用的處理序列的神經(jīng)網(wǎng)絡(luò)模塊，如循環(huán)神經(jīng)網(wǎng)絡(luò)和注意力機制等，這類方法相比于第一類方法可以獲取歷史興趣點序列的長期特征即用戶的長期偏好以及興趣點被訪問的前后關(guān)系特征，并可充分挖掘利用興趣點簽到相關(guān)的上下文信息，如興趣點地理位置、簽到時間等，因此在相關(guān)工作中被應(yīng)用得更加廣泛。

　　2.1詞向量獲取方法

　　為獲取簽到序列的序列特征，興趣點推薦系統(tǒng)需要挖掘興趣點之間的潛在關(guān)聯(lián)，一類常見的方法是借鑒自然語言處理中獲取詞向量的方法，將每個興趣點類比為一個單詞，將用戶歷史簽到的興趣點序列看作句子，最終刻畫用戶的興趣點訪問模式可以被轉(zhuǎn)化為提取句子的語義特征。常用的詞向量獲取方法Word2vec模型[10]分為兩種實現(xiàn)，即Skip-gram和ContinuousBag-of-Words(CBOW)。Skip-gram是根據(jù)當前的詞來預(yù)測其周圍的詞，而CBOW則是根據(jù)周圍的詞預(yù)測當前的詞，這兩種模型均可被應(yīng)用于興趣點推薦。

　　文獻[14]利用Skip-gram實現(xiàn)以建模用戶的簽到興趣點序列以獲取每個興趣點的隱特征，Skip-gram在興趣點推薦中其目標方程是最大化興趣點上下文(歷史數(shù)據(jù)中曾經(jīng)在某個興趣點前后被訪問的興趣點)和該興趣點同時出現(xiàn)的概率，該方法在推薦前十個興趣點時比利用非一致性和連續(xù)性的特征改進的矩陣分解算法[11]準確率提高了約0.03。文獻[15]對上述方法進行了進一步優(yōu)化，將用戶每一天的簽到序列看作一個單獨的句子，并對興趣點在工作日和周末的簽到進行了區(qū)分。文獻[16]則使用了CBOW實現(xiàn)，根據(jù)興趣點序列獲取興趣點特征表示。

　　2.2處理序列的神經(jīng)網(wǎng)絡(luò)方法

　　使用類比后獲取詞向量的方法從用戶簽到序列中提取興趣點特征表示僅僅考慮到了興趣點短期被同用戶訪問的關(guān)系，而沒有考慮到興趣點之間更復(fù)雜的關(guān)聯(lián)，簽到數(shù)據(jù)的具體地理位置信息和時間戳信息沒有得到充分利用。為了更加深入地挖掘帶時空上下文的序列特征，一些處理序列的神經(jīng)網(wǎng)絡(luò)模塊可被應(yīng)用于興趣點推薦。

　　循環(huán)神經(jīng)網(wǎng)絡(luò)(RecurrentNeuralNetwork,RNN)[17]是處理帶豐富上下文信息的序列數(shù)據(jù)的有效方法，將基于循環(huán)神經(jīng)網(wǎng)絡(luò)的方法引入興趣點推薦可以有效地從簽到序列中提取時空序列特征。由于傳統(tǒng)的循環(huán)神經(jīng)網(wǎng)絡(luò)在刻畫用戶長期偏好時存在梯度消失的問題，基于長短期記憶網(wǎng)絡(luò)(LongShort-TermMemory,LSTM)[18]的方法在相關(guān)工作中被使用得更加廣泛，它可以有效地刻畫用戶的長短期偏好。

　　文獻[19]引入了興趣點類別的概念并利用兩個長短期記憶網(wǎng)絡(luò)編碼器分別提取用戶簽到的興趣點類別序列和具體興趣點序列的時間特征，根據(jù)興趣點類別特征進行初步篩選后再根據(jù)每個興趣點的特征和用戶特征實現(xiàn)推薦，通過刻畫不同層次的序列特征減小了推薦的搜索空間，提高了興趣點推薦的準確性。上述工作通過改進循環(huán)神經(jīng)網(wǎng)絡(luò)的循環(huán)神經(jīng)元使得其更加適應(yīng)于興趣點推薦系統(tǒng)中時空序列特征的處理。但這類方法的缺點在于循環(huán)神經(jīng)元無法有區(qū)別地處理簽到序列中不同的簽到，而事實上歷史簽到對未來簽到的影響并不完全是隨著時間間隔的增大而衰減。

　　注意力機制是另一類處理序列的神經(jīng)網(wǎng)絡(luò)方法，可用于提取興趣點序列的時空特征。從地理位置來看，每一對興趣點之間的影響力大小不同。文獻[26]提出了地理注意力網(wǎng)絡(luò)來刻畫興趣點之間基于位置的關(guān)系，考慮了兩個興趣點之間的距離以及他們各自的地理屬性——地理影響力(即該興趣點引導(dǎo)用戶去其他興趣點的能力)和地理被影響力(即該興趣點吸引其他興趣點的訪客的能力)，使用候選興趣點的地理被影響力作為注意力機制中的查詢(Query)、該用戶歷史訪問過的興趣點的地理影響力作為鍵(Key)，影響力系數(shù)根據(jù)兩個興趣點之間的距離使用RBF核獲得，最終計算出注意力權(quán)重，模型輸出的對于候選興趣點的用戶偏好為歷史興趣點地理影響的加權(quán)求和。地理注意力網(wǎng)絡(luò)使得模型的性能在Foursquare和Gowalla數(shù)據(jù)集上均獲得了較大提升。

　　在處理時序特征時，注意力機制一般與循環(huán)神經(jīng)網(wǎng)絡(luò)或長短期記憶網(wǎng)絡(luò)一起使用，一類方法是使用后者獲取每次簽到的隱特征，再利用注意力機制加權(quán)聚合簽到序列中多次簽到的隱特征;另一類方法則是并行使用這兩種方法從多維度提取簽到序列的特征。文獻[27]為推薦下一次簽到的興趣點，先將用戶簽到序列(候選興趣點和推薦時間作為序列的最后一個節(jié)點)中每一次簽到的興趣點特征和時空上下文特征輸入長短期記憶網(wǎng)絡(luò)以獲取其隱特征，由于每個歷史簽到對未來簽到興趣點預(yù)測的貢獻程度不同，他們再利用注意力機制根據(jù)歷史簽到的隱特征和候選興趣點的隱特征計算注意力權(quán)重加權(quán)的決策向量，基于此向量可預(yù)測該候選興趣點被訪問的概率，訪問概率最高的候選興趣點被作為推薦的結(jié)果。

　　文獻[28]提出了一種基于長短期記憶網(wǎng)絡(luò)模塊的編碼器-解碼器模型來預(yù)測下一個被訪問的興趣點，其中編碼器中的長短期記憶網(wǎng)絡(luò)被用來獲取簽到序列中每個簽到興趣點的隱特征，解碼器同樣利用長短期記憶網(wǎng)絡(luò)根據(jù)編碼器的結(jié)果進一步挖掘簽到興趣點特征，時間注意力機制根據(jù)編碼器輸出的歷史簽到的隱特征和解碼器計算的候選興趣點特征計算注意力權(quán)重，考慮歷史簽到與候選興趣點之間不同大小的相關(guān)性獲取更準確的候選興趣點特征進行推薦預(yù)測。不同于上述兩個工作，文獻[29]并行地使用注意力機制和長短期記憶網(wǎng)絡(luò)來共同刻畫用戶偏好的整體特征。

　　他們認為用戶簽到行為從短期來看往往呈現(xiàn)出一定的連續(xù)性和一致性，長短期記憶網(wǎng)絡(luò)適用于建模用戶簽到的序列行為以獲取用戶的短期偏好;而從長期來看，用戶的偏好在不同的情景和位置下往往具有非一致性，注意力機制可以更有效地刻畫用戶的整體長期偏好。為了刻畫出用戶偏好在一天中具體時間段的特征，文獻[19]區(qū)分了工作日和周末，并將1天根據(jù)簽到的分布密度分為12個時間窗口，他們將長短期記憶網(wǎng)絡(luò)輸出的興趣點隱特征劃分到不同時間窗口中，并利用用戶和窗口中興趣點的隱特征的相關(guān)性計算了每個時間窗口的注意力權(quán)重，這項機制的設(shè)計大幅提升了興趣點推薦的準確性。

　　2.3相關(guān)工作的不足

　　時空特征是興趣點推薦系統(tǒng)中最重要的特征之一，目前大多數(shù)關(guān)于興趣點推薦和位置預(yù)測的研究都聚焦于時空特征的提取和分析。大部分的現(xiàn)有工作側(cè)重于利用深度學(xué)習(xí)模型提取時間序列特征，盡管一些工作引入了時間影響力和時間間隔的概念，但具體的時間點特征目前還沒有能夠被充分挖掘。例如，用戶更傾向于在某些特定日期訪問某些興趣點，或某些興趣點只在某些特定的時間段可被訪問，粗粒度的時間窗口無法描述這些特征。與時間相關(guān)的用戶訪問模式如多層次的周期性和一致性特征有待進一步挖掘。

　　此外，相關(guān)工作多是對單個用戶簽到序列進行建模，盡管每個單序列中都包含了豐富的時空序列特征，但序列之間關(guān)系的挖掘和利用可以進一步提升用戶偏好預(yù)測的效果，目前該方面的研究工作較少。不同序列中由于存在某些相同或相近的興趣點可以聯(lián)合進行時空特征提取，通過多序列特征提取可以獲取更加全面的時空序列特征。

　　3內(nèi)容社交特征提取

　　除了用戶簽到數(shù)據(jù)，LBSN中還包含了大量用戶生成內(nèi)容和社交關(guān)系信息，如用戶評論、照片以及用戶之間的社交關(guān)系等，這些信息也能夠反映出用戶的偏好和興趣點的特征，在數(shù)據(jù)集中包含這些類型的輔助信息時，充分利用這些信息可以有效提升興趣點推薦的效果。根據(jù)用戶評論可以分析出用戶訪問某個興趣點時的感受和情緒，用戶上傳的照片不僅可以反映出其關(guān)注點和偏好，還可以提供更多關(guān)于興趣點的信息。此外由于這些數(shù)據(jù)都是公開可見的，它們也會影響其他用戶對該興趣點的預(yù)期，進而影響用戶選擇是否會訪問該興趣點，因此興趣點推薦時需要考慮到評論、照片等用戶生成內(nèi)容中包含的語義特征。

　　4多特征整合

　　如上所述，從LBSN中的歷史簽到、用戶生成內(nèi)容和用戶社交關(guān)系信息等數(shù)據(jù)中可以提取出豐富的特征，用戶對于興趣點的偏好受這些特征共同影響。從對象的角度分類，這些特征可以分為用戶特征、興趣點特征和外部環(huán)境特征;從影響因素的角度來看，可以分為時空特征、序列特征、內(nèi)容語義特征、社交關(guān)系特征等。傳統(tǒng)的協(xié)同過濾方法使用矩陣分解來獲取用戶和興趣點的隱特征向量，這種方法將用戶和興趣點之間的關(guān)系刻畫為隱特征之間的內(nèi)積關(guān)系，其缺陷在于其要求用戶和興趣點的隱特征具有相同的維度，限制了用戶興趣點特征提取的效果;此外，線性運算無法全面地刻畫用戶和興趣點之間的復(fù)雜關(guān)聯(lián)，難以建模多特征的共同影響。

　　神經(jīng)元中非線性激活函數(shù)的設(shè)計以及神經(jīng)元之間的網(wǎng)絡(luò)結(jié)構(gòu)使得神經(jīng)網(wǎng)絡(luò)模型可以刻畫輸入和輸出之間的復(fù)雜非線性關(guān)聯(lián)，因此可以被用于興趣點推薦中多特征整合的過程。此外，LBSN中各個實體(如用戶、興趣點等)之間存在不同類型的關(guān)系，構(gòu)建多實體關(guān)系圖并使用圖嵌入的方法可以在特征整合的過程中有效地保留不同實體之間不同關(guān)系的結(jié)構(gòu)特征。本章將歸納總結(jié)興趣點推薦相關(guān)工作中進行特征整合時使用的這兩類深度學(xué)習(xí)方法。

　　5無簽到用戶興趣點處理

　　興趣點推薦系統(tǒng)一個值得關(guān)注的特征就是其興趣點數(shù)量規(guī)模巨大，由于時間和地理位置的限制單個用戶只能訪問其中很少一部分，因此興趣點推薦系統(tǒng)存在嚴重的數(shù)據(jù)稀疏性問題。能否有效處理正樣本(歷史訪問過的興趣點)和負樣本(歷史未訪問過的興趣點)之間的數(shù)量不平衡對于用戶偏好建模的效果至關(guān)重要，一方面如何根據(jù)少量歷史訪問數(shù)據(jù)從大量未訪問過的候選興趣點中推薦用戶可能感興趣的興趣點是一項巨大挑戰(zhàn);另一方面用戶歷史未訪問過的興趣點也可以借助其自身的地理位置信息以及LBSN中的社交信息等輔助推薦。

　　近幾年，在深度學(xué)習(xí)領(lǐng)域，介于監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)之間的半監(jiān)督學(xué)習(xí)受到了廣泛關(guān)注。利用少量有標簽數(shù)據(jù)和大量無標簽數(shù)據(jù)，結(jié)合數(shù)據(jù)分布上的特征來構(gòu)建模型，可以有效提升模型的準確性，同時降低訓(xùn)練的成本，因此被廣泛運用在有標簽數(shù)據(jù)不足的場景中。在興趣點推薦系統(tǒng)中，歷史簽到數(shù)據(jù)可以被看作是有標簽的數(shù)據(jù)，而歷史未被訪問的興趣點是無標簽數(shù)據(jù)，雖然有標簽的數(shù)據(jù)量較少，但興趣點的時空特征、用戶的社交特征等分布具有一定的規(guī)律性，因此半監(jiān)督學(xué)習(xí)的思想可以被應(yīng)用在興趣點推薦任務(wù)中以緩解數(shù)據(jù)稀疏的問題。

　　6未來工作

　　根據(jù)上述分析可以發(fā)現(xiàn)，深度學(xué)習(xí)方法的應(yīng)用可以有效解決興趣點推薦系統(tǒng)中存在的挑戰(zhàn)，但目前興趣點推薦的相關(guān)工作依然存在不足，未來可以針對上述四方面相關(guān)工作的不足進行進一步地研究。此外除了本文總結(jié)的興趣點推薦的四方面挑戰(zhàn)，深度學(xué)習(xí)相關(guān)技術(shù)還可用于解決目前興趣點推薦中一些尚未得到足夠重視的問題。

　　首先，目前大多數(shù)的興趣點推薦相關(guān)工作都著力于提高推薦的準確率，而推薦方法的時空復(fù)雜度沒有得到足夠的重視。目前大多數(shù)的研究都是離線推薦，它們在已有的數(shù)據(jù)集上進行分析和預(yù)測，但實際運用這些推薦算法時，在線推薦是不可避免的。由于每秒鐘都會有大量的用戶簽到數(shù)據(jù)產(chǎn)生，歷史可用作訓(xùn)練的數(shù)據(jù)集的規(guī)模較大且增長較快，其中體現(xiàn)出的用戶偏好也會不斷變化，因此需要不斷更新模型以適應(yīng)這種偏好變化。

　　在效率和有效性之間做權(quán)衡，一種折中方案是將訓(xùn)練和推斷模型拆分為離線和在線兩部分，離線部分根據(jù)最近收集的數(shù)據(jù)定期重訓(xùn)練模型，其效率問題是可容忍的;在線部分基于最新的模型實時產(chǎn)生每個用戶的興趣點推薦結(jié)果，對效率敏感，但這種方案推薦的準確率一定程度上取決于模型更新的頻率。未來工作可以考慮利用增量學(xué)習(xí)(incrementallearning)[65]來持續(xù)對興趣點推薦的模型進行更新[66]，增量學(xué)習(xí)不斷利用新收集的數(shù)據(jù)來擴展模型知識，訓(xùn)練過程是高效且節(jié)省資源的，同時模型可以快速捕捉到用戶偏好的變化。

　　其次，冷啟動是興趣點推薦的一個經(jīng)典問題，預(yù)測新用戶或新到訪一個地區(qū)的用戶的偏好是一項挑戰(zhàn)。目前已有的興趣點推薦方法往往需要挖掘用戶的歷史數(shù)據(jù)，但在一個LBSN中關(guān)于新用戶的相關(guān)信息較少，不足以反映出他們的偏好。隨著智能手機的普及以及各類應(yīng)用數(shù)量的增加，用戶往往會使用多個社交網(wǎng)絡(luò)應(yīng)用，即一個LBSN中的新用戶很可能是其他社交網(wǎng)絡(luò)的老用戶。

　　因此可以通過“跨站鏈接(cross-sitelinking)”[67]的方式從其他網(wǎng)絡(luò)中獲取更多用戶相關(guān)數(shù)據(jù)來幫助興趣點推薦。遷移學(xué)習(xí)[68]也是一種可以被運用的技術(shù)，它根據(jù)兩個任務(wù)之間的相關(guān)性，重利用在一個任務(wù)上訓(xùn)練的模型去處理另一個任務(wù)。目前僅有很少一些工作[69-70]嘗試使用遷移模型根據(jù)本地用戶的偏好來推斷新移民或游客的偏好。未來一個LBSN可以從其他LBSN或傳統(tǒng)社交網(wǎng)絡(luò)中獲取更多反映用戶、興趣點特征以及社交關(guān)系的信息以提升興趣點推薦的效果。此外由于時空特征是興趣點推薦的一個重要影響因子，因此一些交通數(shù)據(jù)可以被用來輔助推薦。

　　第三，用戶的偏好是動態(tài)變化的，一個LBSN提供的興趣點推薦服務(wù)不是一次性的服務(wù)，興趣點推薦取決于已知的用戶偏好，但同時用戶偏好的變化也會受歷史推薦的影響�，F(xiàn)有的工作僅僅最優(yōu)化了當前一次推薦的用戶滿意度而忽視了本次推薦對未來用戶偏好的影響。

　　深度學(xué)習(xí)論文：基于深度學(xué)習(xí)算法的學(xué)術(shù)查詢意圖分類器構(gòu)建

　　強化學(xué)習(xí)[71]可以被引入興趣點推薦以建模用戶偏好的動態(tài)特征，該方法已被廣泛應(yīng)用于其他推薦系統(tǒng)如商品推薦[72]和新聞推薦中[73]，其主要思路是將推薦系統(tǒng)看作是一種追求用戶效用(即獎勵,reward)最大的策略(policy)，每次推薦根據(jù)當前狀態(tài)(state)計算出最優(yōu)的動作(action)，即推薦的興趣點，再根據(jù)該行為進行狀態(tài)轉(zhuǎn)化，最終目標是最大化用戶訪問的興趣點序列的效用之和，進而提高綜合推薦效果。

　　對于具體強化學(xué)習(xí)方法的選擇，由于用戶狀態(tài)的刻畫較復(fù)雜，狀態(tài)空間較大，因此推薦系統(tǒng)中一般使用是深度強化學(xué)習(xí)模型，在文獻[72]和[73]中均采用了基于值函數(shù)的DeepQ-Learning(DQN)[74]的算法。由于候選興趣點數(shù)量較大，動作空間也較大，在未來興趣點推薦的研究中也可嘗試使用基于策略梯度的深度強化學(xué)習(xí)算法，如DDPG算法[75]。

　　作者：湯佳欣1,2，陳陽1,2，周孟瑩1,2，王新1,2