本文摘要:隨著我國(guó)電子商務(wù)行業(yè)發(fā)展腳步的不斷加快,對(duì)客戶信用的評(píng)估也引起了企業(yè)的高度重視,其不僅關(guān)系著電子商務(wù)活動(dòng)的順利開(kāi)展,而且對(duì)企業(yè)可持續(xù)發(fā)展目標(biāo)的實(shí)現(xiàn)也具有重要意義。從本文的分析我們能夠看出,基于支持向量機(jī)集成的電子商務(wù)環(huán)境下客戶信用的評(píng)估模
隨著我國(guó)電子商務(wù)行業(yè)發(fā)展腳步的不斷加快,對(duì)客戶信用的評(píng)估也引起了企業(yè)的高度重視,其不僅關(guān)系著電子商務(wù)活動(dòng)的順利開(kāi)展,而且對(duì)企業(yè)可持續(xù)發(fā)展目標(biāo)的實(shí)現(xiàn)也具有重要意義。從本文的分析我們能夠看出,基于支持向量機(jī)集成的電子商務(wù)環(huán)境下客戶信用的評(píng)估模型,不僅簡(jiǎn)單有效,而且具有更好的泛化能力,能夠?qū)⒖蛻舻男庞谜鎸?shí)的反映出來(lái),為電子商務(wù)活動(dòng)的開(kāi)展提供參考。
《電子商務(wù)世界》由機(jī)械工業(yè)信息研究院、電腦報(bào)集團(tuán)聯(lián)合主辦。定位于制造、高科技、商業(yè)流通和物流等重點(diǎn)行業(yè)的信息化建設(shè)及電子商務(wù)應(yīng)用,為企業(yè)從軟件到硬件實(shí)施信息化建設(shè)提供全方位、多角度的參考。電子商務(wù)作為一種新生事物,無(wú)論是技術(shù)還是管理,都有太多東西需要我們學(xué)習(xí)和糾正!峨娮由虅(wù)世界》伴隨商界發(fā)展,總結(jié)得失與成敗。
在電子商務(wù)飛速發(fā)展的今天,參與到電子商務(wù)活動(dòng)中的人也越來(lái)越多。為了能夠給電子商務(wù)活動(dòng)的開(kāi)展?fàn)I造一個(gè)良好的氛圍,國(guó)家相關(guān)部門對(duì)與電子商務(wù)相關(guān)的配套設(shè)施和法律法規(guī)等進(jìn)行了不斷優(yōu)化與完善,但由于執(zhí)行力度不夠,從而導(dǎo)致仍有很多問(wèn)題制約了電子商務(wù)的發(fā)展,信用問(wèn)題就是其中最主要的一項(xiàng)。通過(guò)對(duì)基于支持向量機(jī)集成的電子商務(wù)環(huán)境下客戶信用評(píng)估模型的研究,可以為日后電子商務(wù)客戶信用的評(píng)價(jià)工作提供一定的參考依據(jù),進(jìn)而更好的促進(jìn)我國(guó)電子商務(wù)行業(yè)的可持續(xù)發(fā)展。
1 基于模糊積分支持向量機(jī)集成
1.1 Bagging個(gè)體生成
Bagging個(gè)體生成主要是以可重復(fù)采樣為基礎(chǔ),對(duì)訓(xùn)練集的選取通常是在原始訓(xùn)練集中隨機(jī)抽取產(chǎn)生的,訓(xùn)練集的規(guī)模與原始訓(xùn)練集相當(dāng),訓(xùn)練集允許重復(fù)選取。這樣一來(lái),同一示例就會(huì)在不同的訓(xùn)練集中出現(xiàn),同樣也會(huì)有一部分示例沒(méi)有出現(xiàn)的情況。隨著訓(xùn)練集選取內(nèi)容的不斷增加,Bagging分類器集成的差異度也會(huì)隨之增加,從而促進(jìn)了泛化能力的進(jìn)一步提升。
1.2 基于模糊積分的結(jié)論生成
模糊積分基本理論是基于支持向量機(jī)集成的客戶信用評(píng)價(jià)模型的基本理論。所謂模糊積分理論,主要指的是設(shè)X為一有限集合,若集合函數(shù)g:2X→[0,1]滿足g(X)=1、g(A)≤g(B),那么我們便將g視為一個(gè)模糊測(cè)度。如果g在滿足上述條件的基礎(chǔ)上,還滿足等式g(AUB)=g(A)+g(B)+λg(A)g(B),那么我們就將其稱為測(cè)度或Sugeno,記為gλ。在模糊積分理論下,對(duì)模糊積分的計(jì)算,首先需要明確模糊密度。通常情況下,模糊密度的產(chǎn)生是由專家設(shè)定的,也可以通過(guò)訓(xùn)練數(shù)據(jù)產(chǎn)生。
2 模糊密度確定方法
通過(guò)模糊積分理論的介紹我們能夠看出,在基于模糊積分的多分類集成中,對(duì)于各個(gè)子支持向量分類器重要性的模糊密度值的確定是非常重要的。鑒于此,本文采用混淆矩陣的方法來(lái)對(duì)評(píng)估模型中所涉及的模糊密度值進(jìn)行確定,用子分類器各自的訓(xùn)練集對(duì)各個(gè)子分類器進(jìn)行測(cè)試,進(jìn)而得到與之相對(duì)應(yīng)的混淆矩陣。比如說(shuō)一個(gè)K類分類問(wèn)題,對(duì)于子分類器SVCK,其混淆矩陣可以定位為,該矩陣的有效利用可以將順利獲取到各個(gè)支持向量機(jī)的模糊密度,為利用模糊積分進(jìn)行支持向量機(jī)集成奠定了堅(jiān)實(shí)的基礎(chǔ)。
3 實(shí)證分析
3.1 支持向量機(jī)集成過(guò)程
本次實(shí)驗(yàn)是在Libsvm軟件上進(jìn)行的,驗(yàn)證平臺(tái)和操作系統(tǒng)分別是256MB內(nèi)存在AMD Athlon 1800+和Windows 2000。具體實(shí)驗(yàn)過(guò)程共分為6個(gè)步驟:(1)通過(guò)Bagging方法的應(yīng)用,選取支持向量分類器的訓(xùn)練集,并對(duì)其進(jìn)行相應(yīng)的訓(xùn)練;(2)根據(jù)各分類器的訓(xùn)練結(jié)果輸出模型;(3)采取上文介紹的方法對(duì)模糊密度進(jìn)行確定;(4)當(dāng)給定一個(gè)測(cè)試樣本,得到各子支持向量分類器對(duì)該測(cè)試樣本的類概率輸出;(5)根據(jù)計(jì)算模糊積分,集成各子支持向量機(jī);(6)確定測(cè)試樣本的最終類別。通過(guò)上述6個(gè)步驟的合理操作,便可以實(shí)現(xiàn)支持向量機(jī)的有效集成。
3.2 樣本數(shù)據(jù)的選擇處理
本文所選取的是某電子商務(wù)公司400家客戶的數(shù)據(jù)資料,其中322家客戶的數(shù)據(jù)資料結(jié)果顯示為“狀態(tài)良好”,剩下的78家客戶的信用狀況則相對(duì)較差,很容易出現(xiàn)違約現(xiàn)象。由于這兩類客戶的數(shù)據(jù)資料存在很大差距,如果直接將其用于SVM的學(xué)習(xí),那么勢(shì)必會(huì)降低最優(yōu)分類面的準(zhǔn)確性。如果將其應(yīng)用到未來(lái)的預(yù)測(cè)工作中,必將帶來(lái)較大誤差。鑒于此,為了能夠進(jìn)一步確保樣本數(shù)據(jù)處理的有效性,對(duì)樣本數(shù)據(jù)進(jìn)行預(yù)處理是非常重要的。本次實(shí)驗(yàn)中所采取的預(yù)處理方法主要是在322家狀態(tài)良好的客戶中抽取80家,與78家信用狀態(tài)差的客戶構(gòu)成一個(gè)規(guī)模為158家客戶的樣本集,并在此基礎(chǔ)上將該樣本集分為訓(xùn)練樣本集和測(cè)試樣本集兩個(gè)部分。此外,為了更好的將SVMs的泛化能力充分體現(xiàn)出來(lái),在確保兩類樣本數(shù)量相近的前提下,隨機(jī)抽取一部分作為訓(xùn)練樣本集,剩下的一部分則用于檢驗(yàn)?zāi)P偷姆夯芰Α?/p>
3.3 實(shí)證結(jié)果分析
本次實(shí)驗(yàn)在多類別分類方面采用的是一對(duì)一策略,在158個(gè)訓(xùn)練集上訓(xùn)練出5個(gè)SVMs。各子支持向量分類器使用RBF核函數(shù),每個(gè)SVM通過(guò)10重交叉驗(yàn)證的方法來(lái)選擇相應(yīng)的參數(shù),進(jìn)行了10次實(shí)驗(yàn)。表1給出的是訓(xùn)練樣本精度,從表1中我們能夠看出,應(yīng)用該模型可以對(duì)客戶信用進(jìn)行分類,并可以達(dá)到最佳的精度。由此可見(jiàn),與傳統(tǒng)的客戶信用評(píng)價(jià)方法相比,基于支持向量機(jī)集成的電子商務(wù)環(huán)境下的客戶信用評(píng)估模型具有更好的泛化能力,同時(shí)應(yīng)用起來(lái)簡(jiǎn)單有效?梢灶A(yù)見(jiàn),在未來(lái)的時(shí)間里,該評(píng)估模型在電子商務(wù)行業(yè)的發(fā)展中,勢(shì)必會(huì)得到更加廣泛的應(yīng)用。
轉(zhuǎn)載請(qǐng)注明來(lái)自發(fā)表學(xué)術(shù)論文網(wǎng):http:///jjlw/10168.html