本文摘要:摘要:信用評分模型的構(gòu)建及應(yīng)用實(shí)施是學(xué)術(shù)界及工業(yè)界不斷研究創(chuàng)新的重要課題。從機(jī)器學(xué)習(xí)模型的構(gòu)建出發(fā),從建模指標(biāo)、模型構(gòu)建、模型上線后預(yù)期表現(xiàn)幾個角度說明了模型應(yīng)用策略。在建模指標(biāo)處理方面,采用原始變量woe變換作為XGBoost等模型的輸入變量,并驗(yàn)證了模型效果
摘要:信用評分模型的構(gòu)建及應(yīng)用實(shí)施是學(xué)術(shù)界及工業(yè)界不斷研究創(chuàng)新的重要課題。從機(jī)器學(xué)習(xí)模型的構(gòu)建出發(fā),從建模指標(biāo)、模型構(gòu)建、模型上線后預(yù)期表現(xiàn)幾個角度說明了模型應(yīng)用策略。在建模指標(biāo)處理方面,采用原始變量woe變換作為XGBoost等模型的輸入變量,并驗(yàn)證了模型效果提升;在模型構(gòu)建上,創(chuàng)新采用多種算法單獨(dú)建模,用XGBoost算法擬合各單模型輸出結(jié)果,證明復(fù)合模型效果有明顯提升;在模型上線后預(yù)期表現(xiàn)方面,提出了確定模型切分點(diǎn)的方法,即從授信額度、風(fēng)險級別以及群體分布三個維度,預(yù)測即將進(jìn)件群體的壞賬率。本研究最后結(jié)合模型表現(xiàn)及業(yè)務(wù)模式給出實(shí)施建議,即對于部署難度高的復(fù)合模型可采用預(yù)授信的模式,而LR評分卡模型部署可延用申請-授信的模式。
關(guān)鍵詞:信用評分;風(fēng)控模型;XGBoost;機(jī)器學(xué)習(xí);模型應(yīng)用策略
近6年來,隨著電商平臺的迅猛發(fā)展,消費(fèi)金融產(chǎn)品層出不窮。這些產(chǎn)品依托電商平臺的天然流量優(yōu)勢迅猛發(fā)展,從商城內(nèi)擴(kuò)展到商城外,不斷拓展使用場景搶占市場。在版圖的不斷擴(kuò)張中,信貸審批模型、模型在具體商業(yè)模式中的應(yīng)用也隨著用戶流量的擴(kuò)張、業(yè)務(wù)場景的拓展不斷更新迭代[1]。
電商論文范例:佛山傳統(tǒng)制造業(yè)發(fā)展跨境電商策略研究
目前,在信貸審批模型中,算法LogisticRegression(簡稱LR)依然是最為普及的,在一些特定的用戶群體和場景下依然有難以替代的地位,依據(jù)該算法建立的評分模型規(guī)則簡單、邏輯清晰、解釋性強(qiáng),便于用戶理解。然而,LR模型并不能保證在各種場景、用戶群體中都有良好表現(xiàn)。比如從模型穩(wěn)定性考慮,LR模型用到的變量維度一般不超過15個,在整體自變量與因變量相關(guān)性都不高的情況下,有限的變量數(shù)量難以達(dá)到較好的模型表現(xiàn)。模型表現(xiàn)不夠理想直接影響到通過率及日后壞賬風(fēng)險,會對商城信貸收益產(chǎn)生直接影響。
在本研究項(xiàng)目中,商城平臺主要信貸模型算法采用的就是LR模型,當(dāng)前LR模型的應(yīng)用在風(fēng)控能力及通過率表現(xiàn)方面能基本達(dá)成一個平衡,但客戶仍然希望嘗試新的模型算法,通過提升模型效果達(dá)到保證壞賬率不增長的前提下提高模型通過率的目的;此外,客戶尤其強(qiáng)調(diào)好的模型需要應(yīng)用于生產(chǎn)線產(chǎn)生實(shí)際效益,若一個模型太過復(fù)雜導(dǎo)致部署周期長、出錯率高而難以實(shí)施也是沒有意義的。
根據(jù)用戶的上述2個要求,項(xiàng)目組從模型構(gòu)建出發(fā),提出確定模型切分點(diǎn)預(yù)測壞賬率的方法,并針對平臺實(shí)際不同業(yè)務(wù)場景及業(yè)務(wù)要求確立模型應(yīng)用的方法。首先,在信貸風(fēng)控模型構(gòu)建上,筆者參考了如下學(xué)者提出的方法并將該方法應(yīng)用在商城平臺上,再根據(jù)平臺數(shù)據(jù)特點(diǎn)以及模型表現(xiàn)作數(shù)據(jù)特征提取及模型算法的改善。近年來,信貸風(fēng)控領(lǐng)域較受青睞的分類算法模型包括DecisionTree(決策樹)[2]、SVM(支持向量機(jī))[3-4]、RandomForest(隨機(jī)森林)、GBDT(梯度提升決策樹)、XGBoost(極度梯度提升算法)、神經(jīng)網(wǎng)絡(luò)算法(NeuralNetworks)[5-7]等。2014年,蕭超武等在實(shí)證分析中將隨機(jī)森林組合分類算法與KNN、SVM等單分類器模型以及組合模型GBDT比較,發(fā)現(xiàn)前者具有更高的精確度及穩(wěn)定性[8]。
2017年,Bequé將神經(jīng)網(wǎng)絡(luò)極限學(xué)習(xí)算法(ELM)用于消費(fèi)信貸風(fēng)險管理,通過實(shí)驗(yàn)發(fā)現(xiàn)該算法有計算量小、精準(zhǔn)度高的特點(diǎn)[9]。2017年,LuoCuicui采用LR、SVM、深度信念網(wǎng)絡(luò)(DBN)算法進(jìn)行信貸違約預(yù)測,發(fā)現(xiàn)DBN具有最好的預(yù)測效果[10]。2019年,陳秋華等探討了不同連接函數(shù)下廣義線性模型的分類問題,將線性模型評價指標(biāo)與RF、SVM、XGBoost等模型進(jìn)行分析比對,發(fā)現(xiàn)廣義線性模型中LR模型與SVM預(yù)測效果最佳[11]。2019年,黃志剛等人提出多源數(shù)據(jù)普適模型棧的概念,通過數(shù)據(jù)分類的自由選擇采用XGBoost算法生成子評分模型,再將子評分模型轉(zhuǎn)換為評分卡,通過實(shí)測證實(shí)有效[12]。
在參考上述學(xué)者選用的算法并結(jié)合商城平臺數(shù)據(jù)特點(diǎn),本文最終選用了LR算法、決策樹算法、XGBoost算法建立單模型。在LR模型變量交互方面,參比陳秋華[11]提出的變量相乘的交互方式,本文提出了用相關(guān)系數(shù)法尋找交互變量的方法,并驗(yàn)證了該方法的有效性。受黃志剛[12]多源數(shù)據(jù)普適模型棧的想法啟發(fā),借用不同數(shù)據(jù)特點(diǎn)采用不同模型算法最后用XGBoost模型整合的思路,本文采取首先用多種算法建立單模型,再用各單模型的結(jié)果輸出作為復(fù)合模型的輸入建立復(fù)合模型的方法,經(jīng)驗(yàn)證,復(fù)合模型效果較單模型有明顯提升。
雖然學(xué)術(shù)界對風(fēng)控模型算法的討論十分熱烈,然而對于客戶提出的第二點(diǎn)要求,模型在生產(chǎn)線上的實(shí)際應(yīng)用方面卻略顯單薄。本文花了大量篇幅討論模型的應(yīng)用問題。首先,傳統(tǒng)LR模型、復(fù)雜機(jī)器學(xué)習(xí)模型在實(shí)際部署應(yīng)用方面各有優(yōu)劣:LR模型部署通常借用風(fēng)控決策引擎[13]來完成,優(yōu)勢為部署門檻低、部署時間短、結(jié)果可靠性強(qiáng),但模型效果不及復(fù)雜機(jī)器學(xué)習(xí)模型;而復(fù)雜機(jī)器學(xué)習(xí)模型雖在模型效果上更有優(yōu)勢,但在部署方面,由于受模型復(fù)雜程度、數(shù)據(jù)量級、部署場景、上線時間緊迫等因素制約,不是都能滿足工程上的要求成功上線。
所以,目前工業(yè)界在風(fēng)控模型部署上,LR仍是主流[14],復(fù)雜機(jī)器學(xué)習(xí)模型部署還在不斷嘗試發(fā)展中,不同體量的電商平臺復(fù)雜機(jī)器學(xué)習(xí)模型實(shí)施的普及程度也不一樣。對于本項(xiàng)目,商城平臺剛開始嘗試復(fù)雜機(jī)器學(xué)習(xí)模型的部署,文章給出了兩者并舉的保守方案。本文首先提出風(fēng)控模型在應(yīng)用實(shí)施中不同切分點(diǎn)對應(yīng)的預(yù)測壞賬率,然后比較并驗(yàn)證了在相同風(fēng)險前提下LR模型與XGBoost復(fù)合模型實(shí)際通過率差異,并結(jié)合具體業(yè)務(wù)模式及業(yè)務(wù)需求給出模型選擇的依據(jù)及部署方式。
一、模型效果指標(biāo)評價
模型評價指標(biāo)是用來評估模型對數(shù)據(jù)的擬合能力,二元分類的模型算法有很多,但無論是哪種模型算法都可以使用AUC[15]和KS這兩個指標(biāo)來衡量。AUC的取值為0.5~1,AUC值越高代表該算法對模型整體擬合能力越強(qiáng),AUC等于0.5代表模型沒有區(qū)辨能力,但大于0.9則模型擬合過于完美考慮異常,AUC在0.7~0.9之間的模型被視為可用。AUC在0.7與0.8之間代表模型有較好的區(qū)辨能力;AUC大于0.8代表模型有非常好的擬合能力。
二、建模實(shí)證分析
(一)建模數(shù)據(jù)構(gòu)成及變量預(yù)處理
目前,該平臺信貸產(chǎn)品申請用戶為在平臺商城近1年內(nèi)有過歷史交易記錄的用戶,該產(chǎn)品運(yùn)營已超過1年,有充足的壞用戶積累。建模用戶群體,我們選擇授信前1年內(nèi)在平臺商城內(nèi)有較為活躍表現(xiàn)的用戶,授信后6~12個月內(nèi)出賬次數(shù)大于等于6的用戶確立建模樣本。y定義方面,通過分析逾期天數(shù)與回款率關(guān)系,以及通過逾期用戶M1~M4壞賬滾動率分析后確定的[16]。
相同樣本,不同y定義,最終AUC和KS模型評價指標(biāo)會有較大差異。通常y定義越嚴(yán)格,模型指標(biāo)AUC及KS表現(xiàn)越好,比如把進(jìn)入M4的用戶定義為壞用戶比把進(jìn)入M2的用戶定義為壞用戶有更好的模型表現(xiàn)。然而,考慮到該評分卡是建立申請用戶審批模型,目的不是把最壞的用戶排除,而是把有可能進(jìn)入M3或M4的用戶攔截在外。所以,y用戶定義采用進(jìn)入M2或M3的用戶,但由于M3用戶數(shù)量有限,所以把多次進(jìn)入M2的用戶列為壞用戶。經(jīng)過多次嘗試,得到y(tǒng)定義為至少有2次出賬且2次出賬的逾期天數(shù)均大于30天(進(jìn)入M2)的用戶為壞用戶,其余為好用戶。X變量共126個,為用戶申請消費(fèi)貸前平臺商城的歷史行為數(shù)據(jù)。從分類來看,可將X變量分為用戶基本信息、用戶申請渠道、用戶信用資質(zhì)、平臺活躍度、平臺交易信息、收貨方式、收貨人(地址)信息等類別。數(shù)據(jù)樣本共11180個觀測值,其中壞用戶為1118個,odds比9∶1。
采用分層抽樣的方式將數(shù)據(jù)切分為7∶3兩部分,前者用作模型訓(xùn)練及驗(yàn)證,后者用于模型測試。在數(shù)據(jù)預(yù)處理環(huán)節(jié),對每個X變量作單變量分析,進(jìn)行變量一致性、完整性、準(zhǔn)確性檢驗(yàn),剔除變量缺失率高于20%的變量;對變量進(jìn)行woe轉(zhuǎn)換并計算其iv值,預(yù)測每個自變量x與因變量y的相關(guān)程度。在作變量woe轉(zhuǎn)換時,對自變量排序后切分為10等分進(jìn)行粗分箱,然后對變量分箱進(jìn)行合并,合并時確保變量woe值為單調(diào)趨勢,各分箱觀測值數(shù)量不低于25個,且相鄰分箱的woe值有較大差異。
(二)LogisticRegression單模型
篩選出iv值大于0.1的經(jīng)過woe轉(zhuǎn)換的自變量作為模型輸入變量,采用stepwise逐步回歸法篩選變量,模型置信度設(shè)為95%,y變量共2個取值,“0”代表好用戶,“1”代表壞用戶,以“0”為目標(biāo)構(gòu)建模型。在模型變量調(diào)整上,通過計算自變量的相關(guān)性,使相關(guān)性較大的變量組合盡可能避免同時出現(xiàn)在模型中。根據(jù)模型輸出結(jié)果,刪除變量系數(shù)為正或者系數(shù)過小的變量,以減小共線性對模型效果的影響。
檢查進(jìn)入模型的x變量分類,確保模型盡可能覆蓋到每個分類。檢查模型評分確保評分均勻分布。當(dāng)出現(xiàn)超過樣本量5%的觀測值對應(yīng)同一個評分時,找到是哪個變量造成的,用別的變量加以替換。最后確認(rèn)模型,入模變量及模型參數(shù),模型變量分別為收貨人數(shù)量、近12個月的貨到付款次數(shù)、近3個月的貨到付款次數(shù)、近12個月拒收次數(shù)、近12個月每個月都有交易的月份數(shù)、近3個月交易金額、近3個月信用卡支付金額、近3個月借記卡支付次數(shù)、近3個月使用app登錄平臺次數(shù)、用戶婚姻狀況、用戶性別以及用戶進(jìn)件渠道。
1.LR變量交互。
在不改變?nèi)肽W兞繑?shù)量的前提下,將入模變量與待選變量做交互,以達(dá)到提升模型整體效果的目的。通常待選變量iv值過小難以進(jìn)入模型,但待選變量與模型變量涵蓋信息不同,且與之交互的模型變量相關(guān)性低。為尋找待選變量,采用對需要交互的兩變量計算Pearson相關(guān)系數(shù)的辦法,最后發(fā)現(xiàn)兩組可以通過變量交互提升模型的變量。第一組,“授信渠道”、“商城卡包提取標(biāo)志”進(jìn)行變量交互替代原模型中“授信渠道”變量;第二組,“婚姻狀況”、“客單價”進(jìn)行變量交互替代原模型中“客單價”變量;交互后模型效果提升,可以看出交互前后AUC沒有顯著提升,但模型KS值約有6‰的提升。
2.決策樹單模型。
在決策樹模型構(gòu)建過程中使用了兩種葉節(jié)點(diǎn)分裂的算法,一個是熵分裂標(biāo)準(zhǔn),另一個是Kolmogorov-Smirnov(FastCHAID)分裂標(biāo)準(zhǔn),剪枝過程中均采用誤判率、最小葉子數(shù)作為剪枝標(biāo)準(zhǔn)[17-18]。兩模型輸入變量前者是原始變量,后者為經(jīng)過woe轉(zhuǎn)換后的變量。本模型采用SASPROCHPSPLIT完成,通過對leafsize(葉節(jié)點(diǎn)最小觀測數(shù))、最小葉子數(shù)量、maxdepth(最大樹深)、maxbranch(最大分枝數(shù))參數(shù)調(diào)整完成決策樹的構(gòu)建。對每片葉子目標(biāo)變量預(yù)測概率排序,通過計算每個概率分箱中累計好壞用戶的占比,得到AUC及KS值。
三、模型選擇及部署實(shí)施探索
(一)風(fēng)險評估
評分模型在風(fēng)控策略中有兩個重要作用:一個是確立拒絕分?jǐn)?shù)線,即小于某一預(yù)測概率(評分)的用戶拒絕授信;另一個是根據(jù)預(yù)測概率(評分)劃分風(fēng)險等級、確定授信額度。評分模型設(shè)立的目的是為了讓壞賬率在可控范圍內(nèi),那如何利用評分模型預(yù)測進(jìn)件用戶的壞賬率便成了關(guān)鍵。電商平臺消費(fèi)貸產(chǎn)品通常是分期的,根據(jù)消費(fèi)貸產(chǎn)品設(shè)計,若用戶在某一期還款截止日10天內(nèi)未還清賬款,賬戶自動凍結(jié)。賬款催收方面,逾期90天以內(nèi)的賬款由平臺內(nèi)部催收部門催收,逾期超過90天(進(jìn)入M4)的賬戶因賬款難以回收,故采用外包形式,催回金額與外包公司按比例分成。
所以這里我們把進(jìn)入M4(逾期天數(shù)>90天)的用戶記為壞賬用戶,未還清金額(包括已出賬、未出賬)記為壞賬余額,表現(xiàn)時長取1年。由于使用余額、壞賬余額是一個動態(tài)平衡的過程,這里選取時點(diǎn)數(shù)據(jù)來定義,以賬戶成功授信之日起1年為時間節(jié)點(diǎn),壞賬率定義為壞賬余額與使用余額之比。在作風(fēng)險評估方面,需要用到2個群體:已授信群體和即將進(jìn)件群體。已授信群體定義為成功授信且表現(xiàn)期滿1年的用戶;即將進(jìn)件群體定義為近一個月內(nèi)申請授信的用戶。
(二)通過率評估
通過率評估是將評分模型應(yīng)用到當(dāng)前進(jìn)件用戶模擬進(jìn)件用戶通過率的方式。通常業(yè)務(wù)部門與風(fēng)控部門為通過率博弈,業(yè)務(wù)部門要求更高的通過率,風(fēng)控部門則通過模型優(yōu)化在保證風(fēng)險的前提下提高通過率,但模型評價指標(biāo)越好并不意味著使用該模型就一定有更高的通過率。
本文采用傳統(tǒng)LR單模型、XGBoost復(fù)合模型進(jìn)件通過率的模擬驗(yàn)證以上觀點(diǎn)。設(shè)計思路為上述兩模型應(yīng)用于102787名即將進(jìn)件用戶群體,并計算其預(yù)測概率。分別對兩模型預(yù)測概率進(jìn)行從小到大排序,每一個預(yù)測概率對應(yīng)與風(fēng)控模型中累計壞用戶數(shù)對應(yīng),而預(yù)測概率在該進(jìn)件用戶群體的分位數(shù)即為拒絕率,進(jìn)而計算得到進(jìn)件群體的通過率。本文通過作圖的方法比較LR模型與XGBoost復(fù)合模型相同風(fēng)控效果對應(yīng)的通過率。以累計壞用戶數(shù)作為橫軸,進(jìn)件用戶通過率(1-拒絕率)作為縱軸,分別對兩模型作散點(diǎn)圖。
從中可以看出兩模型頭尾幾乎是重合的,只在中間段看出差異。通過計算得到在“抓壞人”能力相同條件下,兩模型通過率最大差異為7.9%,對應(yīng)的LR模型和XGBoost復(fù)合模型通過率分別為44.8%和52.74%;若業(yè)務(wù)部門要求75%以上的通過率(假設(shè)容差為2%),且風(fēng)險在可以接受范圍內(nèi),兩模型則在風(fēng)險能力控制和通過率上幾乎沒有差別。
四、結(jié)語
本文通過真實(shí)數(shù)據(jù)從多個維度非常詳實(shí)地分析了從模型構(gòu)建到模型應(yīng)用實(shí)施全過程。模型特征工程方面,相比陳秋華[11]提出的自變量交互對模型指標(biāo)效果的提升,本文進(jìn)一步提出用相關(guān)系數(shù)法尋找交互變量的方法;在特征變量構(gòu)建上,創(chuàng)新采用對原變量進(jìn)行woe轉(zhuǎn)換的方式創(chuàng)建衍生變量。經(jīng)驗(yàn)證,該方法對于模型效果指標(biāo)的提升是有效的。
對于XGBoost模型,此方式相當(dāng)于將分類變量轉(zhuǎn)換為可以計算的定距變量,解決了XGBoost模型矩陣不能處理字符型變量的問題,也避免了分類變量轉(zhuǎn)化為虛擬變量的麻煩。在復(fù)合模型變量構(gòu)建方面,跳出通過原變量加減乘除的方式進(jìn)行變量衍生的圈子,將LR單模型的woe變量連同決策樹、XGBoost單模型的輸出結(jié)果(概率&評分)作為輸入變量,并使用XGBoost進(jìn)行擬合,經(jīng)驗(yàn)證,復(fù)合模型評價指標(biāo)優(yōu)于各單模型。
本文創(chuàng)新之處在于不只對模型評價指標(biāo)進(jìn)行比較,更從模型應(yīng)用實(shí)施角度提出了模型拒絕分?jǐn)?shù)線(切分點(diǎn))的確定方法[21]。該方法首先采用模型各分段壞賬率對模型進(jìn)行風(fēng)險等級劃分,并通過風(fēng)險等級與授信額度交叉的方法模擬各單元格內(nèi)壞賬率分布構(gòu)成,并將模型運(yùn)用于新進(jìn)件的用戶,預(yù)測進(jìn)件用戶預(yù)期壞賬率,以此確定拒絕用戶切分點(diǎn)。不僅如此,本文用模型表現(xiàn)與通過率之間的關(guān)系闡述了模型選用標(biāo)準(zhǔn)。以LR單模型、XGBoost復(fù)合模型為例,用數(shù)據(jù)驗(yàn)證了在“抓壞人”能力相同的條件下兩模型通過率的大小及差異。
并從通過率差異、業(yè)務(wù)部門通過率最低要求、模型部署實(shí)施難度及商城現(xiàn)有的業(yè)務(wù)模式進(jìn)行綜合分析,給出模型選用建議[22]。在建議實(shí)施方面,對于選用難以部署的復(fù)合模型,建議采用預(yù)授信的模式。將模型應(yīng)用在新進(jìn)件用戶群體上,篩選出通過用戶,并用彈框或短信等方式通知,讓用戶選擇是否開通。與現(xiàn)有的申請-授信模式相比,此種方式在確保風(fēng)險的同時,擴(kuò)大了人群覆蓋面,提升了總體進(jìn)件人數(shù),繞開了模型部署實(shí)施難的障礙。
[參考文獻(xiàn)]
[1]何飛,張兵.互聯(lián)網(wǎng)金融的發(fā)展:大數(shù)據(jù)驅(qū)動與模式衍變[J].財經(jīng)科學(xué),2016,23(6):12-22.
[2]涂艷,王翔宇.基于機(jī)器學(xué)習(xí)的P2P網(wǎng)絡(luò)借貸違約風(fēng)險預(yù)警研究:來自“拍拍貸”的借貸交易證據(jù)[J].統(tǒng)計與信息論壇,2018,33(6):69-76.
[3]BaesensB,VanGestelT,ViaeneS,StepanovaM.Benchmarkingstate-of-the-artclassificationalgorithmsforcreditscoring[J].JournaloftheOperationalResearchSociety,2003,54(6):627-635.
[4]晏艷陽,蔣恒波.信用評分模型應(yīng)用比較研究:基于個體工商戶數(shù)據(jù)的檢驗(yàn)[J].統(tǒng)計與信息論壇,2010,25(5):30-35.
[5]石慶炎,勒云匯.多種個人信用評分模型在中國度用的比較研究[J].統(tǒng)計研究,2004,21(6):43-47.
[6]陳為民,馬超群,馮廣波.基于KMOD核函數(shù)的SVM方法在信用評分中的應(yīng)用[J].經(jīng)濟(jì)數(shù)學(xué),2008(1):24-27.
作者:汪曉曦1,馬穎2
轉(zhuǎn)載請注明來自發(fā)表學(xué)術(shù)論文網(wǎng):http:///jjlw/28901.html