上次,番茄風(fēng)控第61節(jié)的星球課堂:風(fēng)控人必知的風(fēng)控知識—《遷徙率預(yù)估》,課程中跟各位童鞋繼續(xù)介紹了遷徙率(滾動率)和時間序列相關(guān)內(nèi)容。有不少童鞋對相關(guān)的內(nèi)容似乎還不是特別
上次,番茄風(fēng)控第61節(jié)的星球課堂:風(fēng)控人必知的風(fēng)控知識—《遷徙率預(yù)估》,課程中跟各位童鞋繼續(xù)介紹了遷徙率(滾動率)和時間序列相關(guān)內(nèi)容。
有不少童鞋對相關(guān)的內(nèi)容似乎還不是特別了解,今天再跟大家稍微講解遷徙率與時間序列如何做壞賬預(yù)估。
一.遷徙率
1.1.遷徙率預(yù)估具體實操
遷徙率預(yù)估一個重要的步驟就是獲取到每個階段的資產(chǎn)金額分布:
編輯切換為居中
添加圖片注釋,不超過 140 字(可選)
有了這個階段的資產(chǎn)便可以計算每個階段的遷徙率,對應(yīng)的數(shù)據(jù)如下:
編輯切換為居中
添加圖片注釋,不超過 140 字(可選)
有了以上數(shù)據(jù),可以通過計算平均的遷徙率:
編輯切換為居中
添加圖片注釋,不超過 140 字(可選)
再通過這個平均遷徙率,就可以看到每個階段的遷徙率數(shù)據(jù):
編輯
添加圖片注釋,不超過 140 字(可選)
通過以上的每個階段的遷徙率,就能得到整體的階段遷徙率預(yù)估,如M0的遷徙率其計算方式是采用:連乘的方式進(jìn)行,轉(zhuǎn)化為具體算式就是:=M0*P1*P2*P3*P4*P5*P6
其中P1~P6為以上所對應(yīng)的遷徙率預(yù)估數(shù)據(jù):
編輯
添加圖片注釋,不超過 140 字(可選)
1.2.建模中的遷徙率分析
遷徙率分析(RollRateAnalysis),是信貸風(fēng)險管理資產(chǎn)質(zhì)量分析中的重要概念,是指從某個觀察點之前的一段時間(觀察期)的最壞狀態(tài),向觀察點之后一段時間(表 現(xiàn)期)的最壞狀態(tài)的發(fā)展變化情況。
編輯切換為居中
添加圖片注釋,不超過 140 字(可選)
遷徙率分析的具體過程如下:
1、明確數(shù)據(jù)來源,“客戶還款計劃表(CustomerRepaymentSchedule)”較為 常見(具體表名不同業(yè)務(wù)方可能有區(qū)別);2、選定觀察時點,觀察點往前推m個月定義為觀察期,觀察點往后推n個月定 義為表現(xiàn)期(觀察期與表現(xiàn)期時長根據(jù)產(chǎn)品特征定義);
3、提取分析樣本,對于選定的樣本用戶,需要限定其放款日期在觀察期前,最后一期還款日期在表現(xiàn)期后(這樣保證樣本用戶的分析時間周期一致);
4、統(tǒng)計觀察期逾期狀態(tài),以觀察點為截止時點,統(tǒng)計客戶在觀察期(觀察點前m 個月)的最長逾期期數(shù),以對應(yīng)最壞逾期狀態(tài),如C、M1、M2、M3+等(C表示當(dāng) 前未逾期,M1表示逾期1-30天,M2表示逾期31-60天,M3+表示逾期61天及以上);
5、統(tǒng)計表現(xiàn)期逾期狀態(tài),以觀察點為起始時點,統(tǒng)計客戶在表現(xiàn)期(觀察點后n個月)的最長逾期期數(shù),以對應(yīng)最壞逾期狀態(tài),如C、M1、M2、M3+等;
6、構(gòu)建逾期情況矩陣,以觀察期的逾期情況和表現(xiàn)期的逾期情況進(jìn)行交叉統(tǒng)計, 依次形成樣本數(shù)量矩陣表、樣本占比矩陣表(即遷徙率分析表);
7、分析遷徙率數(shù)據(jù)表,根據(jù)不同狀態(tài)的變化率情況大小,定義目標(biāo)變量的逾期狀態(tài)閾值;
8、對比多個觀察時點,為了排除某個觀察點選擇時的隨機(jī)影響,一般會選擇多個觀察點數(shù)據(jù),重復(fù)前述過程,形成多個遷徙率分析表進(jìn)行對比,得出最終目標(biāo)定義。
假設(shè)有一場景示例:某網(wǎng)貸小額分期產(chǎn)品,一次性放款,分12期按月等本等息還款,現(xiàn)結(jié)合以上遷徙率分析步驟,簡述遷徙率分析過程與結(jié)果。
我們選取20200630為觀察時點,前推3個月為觀察期(20200101-20200630),后推3個月為表現(xiàn)期(20200701-20201230),統(tǒng)計用戶的逾期狀態(tài)分為C、DPD7+、 DPD15+、DPD30+、DPD60+共6種情況,其中C表示未逾期,
DPD7+表示逾期8~15天,DPD15+表示逾期16~30天,
DPD30+表示逾期31~60天,
DPD60+表示逾期61及以上。
編輯
添加圖片注釋,不超過 140 字(可選)
(表1逾期狀態(tài)樣本數(shù)量)
編輯
添加圖片注釋,不超過 140 字(可選)
(表2逾期狀態(tài)樣本占比)
從表2滾動率分析表可以分析得出:
(1)在觀察期狀態(tài)為正常(C)的用戶,在表現(xiàn)期有86.21%仍保持正常狀態(tài),有13.79%轉(zhuǎn)變?yōu)橛馄跔顟B(tài)(DPD7+、DPD15+、DPD30+、DPD60+);
(2)在觀察期最高逾期狀態(tài)為DPD7+的用戶,在表現(xiàn)期有61.37%轉(zhuǎn)變?yōu)檎?狀態(tài),有20.93%仍保持DPD7+狀態(tài),有17.70%轉(zhuǎn)變?yōu)楦哂馄跔顟B(tài)(DPD15+、 DPD30+、DPD60+);
(3)在觀察期最高逾期狀態(tài)為DPD60+的用戶,在表現(xiàn)期僅有0.82%轉(zhuǎn)變?yōu)檎?常狀態(tài),有4.86%轉(zhuǎn)變?yōu)檩^低逾期狀態(tài)(DPD7+、DPD15+、DPD30+),而有94.32% 仍保持DPD60+逾期狀態(tài);
(4)在觀察期最高逾期狀態(tài)為DPD15+、DPD30+的用戶,在表現(xiàn)期變化狀態(tài) 的分析思路同上;
(5)表中的“回滾率”表示用戶從觀察期到表現(xiàn)期的逾期狀態(tài)降低的樣本占比, 如從DPD7+轉(zhuǎn)變?yōu)镃,從DPD15+轉(zhuǎn)變?yōu)镃或DPD7+,從DPD30+轉(zhuǎn)變?yōu)镃或 DPD7+或DPD15+,從DPD60+轉(zhuǎn)變?yōu)镃或DPD7+或DPD15+或DPD30+。由表 中回滾率統(tǒng)計結(jié)果可知,在觀察期隨著逾期狀態(tài)的升高,對應(yīng)表現(xiàn)期的回滾率逐漸降低,在觀察期逾期狀態(tài)DPD7+的用戶,在表現(xiàn)期有61.3%轉(zhuǎn)變?yōu)檎#f明觀察期 逾期為DPD7+的用戶較多仍為“好”用戶;在觀察期逾期狀態(tài)為DPD30+的用戶,在表現(xiàn)期有32.49%轉(zhuǎn)變?yōu)檩^低逾期狀態(tài),說明觀察期逾期為DPD30+的用戶仍存在
部分用戶后期向“好”的方向變化;但在觀察期逾期狀態(tài)為DPD60+的用戶,在表現(xiàn) 期僅有5.68%轉(zhuǎn)變?yōu)檩^低逾期狀態(tài),說明觀察期逾期為DPD60+的用戶大多數(shù)已成為“壞”用戶;
(6)根據(jù)以上分析,認(rèn)定逾期狀態(tài)為DPD60+的用戶,在后期降低逾期程度的 概率很低,故可以將DPD60作為目標(biāo)變量Y的定義范圍,即逾期61天及以上的用戶定義為“壞”用戶,其余為“好”用戶。
以上為風(fēng)控中的遷徙率率的知識點,更系統(tǒng)性的內(nèi)容更可以參考我們目前ing的課程《第五期全線條訓(xùn)練營課程》。
編輯切換為居中
添加圖片注釋,不超過 140 字(可選)
二.時間序列
時間序列是按照時間排序的一組隨機(jī)變量,它通常是在相等間隔的時間段內(nèi)依照給定的采樣率對某種潛在過程進(jìn)行觀測的結(jié)果。
時間序列數(shù)據(jù)本質(zhì)上反映的是某個或者某些隨機(jī)變量隨時間不斷變化的趨勢,而時間序列預(yù)測方法的核心就是從數(shù)據(jù)中挖掘出這種規(guī)律,并利用其對將來的數(shù)據(jù)做出估計。
構(gòu)成要素:長期趨勢,季節(jié)變動,循環(huán)變動,不規(guī)則變動。
1)長期趨勢(T)現(xiàn)象在較長時期內(nèi)受某種根本性因素作用而形成的總的變動趨勢。
2)季節(jié)變動(S)現(xiàn)象在一年內(nèi)隨著季節(jié)的變化而發(fā)生的有規(guī)律的周期性變動。
3)循環(huán)變動(C)現(xiàn)象以若干年為周期所呈現(xiàn)出的波浪起伏形態(tài)的有規(guī)律的變動。
4)不規(guī)則變動(I)是一種無規(guī)律可循的變動,包括嚴(yán)格的隨機(jī)變動和不規(guī)則的突發(fā)性影響很大的變動兩種類型。
時間序列在消費金融公司運用場景:
1、銷售數(shù)據(jù)預(yù)測
2、Vintage壞賬預(yù)估
3、回收率預(yù)估
常見方法:移動平均法、指數(shù)平滑法:指數(shù)平滑法實際上是一種特殊的加權(quán)移動平均法。
指數(shù)平滑法是在移動平均法基礎(chǔ)上發(fā)展起來的一種時間序列分析預(yù)測法,它是通過計算指數(shù)平滑值,配合一定的時間序列預(yù)測模型對現(xiàn)象的未來進(jìn)行預(yù)測。其原理是任一期的指數(shù)平滑值都是本期實際觀察值與前一期指數(shù)平滑值的加權(quán)平均。