搭建風控量化模型_第1頁
已閱讀1頁,還剩4頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、搭建風控量化模型當前,大型金融機構已被監(jiān)管機構批準使用內部模型來計量風險和監(jiān)管資本;中小金融機構的積極性也很高,力求借鑒資本管理高級法,調整資產組合,提高資本使用效率,推進管理流程再造,由“干了再算”向“算了再干”轉變。以上趨勢令人鼓舞。我們看到,強化風險量化管理的理念正在對中國金融業(yè)提高識別、計量和控制風險的能力產生重要的影響中國金融業(yè)風險量化管理水平正在迅速提升。如何更好地“算了再干”?為了回答這一問題,本文談一談金融機構的風險量化

2、模型。為保證風險量化模型的開發(fā)質量和實施效果,金融機構所有的風險量化模型都應該參考模型建設和管理技術行業(yè)標準進行開發(fā)、評估和文檔歸檔。下文總結了國內外信用風險量化模型建設和管理的先進經驗,全面遵循這些要求有利于模型的建設、使用、監(jiān)控、審批、上線。模型的設計模型的設計對模型最終是否能實現其目標起著舉足輕重的作用。為了保證模型的設計可以滿足模型的目標,審批人員應需要關注的是從哪些方面對模型的設計進行評估??偨Y來說,以下方面要特別留意。要解決

3、的業(yè)務問題建模人員應該用簡單易懂的語言對模型要解決的業(yè)務問題進行描述。這些描述應該包括一個或多個已達成共識的業(yè)務原則或核心價值,如客戶的行為、銀行員工的參與度、競爭對手的動作、經濟形勢的變動、合規(guī)的需要、公司戰(zhàn)略的考慮等。例如,信用卡部門要設計一個申請評分模型來測算新客戶出現不良貸款的風險。這個模型在新客戶審批過程的應用中,需要審批人員和客戶進行溝通,手動輸入一些關鍵的模型變量數值,在很多情況下還需要對模型的評分結果進行覆蓋。這種模型在

4、業(yè)務中的應用方式就需要在模型設計開發(fā)的過程中,考慮如何解決驗證客戶提供信息的真實性、員工手動輸入數據的可靠性、對模型評分結果覆蓋的審批案例如何進行表現監(jiān)控等問題。目標變量的定義建模人員應該對目標變量的定義進行如下描述:明確描述目標變量的定義,并說明為何這樣的定義與要解決的任務問題是相關的;明確定義目標變量的表現時間窗(perfmancewindow)和觀察時間窗:例如,目標變量可以定義為未來12個月貸款出現至少一次60天或60天以上逾期

5、的概率。在這個定義里,“未來12個月”為表現時間窗,“貸款出現至少一次60天或60天以上逾期”為觀察時間窗。如果模型需要滿足監(jiān)管部門的要求,此定義是否滿足監(jiān)管部門的要求;為何選擇這樣的定義而不是其他定義;對定義可能產生的誤解進行澄清,如定義是在客戶層面還是賬號層面的,定義是在觀察期之間的表現還是在觀察期結束的時間點的表現等。樣本的選擇建模人員應該對建模樣本的選擇進行如下描述:樣本選擇的方法,如有隨機抽樣和非隨機抽樣(有目的抽樣),其中隨

6、機抽樣方法包括簡單隨機抽樣、等距抽樣、分層隨機抽樣、整群抽樣幾種常用類型;非隨機抽樣也稱為有目的抽樣,包括全面抽樣、最大差異抽樣、極端個案抽樣、典型個案抽樣幾種常用類型;樣本的大小,為了增強可測性和檢驗的準確性,應該盡量增大樣本容量,但同時還應考慮可行性和經濟成本;建模樣本、保留樣本、驗證樣本的劃分;樣本可能有的偏差,如必須通過審批的條件限制、經過客戶自然流失后的樣本、外部因素的變化對樣本的影響如產品特征、競爭對手的策略、經濟周期、季節(jié)

7、性因素等。分析的方法分析方法的描述應該包括以下內容:數據獲取渠道的描述,主要分為直接渠道和間接渠道:直接渠道主要指通過統(tǒng)計調查獲得的第一手統(tǒng)計數據,如辦理信用卡業(yè)務時客戶填寫的個人信息資料、當下十分流行的大數據方法等;間接渠道通常指通過查閱資料或者通過其他網站、平臺獲取的二手數據,如通過WIND或Bloomberg獲得數據;模型的結構,根據所作的假設分析對象的因果關系,利用對象的內在規(guī)律和適當的數學工具,構建各個變量間的等式關系或其他的

8、數學結構。同時,在建模過程中還應注意細節(jié)問題,如客戶的分群、子模型的架構等;建模技術,在建模過程中常用到的數學方法和計算機技術,如logistic回歸、決策樹、普通線性回歸、分層分析、聚類分析、時間序列等;變量的處理,如變量的剔除、轉換、最大最小值的設置、缺失值的處理、變量相關性的處理等。變量最大、最小值處理對此部分的描述應該包括:每個變量的最大或最小值;對最大或最小值的處理方法;處理后對這些變量取值范圍的影響以及數據記錄表現的影響;以

9、變量減少、建?;蛟u分、或拒絕原因算法為目標的最大或最小值設置;這些設置是否能防止所有可能出現的取值錯誤。變量轉換對此部分的描述應該包括:單變量轉換,如反正弦、對數、開方、BoxCox等;多變量轉換,如變量之間相除、相減、相加、相乘等;變量取值的劃分或歸成大類;變量轉換的處理程序及編程方法;這些設置是否能防止所有可能出現的取值;采用WeightofEvidence(WoE)方法(該方法在生態(tài)風險評估ERA領域使用多年,能結合多方面數據給出

10、總體風險評估)進行分欄并計算InfmationValue來驗證。數據的外部因素可能影響目標變量表現的外部因素主要有:國家或區(qū)域的經濟環(huán)境;宏觀經濟指標;產品特征;獲客渠道;主要競爭對手的策略;天氣因素;季節(jié)性周期因素等。模型的選擇模型審批人員應該對建模的方法及模型的表現是否能夠到達預期的目標進行診斷和評估,這是一個至關重要的步驟。從具體實施的角度而言,評估應該至少包含以下九個方面內容。子模型分割方法模型分割(子模型)的方法應該包括以下內

11、容:分割優(yōu)化的標準及目的:如對無數據記錄的處理、模型表現的連續(xù)性考慮、變量相關性的區(qū)格、變量預測能力的區(qū)格等;選擇分割的手段,如歷史數據分析、CART分析、貝葉斯樹等;采用分割后對模型的表現所帶來的提升的數據支持,尤其要說明表現的提升足以覆蓋由于分割所帶來的模型復雜度增加的負擔。變量剔除模型獨立變量剔除或合并的考慮因素包括:變量缺失的頻率;變量的波動性;變量組合;變量聚類,將集合分成由類似的對象組成的多個類;變量之間的相關性檢驗,如采用

12、相關系數矩陣,Pearson相關系數或者Spearman相關系數方法;不同分割模型(子模型)變量的同質性檢驗,用卡方統(tǒng)計量驗證不同子模型是否來自同一總體;變量選擇的方式:如向前選擇、向后選擇、逐步選擇等;變量的交叉驗證。模型優(yōu)化的標準對此部分的描述應該明確定義模型優(yōu)化的標準,進而說明為何候選模型是最佳的選擇。如果選擇多個指標,應說明多個指標的選擇標準,例如:KS值決策邊際變現等。對于需要滿足監(jiān)管要求的模型,要將監(jiān)管要求融入到選擇模型優(yōu)化

13、的過程中。模型參數的確定對此部分的描述應該明確模型選擇的方法,包括:如何確定模型的參數;如何從眾多的候選模型中選擇最終的模型;VIF(VarianceInflationFact)檢驗,判斷模型是否存在多重共線性問題,經驗判斷方法表明:當0VIF10,不存在多重共線性;當10≤VIF100,存在較強的多重共線性;當VIF≥100,存在嚴重多重共線性,此時模型效率低;如何對模型的參數進行平滑處理;如何確定模型的變量及結構是簡單適用的;如何防

14、止擬合不足或擬合過度。建模程序的結構對此部分的描述應該說明建模使用的程序的結構,包括:處理原始數據的所有的程序,從開始到結束;程序是否具有恰當的標注和結構說明,如數據處理部分,變量選擇部分,候選模型比較部分等;程序是否被妥善統(tǒng)一存檔,存檔是否可以被訪問,程序是否可以被其他人運行這些具體備注說明。建模程序細節(jié)對此部分的描述應該選擇一段建模程序進行評估,評估內容包括:程序的標注是否充分,程序的結構是否容易理解;變量的名稱、標識是否簡單易懂;

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論