多多色-多人伦交性欧美在线观看-多人伦精品一区二区三区视频-多色视频-免费黄色视屏网站-免费黄色在线

國內最全IT社區平臺 聯系我們 | 收藏本站
阿里云優惠2
您當前位置:首頁 > 互聯網 > 評分卡模型剖析之一(woe、IV、ROC、信息熵)

評分卡模型剖析之一(woe、IV、ROC、信息熵)

來源:程序員人生   發布時間:2014-10-08 08:00:01 閱讀次數:5451次

信用評分卡模型在國外是一種成熟的預測方法,尤其在信用風險評估以及金融風險控制領域更是得到了比較廣泛的使用,其原理是將模型變量WOE編碼方式離散化之后運用logistic回歸模型進行的一種二分類變量的廣義線性模型。

       本文重點介紹模型變量WOE以及IV原理,為表述方便,本文將模型目標標量為1記為違約用戶,對于目標變量為0記為正常用戶;則WOE(weight of Evidence)其實就是自變量取某個值的時候對違約比例的一種影響,怎么理解這句話呢?我下面通過一個圖標來進行說明。

Woe公式如下:






Age

#bad

#good

Woe

0-10

50

200

=ln((50/100)/(200/1000))=ln((50/200)/(100/1000))

10-18

20

200

=ln((20/100)/(200/1000))=ln((20/200)/(100/1000))

18-35

5

200

=ln((5/100)/(200/1000))=ln((5/200)/(100/1000))

35-50

15

200

=ln((15/100)/(200/1000))=ln((15/200)/(100/1000))

50以上

10

200

=ln((10/100)/(200/1000))=ln((10/200)/(100/1000))

匯總

100

1000

 

    表中以age年齡為某個自變量,由于年齡是連續型自變量,需要對其進行離散化處理,假設離散化分為5組(至于如何分組,會在以后專題中解釋),#bad#good表示在這五組中違約用戶和正常用戶的數量分布,最后一列是woe值的計算,通過后面變化之后的公式可以看出,woe反映的是在自變量每個分組下違約用戶對正常用戶占比和總體中違約用戶對正常用戶占比之間的差異;從而可以直觀的認為woe蘊含了自變量取值對于目標變量(違約概率)的影響。再加上woe計算形式與logistic回歸中目標變量的logistic轉換(logist_p=ln(p/1-p))如此相似,因而可以將自變量woe值替代原先的自變量值;

講完WOE下面來說一下IV

IV公式如下:



其實IV衡量的是某一個變量的信息量,從公式來看的話,相當于是自變量woe值的一個加權求和,其值的大小決定了自變量對于目標變量的影響程度;從另一個角度來看的話,IV公式與信息熵的公式極其相似。

事實上,為了理解WOE的意義,需要考慮對評分模型效果的評價。因為我們在建模時對模型自變量的所有處理工作,本質上都是為了提升模型的效果。在之前的一些學習中,我也總結了這種二分類模型效果的評價方法,尤其是其中的ROC曲線。為了描述WOE的意義,還真的需要從ROC說起。仍舊是先畫個表格。



數據來自于著名的German credit dataset,取了其中一個自變量來說明問題。第一列是自變量的取值,N表示對應每個取值的樣本數,n1n0分別表示了違約樣本數與正常樣本數,p1p0分別表示了違約樣本與正常樣本占各自總體的比例,cump1cump0分別表示了p1p0的累計和,woe是對應自變量每個取值的WOEln(p1/p0)),ivwoe*(p1-p0)。對iv求和(可以看成是對WOE的加權求和),就得到IV(information value信息值),是衡量自變量對目標變量影響的指標之一(類似于gini,entropy那些),此處是0.666,貌似有點太大了,

生活不易,碼農辛苦
如果您覺得本網站對您的學習有所幫助,可以手機掃描二維碼進行捐贈
程序員人生
------分隔線----------------------------
分享到:
------分隔線----------------------------
關閉
程序員人生
主站蜘蛛池模板: 国产aa网站| 中文字幕日产乱码 | 在线不卡国产 | 亚洲精品国产三级在线观看 | 亚洲一二三区在线观看 | 手机看片福利日韩 | 精品日韩 | 亚洲欧美久久精品1区2区 | 亚洲综合色自拍一区 | 亚洲美女激情视频 | 国产精品日产三级在线观看 | 欧美天天| 老司机午夜精品视频在线观看免费 | 日本二本三本二区 | 中文字幕最新中文字幕中文字幕 | 国产中文字幕在线播放 | q欧美性猛交xxxx乱大交 | 亚洲码在线 | 2020国产精品永久在线观看 | 真人肉体一级毛片 | 日韩亚洲欧美一区 | 亚洲国产精品二区久久 | 亚洲一逼 | 久久69精品久久久久久hb | 福利视频99 | 国产精品日韩欧美 | 亚洲伊人久久大香线蕉啊 | 欧美xxxx精品另类 | 国产成人精品曰本亚洲78 | 国内精品一区二区三区 | 欧美高清videos性极品 | 午夜影院网站 | 欧美日韩亚洲国产 | 亚洲一级毛片免费在线观看 | 国产不卡视频一区二区在线观看 | 日本亚州在线播放精品 | 娇小性色xxxxx | 99久久精品免费看国产免费软件 | 国内高清久久久久久久久 | 久久精品国产99久久99久久久 | 性欧美video另类hd人妖 |