一:什么是風(fēng)控審核標(biāo)準(zhǔn)呢
(資料圖片)
二:什么是風(fēng)控審核黑名單
寬帶風(fēng)控是指針對(duì)寬帶網(wǎng)絡(luò)用戶的安全狀態(tài),通過網(wǎng)絡(luò)技術(shù)手段采集數(shù)據(jù),進(jìn)行風(fēng)險(xiǎn)智能分析和監(jiān)控,實(shí)現(xiàn)信息安全風(fēng)險(xiǎn)控制管理的過程。寬帶風(fēng)控主要是對(duì)寬帶網(wǎng)絡(luò)中的黑客攻擊、病毒傳播、僵尸網(wǎng)絡(luò)、釣魚欺詐、有害信息等惡意行為進(jìn)行實(shí)時(shí)監(jiān)測和全面管理。
寬帶風(fēng)控包含以下方面:
1. 安全加固規(guī)范和設(shè)備統(tǒng)一管理:對(duì)寬帶用戶采取防火墻、 VPN、入侵檢測等多種手段,以防止非法入侵和網(wǎng)絡(luò)攻擊。
2. 惡意網(wǎng)站數(shù)據(jù)篩查:篩查有害的網(wǎng)絡(luò)信息,禁止非法行為,比如網(wǎng)站黑名單、IP阻止等。
3. DDoS攻擊防護(hù):通過流量分析、數(shù)據(jù)包過濾、源地址檢測等技術(shù)手段,剔除無效流量,減少DDoS攻擊產(chǎn)生的影響。
4. 用戶網(wǎng)絡(luò)行為監(jiān)測:對(duì)寬帶網(wǎng)絡(luò)中的用戶進(jìn)行監(jiān)管,及時(shí)發(fā)現(xiàn)及處理存在的安全隱患。
總之,寬帶風(fēng)控是指對(duì)寬帶網(wǎng)絡(luò)中的安全隱患進(jìn)行監(jiān)管和分析,從而加強(qiáng)對(duì)網(wǎng)絡(luò)的安全管理和控制。這對(duì)于網(wǎng)絡(luò)服務(wù)提供商和個(gè)人或企業(yè)用戶都有很大的意義,可以保證網(wǎng)絡(luò)的安全和穩(wěn)定運(yùn)行。
三:什么是風(fēng)控審核員
前幾天一位網(wǎng)友整理了一份面試題目,主要是偏風(fēng)控模型崗,看了一下整理得很全面和實(shí)用。之前也整理過幾份面試題,這次繼續(xù)整理一下,希望能幫助一些需要的同學(xué)。之前寫面試相關(guān)的問題:
一份很全的風(fēng)控面試題(見
信貸風(fēng)控模型崗的一些經(jīng)驗(yàn)(見
1.進(jìn)件渠道(60%會(huì)問到)
線上業(yè)務(wù):信息流、貸超、APP、
線下業(yè)務(wù):地?cái)倢?dǎo)流、網(wǎng)點(diǎn)進(jìn)件、合作企業(yè)團(tuán)辦、客戶自己申請(qǐng)等
2.策略制定的步驟(20%會(huì)問到)
策略主要是根據(jù)業(yè)務(wù)中的風(fēng)險(xiǎn)點(diǎn),尋找有效的特征進(jìn)行防范。將變量進(jìn)行特征重要性排序,用排名較高的/高IV的變量用作策略,一般命中策略的壞樣本濃度要達(dá)到3倍以上,同時(shí)也要按月回溯策略的命中率和逾期率,盡可能少影響通過率的情況下框住壞的客群。弱變量/低IV的變量可以放到模型中,同時(shí)要注意策略用到的變量和模型用到的變量盡量不要有相似的,這樣可以減少策略與模型的耦合。
3.貸前策略包括哪些數(shù)據(jù)(80%會(huì)問到)
一般數(shù)據(jù)源類型分為決策類和排序類。決策類有黑名單類(多頭、逾期、黑產(chǎn)、失信、罪犯等),驗(yàn)證類(學(xué)歷、社保公積金、運(yùn)營商實(shí)名與在網(wǎng)時(shí)長、地址信息、收入信息等),刻畫類(
4.說說策略是怎么做優(yōu)化的?(100%會(huì)問到)
策略調(diào)優(yōu)分為幾步:
(1). 確認(rèn)是A類調(diào)優(yōu)還是D類調(diào)優(yōu)。
D類就是降逾期指標(biāo),在通過客群中找差客戶拒絕;A類就是提通過率回?fù)疲诰芙^的客群中找好客戶通過。
(2). 量化分析調(diào)優(yōu)閾值。
D類調(diào)優(yōu)離線即可完成分析,根據(jù)逾期指標(biāo)選定Y(FPD1/FSTPD1/M4+等),比較逾期指標(biāo)上升前后的客群異,找到逾期率發(fā)生變化的原因。然后尋找單變量或者組合變量進(jìn)行分析,識(shí)別出逾期率較高的客戶進(jìn)行拒絕。
A類調(diào)優(yōu)需要決策引擎標(biāo)記豁免樣本,比較通過率下降前后的客群差異(新老客戶/新老資產(chǎn)/渠道變化等),尋找拒絕率較高的可放松的拒絕規(guī)則,放松閾值進(jìn)行AB測試。
(3). 預(yù)測策略調(diào)整的效果
根據(jù)歷史數(shù)據(jù)回溯每月數(shù)據(jù),分析策略調(diào)整對(duì)通過率、逾期率的變化。
(4). 調(diào)整后觀察和驗(yàn)證結(jié)果是否與預(yù)期一致
試驗(yàn)一段時(shí)間后,對(duì)上與不上策略的樣本進(jìn)行vintage分析,觀察策略上線是否對(duì)逾期指標(biāo)有影響以及影響是否與預(yù)測一致。
5.怎么做數(shù)據(jù)清洗的?(80%會(huì)問到)
缺失值處理:缺失值處理的 *** 有剔除、填補(bǔ)以及不處理三種方式。
異常值處理:了解異常值出現(xiàn)的原因,根據(jù)實(shí)際情況決定是否保留異常值。
常變量/同值化處理:對(duì)同值較高或者方差較低的變量作剔除。
分類變量降基處理:分類變量可以根據(jù)bad_rate編碼后再做分箱,也可以將少數(shù)類合并成一類,確保每一類中都有好壞樣本。
6.怎么做特征衍生的?(60%會(huì)問到)
RFM *** 。
R(Recency):客戶最近一次交易消費(fèi)時(shí)間的間隔。R值越大,表示客戶交易發(fā)生的日期越久,反之則表示客戶交易發(fā)生的日期越近。
F(Frequency):客戶在最近一段時(shí)間內(nèi)交易消費(fèi)的次數(shù)。F值越大,表示客戶交易越頻繁,反之則表示客戶交易不夠活躍。
M(Monetary):客戶在最近一段時(shí)間內(nèi)交易消費(fèi)的金額。M值越大,表示客戶價(jià)值越高,反之則表示客戶價(jià)值越低。
常規(guī)統(tǒng)計(jì)特征:統(tǒng)計(jì)函數(shù)最大值、最小值、平均值、標(biāo)準(zhǔn)差來描述以上分布特征。
時(shí)間距離特征:客戶最遠(yuǎn)一次、最近一次或者某個(gè)特殊事件發(fā)生的時(shí)點(diǎn)。
行為波動(dòng)特征:刻畫客戶某段連續(xù)時(shí)間內(nèi)的行為變化特征。
集中度特征:用以刻畫客戶行為的偏好程度。
轉(zhuǎn)自知乎求是汪《信貸時(shí)序數(shù)據(jù)與特征工程介紹》
舉一些根據(jù)征信報(bào)告還款歷史衍生的例子:
近3個(gè)月總逾期次數(shù)、近6個(gè)月最大連續(xù)逾期次數(shù)、最近1次逾期距今月數(shù)、近12個(gè)月逾期連續(xù)增加次數(shù)、近12個(gè)月逾期增加次數(shù)、近12個(gè)月每兩個(gè)月之間增長的最大值、近12個(gè)月取最大值距今月數(shù)等。
7.怎么做特征篩選的?(60%會(huì)問到)
特征選擇的話常見的有IV值、相關(guān)系數(shù)、穩(wěn)定性CSI、邏輯回歸系數(shù)一致、邏輯回歸變量顯著性、xgb特征重要度。邏輯回歸評(píng)分卡篩選變量的步驟案例如下:1、保留IV值大于0.02的變量,共500個(gè);2、把初篩的到的量進(jìn)行WOE編碼;3、變量間兩兩相關(guān)檢驗(yàn)并篩選,刪除相關(guān)性大于0.7的變量400個(gè),剩余100;4、變量穩(wěn)定性檢驗(yàn),把穩(wěn)定性大于0.05的變量刪除,剩余60個(gè);5、逐步回歸法篩選最終入模變量,剩余入模變量10個(gè)。
8.怎么做特征分箱的?(60%會(huì)問到)
類別型變量進(jìn)行降基處理(看是否需要)后分箱;
數(shù)值型變量等頻分箱、等距分箱、決策樹分箱、卡方分箱、手工分箱。
分完箱之后看woe與壞賬率是否單調(diào)或者符合業(yè)務(wù)意義,如不符合再手動(dòng)進(jìn)行調(diào)整。
9.目標(biāo)變量怎么定義?(100%會(huì)問到)
貸前模型的Y主要通過vintage和遷徙率。vintage確定觀察期,遷徙率確定逾期多少為壞。
10.模型是怎么調(diào)參的?
先用交叉驗(yàn)證 *** 初步檢驗(yàn)?zāi)P涂梢赃_(dá)到的上限,作為baseline,調(diào)參 *** 可以從訓(xùn)練速度、精度、過擬合三個(gè)方面回答,一般用網(wǎng)格搜索或者貝葉斯優(yōu)化。調(diào)參可以看之前寫的筆記xgboost調(diào)參小結(jié)或者網(wǎng)上搜索一下,步驟都差不多。
11.有沒有ks允許變動(dòng)的范圍?(40%會(huì)問到)
投產(chǎn)后ks一定會(huì)有個(gè)衰減,因?yàn)樯暇€后的客群是通過評(píng)分切過一刀的,區(qū)分能力上肯定不如建模樣本。一般投產(chǎn)后的ks最低要在0.2以上,ks的衰減和通過率的影響也有關(guān)系。如果上線后通過率降低得多,ks衰減得也多。
12.模型會(huì)做哪些監(jiān)控?(40%會(huì)問到)
模型監(jiān)控主要分為前端監(jiān)控和后端監(jiān)控。前端分析主要
前端監(jiān)控主要是監(jiān)控開發(fā)樣本和現(xiàn)有樣本分?jǐn)?shù)的差異程度,模型第一要穩(wěn)定,無論是分?jǐn)?shù)的穩(wěn)定還是變量的穩(wěn)定,特別是重要性強(qiáng)的特征,它們分布的微小變動(dòng)都會(huì)造成模型分?jǐn)?shù)的偏移。監(jiān)控指標(biāo)有PSI、CSI。PSI有經(jīng)驗(yàn)閾值,CSI沒有,不同特征之間的CSI沒有可比性。當(dāng)特征的CSI為正時(shí),表明該特征分布變化使模型得分往高分偏移,當(dāng)CSI為負(fù)時(shí)則相反。
實(shí)踐中,我們一般會(huì)先觀察PSI,如果PSI顯示模型分?jǐn)?shù)不穩(wěn)定,那么此時(shí)再去觀察CSI,從特征級(jí)分析原因。如果模型穩(wěn)定且只是個(gè)別變量不穩(wěn)定的話就沒事,如果是多個(gè)變量不穩(wěn)定就要考慮根據(jù)特征相關(guān)性,替換成IV值相對(duì)較高的那個(gè)變量等。
后端分析有vintage分析和滾動(dòng)率分析,可以分析出模型上線前后風(fēng)險(xiǎn)的差異,以及模型壞樣本的定義是否準(zhǔn)確。先利用滾動(dòng)率分析確定訓(xùn)練目標(biāo)(例如M3+),然后利用Vintage分析確定表現(xiàn)期(例如6個(gè)月),最后限定表現(xiàn)期大于等于6個(gè)月的樣本用于模型訓(xùn)練。
后端分析因?yàn)橛辛藰颖颈憩F(xiàn),還可以監(jiān)控模型的排序性和區(qū)分能力的變化情況。排序性的監(jiān)控指標(biāo)有Bad Rate、Odds、Lift等指標(biāo);區(qū)分能力的監(jiān)控指標(biāo)有AUC、Gini、KS。
此外,模型監(jiān)控還有拒絕樣本瀑布流分析、撤銷分析、一致性分析等。拒絕瀑布流分析是對(duì)申貸過程中每個(gè)環(huán)節(jié)拒絕流量變化進(jìn)行分析,反映了整體流程的穩(wěn)定性;撤銷分析是對(duì)被模型通過但是被信審拒絕人群的拒絕原因進(jìn)行分析;一致性分析是分析模型決策與策略決策(不使用模型分的策略規(guī)則)的一致性,即模型決策過程中認(rèn)為的壞樣本,策略決策過程中是否也認(rèn)為是壞樣本。
摘自知乎
https://zhuanlan.zhihu.com/p/95797653
13.匯總一些指標(biāo)的閾值
以下閾值為參考,可結(jié)合實(shí)際情況作調(diào)整。
lift:作規(guī)則時(shí)>3
多重共線性:VIF<=10
相關(guān)系數(shù):<0.7
IV:>0.02
KS:0.2-0.5,訓(xùn)練集和測試集的KS相差在3%以內(nèi)
PSI:<0.25
邏輯回歸要檢驗(yàn)系數(shù)符號(hào)一致性,否則分?jǐn)?shù)和bad_rate會(huì)無法解釋。
暫時(shí)就寫這么多,以上問題如有不同見解或者補(bǔ)充的,歡迎交流討論~
關(guān)鍵詞:
版權(quán)與免責(zé)聲明:
1 本網(wǎng)注明“來源:×××”(非商業(yè)周刊網(wǎng))的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),本網(wǎng)不承擔(dān)此類稿件侵權(quán)行為的連帶責(zé)任。
2 在本網(wǎng)的新聞頁面或BBS上進(jìn)行跟帖或發(fā)表言論者,文責(zé)自負(fù)。
3 相關(guān)信息并未經(jīng)過本網(wǎng)站證實(shí),不對(duì)您構(gòu)成任何投資建議,據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
4 如涉及作品內(nèi)容、版權(quán)等其它問題,請(qǐng)?jiān)?0日內(nèi)同本網(wǎng)聯(lián)系。