what?傳統風控策略,無法cover到以下風控場景

反欺詐是風控中非常重要的環節,也是知識圖譜適合應用的場景。而知識圖譜用來描述關係網路,天生是分析關聯欺詐的便捷手段。以先進的團伙識別演算法為基礎,目前越來越多的機構構建了全新的團伙欺詐識別模型,在實際業務中識別準確率可達70%+以上。

除了反欺詐之外,圖譜還可以cover哪些傳統風控策略,無法cover到的場景呢?請看:

1.反欺詐

反欺詐是圖譜中應用最廣的場景,是風控中非常重要的一道環節。基於大資料的反欺詐的難點在於如何把不同來源的資料(結構化,非結構)整合在一起,並構建反欺詐引擎,從而有效地識別出欺詐案件(比如身份造假,團體欺詐,代辦包裝等)。而且不少欺詐案件會涉及到複雜的關係網路,這也給欺詐稽核帶來了新的挑戰。

知識圖譜,作為關係的直接表示方式,可以很好地解決這兩個問題。首先,知識圖譜提供非常便捷的方式來新增新的資料來源,這一點在前面提到過。其次,知識圖譜本身就是用來表示關係的,這種直觀的表示方法可以幫助我們更有效地分析複雜關係中存在的特定的潛在風險。

反欺詐的核心是人,首先需要把與借款人相關的所有的資料來源打通,並構建包含多資料來源的知識圖譜,從而整合成為一臺機器可以理解的結構化的知識。在這裡,我們不僅可以整合借款人的基本資訊(比如申請時填寫的資訊),還可以把借款人的消費記錄、行為記錄、網上的瀏覽記錄等整合到整個知識圖譜裡,從而進行分析和預測。這裡的一個難點是很多的資料都是從網路上獲取的非結構化資料,需要利用機器學習、自然語言處理技術把這些資料變成結構化的資料。

2.不一致性驗證

不一致性驗證可以用來判斷一個借款人的欺詐風險,這個跟交叉驗證類似。比如借款人張三和借款人李四填寫的是同一個公司電話,但張三填寫的公司和李四填寫的公司完全不一樣,這就成了一個風險點,需要稽核人員格外的注意。

再比如,借款人說跟張三是朋友關係,跟李四是父子關係。當我們試圖把借款人的資訊新增到知識圖譜裡的時候,“一致性驗證”引擎會觸發。引擎首先會去讀取張三和李四的關係,從而去驗證這個“三角關係”是否正確。很顯然,朋友的朋友不是父子關係,所以存在著明顯的不一致性。

不一致性驗證涉及到知識的推理。通俗地講,知識的推理可以理解成“連結預測”,也就是從已有的關係圖譜裡推匯出新的關係或連結。比如在上面的例子,假設張三和李四是朋友關係,而且張三和借款人也是朋友關係,那我們可以推理出借款人和李四也是朋友關係。

3.組團欺詐

相比虛假身份的識別,組團欺詐的挖掘難度更大。這種組織在非常複雜的關係網路裡隱藏著,不容易被發現。當我們只有把其中隱含的關係網路梳理清楚,才有可能去分析並發現其中潛在的風險。知識圖譜,作為天然的關係網路的分析工具,可以幫助我們更容易地去識別這種潛在的風險。

舉一個簡單的例子,有些組團欺詐的成員會用虛假的身份去申請貸款,但部分資訊是共享的。下面的圖大概說明了這種情形。從圖中可以看出張三、李四和王五之間沒有直接的關係,但透過關係網路我們很容易看出這三者之間都共享著某一部分資訊,這就讓我們馬上聯想到欺詐風險。雖然組團欺詐的形式眾多,但有一點值得肯定的是知識圖譜一定會比其他任何的工具提供更加便捷的分析手段。

4.異常分析(AnomalyDetection)

異常分析是資料探勘研究領域裡比較重要的課題。我們可以把它簡單理解成從給定的資料中找出“異常”點。在我們的應用中,這些”異常“點可能會關聯到欺詐。既然知識圖譜可以看做是一個圖(Graph),知識圖譜的異常分析也大都是基於圖的結構。由於知識圖譜裡的實體型別、關係型別不同,異常分析也需要把這些額外的資訊考慮進去。大多數基於圖的異常分析的計算量比較大,可以選擇做離線計算。在我們的應用框架中,可以把異常分析分為兩大類:靜態分析和動態分析,後面會逐一講到。

what?傳統風控策略,無法cover到以下風控場景

a)失聯客戶管理

除了貸前的風險控制,知識圖譜也可以在貸後發揮其強大的作用。比如在貸後失聯客戶管理的問題上,知識圖譜可以幫助我們挖掘出更多潛在的新的聯絡人,從而提高催收的成功率。

現實中,不少借款人在借款成功後出現不還款現象,而且玩“捉迷藏”,聯絡不上本人。即便試圖去聯絡借款人曾經提供過的其他聯絡人,但還是沒有辦法聯絡到本人。這就進入了所謂的“失聯”狀態,使得催收人員也無從下手。那接下來的問題是,在失聯的情況下,我們有沒有辦法去挖掘跟借款人有關係的新的聯絡人?而且這部分人群並沒有以關聯聯絡人的身份出現在我們的知識圖譜裡。

如果我們能夠挖掘出更多潛在的新的聯絡人,就會大大地提高催收成功率。舉個例子,在下面的關係圖中,借款人跟李四有直接的關係,但我們卻聯絡不上李四。那有沒有可能透過2度關係的分析,預測並判斷哪些李四的聯絡人可能會認識借款人。這就涉及到圖譜結構的分析。

b)智慧搜尋及視覺化展示

基於知識圖譜,我們也可以提供智慧搜尋和資料視覺化的服務。智慧搜尋的功能類似於知識圖譜在Google,Baidu上的應用。也就是說,對於每一個搜尋的關鍵詞,我們可以透過知識圖譜來返回更豐富,更全面的資訊。比如搜尋一個人的身份證號,我們的智慧搜尋引擎可以返回與這個人相關的所有歷史借款記錄、聯絡人資訊、行為特徵和每一個實體的標籤(比如黑名單,同業等)。另外,視覺化的好處不言而喻,透過視覺化把複雜的資訊以非常直觀的方式呈現出來,使得我們對隱藏資訊的來龍去脈一目瞭然。

c)精準營銷

一個聰明的企業可以比它的競爭對手以更為有效的方式去挖掘其潛在的客戶。在網際網路時代,營銷手段多種多樣,但不管有多少種方式,都離不開一個核心-分析使用者和理解使用者。知識圖譜可以結合多種資料來源去分析實體之間的關係,從而對使用者的行為有更好的理解。比如一個公司的市場經理用知識圖譜來分析使用者之間的關係,去發現一個組織的共同喜好,從而可以有針對性的對某一類人群制定營銷策略。只有我們能更好的、更深入的(Deepunderstanding)理解使用者的需求,我們才能更好地去做營銷。

詳細可關注“關係網路實操專題課”,會重點介紹關係網路:

1.特徵提取

#聯絡一度聯絡人的人均二度逾期會員個數

#聯絡一度聯絡人的人均二度黑名單會員個數

##同商戶同手機歸屬地客戶數

#同商戶同手機歸屬地黑名單客戶數

#同商戶同手機歸屬地逾期客戶數

。。。

2.社交網路模型的建模與分析

3.貸中反欺詐的應用

4.風控閉環——標籤回饋

5.關係網路深度拓展——二度三度四度關係網的運用

6.解決關係圖譜中,用起來越來越慢,相關的提速方案有哪些?

7.計算圖指標中的密數,密度?

8.如何結合python中應用場景,計算圖指標做建模特徵?

...

將以理論+實操案例的角度,為各位童鞋深度剖析關係網路實操落地。

~原創文章

。。。

~end