繼11月初的珠海航展后,汽車行業(yè)也迎來了一件大事。11月9日,由中國汽車流通協會及各省市自治區(qū)汽車流通協(商)會聯合主辦的2016中國汽車流通行業(yè)年會暨博覽會在珠海國際會展中心正式開幕。本次博覽會號稱行業(yè)年會,不僅邀請到來自政府機構的負責人、研究領域的行業(yè)專家,同時也請到汽車流通行業(yè)全產業(yè)鏈企業(yè)代表以及歐美的行業(yè)組織代表前來助陣,針對當前中國汽車流通行業(yè)的熱點、難點問題,各方人馬展開深入交流與探討。
作為國內領先的車聯網數據服務運營商,廣聯賽訊也應邀參加了本次年會。副總經理沈劍先生以《大數據在GPS風控預警中的實戰(zhàn)圖譜》為主題發(fā)表演講,為大家詳細講解了車聯網大數據在汽車金融風控領域發(fā)揮的重要作用。
沈劍,車聯網車云平臺產品設計專家
以下是現場演講的主要文字實錄。
在金融圈里有兩個熱得發(fā)燙的關鍵詞:一個是大數據,一個是風控。雖然將大數據和風控結合并不是什么新鮮概念,但是要找到一些能擦出火花的結合點,并且做得有穿透力卻是很難的。下面我就和大家分享一下廣聯賽訊在這方面的探索,也就是關于大數據在GPS風控預警中的實戰(zhàn)圖譜。
先簡單介紹一下廣聯賽訊,我們是一家專注于車聯網數據服務的公司,致力于依托強大的車聯網云平臺和大數據分析技術,圍繞著車主買車、用車、養(yǎng)車、賣車的全生命周期的需求,開發(fā)出以車聯網+服務、車聯網+保險、車聯網+金融為核心的車聯網產品和服務。數據是我們的立命之本,服務是我們的制勝之道。
回到主題,首先,讓我們回顧一下什么是GPS風控預警?GPS風控預警本質上是通過安裝車載智能硬件(例如GPS)到車貸客戶的車輛上,并借助車聯網云平臺的強大分析、監(jiān)控和預警能力,幫助汽車金融公司實現貸前、貸后的風控及資產回收。我們認為GPS風控預警是汽車金融風控不可分割的一個關鍵部分。
具體來說,在汽車金融風控的貸前環(huán)節(jié),借助GPS設備的安裝服務人員,可以實現對渠道的真實性確認、對車型 VIN 碼的準確匹配,有效杜絕低配高貸;通過隱蔽性的安裝及不斷變換安裝位置,有效的保障逾期收車時能夠找到車輛。在貸后環(huán)節(jié),一方面在微觀層面可以借助設備的斷電報警、子母分離報警、長期不在線報警及時進行檢修和回訪;另一方面,還可以在宏觀層面借助強大的大數據分析能力,通過逾期熱力圖、偏移度逾期分析、異常聚集預警等大數據算法實現更加精細化、智能化的風控運營。
目前,廣聯賽訊在GPS風控預警的大數據分析方向上,主要有四個落地點。第一個落地點是,解決合理離線時長的標準設定問題。我們都知道,金融公司在委案收車時,都是根據車輛有無定位來和收車隊結算傭金的。而這里的車輛有無位置,不是指委派案件的時刻,而是一個時段。這就存在一個問題,由于車輛很可能因為用戶出差等原因,停在了封閉的地下車庫,導致較長時間沒有位置。那么我們給收車團隊設置多長時段是合理的呢?這個問題以往都是拍腦袋估算,今年,廣聯賽訊對數十萬在網客戶車輛一年內的軌跡及運動規(guī)律進行了大數據分析,做出了這個圖(如下),可以看出離線時長設置的越短,誤差率會越大,離線時長設置的越長,準確率越高。當離線時長設置為96個小時的時候,準確度已經達到了95%以上。大家都知道從金融公司的角度看,這個時段并不是越長越好,它希望在一個合理誤差范圍內越短越好。
第二個落地案例是在逾期分析上。由于當前渠道下沉趨勢明顯,不少中大型SP覆蓋地域越來越廣,二三級渠道越來越多,飛單情況越來越普遍。這使得金融公司不僅需要知道渠道的逾期率,還需要知道渠道內逾期的地理位置分布狀況,從而有針對性的幫助渠道改進風控,而不是整個渠道的開啟和關停。廣聯賽訊針對這個問題,利用GPS設備的備案安裝點、激活點和安裝后的常駐位置點等,結合每月的逾期信息,借助大數據計算平臺和數據可視化工具,繪制出動態(tài)更新的逾期追蹤熱力圖。借助高頻次更新的逾期熱力圖,能把握更細的逾期分布情況,從而幫助金融公司對渠道進行更深入的風控。
第三個落地案例是在反騙貸環(huán)節(jié)上。在和多家金融公司交流后,我們了解到規(guī)?;_貸往往伴隨著大量來自不同金融公司的車輛,或者是同一家金融公司的不同渠道的車輛,在一個較短的時間段內大量聚集。為此,廣聯利用GPS設備的備案安裝點、激活點及安裝后的軌跡數據,借助大數據平臺的空間聚類算法,對多車異常聚集實現及時的預警。屏幕上的圖展示了我們對寧夏多車異常聚集點的分析。
第四個落地案例是偏移度逾期分析。因為我們擁有了客戶的用車軌跡,我們自然希望發(fā)揮軌跡的最大價值。那么,能不能通過對客戶用車軌跡進行分析,找到客戶經常停留的點?能不能根據這些經常停留的點,去驗證客戶申報的家庭地址是否真實?客戶申報時的家庭地址是否真實和客戶逾期之間是否存在著相關性?
下面來看一下偏移度逾期分析具體是怎么做的。首先,根據GPS軌跡找出停留點。那么滿足什么條件的是停留點呢?就是連續(xù)一段時間位置沒有什么變化的點,用數學的方式表達就是:在任意一段連續(xù)的GPS軌跡中,如果滿足1)軌跡上的每個點的速度均小于5km/s,說明沒怎么移動;2)每個點與開始點的距離都小于800米;3)結束點B與開始點A之間的時間間隔大于15分鐘,說明停留時間長。這種情況下,我們認為軌跡開始點A就是停留點。按照上面停留點的定義,我們對80萬用戶一年的軌跡進行了測試,大概有9億個停留點。這個量還是相當大的。
第二個環(huán)節(jié),需要聚類停留點,判斷出常駐地來。這主要分三個步驟。首先,通過K-means算法將臨近的點分組,接著,將每個分組內停留點的停留時長進行累計,得出分組的停留時長。最后選取分組的停留時長前6位的作為常駐地。按照這個定義,80萬用戶大概有140萬個常駐地。最后,比對常駐地和家庭地址,判斷家庭地址是否真實。這也是分三個步驟,第一步,只選取0:00到6:00的常駐地,因為一個常駐地要成為家庭地址,一定是晚上睡覺的地方;第二步,找出累計停留時間最長的3個常駐地;第三步,判斷這三個常駐地中是否有一個常駐地和家庭地址之間的距離小于 3km,如果有,那么家庭地址就是正確的。
最后,廣聯賽訊結合2萬多樣本數據對應的逾期情況,按設備激活后的1-3個月的逾期狀況繪制了上面的圖。從圖中可以看出家庭住址匹配的逾期百分比分別是3.5%、 3.9%、 5.2%,而家庭地址不匹配的逾期百分比則高達6.9%、 9.9%、 10.4%,基本上是家庭地址匹配客戶的兩倍。這充分說明申報信息的準確性與逾期成反比,而且從貸后環(huán)節(jié)來看,應該重點關注申報信息不匹配的用戶,將這些用戶和設備拆除報警等結合起來,提高預警的及時性和準確性。
我們相信,大數據和風控的結合一定是未來汽車金融的核心競爭力,廣聯賽訊將一如既往地埋頭深耕,不懈努力,為汽車金融事業(yè)添磚加瓦。