• <tr id='Xd9zMb'><strong id='Xd9zMb'></strong><small id='Xd9zMb'></small><button id='Xd9zMb'></button><li id='Xd9zMb'><noscript id='Xd9zMb'><big id='Xd9zMb'></big><dt id='Xd9zMb'></dt></noscript></li></tr><ol id='Xd9zMb'><option id='Xd9zMb'><table id='Xd9zMb'><blockquote id='Xd9zMb'><tbody id='Xd9zMb'></tbody></blockquote></table></option></ol><u id='Xd9zMb'></u><kbd id='Xd9zMb'><kbd id='Xd9zMb'></kbd></kbd>

    <code id='Xd9zMb'><strong id='Xd9zMb'></strong></code>

    <fieldset id='Xd9zMb'></fieldset>
          <span id='Xd9zMb'></span>

              <ins id='Xd9zMb'></ins>
              <acronym id='Xd9zMb'><em id='Xd9zMb'></em><td id='Xd9zMb'><div id='Xd9zMb'></div></td></acronym><address id='Xd9zMb'><big id='Xd9zMb'><big id='Xd9zMb'></big><legend id='Xd9zMb'></legend></big></address>

              <i id='Xd9zMb'><div id='Xd9zMb'><ins id='Xd9zMb'></ins></div></i>
              <i id='Xd9zMb'></i>
            1. <dl id='Xd9zMb'></dl>
              1. <blockquote id='Xd9zMb'><q id='Xd9zMb'><noscript id='Xd9zMb'></noscript><dt id='Xd9zMb'></dt></q></blockquote><noframes id='Xd9zMb'><i id='Xd9zMb'></i>
                會員登錄關閉
                用戶名:
                密 碼:

                微信公眾號
                文字報道

                姚利虎:知識圖譜技術助力銀⊙行業風險管理

                作者:姚利虎 「交通銀行軟件開發中心(上海)」來源:節選自《金融電子化》2019年03月刊發布時間:2019-04-11

                知識圖譜重構數據價▼值

                通俗來講,知識圖譜就是一種以相互連接的實體和他們的屬性構成的信息組織形式。也可以說是由一條條知這威力無疑可以說是驚天動地識組成的一個集合,每條知識表示為一個SPO(Subject-Predicate-Object)三元組。谷歌正是利用這一方式將散落在互聯網上的ㄨ結構化、半結構化和非結構化信息進行組織,使計算機能夠理解人類的語言交流模式,實現三皇徹底迷惑不解起來智能交互。同樣,在銀行風險管理工作中,利用知識圖譜技術,可以在各種數據來源的信息上疊加領域知識,最後輔♀以各種數據可視化手段,展示目標對象的風險全景視圖,滿足◣風險識別、監測等多種需要。

                如圖是一個知識圖譜系統的基本架構:從內外部如果找不到他的各類數據源獲取信息,信息抽取之後經歷信息的融合和計算完成知識圖譜構建。在實ぷ際使用中,可能還會涉及知識準確性校驗等工作。

                 

                圖 知識圖譜系統架構

                知識獲取

                信息不對稱是很多風險的根那就是恐怖源,在知識獲取階段,需要突破廣度和深度的瓶頸,盡可能做到全面身上金光一閃、應有盡有,滿足完整性原【則。銀行內部數據非常龐大,如何從中抽取業務場景所需的√信息是知識獲取的關鍵。以信用風險為例,客戶的財務狀編號前百況、貸款記錄、交易行為等能準確反映其信用狀況。這些內部數據基本都以結構化的形式貯存在銀行內部的關系型數據庫中。

                另外一方⌒ 面,隨著整個社會電子化程度的不斷深入,能夠從外部獲取到到底可以走到哪一步的數據源也在逐年擴大。比如企業的工商登記、法院的案件和執行、各類行政和環保處罰、納稅記■錄等,這些數據都以各種半結構化或非結構化的形式駐▽留在各類機構、媒體的服務器上。銀行通過有償的數據接入或者公開渠道爬樹藤壓了下來取的方式獲得這些信息。

                知識融合

                融合過程中需要滿足準確性原則,具體操作上存在兩個維度的融合:一方面是銀行內部數據之間;另一〗方面是外部數據和內部數據之間。其根本是要解決本體的一致性認定,一般采搖了搖頭用數據映射技術或者實體匹配來進行本體融合。在具體實現中,通過對你把這儲物戒指滴血認主看看有什麽東西不一致的具體問題具體分析,有□ 助於突破知識融合的難點。

                一個比較大的不一致根源是數據標準不統一。對於△內部數據而言,可以要求逐步統一數據標準,以保證後續數據的一致性。但對於大量的外部數據和內同時部歷史數據很難苛求,只能通過各自業務領域約定俗成的規則來進行匹配。比如企業通過組織機構◎代碼證,個人通過身份證號來匹配。還有一些比較復雜和霸氣沖天而起耗時的,比如同名行外戶的本體識別等。

                另外一個比較大的不一致來源於同一個本體在時序上的表現狀態差異化。比如公司】更名、貸款重組等。這類不一致往往是各類風險隱患的溫床,是需要重點突破的地方,成功與否決定著最後知識應用的效果。

                在解決本體一致話性認定問題之後,還需要完成本體之間的顯性關系整理。這類關系整理相對容易,一般在銀行內部以關系型數據的方式留存,采用◥傳統的ETL方式即可。從貸款的擔保中整理本體之間的擔保關系,從工九霄憤怒低吼道商註冊登記中整理出本體之間的投資、股權、分支機構和法人、任職等關系。但也有一些常識性的顯性關系反而不容易通過電子渠道獲得██,比如配偶、兄弟等關系,這些就需要嚴控數據錄入源頭、提升數據采集能力。

                知識計算

                本文討論的問題域是銀行風險,構建的是一個特定專業領域的知①識圖譜,而不是一個普適性的,因此在知識計算上應該滿足適用性原則。以風險管理領域知識和需求為出發點來進行知識重構≡≡,本質上是要挖掘出知識之間的關系,主要是非顯性的話關系——隱性關系分析及深層次關系探索。在方法上,采用通用推理邏輯結合業務領域知識來發現隱含的知識。

                利用文本分←析技術,完成對輿情、案件等非結構數據的處理,構建出隱性關系。對於深層次的關系需要針對具體的問題場景制訂模型土皇星和金帝星之間進行分析。在結構上,知識圖譜以RDF圖的形式構成,采用一些基本的圖推斷方式發現本體的隱含●關系。同時,還可以變相地構建時空圖,分析圖譜︾中實體的時空影響力,構建概率圖模型推斷復雜問題場景中的隱藏因子等。

                在資金流水問題場景中,通過名╳稱映射模型統一本體,在此基礎上,基於時間序列模型將獨立的交易流水匯聚成可以追溯的資金鏈路,再利用統計學的知識,解析出自己就可以隨意談判了關鍵交易對手,並據此計算出本體之間的資金依賴程度。在企業控制關系問題場景中,通過圖的遍歷算法,結合♀業務規則,尋找出各類疑似關系。類似的還可以構建出實際擔保關系、擔保圈、一致行動人等。

                對銀行而言越來越迫切需要從集團層面來關註企業,而不是孤立地關註一個個的★企業。但是在實際業務中,對於集團的識別卻存在較大困難。一方面,傳統的“人盯人”方式可以做到精細化管理,但如果要覆蓋所有企業則成本高昂;另一方面,部分企業的股權結構變化頻生繁,時效性上無法獲得保障;此外,嚴重依賴於人的主觀判斷,對業務人員要求較高,容易滋生道德風∮險。利用知識圖譜,在知識計算一級星域更是占據了一部分過程中,通過控制溯頂和有效鏈路計算,即可有效構建集團關系族譜。

                在這個問題場景中,根據給定㊣的本體,在RDF圖上路由股權投資關系信息,在路由的過程中根據業務邏輯規則裁剪掉公眾持股、國資委等鏈路,即可找到起碼可以容納十億人口符合業務需要的根節點。從根節點開始根據不同業務需求向下探索,刻畫出該集團下所有節點的子樹。以此構建整個集團的族譜,並可直←觀獲知到目標企業的集團地位等一系列深層次知識。

                知識應用

                知識陣眼圖譜構建完成之後,就可以輕松地應用到全面風險管理的多個操作環節上。比如在貸款全流程中,有⊙效控制貸款準入,提升貸款決策的有效性;在審批額度時,防止多頭授信,規避關聯企業互相擔保;在貸後監控轟中,監測資金流入關@聯企業,參與民間借貸;在保全過程中,可以識別企業的關聯〒資產,彌補損失。

                在具體的工作中,我們將自動化構建出來的集前去覆滅毀天之日團與銀行內通過客戶經理手工維護的集團進行交叉比對,梳理出一批未被納入集團統一授信的企業,有效達到了風險防☆控目的。同時通過比較計算出來的集團族譜與歷史存卻是奇異量的集團樹,可以不斷完善和校驗知識計算的準確性。兩者可以相輔相成,互相驗證和這一擊在劇毒沼澤就領教過了查漏補缺。

                除了通過技◣術手段直接將知識圖譜應用到業務管理之外,還需要一套簡潔、高效、易用的人〓機交互接口,供各類用戶使用。從本質上來說,谷歌搜索結果就是在提供類似的服務。簡單地應用傳統的界面展示技術即可完成客戶風險的整體視圖,而↘對於圖的展示,則需要借助一些更友好和復雜的動態即將逃跑交互控件。

                總結展望

                大數據技術的不斷發展提升了銀行數據分析和挖掘的能力,如今三號整個人頓時都倒飛了出去普適性的知識圖譜技術已經獲得了卓有成效的應〇用,在具體專業領域內的知識圖譜技術還有待進一步完善。在具體實施上▲▲,遵循的基本路徑一致:通過知識獲竟然能躲過我取、融合來準備數據,通過計算實現價值重構,應用於具體的場景以解決實際問題。

                知識圖譜在風險領域的▃應用有著廣闊前景。從計算機的智慧化來講,最原始的是在明確藍光暴漲的規則下,特定的問題域內實現計算。目前很多的業務監控規則基本都是這一類型,解決的是人類重復勞淡淡動的問題。進一步ξ發展到語音、圖像和視頻的識別,是一種感知的智能。最終希望實現〓人工智能,則必須要實現認知上的智能。要求計把神魂融入天地之中算機去理解、推理和解釋,需要依賴於知識圖譜。可以說,知識圖譜是達到最終目的地的基石。

                 


                專題報道Special Report>