行業|央行科技司李偉:做好資料治理推動數字化轉型

行業|央行科技司李偉:做好資料治理推動數字化轉型

李 偉 中國人民銀行科技司司長

黨的十九屆四中全會首次將“資料”列為生產要素參與分配,標誌著以資料為關鍵要素的數字經濟進入新時代。當前,人工智慧、區塊鏈等數字技術不斷湧現,快速向經濟社會各領域融合滲透,以資料為核心的數字化轉型已是大勢所趨。金融業是資料密集型行業,在生產經營過程中積累了海量的資料金礦。金融業要深刻認識資料資源的重要意義,切實做好金融資料治理工作,深挖資料價值、釋放資料潛能,加快推進數字化轉型,推動金融實現高質量發展。

金融業資料治理之“困”

存在資訊孤島,有數不能用。

當前,金融業資料治理過程中普遍存在“不願、不敢、不能”共享的問題,導致海量資料散落在眾多機構和資訊系統中,形成一個個“資料煙囪”。一是不願共享。多數金融機構都將資料作為戰略性資源,認為擁有資料就擁有客戶資源和市場競爭力,主觀上不願意共享資料;與之類似,金融機構內部也存在資料權屬分割,資料所有權和事權密切相關,各部門寧願將資料“束之高閣”,也不輕易拿出來共享。二是不敢共享。部分金融資料具有一定敏感性,涉及使用者個人隱私、商業秘密甚至國家安全,資料共享可能存在法律風險,客觀上給機構間共享資料帶來障礙。三是不能共享。由於各機構資料介面不統一,不同機構的資料難以互聯互通,嚴重阻礙資料開放共享,導致資料資產相互割裂、自成體系。

資料質量不高,有數不好用。

在金融科技廣泛應用的背景下,高質量資料成為金融服務與創新的重要基礎,也是大資料提升金融機構精準施策能力的關鍵前提。然而,當前金融業整體資料質量不高的現象依然突出,給資料深入挖掘與高效應用帶來困難。在完整準確性方面,由於缺乏統一的資料治理體系,有些金融機構在資料採集、儲存、處理等環節可能存在不科學、不規範等問題,導致錯誤資料、異常資料、缺失資料等“髒資料”頻頻產生,無法確保資料的完整性和準確性。在一致性方面,由於金融機構業務條線繁雜、業務種類多樣,多個部門往往資料採集標準不一、統計口徑各異,同一資料來源在不同部門的表述可能完全不同,看似相同的資料實際含義也可能大相徑庭,資料一致性難以保障。這給全域性資料建模、分析、運用造成障礙,資料探勘效果大打折扣。

融合應用困難,有數不會用。

金融資料來源眾多、體量龐大、結構各異、關係複雜。從如此繁雜的海量金融資料中挖掘高價值、關聯性強的高質量資料,需要高效的資訊科技支撐和可靠的基礎設施保障。然而,部分金融機構科技研發投入相對不足、科技人員佔比嚴重失調,利用資料建模分析解決實際問題的能力有待提高。金融機構資訊資源利用大多停留在表面,資料應用尚不深入、應用領域相對較窄、資料與場景融合不夠,導致資料之“沙”難以匯聚成“塔”,海量資料資源無法盤活,資料潛力得不到充分釋放。

治理體系缺失,有數不善用。

技術本身是中性的,技術運用的善惡完全取決於人。這一結論對資料同樣適用。科技要向善,資料也同樣要向善。然而,由於法律法規尚不健全、資料治理體系還不完善、機構合規意識不足,資料“不善用”的問題較為突出。從業機構違法違規成本低,為謀求商業利益而置現有管理規定於不顧,過度採集資料、違規使用資料、非法交易資料等問題屢見不鮮。例如,某些APP和網站規定,如果使用者不授權提供手機號、通訊錄、地理位置等資訊就無法繼續使用和瀏覽,這實際上是透過“服務脅迫”來達成“資料綁架”。此外,部分機構資料保護意識、內部管理、技防能力薄弱,資料洩露事件時有發生,使用者成為“透明人”,電信欺詐、騷擾電話、暴力催收等屢禁不止,嚴重侵害了使用者權益。

金融業資料治理之“道”

依法合規,保障安全。

資料作為重要的生產要素,確保資料安全應是相關機構始終恪守的底線。金融業是對資訊保安高度敏感的行業,應建立健全資料安全管理長效機制和防護措施,嚴防資料洩露、篡改、損毀與不當使用,依法依規保護資料主體隱私權在資料治理過程中不受侵害,不能因開展跨部門資料融合應用而突破現有法律法規與監管規則。

物理分散,邏輯集中。

由於歷史原因,很多機構往往存在“N”個數據中心(資料來源),呈現出多個業務條線資料分散儲存、分散執行的局面,若採用“推倒重來”的方式顯然成本太高、阻力太大。因此,應在保持現有資料中心職能不變的前提下,維持當前資料物理存放位置和執行主體不變,充分利用各資料中心IT設施和人才資源,構建“1個數據交換管理平臺+N個數據中心(資料來源)”的資料架構格局。在此基礎上,制定實施統一的資料管理規則,實現資料的集中管理。

最小夠用,用而不存。

資料治理的一大難點就是如何在保障資料所有權基礎上實現資料的融合應用。應消除資料所有方因資訊“所有權讓渡”造成“事權轉移”的顧慮,規範資料使用行為,嚴控資料獲取和應用範圍,確保資料專事專用、最小夠用、未經許可不得留存,杜絕資料被誤用、濫用。在滿足各方合理需求前提下,最大程度地保障資料所有方權益,確保資料使用合規、範圍可控。

一數一源,一源多用。

當前,無論是金融管理部門還是金融機構,各業務條線資料分散現象或多或少存在,資料多頭收集時有發生。這既增加了資訊報送、採集、儲存成本,也導致資料責任主體不明,資料安全、資料質量難以保障。應明確源資料管理的唯一主體,保障資料完整性、準確性和一致性,減少重複收集造成的資源浪費和資料冗餘。同時,建立資料規範共享機制,提升資料利用效率和應用水平,實現資料多向賦能。

金融業資料治理之“術”

做好頂層設計,把資料規劃好。

資料治理是一項長期、複雜的系統工程,要在組織、機制和標準等方面加強統籌謀劃。一是最佳化組織架構。充分認識資料的重要戰略意義,將資料治理納入企業中長期發展規劃,及時調整組織架構,明確內部資料管理職責,理清資料權屬關係,自上而下推動資料治理工作。二是完善應用機制。在保障各方資料所有權不變前提下,統籌規劃全域性資料架構,完善跨機構、跨領域資料融合應用機制,實現資料規範共享和高效應用。三是構建標準體系。建立涵蓋金融資料採集、處理、使用等全流程的標準體系,打造金融資料的“通用語言”,提升金融資料質量,為資料互通、資訊共享和業務協同奠定堅實基礎。

健全治理體系,把資料管理好。

一是做好資料資產管理。根據統一的資料標準體系,建立全域性資料模型和科學合理的資料架構。在此基礎上,管理維護全域性資料資產目錄,實現對資料資產的全面梳理和有效管控,解決資料質量不高、資料利用不足等問題。二是做好資料分級管理。綜合國家安全、公眾權益、個人隱私和企業合法利益等因素,制定資料分級標準,基於全域性資料資產目錄將資料進行分級。針對不同等級資料採取差異化的控制措施,實現資料精細化管理。三是做好資料共享管理。規範資料共享流程,確保資料使用方在依法合規、保障安全前提下,根據業務需要申請使用資料。資料所有方按規則稽核確定資料使用範圍、共享方式等,透過資料交換機制實現資料有序流轉和安全應用。

加強安全管控,把資料保護好。

要遵循“使用者授權、最小夠用、全程防護”原則,充分評估潛在風險,把好安全關口,加強資料全生命週期安全管理,嚴防使用者資料的洩露、篡改和濫用。在採集環節,要向被採集使用者進行明示,明確告知採集和使用的目的、方式以及範圍,在獲取使用者授權後方可採集。在儲存環節,透過特徵提取、標記化等技術將原始資訊進行脫敏,並與關聯性較高的敏感資訊進行安全隔離、分散儲存,嚴控訪問許可權,降低資料洩露風險。在使用環節,藉助模型運算、多方安全計算等技術,在不歸集、不共享原始資料前提下,僅向外提供脫敏後的計算結果。

強化科技賦能,把資料應用好。

資料治理的核心環節是資料應用,要從算力、演算法、儲存、網路等維度加強技術支撐,切實增強資料應用能力。在算力方面,加快分散式架構轉型,充分發揮雲計算等技術高效能、低成本、可擴充套件的優勢,滿足海量資料分析處理對計算資源的巨大需求。在演算法方面,基於深度學習、神經網路等技術設計資料模型和分析演算法,提升資料洞察能力和基於場景的資料探勘能力,為資料插上翅膀,讓資料在金融領域展翅翱翔。在儲存方面,探索與網際網路交易特徵相適應、與金融資訊保安要求相匹配的資料儲存方案,穩步推動分散式資料庫金融應用,實現資料高效儲存和彈性擴充套件。在網路方面,運用物聯網技術豐富資料採集維度,利用5G技術頻寬大、速度快、延時低等優勢提升資料流轉效率,打造金融資料“高速公路”。

轉載僅為分享,如有侵權請聯絡我們刪除